工业和信息化部主管 中国电子报社主办
联系合作投稿

人工智能

智谱AI CEO张鹏:大模型向上探索的天花板还远远没到

在经历了一段时间的“野蛮生长”后,业内人士普遍认为,2024年,国内大模型市场将逐渐回归理性。谁将从百模大战中脱颖而出成为业界最关注的话题。这其中,智谱AI被称作“最像OpenAI的中国公司”,吸引到了不少关注。

1月16日,智谱AI发布新一代基座大模型GLM-4,基础能力实现大幅升级,性能相比上一代全面提升 60%,逼近 GPT-4。智谱AI CEO张鹏在接受《中国电子报》记者专访时表示,大模型技术往前演进的空间很大,向上探索的天花板还远远没到。

张鹏.jpg

要“学习”OpenAI,而不是“成为”OpenAI

作为一家成立于2019年的创业公司,智谱AI是由清华大学计算机系知识工程实验室的技术成果转化而来,在人工智能领域拥有十多年的研究积淀。早在2020年,OpenAI推出GPT-3大模型,而国内大模型市场还没“热”起来的时候,智谱AI便把OpenAI当作对标对象,开始启动自己的大模型项目。彼时,国内大模型企业寥寥无几,智谱AI可以说是第一批“吃螃蟹”的人。

与其他商业化公司不同,智谱AI更像是一群学术研究者共同打造的一个“理想岛”。“我们当时的想法是要发掘科技创新的源动力,希望通过提前掌握一些技术发展规律去指导科研、应用的方向,甚至指导产业的发展。大模型就是在这样一个时间点、这样一个环境下,我们找到的一个阶段性的重要源动力。”张鹏表示。

由于同为专注做AI大模型、并得到众多明星机构青睐的创业公司,很多人喜欢把智谱AI和OpenAI放在一起做对比。对此,张鹏毫不避讳谈及二者的相似性。他说:“智谱AI和OpenAI最重要的一个相似之处是我们的目标相同,都希望能够实现AGI,而且我们都认为大模型是实现AGI的必经之路。由于目标相同、诉求一致,所以大家才会看到我们的发展路径是有相似性。”

但智谱AI也并不是完全按照OpenAI的路径发展。不同于比较主流的 GPT,智谱 AI 采用的是全自研的GLM(通用语言模型)预训练框架。“中国没有自己的预训练模型框架。无论是GPT、BERT,还是T5,都是西方的科学家提出的底层技术,我们希望打破垄断,所以没有完全复刻OpenAI的路径。”张鹏说道。

他表示,从2020年开始,国外的一些顶尖的公司不再选择开源路线,学术界关于大模型的研究和技术上的细节也不再公开,国内研发团队相当于走进了“无人区”,前方没有可供参照的道路。而一个千亿参数规模的大模型研发成本动辄上千万,试错成本巨大。

“现在回过头去看,当初选择做大模型虽然有点‘孤注一掷’,但我们对自己是有信心的。”张鹏说道。据官方信息显示,智谱AI2023年已累计获得超25亿人民币融资,主要参与方不乏美团、蚂蚁、阿里、腾讯、小米等明星企业的身影。

要“承认差距”,也要保持“不认输”的心态

在谈及国内外大模型发展差距时,张鹏坦言:“从技术发展方面来看,国内外已经没有太大差距了,但在对于通用人工智能的认知方面,国际顶尖团队的认知水平更高,创新氛围更活跃,这让其思考问题的层次更深入,眼光也更长远。”

中国科学院院士、清华大学计算机系教授、清华大学人工智能研究院名誉院长张钹曾分享过这样一个观点:通用人工智能的三要素数据、算力和算法,应该升级为四个要素,第四个要素是知识。正是由于我们从大量的数据中获取了知识,建立起了可解释鲁棒的人工智能理论,这才掀起了第三代人工智能浪潮。

张鹏对此观点表示赞同。他指出,国内外社会发展阶段不同、文化氛围不同、技术发展水平不同,人工智能的投资决策逻辑、发展路径也存在很大差异,因此不能完全照搬国外人工智能的发展经验。“可以借鉴是他们对通用人工智能的深刻认知以及活跃的创新思想和氛围,但我们必须要承认差距的存在,也要保持‘不服输’的心态,虚心学习、奋力赶超。”张鹏说道。

智谱AI发布新一代基座大模型GLM-4.png

图为智谱AI发布新一代基座大模型GLM-4现场

大模型的发展方向是越来越像人。张鹏表示:“以前我们解决的是简单的自然语言交互的问题,以后要解决的是‘大脑’的问题,要让它拥有人的大脑,能感知、能理解、能推理、能交互,还能自我学习。这种能力的拓展不应该是简单的线性叠加,而应该是一种几何关系,甚至是指数关系,将会产生爆炸式的增长。”

在他看来,未来大模型的泛用性将进一步提升。随着技术的进步和资源的投入,未来的大模型将具有更高的精度、更强的理解能力和更广泛的适用性。这不仅意味着它们能够更好地理解自然语言,还能够进行更多的复杂任务,如翻译、推理、创作等。

多模态也是一个重要发展方向。除了传统的文本处理之外,大模型将在语音识别、图像生成、视频理解和推荐系统等领域发挥更大的作用。此外,未来大模型还将更加定制化,这将使用户能够更加灵活地利用大模型来解决自己的问题。

模型能力涌现将加速商业化落地

商业化落地是验证一项新技术价值几何最直接的检验方式。现阶段来看,国内大模型百花齐放,但大部分仍处于讲技术、讲发展的阶段。对于商业化落地,基本上处于探索阶段。

“当模型能力提升到一定的水平线以上之后,模型的应用或者说在产业上的落地才能变得顺理成章,”张鹏表示,“现在大家感觉模型没那么‘好用’,归根究底还是在于模型的能力有限,在走向实际应用场景的过程中还需要攻克许多难题。”

比如“模型幻觉”,现在普遍的认知是不能把所有工作交给人工智能来做,尤其在一些关键性的、安全性要求高的场景中,幻觉问题不仅影响了模型的准确性和稳定性,还制约了大模型在真实场景中的广泛应用的可靠性。不过,可以采用人机协同的方式来避免模型幻觉带来的一些问题。

从行业应用角度来看,大模型在工业制造领域的应用存在巨大的想象空间。“坦白地讲,传统工业企业大多还是以人力为主,相对互联网行业、金融行业等来说,数字化基础相对比较薄弱,在大模型应用过程中需要花费更多力气。”张鹏说道。

据他分析,高技术需求、数据密集型场景将会成为大模型率先实现规模化落地的领域。“大模型实际上就是在模拟人的大脑,它更适合用在具有高技术需求,且需要根据大量数据和知识去做出判断决策的场景中,而不是那些一线的、操作需求强的场景。”

以操作流程优化这个场景为例,标准化的操作流程是工业企业提升良品率和工作效率的重要基础。原本需要几十人组成的专家团队,花费一个月时间针对某一种新型设备人工编写的操作流程,在引入大模型技术后,编写时间可以缩短一半,优化效果提升30%。在降本增效的同时,操作流程涉及到的工业数据将演变成企业内部可沉淀的标准化知识沉淀下来,减少对人的依赖。

“IT基础设施成熟度、人才基础、技术基础、资金基础等,这些条件共同决定了哪些行业能够实现大模型率先落地。实际上,很多工业企业已经在探索大模型应用了。”张鹏对记者表示。比如在安全生产方面,上一代人工智能技术主要是通过布设大量的摄像头来进行图像识别,以此实现安全生产。然而,由于样本数据标注周期长,照片、视频等数据的识别与处理需要耗费大量人力和物力资源,这样做的效率其实并不高。

如果引入一个学习过大量图像数据的通用大模型,其本身已在若干任务上达到了基准性水平,只需在上面稍做微调,增加一些定制化的需求能力,就能轻松实现原本需要花费大量人力物力才能达到的监测效果。张鹏向记者透露:“我们已经在和一些厂家在工业领域做大模型应用的前期测试了。一些原本技术能力就不错的工业企业,也在开源版本的大模型上做了一些应用端的尝试,效果非常不错。”

在他看来,只有一定规模的通用大模型,才能实现类人的认知能力涌现。训练一个通用大模型的成本很高,但在通用大模型基座上做微调可以大大降低整体成本,这对企业而言具有很大吸引力。未来,随着技术进一步演进,使用者越来越多,大模型的进化将会越来越快。

“从全局视角来看,没必要重复‘造轮子’,我们真正要做的事情是集中力量投入在最好的几个通用大模型上,持续推动它的技术演进,加快智能涌现的到来。”张鹏表示。至于未来什么样的模型值得被留下,他表示应该回归市场,用实践和应用检验。

“2024年,大模型市场将从野蛮生长回归冷静,对于大模型的投资与炒作将会告一段落,行业焦点也将从模型本身转向寻找应用的层面。”张鹏表示,“不过这并不代表大模型的技术演进速度会下降,向上探索的天花板还远远没到。”

责任编辑:宋婧


声明

1、本站遵循行业规范,任何转载的稿件都会明确标注作者和来源;2、本站的原创文章,请转载时务必注明文章作者和来源,不尊重原创的行为我们将追究责任;3、作者投稿可能会经我们编辑修改或补充;4、如本站的文章或图片存在版权,请拨打电话010-88558835进行联系,我们将第一时间处理。

相关链接

视频

专题

2023中国电子报编辑选择奖

12月26日,“2023中国电子报编辑选择奖”获奖名单正式出炉。本次评选采用企业自荐和编辑推荐两种方式,综合考量影响力、创新性、成长性等多个维度,围绕企业、技术、产品、解决方案等赛道评出20个奖项。

2024年全国工业和信息化工作会议

12月21日,全国工业和信息化工作会议在京召开。会议坚持以习近平新时代中国特色社会主义思想为指导,全面贯彻党的二十大和二十届二中全会精神,深入学习贯彻习近平总书记关于新型工业化的重要论述,认真落实中央经济工作会议和全国新型工业化推进大会部署要求,总结2023年工作,部署2024年任务。

深入学习贯彻党的二十大精神·工信系统在行动

当前,全国工业和信息化系统正进一步深入学习党的二十大精神,将二十大精神贯彻落实到具体举措和实际行动。为深入学习宣传贯彻党的二十大精神,中国电子报推出“深入学习贯彻党的二十大精神·工信系统在行动”专栏,通过调研采访报道各地贯彻落实党的二十大精神的具体举措、典型案例,反映各地实干担当、求真务实的精神风貌。敬请关注。

学习贯彻习近平新时代中国特色社会主义思想主题教育

学习贯彻习近平新时代中国特色社会主义思想主题教育开展以来,全国工信系统牢牢把握“学思想、强党性、重实践、建新功”的总要求,多措并举扎实推进主题教育高质量开局、高标准起步。

聚焦2023年全国两会

北京3月5日电 第十四届全国人民代表大会第一次会议5日上午在北京人民大会堂开幕。近3000名新一届全国人大代表肩负人民重托出席盛会,认真履行宪法和法律赋予的神圣职责。

世界超高清视频(4K/8K)产业发展大会

会议

2023全球数字贸易创新大赛

11月22—23日,2023全球数字贸易创新大赛总决赛在杭州举行。大赛是第二届全球数字贸易博览会重要活动之一,今年为首次举办。大赛设置人工智能元宇宙和区块链Web3.0两个赛道,吸引了近200家优秀企业及项目团队参与,其中,100余家入围半决赛,24家进入总决赛。

2023世界VR产业大会

10月19日,由工业和信息化部、江西省人民政府共同主办的2023世界VR产业大会在江西南昌开幕。江西省委书记、省人大常委会主任尹弘,工业和信息化部副部长徐晓兰,江西省委常委、南昌市委书记李红军出席开幕式并致辞。开幕式由江西省委副书记、省政府省长叶建春主持。

2023世界显示产业大会

9月7日-8日,由四川省人民政府、工业和信息化部主办的2023世界显示产业大会在四川省成都市召开。四川省委副书记、省长黄强,工业和信息化部党组成员、副部长张云明,重庆市政府党组成员、副市长江敦涛,德国联邦经济发展和对外贸易协会主席米夏埃尔·舒曼出席开幕式并先后致辞。

2023世界超高清视频产业发展大会

5月8日-10日,由工业和信息化部、国家广播电视总局、中央广播电视总台、广东省人民政府共同主办的2023世界超高清视频产业发展大会在广州召开。5月9日,广州市委副书记、市长郭永航,中央广播电视总台副台长胡劲军,国家广播电视总局副局长朱咏雷,工业和信息化部总工程师赵志国,广东省委副书记、省长王伟中出席开幕式并先后致辞。

2022世界集成电路大会

11月17日,由工业和信息化部、安徽省人民政府共同主办的2022世界集成电路大会在安徽省合肥市召开。安徽省委书记、省人大常委会主任郑栅洁出席会议。安徽省委副书记、省长王清宪,工业和信息化部党组成员、副部长王江平出席开幕式并致辞。

世界显示产业大会

本周排行