工业和信息化部主管 中国电子报社主办
联系合作投稿

人工智能

谷歌 vs OpenAI:决战2024?

谷歌与Open AI“AI大战”的真正交火将会在2024年。

2023年最后一个月,谷歌发布了原生多模态大模型Gemini,称其在大语言模型领域的32个常用测试指标里,有30项领先于GPT-4。Gemini针对不同任务设定了Nano、Pro、Ultra三个版本,目前上线的只是Gemini Pro版,“顶配”Gemini Ultra将于2024年初推出。随后,谷歌发布2023年度AI研究总结,给出“全面碾压OpenAI”的万字长文。

640 (3).gif

OpenAI首席执行官山姆·奥特曼公布的圣诞愿望清单,可以理解为OpenAI的“应战书”,并透露将在2024年推出GPT-5。

外界评论,2024年全球AI大模型比拼的焦点是GPT-5和Gemini Ultra,虽然目前两个模型都还被“捂”在闺中,无法直接比较,但模型之争背后的数据、算力、生态的全方位较量已经开始。

1月11日凌晨,OpenAI的GPT Store(GPT应用商店) 正式上线,首先面向付费用户开放,最终将直接进行创收。这意味着“App Store”商业模式引入大模型领域。也是在这几天,谷歌DeepMind宣布了SARA-RT、RT-Trajectory、AutoRT三项具身智能成果。

2024年元旦刚过,OpenAI与谷歌AI之争火药味弥漫,一场关于AI核心基础的变革山雨欲来。

round1:多模态数据,谁拥有更多?

2024年大模型的竞争焦点,业界的共识是“多模态模型”,无论是GPT-5还是Gemini Ultra,都主打“多模态”,这意味着训练这些模型需要海量高质量的视频、音频、图片等数据。

谷歌和Open AI,谁更拥有源源不断的此类资源?

360集团创始人、董事长周鸿祎在与甲子光年创始人兼CEO张一甲的对话中表示,“人才密度、算力密度和数据质量的高低是决定通用大模型胜负的关键,谷歌的人才不是问题,算力也不是问题,在数据方面拥有搜索、YouTube和Android生态系统”。有消息称,谷歌训练Gemini时所用的数据量是GPT-4的两倍之多。

Open AI同样拥有自己的生态。如果说搜索、短视频是互联网时代的“超级应用”,大模型时代,杀手级应用很可能是“AI智能体”,从这个意义上看,Open AI的GPT商店有可能建立庞大的“AI超级应用”。据悉,目前用户自定义构建的ChatGPT助手已超过300万个。

接下来,数据竞争的焦点有可能是机器数据。蚂蚁集团副总裁、金融大模型负责人王晓航表示:“有一种说法是预计2025年左右,全世界50%左右的数据会来自感知和传感等IoT(物联网)数据,这部分数据能产生新的能力。”目前的数据来源于传统计算平台,如PC、服务器、手机和平板电脑,嵌入式数据则来源于极其广泛的设备类型。

因此,大模型与硬件结合将成为2024年重要的创新方向,也将创造智能硬件新物种。去年11月,由山姆·奥特曼投资的智能穿戴设备公司推出一个基于大模型的智能穿戴设备AI Pin,有人称其“有可能取代智能手机”。AI Pin将于2024年3月批量上市。

基于此,我们就很好理解,为什么谷歌Gemini大模型也包括了Nano版本。“当手机上的传感器都跟大模型整合,会产生非常多的应用场景,谷歌推出Gemini Nano版本,能够在终端、手机等各种设备上部署,与安卓系统紧密联系在一起。”周鸿祎表示。

微信截图_20240115095933.png


Pixel 8 Pro 在录音机应用中使用 Gemini Nano 来总结会议音频,即使没有网络连接也可以实现

大模型的目标不仅在于理解文本、图片、视频,它必须真正理解物理世界。谷歌Deep Mind首席执行官德米斯·哈斯比斯表示:“谷歌DeepMind已经在研究如何将Gemini与机器人技术结合,与世界进行物理交互,真正的多模态需要包括触摸和触觉的反馈。”

2024年元旦刚过,谷歌DeepMind又拿出了SARA-RT、RT-Trajectory、AutoRT三项机器人与大模型结合的成果,其中AutoRT是一个机器人数据收集系统,可以一次管理20个机器人。而在此前,OpenAI也投资了一家人形机器人公司1X。谷歌与OpenAI,谁都不愿错失任何一个有可能产生AI爆品的机会。

Round2:算力是关键底座,谁主动权更大?

在谷歌发布Gemini大模型时,特别强调自家的TPU(AI专用张量处理器)v4和v5e对大规模训练的给力支撑。为何?因为算力资源是AI的关键基础设施,是AI研究、AI模型训练、AI商业应用的关键利器。有信息透露,谷歌训练Gemini 1.0时所用算力是OpenAI训练GPT-4的四到五倍。谷歌除了想凸显自身的算力优势,还要做算力服务的生意。当天,谷歌还发布了号称“迄今为止最强大、最高效、可扩展的TPU系统”Cloud TPU v5p,将用于开发更高层次的AI大模型。

640 - 2024-01-15T095956.320.png

在大多数基准测试中,Gemini 的性能都超越了 GPT-4

谷歌这样做当然也希望“打脸”OpenAI——就在谷歌发布Gemini前,OpenAI宣布暂停ChatGPT Plus付费新用户的注册,此前还出现了ChatGPT周期性的宕机。直到去年12月中旬, 山姆·奥特曼才发文称:“我们重新启动了ChatGPT Plus付费订阅的注册,感谢您的耐心等待,同时我们找到了更多的GPU。”

山姆·奥特曼没有说明,其GPU究竟来自英伟达还是微软,但至少承认了一件事:OpenAI缺算力。尽管OpenAI的“好伙伴”微软已推出AI专用处理器,OpenAI也用上了,甚至还挖来了前谷歌TPU负责人主管OpenAI的硬件,但短期来看,其算力资源仍无法与谷歌相提并论。有报道称,即便OpenAI在两年内将GPU的总数增加四倍,依然无法赶上谷歌的算力资源,目前OpenAI 、Meta、CoreWeave、甲骨文、亚马逊的GPU总和,仍小于谷歌所拥有的TPU v5的数量。

640 - 2024-01-15T100007.622.png

Google 数据中心内的一排 Cloud TPU v5p AI 加速器超级计算机

算力资源的差距有可能在2024年改变谷歌与OpenAI模型差距,因为拥有更多的算力资源意味着能进行更多的试验、更快的迭代模型。按照SemiAnalysis预测,到2024年年底,谷歌模型训练的AI算力资源有可能是OpenAI的20倍。

业界也有人说,缺算力花钱买就好了,OpenAI正在启动新一轮融资,并不缺钱,自己赚钱能力也蒸蒸日上。最新消息显示,OpenAI近期年化收入突破16亿美元,主要收入来源包括ChatGPT Plus会员服务、API模型访问以及与微软的合作,预计到2024年底OpenAI年化收入可达50亿美元。

更何况,刚刚上线的GPT Store,带来OpenAI新的商业变现的想象空间。

不过,小冰公司CEO李笛认为:“GPT Store的建立不是为了商业模式,更是为了收集究竟什么样的GPT落地应用是有效的,是为了从开发者处获得想法和灵感。”这样看起来,OpenAI建立GPT Store的目的并不单纯,那么开发者会不会把好的创意拿出来,就是未知数。澜码科技创始人、CEO周健也认为,当前GPT-4的能力对于发展GPT store还存在瓶颈,GPT Store开发者是否能够做出用户愿意买单的应用,需要等到OpenAI发布GPT-5后才知。

更何况,目前情况看,芯片并不是想买就能买到,OpenAI更不希望沦为GPU和云计算公司的“打工人”。目前看,OpenAI与微软的关系依然牢固,微软也拿到了OpenAI无投票资格的董事会成员资格,但福布斯却预测,2024年OpenAI与微软就有可能走向分手,“随着OpenAI大到蚕食微软客户”。OpenAI还在寻找英伟达之外其他途径来解决眼下算力不足的问题,包括最近与AMD洽谈合作的可能性,也自主研发芯片、评估潜在收购目标。

基于种种不确定性,OpenAI希望将更多的“算力主动权”掌握在自己手里。最近,OpenAI与人工智能芯片初创公司Rain AI在2019年签署的一份意向书被曝出,OpenAI将购买该公司总价值5100万美元的NPU芯片,而在此前,山姆·奥特曼自己也投资了这家公司。这一举动引起广泛关注,因为Rain AI的NPU芯片采用神经拟态技术,模仿人脑的结构和功能,被认为具有低成本高能效的潜力,有望为OpenAI提供所需的硬件支持。

与Rain AI的这一交易,被视为OpenAI为确保其AI项目的芯片和硬件供应而进行的关键举措之一。但事实上这家芯片创业公司给出的出货时间至少要到2024年底。算力的差距,可能在2024年成为OpenAI与谷歌AI竞争的“关键变量”。

Round3:酝酿底层变革,谁先实现AGI?

更或许,谷歌与OpenAI的真正较量并不是GPT-5和Gemini Ultra,而是谁先实现AGI(通用人工智能)。

目前看,无论是GPT还是Gemini 都基于Transformer 架构。谷歌团队在2017年发表的论文《Attention Is All  You  Need》提出了Transformer 架构,如今的主流大模型产品,大多基于该架构。有人分析,谷歌拥有原创AI架构、算力、数据、技术、人才等显著优势,但其推出的Gemini也就仅领先GPT-4一点点,这或许意味着Transformer架构存在天花板。

Google DeepMind资深工程师卢一峰在与美国工程院院士张宏江对话中坦言,“现在的Transformer架构已经比当年有了很大的优化和改进”,从2016年到现在,整个业界在软件、硬件和数据方面对Transformer架构进行了许多组合优化,“已经将其推进到了一个局部最优状态”。“我认为我们可以继续改进它,还有很大的空间,但要显著改变它则有一定难度。 这个难度在于这几个维度已经彼此交织在一起。”卢一峰说。

需要有新的架构来“接力”这场AI加速跑。


福布斯在最近出炉的《2024年十大AI趋势预测》指出,“尽管我们不认为Transformer架构在2024年将消失,但确信将出现新一代更先进的AI架构替代方案,而且新的替代架构将会在2024年得到真正的应用。”福布斯在预测中提及了斯坦福大学的Chris Ré实验室正在构建一种新的模型架构,这种架构可随序列长度以次二次方的方式扩展(而不是像Transformer那样以四次方的方式扩展)。将使得人工智能模型计算密度更低,并能更好的处理长序列。“替代候选”还包括麻省理工学院开发的液态神经网络以及由Transformer联合发明人之一Llion Jones所创公司推出的Sakana架构。据悉,目前Transformer架构的五位共同发明者均已离开了谷歌,开启了各自的AI创新创业之旅,这些亲手孕育了Transformer的人有可能就是Transformer的“掘墓人”。

此外,随着大模型能力的不断演进,需要带来“跨越式变革”的未来计算,量子计算机或许是硬件“接盘”方案。创世伙伴资本主管合伙人周炜表示:“量子计算擅长的就是处理排列组合、并发的问题,当量子计算与大模型结合在一起能够解决很多问题。”

“首先,人工智能领域的算法,大部分属于并行计算范畴。而量子计算机擅长进行并行计算,因为它可以同时计算和存储0、1两种状态,无需像电子计算机那样消耗额外的计算资源,譬如串联多个计算单元,或将计算任务在时间上并列。计算任务越复杂,量子计算就越具备优势。其次,运行ChatGPT所需的硬件条件,同样也十分适合导入当前体积庞大的量子计算机,二者都需要安装在高度集成的计算中心里,由一支专业化技术团队进行管理支撑。”中国现代国际关系研究院科技与网络安全研究所人工智能项目负责人谭笑间表示。

2022年,来自谷歌、微软、加州理工学院等机构的研究者从原理上证明了“量子优势”在预测可观测变量、量子主成分分析以及量子机器学习中确实存在。量子计算与人工智能两大前沿技术合流的趋势正在变得越来越明朗。在量子计算、量子机器学习方面,谷歌是先行者。如果量子计算机能够成为未来AI硬件的替代方案,谷歌无疑拥有比OpenAI更多的优势。

谷歌会比OpenAI更快实现AGI吗?亦或,最先实现AGI的既不是谷歌也不是OpenAI,而是另外其他公司?一切皆有可能。

责任编辑:赵强


声明

1、本站遵循行业规范,任何转载的稿件都会明确标注作者和来源;2、本站的原创文章,请转载时务必注明文章作者和来源,不尊重原创的行为我们将追究责任;3、作者投稿可能会经我们编辑修改或补充;4、如本站的文章或图片存在版权,请拨打电话010-88558835进行联系,我们将第一时间处理。

相关链接

视频

专题

2023中国电子报编辑选择奖

12月26日,“2023中国电子报编辑选择奖”获奖名单正式出炉。本次评选采用企业自荐和编辑推荐两种方式,综合考量影响力、创新性、成长性等多个维度,围绕企业、技术、产品、解决方案等赛道评出20个奖项。

2024年全国工业和信息化工作会议

12月21日,全国工业和信息化工作会议在京召开。会议坚持以习近平新时代中国特色社会主义思想为指导,全面贯彻党的二十大和二十届二中全会精神,深入学习贯彻习近平总书记关于新型工业化的重要论述,认真落实中央经济工作会议和全国新型工业化推进大会部署要求,总结2023年工作,部署2024年任务。

深入学习贯彻党的二十大精神·工信系统在行动

当前,全国工业和信息化系统正进一步深入学习党的二十大精神,将二十大精神贯彻落实到具体举措和实际行动。为深入学习宣传贯彻党的二十大精神,中国电子报推出“深入学习贯彻党的二十大精神·工信系统在行动”专栏,通过调研采访报道各地贯彻落实党的二十大精神的具体举措、典型案例,反映各地实干担当、求真务实的精神风貌。敬请关注。

学习贯彻习近平新时代中国特色社会主义思想主题教育

学习贯彻习近平新时代中国特色社会主义思想主题教育开展以来,全国工信系统牢牢把握“学思想、强党性、重实践、建新功”的总要求,多措并举扎实推进主题教育高质量开局、高标准起步。

聚焦2023年全国两会

北京3月5日电 第十四届全国人民代表大会第一次会议5日上午在北京人民大会堂开幕。近3000名新一届全国人大代表肩负人民重托出席盛会,认真履行宪法和法律赋予的神圣职责。

世界超高清视频(4K/8K)产业发展大会

会议

2023全球数字贸易创新大赛

11月22—23日,2023全球数字贸易创新大赛总决赛在杭州举行。大赛是第二届全球数字贸易博览会重要活动之一,今年为首次举办。大赛设置人工智能元宇宙和区块链Web3.0两个赛道,吸引了近200家优秀企业及项目团队参与,其中,100余家入围半决赛,24家进入总决赛。

2023世界VR产业大会

10月19日,由工业和信息化部、江西省人民政府共同主办的2023世界VR产业大会在江西南昌开幕。江西省委书记、省人大常委会主任尹弘,工业和信息化部副部长徐晓兰,江西省委常委、南昌市委书记李红军出席开幕式并致辞。开幕式由江西省委副书记、省政府省长叶建春主持。

2023世界显示产业大会

9月7日-8日,由四川省人民政府、工业和信息化部主办的2023世界显示产业大会在四川省成都市召开。四川省委副书记、省长黄强,工业和信息化部党组成员、副部长张云明,重庆市政府党组成员、副市长江敦涛,德国联邦经济发展和对外贸易协会主席米夏埃尔·舒曼出席开幕式并先后致辞。

2023世界超高清视频产业发展大会

5月8日-10日,由工业和信息化部、国家广播电视总局、中央广播电视总台、广东省人民政府共同主办的2023世界超高清视频产业发展大会在广州召开。5月9日,广州市委副书记、市长郭永航,中央广播电视总台副台长胡劲军,国家广播电视总局副局长朱咏雷,工业和信息化部总工程师赵志国,广东省委副书记、省长王伟中出席开幕式并先后致辞。

2022世界集成电路大会

11月17日,由工业和信息化部、安徽省人民政府共同主办的2022世界集成电路大会在安徽省合肥市召开。安徽省委书记、省人大常委会主任郑栅洁出席会议。安徽省委副书记、省长王清宪,工业和信息化部党组成员、副部长王江平出席开幕式并致辞。

世界显示产业大会

本周排行