2024云栖大会上,极少在公开场合露面的阿里CEO、阿里云董事长兼CEO吴泳铭对AI的未来发展提出了积极的观点。他认为过去22个月,AI发展速度已超任何历史时期,“但我们依然还处于AGI变革早期”。面向未来,他提出生成式AI最大的想象力,“绝不是在手机屏幕上做一两个新的超级app,而是接管数字世界,改变物理世界。”
阿里CEO、阿里云董事长兼CEO吴泳铭
此刻距离OpenAI发布ChatGPT已过去22个月。全球AI技术圈和创投圈经历了一个完整周期:技术奇点爆发引发狂热追捧,再到创新曲线放缓,失望和质疑声音浮现。如今随着OpenAI发布o1模型,AI深入各行各业,市场的信心正在重新爬升。吴泳铭的此次发声,在当下的冷暖切换期,无疑更具参考意义。
如何看待这一次AI革命浪潮?AGI的最终形态会是什么?我们如何把握这一次技术革命?
吴泳铭发言和这届云栖大会变成了最好的解题集。主论坛成为AI创业者的舞台,阿里云请来了国内大模型、自动驾驶和人型机器人的明星创业者和科学家。走进云栖小镇,阿里云几乎搬来了中国AI圈所有的创业公司和产品,4万平米的展区,挤满了全球百余款AI应用。400多场并行话题及论坛中,150余场和大模型相关。在世界机器人大会爆火的人形机器人,在云栖再次当上了顶流。
上一届云栖大会,焦点还在AI上游的算力和生态。这一届云栖成为中国AI产业的微缩地图。AI开始走出服务器,深入千行百业。始于2009年的云栖大会,见证了每一波中国科技潮水的方向,也给出了理解当下的线索。
01 悄然演进的新产业革命
ChatGPT爆火后,如何定义这一浪潮的级别,成为全球顶级大脑热议的话题。其中,互联网是个热门对比维度。
A16Z创始人 Marc Andreessen提出过一个有趣的观点:互联网通过连接现有的计算机来促进新计算机的创建,而AI尤其是大模型,则更像是一种新型计算机。
对于这个全球记者采访提纲里的CEO热门问题,吴泳铭给出了进一步的延伸。他认为,过去三十年,互联网浪潮的本质是连接,互联网连接了人、信息、商业、服务等等,通过连接提高了世界的协作效率,创造了巨大的价值,改变了人们的生活方式。但生成式AI是通过给生产力供给增加智能,从而为世界创造更大的内在价值。“这种价值创造,可能是移动互联网连接价值的十倍、几十倍。”
吴泳铭给予AI浪潮如此之大的预期,很大原因在于作为中国最大云厂商的掌舵者,他可以亲眼见证中国AI市场水面之下的暗流涌动。正如他在云栖大会上提到:
“今天我们接触到的所有客户、所有CTO,几乎都在用AI重构自己的产品。大量新增需求正在由GPU算力驱动,大量存量应用也在由GPU重新编程。在汽车、生物医药、工业仿真、气象预测、教育、企业软件、移动APP、游戏等行业,AI计算正在加速渗透。”
传统AI焦点在于模拟人类的感知,生成式AI却将机器智能跃升到了思考推理和创造的维度。吴泳铭在演讲中进一步解释道:
“生成式AI让世界有了一个统一的语言——Token。它可以是任何文字、代码、图像、视频、声音。AI模型可以通过对物理世界数据的Token化,理解真实世界的方方面面,比如人类行走、奔跑、驾驶车辆、使用工具的动作,绘画、作曲、写作、表达、教学、编程的技巧。理解之后,AI就可以模仿人类去执行物理世界的任务。这将带来新的产业革命。”
互联网本质上只改变了人类“连接”另一个人类、信息、商业、服务的形态,但大模型同时改造前端的交互界面,和后端的生产环节。很多悄然开始的产业革命,并不容易被普通人所察觉。
以深势科技为例。这家公司是“AI for Science”科学研究范式的头部践行者,运用人工智能和多尺度模拟仿真算法,结合先进计算手段求解重要科学问题,为人类文明最基础的生物医药、能源、材料和信息科学与工程研究打造新一代微尺度工业设计和仿真平台。
基于深势科技发布的Uni-Mol分子构象大模型,可实现分子生成、性质预测等多种通用能力。在药物发现领域,基于Uni-Mol开发的虚拟动力学分子生成方法VD-Gen,能直接在蛋白靶点空腔中生成具有高结合亲和力的分子。
基于阿里云高性能计算,深势科技将单次预测能支持的最大氨基酸序列长度提升至 6.6k,覆盖99.992%已知的蛋白序列。
来自广东的拓斯达工业机器人公司,则将传统的工业机器人控制软件与通义大模型结合,让工业机器人在指令控制、传感反馈、知识学习等方面具备了新能力。在 3C、锂电、光伏等行业的自动化生产场景中,集成了大模型能力的拓斯达六轴工业机器人,可以与现场工程师通过语言交互,无代码完成码垛、喷涂、装配等复杂任务。
生成式AI的想象力正在徐徐展开。物理世界的大部分事物都会具备AI能力,形成下一代的全新产品,并与云端AI驱动的数字世界连接产生协同效应。
02 生成式AI的机会在改变物理世界
2008年,移动互联网诞生,2012年获得全行业共识,这中间走过了五年。ChatGPT引发的生成式AI创业热潮,几乎是从第一天诞生起就达到了全球性共识,全球科技巨头都在不计成本火速投入。
一大原因在于,移动互联网只做到了物理世界的联网,但生成式AI可以真正改造物理世界。吴泳铭在云栖大会上指出,“我们不能只停在移动互联网的视角看未来。生成式AI最大的想象力,绝不是在手机屏幕上做一两个新的超级app,而是接管数字世界,改变物理世界。”
汽车行业正在发生这样的变革。之前的自动驾驶技术,是靠人来写算法规则,几十万行代码,仍然无法穷尽所有的驾驶场景。小鹏汽车董事长、CEO何小鹏在云栖大会现场提到,自动驾驶从1925年开始研发,但接近百年时间都只能做到特定场景下使用。“一个人无法用规则去面对世界上所有的场景,即使仅仅在开车这一个专业的业务。”
采用“端到端”的大模型技术训练后,AI模型直接学习海量人类驾驶视觉数据,让汽车具备了超越大部分司机的驾驶能力。何小鹏表示:“对于最普通的用户,从现在到未来的36个月,可以让我们每一个人在每一个城市都像老司机一样开车。”
宇树科技CEO王兴兴也分享了类似的感受,他曾经非常反对做人形机器人,直到大模型的出现看到了新的可能。
过去让大模型实现跟人类一样的复杂操作基本是无解的,因为人类动作是无穷的。即使是端茶、倒水这样的简单场景,就涉及到几百种细微动作。过去都要依靠人类专家手动编程,大模型为机器人提供了一种可能性——机器人能够形成理解事物本质及其处理方法的世界模型。
人型机器人带来的好处有两方面,首先,今天生活的世界是围绕人类行为所优化的,人形可以让机器人最大程度上适应环境,其次,通用机器人在制造方面存在巨大的规模效应。只有大规模制造,从而获得成本优势,才能真正实现机器人的真正普及。
吴泳铭指出:“机器人将是下一个迎来巨变的行业。未来,所有能移动的物体都会变成智能机器人。它可以是工厂里的机械臂、工地里的起重机、仓库里的搬运工、救火现场的消防员、家庭里的宠物狗。”
在吴泳铭的畅想里,未来,工厂里会有很多机器人,在AI大模型的指挥下,生产机器人。现在每个城市家庭里有一辆车,未来每个家庭可能会有两三个机器人。
AI驱动的数字世界连接着具备AI能力的物理世界,将会大幅提升整个世界的生产力,对物理世界的运行效率产生革命性的影响。而这一切来临的快慢,取决于AI基础设施的进化速度。
03 我们仍处于AI大基建时期
历史上每一波应用的喷涌而出,前提都是基础设施的完善。4G、5G和智能手机的普及,带来了短视频呼啸而来的大爆发。公路、铁路基建,催生了中国领先全球的电商、物流业。
以互联网基建为例。截止到今年6月,中国光缆线路总长度达6712万公里,全国互联网宽带接入端口11.7亿个,我国移动电话基站总数达1188万个,5G基站总数达391.7万个。
AGI应用的繁荣,同样势必根植于一个健全的大一统的算力基建之上。从2012年的AlexNet模型到2017年的AlphaGo Zero,算力消耗足足翻了30万倍。而ChatGPT横空出世的背后是,微软Azure云上的数万张A100芯片,成本高达数亿美元。
根据OpenAI的研究报告,自2012年开始,AI训练需要的算力每隔 3-4 个月便会翻番,到 2018 年,训练所耗费的算力更是增长了大概 30 万倍,而相比之下,摩尔定律在同样的时间里只有 7 倍的增长。
当物理世界被纳入AI改造的范畴后,训练和推理所需的算力成本更会爆发式增长。
这让云计算天生地跟AIGC绑定在了一起。云计算的算力集中、灵活部署、按需付费、成本较低等特点,尽管不能解决全部问题,但几乎是算力短缺昂贵的背景下的唯一答案。无论是训练还是推理,大模型都离不开云。
吴泳铭在云栖大会上提到,在新增算力市场上,超过50%的新需求由AI驱动产生,AI算力需求已经占据主流地位。这一趋势还会持续扩大。过去一年,阿里云投资新建了大量的AI算力,但还是远远不能满足客户的旺盛需求。
CPU主导的计算体系正在加速向GPU主导的计算体系转移,AI计算正在加速渗透千行百业。当前,行业前沿模型训练计算量每年增长4~5倍,中国AI算力规模2022~2027年复合增长率高达33.9%;模型参数以10倍速增长,模型数据集以50倍速增长,对存力也提出了更高需求。
为提升智驾大模型训练效率,小鹏汽车早在2022年就携手阿里云在乌兰察布建成中国最大的自动驾驶智算中心,将自动驾驶模型训练效率提升了超600倍。而近两年内,由于大模型技术快速发展,阿里云已将此智算中心的算力储备扩张超4倍至2.51Eflops,为小鹏汽车提供稳定高效的算力底座,支撑了大模型快速迭代,实现智驾“全国都好用”。
本届云栖大会上,“全球首款AI汽车”小鹏P7+也亮相了2024云栖大会。这款车搭载了业内领先的端到端大模型。过去2年,小鹏汽车与阿里云共建的AI算力规模提升超4倍。何小鹏表示,将继续深化与阿里云的AI算力合作,加速推动端到端大模型拓展自动驾驶上限,提升下限。
吴泳铭无疑清晰地看到了这一趋势。自宣布“AI驱动、公共云优先”以来,阿里云大刀阔斧地进行投入AI基础设施建设。在今年的云栖大会,他再次强调:
“阿里云正在以前所未有的强度投入AI技术研发和基础设施建设。我们的单网络集群已拓展至十万卡级别,正在从芯片、服务器、网络、存储到散热、供电、数据中心等方方面面,重新打造面向未来的AI先进基础设施。”
本次云栖大会,阿里云展示了AI驱动的全系列产品家族升级。
最新上线的磐久AI服务器,支持单机16卡、显存1.5T,并提供AI算法预测GPU故障,准确率达92%;阿里云ACS首次推出GPU容器算力,通过拓扑感知调度,实现计算亲和度和性能的提升;为AI设计的高性能网络架构HPN7.0,可稳定连接超过10万个GPU ,模型端到端训练性能提升10%以上;阿里云CPFS文件存储,数据吞吐20TB/s,为AI智算提供指数级扩展存储能力;人工智能平台PAI,已实现万卡级别的训练推理一体化弹性调度,AI算力有效利用率超90%。
同时,阿里云宣布通义千问三款主力模型再次大幅降价,最高降幅85%,百万tokens价格低至0.3元。过去半年,阿里云百炼平台持续降低大模型调用的门槛,进一步推动大模型的普惠。
模型成本与整个社会的创新之间是一个结构明确的跷跷板。伴随AI基础设施成本下降一同发生的,则是跷跷板另一端创新的喷涌而出。