“草莓”模型对OpenAI新旗舰模型及GPT-4的改进都至关重要。
OpenAI的“草莓”要熟了?
智东西8月28日报道,今天,外媒The Information援引知情人士称,OpenAI将在今年秋天推出代号为“草莓”(之前被称为Q*)的新模型。
“草莓”项目就是盛传已久的神秘Q*模型,据传是此前戏剧化的OpenAI政变关键原因之一。它展现出了解答未见过的数学问题、复杂编程的更强大能力,当时让AI安全的研究人员都为之震惊。
这一项目当下最重要的用处有两个:一是改进ChatGPT等现有产品,二是帮助OpenAI开发下一代旗舰模型Orion。这些都指向了OpenAI想要保持自己在大模型领导地位,并获得更多收入机会的决心。
不过,近日OpenAI还被曝出已经向美国国家安全官员展示了“草莓”项目,这可能是这家创企安全部门高管频繁离职背景下,想要让产品提高透明度的举措。
本月初,OpenAI CEO Sam Altman在推特暗戳戳秀自家花园5颗草莓的时候,就有网友根据草莓成熟时间跳了预言家:GPT-5可能在未来4-6周内确认发布。这正好和现在秋天可能发布的时间点对上了。
网友猜测Altman草莓的成熟时间
可能在不久的将来,我们就能看到“草莓”项目被直接集成到了ChatGPT里。
01.稳住大模型霸主地位,“草莓”能帮新旗舰模型减少幻觉
“草莓”项目是OpenAI新取得的重要技术里程碑,能解决以前从未见过的数学问题,经过训练可以解决涉及编程的问题,回答产品营销策略等主观问题、解决复杂字谜游戏都可以。
一直没有浮出水面的“草莓”模型,近段时间冲到大众视野的迹象变得更加明显。
除了Altman秀5颗草莓,还有OpenAI研究员Trevor Creech发文在OpenAI吃晚餐,盘子里是草莓。
OpenAI研究员Trevor Creech发文在OpenAI吃晚餐
新模型脚步可能越来越近的现实情况下,这可能是OpenAI想要保持自己在大模型领域霸主地位的举措,毕竟它的竞争对手已经拿出了不少与OpenAI最新旗舰模型GPT-4性能相当的模型。
尽管目前OpenAI的模型仍是企业和AI应用程序开发者的首选,但来自谷歌、xAI、Anthropic和Meta等其他企业的模型正在诸多排行榜上迅速赶上OpenAI。
因此,OpenAI的前景在一定程度上取决于它最终能否推出一款代号为Orion的新旗舰模型。该模型旨在改进其去年年初推出的旗舰模型GPT-4,后者于去年年初推出。
而“草莓”项目的发布就对Orion的训练至关重要——它可以为Orion生成高质量训练数据,减少幻觉。
“草莓”模型可以帮助OpenAI克服获取高质量数据的限制,从而利用从互联网上提取的文本或图像等现实世界数据来训练新模型。
智能体创企Minion AI首席执行官、GitHub Copilot前首席架构师Alex Graveley认为,使用“草莓”模型生成更高质量的训练数据可以帮助OpenAI减少其模型产生的错误数量,即所谓的幻觉。该模型之所以能够做到这一点,是因为“训练数据中的歧义较少,所以它猜测的次数较少”。
除了下一代旗舰模型,“草莓”项目的推出也能改进OpenAI的现有产品。
OpenAI内部正在通过“提炼”过程来简化和缩小“草莓”模型,以便在Orion发布之前将其用于提升现有产品的性能。这种“草莓”模型的较小、简化版本,能够在保持与较大模型相同性能水平的同时,更易于操作且成本更低。
一个显而易见的想法是将“草莓”模型改进的推理能力融入ChatGPT中。这可能意味着用户虽然获得了更准确的答案,但速度会变慢。
因此,这可能不适用于SearchGPT搜索引擎等用户希望能获得立即响应的工具,但非常适合对时间不太敏感的用例,例如修复GitHub中的非关键编码错误。
那是不是在不久的将来,ChatGPT用户能够根据请求的时间敏感度来自主选择打开或关闭“草莓”模型。
02.OpenAI收入告急?今年夏天已向政府官员展示
面对资金实力雄厚的科技大公司以及疯狂吸金的创企劲敌,OpenAI需要开辟更多的收入机会。
尽管相比于一年前OpenAI业务增长飞速,目前其向企业销售的API和ChatGPT订阅收入增长了约两倍,达到每月2.83亿美元,但OpenAI每月的亏损可能更高。The Information基于此前未披露的内部财务数据和参与该业务的人士的分析,OpenAI今年可能亏损高达50亿美元。
知情人士透露,Altman希望为公司筹集更多资金,并寻找减少损失的方法。作为与微软达成商业合作的一部分,OpenAI自2019年以来已从微软筹集了约130亿美元,该合作将持续到2030年。但合作条款可能会发生变化,包括OpenAI如何向微软支付租用云服务器的费用以开发其模型,这也是目前是OpenAI最大的成本支出。
鉴于现有的ChatGPT等对话式AI在航空航天和结构工程等数学密集型领域并不擅长,解决棘手数学问题的模型可能是一个潜在的有利可图的应用。同时,数学推理的改进也可以帮助模型更好地推理对话查询,例如客户服务请求。
谷歌和一些初创公司也在开发推理技术。上个月,谷歌DeepMind的模型在国际数学奥林匹克竞赛中击败了大多数人类参赛者;Anthropic最新的模型可以编写更复杂的代码、回答有关图表和图形的能力;还有一些创企通过将问题分解为更小的步骤来提高推理能力,但这种方法速度慢且成本更高……
谷歌、Anthropic等公司正在开发推理技术
因此,“草莓”模型的发布可能会为推理技术带来新的思路。
Altman今年5月就曾透露“我们觉得我们拥有足够的数据来开发下一个模型。我们已经进行了各种实验,包括生成合成数据。”他当时可能指的就是Orion模型。
一位直接知情人士称,OpenAI在今年夏天向国家安全官员展示了“草莓”模型的能力。
此次演示可能是OpenAI努力向美国政策制定者提高透明度的一部分,近几个月来,OpenAI联合创始人之一John Schulman等几位安全部门的高管离职,这也使得业界对于OpenAI的技术安全更加关注。
03.结语:OpenAI寻求开辟更多收入机会
推出“草莓”模型是OpenAI是在大模型产业中永无止境的战斗的一部分,它要领先于其他资金雄厚的竞争对手,稳固自己在大模型领域的霸主地位。此外,这项技术还对未来的产品产生影响,如解决多步骤任务的智能体等。
OpenAI等大模型玩家同样希望借此能在这一领域开辟出更多的收入机会,以支持高昂的大模型训练费用。
本文来自微信公众号“智东西”(ID:zhidxcom),作者:程茜,编辑:心缘,aigpt6经授权发布。