Llama 8B搜索100次超越GPT-4o,推理+搜索即可提升性能,新「Scaling Law」诞生?
最近的论文表明,LLM等生成模型可以通过搜索来扩展,并实现非常显著的性能提升。另一个复现实验也发现,让参数量仅8B的Llama 3.1模型搜索100次,即可在Python...
清华唐杰团队新作:一口气生成2万字,大模型开卷长输出
一口气生成2万字,大模型输出也卷起来了!清华&智谱AI最新研究,成功让GLM-4、Llama-3.1输出长度都暴增。相同问题下,输出结果直接从1800字增加到7800字...
Kimi投放B站后,其他AI公司都投不起了 | 焦点分析
文 | 周鑫雨编辑 | 苏建勋抬高B站流量价格的杠杆,自2024年起,握在了一家AI独角兽手中。在B站首页,或是在视频的推荐区,你总能看到一个名叫“Kimi AI智能助...
马斯克搬家,竟然是新时代“冷战”?
硅谷最近又吵起来了。起因是8月7日,人工智能领域的大拿们写了封联名信,支持加州议会的一项AI监管法案。人工智能大咖纷纷支持加州的人工智能法案,作者依次...
特朗普持枪火拼、哈里斯扮作小丑……发布不到一天的Grok 2,摊上大事了
Grok 2,你是懂如何背刺自家老板的。Grok 2 刚发布不到一天,就摊上事了。事情是这样的:昨天,马斯克旗下的 xAI 发布新一代大模型 Grok 2,并称已与初创公司...
字节跳动上线即梦AI,正式打响文生视频工具之战
今年年初,OpenAI突然扔出了一颗深水炸弹——文生视频大模型Sora,它不仅能生成一分钟的连贯、高清视频,且具有极强的仿真能力,也展现出了对物理世界的初步理...
Mamba再次挑战霸主Transformer,首个通用Mamba开源大模型一鸣惊人
TII开源全球第一个通用的大型Mamba架构模型Falcon Mamba 7B,性能与Transformer架构模型相媲美,在多个基准测试上的均分超过了Llama 3.1 8B和Mistral 7B。今...
再见,Devin,基于GPT-4o,最强”AI工程师“Genie诞生
AI编码的桂冠又易主了,Genie超越Devin,成为了地表最强的「AI软件工程师」,Genie不是一个编程助手,而是一个能够自主思考的「同事」,与你并肩作战。不知道...
”AI数据荒“雪上加霜,MIT:网页数据的公开共享正走向衰落
人工智能系统依靠充足、高质量的训练数据来获得高性能,但MIT等机构最近的一项研究发现,曾经免费提供的数据在多个方面变得越来越难获取。随着GenAI产品开发...
换掉Transformer,7B开源模型立刻登顶,任意长序列都能处理
只是换掉Transformer架构,立马性能全方位提升,问鼎同规模开源模型!(注意力机制不存在了)这就是最新Falcon Mamba 7B模型。它采用Mamba状态空间语言模型架...