4800个大模型团队竞逐「产业真题」，这场金融科技大赛火出圈了

news2年前 (2024)发布曾哥的AI世界

296 0 0

今年 7 月，一份《全球数字经济白皮书 (2024)》统计显示，全球目前已有 1300 多个基础大模型，美国的数量最多，中国紧随其后排在第二。

这一数字对比说明，在大模型这张「牌桌」上，中美是最具实力的两个玩家。曾经，中国奋力追赶「OpenAI 们」，两年之后我们可以看到，国产大模型在技术层面已抵达全球第一梯队。

而在这个过程中，圈内玩家逐渐分化出两条路线：一派继续卷性能，一派专注搞应用。

国内的优势恰恰在于产业场景极其丰富，落地空间极其广阔。面向大模型的下半场战事，业界普遍认为，中国将在应用层展现出更强的后劲。

目前的核心问题是，如何让大模型技术尽快与更多真实的产业场景连接起来。

从何处入手？一是精准定位最需要大模型的产业场景，二是找到能解决这些真实场景问题的人才。

一场直面「产业真命题」的技术赛事

我们熟悉的大模型落地案例更多发生在对话、作画、视频等方向，但其价值远不止于此，大模型同样可以深刻改变城市发展、金融科技、生物医药、工业制造、科学研究等领域。

已连续举办两届的 AFAC 金融智能创新大赛，正在成为国内大模型人才竞逐金融产业真命题的赛场。

AFAC2024 金融智能创新大赛(以下简称 AFAC2024 大赛）以金融行业内真实案例及海量真实数据为牵引，鼓励参赛者直面金融产业真命题，探索最具挑战的创新模型和算法。在去年赛制的基础上，AFAC2024 大赛对比赛形式进一步升级，在「挑战组」之外新增了「初创组」和「企业组」，形成了涵盖算法赛、应用赛和创业赛的综合赛制架构。

蚂蚁集团副总裁、蚂蚁金融技术委员会主席王晓航表示，举办 AFAC2024 大赛的出发点之一就是集聚、培养优秀科技人才、开展高水平合作交流。

同时，大赛设立了丰厚的奖金池，并为选手提供了配套的技术支持，吸引了数千个极具潜力的大模型团队参与。值得注意的是，选手们可以基于蚂蚁开源的 agentUniverse 多智能体框架，对多智能体协作模型进行开发定制，轻松构建智能体应用，节省更多精力以专注于破解产业命题。

3 个月，4882 支队伍的技术探索，让这场比赛「卷」出了新的高度。中国最顶尖的一批大模型人才围绕金融场景下的众多产业真题，贡献了众多前沿解决方案。

「我们始终相信通过科技的力量可以带来更多微小而美好的变化，我们期待 AI 能让高质量的金融服务惠及每一个人，让更好的金融产品进入千家万户，成为人们生活中的一部分。」王晓航表示，「人工智能技术的作用和价值不应仅限于研究和模型能力，更应产生更大的应用价值，就像扫码支付一样能够进入千家万户，进入每一个行业。」

接下来，让我们来看看三个代表团队的技术创新故事。

什么样的金融研报生成应用，能从六百多支队伍脱颖而出？

「拥抱 AIGC」团队的三位成员有很多共同点：都就读于浙江大学软件工程专业，都是硕士二年级的研究生，甚至住在同一个寝室。除了研究方向不太相同：三人分别选择了计算机视觉、数据治理与大语言模型、时空数据作为主攻方向。

队长高天弘曾参加过首届 AFAC 大赛，关注到 AFAC2024 大赛启动之后，他决定拉上室友再挑战，尽管「金融智能」对于三人来说是有些陌生的领域。

一番深思熟虑之后，他们选择了「AIGC 金融多模态研究报告智能生成」这个赛题。团队需要将大模型技术和金融数据深度融合，提出有创新价值的金融研报生成智能体解决方案，并应用于实际场景。

大模型的通用能力在不断进化，但要想解决高水平问题，还要靠行业知识的进一步积累。纵观当前的各类对话式 AI 应用，生成真实、有用、高水平的研究报告仍然是一项极具挑战性的任务。特别是对于金融这种专业门槛极高的领域，数据时效性、长文本总结、图表生成等都是其中存在的挑战。

如何有效攻克？特别是在赛题发布后，留给团队完成方案设计的时间并不算多。

针对上述问题，他们设计了一个面向金融研报生成的多智能体协同框架。具体来说，这个框架包含三层：多元数据来源、金融研报生成智能体 Agent、多源大语言模型。

与传统的对话系统不同，协同的智能体具备任务规划和执行能力，能够在无需人类干预的情况下自动处理复杂问题，包括生成研报：

4800个大模型团队竞逐「产业真题」，这场金融科技大赛火出圈了

其中，团队以 FinGPT-Forecaster 为基础，结合 LoRA 微调，训练了一个用于投资评级分析的股价预测大模型，克服了 ChatGPT 预测含糊和数据隐私问题，提供了可解释的预测结果。

4800个大模型团队竞逐「产业真题」，这场金融科技大赛火出圈了

为了更高效地筛选金融数据，同时保证实时性和专业性，团队设计了一套多源检索增强方案。在检索获得行情、研报、股价等信息之后，首先针对走势图、PDF 研报等多模态数据进行预处理，突破单模态分析的局限性，使市场波动更直观呈现。然后从相关性、市场敏感性、可靠性、时效性多个维度出发，使用基于 LLM 的重排器进行排序优化。在这个过程中，作为赛事主办方之一，蚂蚁集团提供了新闻信息助手 API ，保证了数据收集的实时性，也大大减少了数据处理的工作量。

4800个大模型团队竞逐「产业真题」，这场金融科技大赛火出圈了

最终，这一方案在同赛道的六百多支队伍中脱颖而出，夺得冠军。获奖之外，三位成员通过这次比赛也学会了如何理解现实中的产业需求，又如何面向真实产业场景制定具备可行性的方案。

4800个大模型团队竞逐「产业真题」，这场金融科技大赛火出圈了

他们更加深刻地体会到大模型与传统 AI 研究的巨大差异。此前的 AI 模型基本面向具体任务而设计，仅用少量数据训练就可达到目标性能。相比之下，从底层训练的角度说，大模型对数据、算力的要求已经实现了指数级增长，对训练大模型的人的创新能力要求显然也更上一层楼。

用大模型打造「一对一」旅行智能助理

在「初创组」的赛场上，「智游幻境 Odyssey Agent」团队的成果让评委们印象十分深刻。

这个团队由五位热爱旅行的年轻人组成。众所周知，旅行的回忆是美好的，但旅行前的规划是千头万绪的。出行的人常常花费大量时间辗转于各个平台之间，获取信息、制定行程、预定服务，如果涉及出境游难度更甚。

以 Gemini、ChatGPT 为代表的对话式 AI 应用，也具备提供旅行信息推荐的能力，但往往只有「第一次可用」。很多时候，如果我们继续追问，后续对话可能很难与前面所谈行程保持一致。而且这些基本只能集成单个平台的信息，无法做到有效整合旅行过程中全部所需信息。

能不能做一款提供一站式定制旅行服务的大模型应用呢？五个人一拍即合，决定打造一个「旅行规划智能助理」。尽管团队中有几位成员在大厂的工作非常忙碌，但他们还是利用业余时间快速打造出了这个项目的雏形。

4800个大模型团队竞逐「产业真题」，这场金融科技大赛火出圈了

具体来说，他们参考 agentUniverse 多智能体框架的交互模型设计思路，针对旅行场景搭建了一套多 Agent 协作体系：「CHaTS」（Consult，Hotel and Transportation，Spots）。

生成一个七日行程平均要调用大语言模型 50 余次，能在 3 到 5 分钟内返回一个城市的旅行规划和游记 Vlog。对于用户来说，最大的体验提升就是推荐的攻略细节真的更丰富了。

4800个大模型团队竞逐「产业真题」，这场金融科技大赛火出圈了

由于涉及到多个大语言模型生成机制，为了避免前后行程矛盾、关键信息的遗忘以及 token 长度和整体成本问题，团队引入了共享记忆和 tool memory 机制。具体来说，他们将相关工具的执行结果（比如机票 / 酒店查询结果、每日景点推荐），在简单地预处理后进行本地存储，或者通过 Qwen 模型的 File 编码的形式存储在云端，降低了频繁调用工具造成的时间和经济成本，也避免了模型在重新推荐时产生幻觉或者矛盾冲突。

尽管目前的「智游幻境」还处于早期版本，却恰好展示了大模型在旅行类应用赛道的想象空间。团队表示，未来的「智游幻境」可以引入更强的大模型、更多的模态、更丰富的场景。比如通过 VR/AR 设备、无线耳机、摄像头等设备的联动，这款应用可以变为一个能看、能听、能说的「导游」，带来更沉浸的旅行体验。

从观光推荐到实时翻译服务，这样一款应用真的有可能彻底改变旅行者与世界互动的方式。