图博数智
AI技术

蚂蚁Ling-2.6开源了,企业自建AI Agent还远吗

· 图老师

4月30日,蚂蚁集团开源了Ling-2.6-1T,万亿参数,支持100万token上下文。同时开源的还有Ling-2.6-flash,一个轻量版MoE模型。两天时间,Hugging Face上下载量就炸了。

很多人问我:图老师,又一个开源大模型,跟企业有什么关系?

关系大了。这次的开源重点不在参数量,而在它专门为Agent任务做了优化。蚂蚁管这叫"快思考"——同等任务质量下,用的token只有同类模型的四分之一。对企业来说,这意味着自建AI Agent的成本门槛又降了一截。

开源Agent模型意味着什么

先说结论:企业自建AI Agent,以前最大的成本卡在两个地方——模型能力不够强,推理成本太高。

Ling-2.6-1T的"快思考"机制解决的是第二个问题。Agent任务和普通的问答不一样,它需要多步推理、调用工具、反复验证,一次任务可能要跑几十轮。如果每轮都要消耗大量token,成本就扛不住。

蚂蚁的方案是:用更少的token完成同样的任务。对API用户来说直接省钱,对私有化部署的企业来说,意味着用更低的硬件成本就能跑起来。

同时开源的Ling-2.6-flash更实用——104B参数,激活参数只有7.4B,提供了BF16、FP8、INT4三个版本。说白了,企业可以根据自己的硬件条件选:有高端GPU的跑BF16,硬件有限的跑INT4量化版。

开源 Agent 模型把企业自建门槛往下压

企业Agent落地,模型已经不是瓶颈了

坦白讲,我们做企业AI Agent项目最大的感触是:模型能力早就够了,瓶颈在数据和流程

举个真实的例子。我们帮一家制造企业做AI报价比对Agent——自动抓取供应商报价单,提取关键参数,跟历史数据对比,标记异常价格。技术上用Ling-2.6-flash这种级别的模型绑绑有余,准确率能做到95%以上。

但上线前花了最多时间的不是调模型,而是:

  • 清洗三年的历史报价数据(格式不统一、字段缺失、单位混乱)
  • 对接三个不同的ERP系统接口
  • 设计异常价格的判断规则(什么算"异常",每个品类的标准不一样)

模型只占了整个项目工作量的15%。

企业 Agent 落地路径

哪些企业场景最先受益

基于我们的项目经验,以下场景用开源Agent模型做私有化部署,ROI最高:

文档审阅类:合同审核、标书分析、制度合规检查。这类场景数据敏感、需要私有化,开源模型正好。Ling-2.6的长上下文能力(100万token)意味着可以把整份文档和公司制度库一起喂进去。

客服问答类:产品咨询、售后支持、内部IT帮助台。用Ling-2.6-flash做私有化部署,硬件成本可控,数据不出公司。

数据报表类:自动生成分析报告、数据异常预警、定期报表汇总。Agent可以定时触发,自动跑完整个分析流程。

报价/采购类:供应商报价比对、采购方案推荐、成本趋势分析。这类场景需要调用内部系统数据,私有化部署是刚需。

优先做私有化 Agent 的四类场景

开源不等于免费,三个成本别忽略

模型开源了,但企业落地还有三块成本要算清楚:

硬件成本。Ling-2.6-1T是万亿参数,私有化部署需要多张A100或同等算力。如果硬件条件不够,先用Ling-2.6-flash的INT4版本,硬件门槛低很多。

数据准备成本。前面说了,Agent项目的最大工作量不在模型,在数据。企业的文档、报表、历史数据不整理好,再强的模型也白搭。这块投入往往占项目40%以上的工作量。

流程改造成本。Agent不是"装上就能用"的工具,它需要嵌入到现有的业务流程里。哪些环节由Agent自动执行,哪些需要人工确认,异常情况怎么兜底——这些都要提前设计好。

图老师的建议

如果你正在评估企业AI Agent方案,我的建议是:

别急着选模型。先花一周时间,把公司里最适合做Agent化的三个场景列出来——标准是:数据已结构化、流程可定义、人工确认环节少。

然后评估一下数据准备的工作量。如果数据干净、流程清晰,用Ling-2.6-flash这类开源模型做私有化部署,成本会比你想象的低很多。

如果不确定怎么选场景,可以找我们聊聊,帮你做个Agent场景评估和成本测算。

添加图老师微信

高校科研 AI 交流群

企业 AI 落地交流群

先进团队正在用的 AI 落地方案

判断您的业务里哪些环节已经适合用 AI 替代?