蚂蚁Ling-2.6开源了，企业自建AI Agent还远吗

4月30日，蚂蚁集团开源了Ling-2.6-1T，万亿参数，支持100万token上下文。同时开源的还有Ling-2.6-flash，一个轻量版MoE模型。两天时间，Hugging Face上下载量就炸了。

很多人问我：图老师，又一个开源大模型，跟企业有什么关系？

关系大了。这次的开源重点不在参数量，而在它专门为Agent任务做了优化。蚂蚁管这叫"快思考"——同等任务质量下，用的token只有同类模型的四分之一。对企业来说，这意味着自建AI Agent的成本门槛又降了一截。

开源Agent模型意味着什么

先说结论：企业自建AI Agent，以前最大的成本卡在两个地方——模型能力不够强，推理成本太高。

Ling-2.6-1T的"快思考"机制解决的是第二个问题。Agent任务和普通的问答不一样，它需要多步推理、调用工具、反复验证，一次任务可能要跑几十轮。如果每轮都要消耗大量token，成本就扛不住。

蚂蚁的方案是：用更少的token完成同样的任务。对API用户来说直接省钱，对私有化部署的企业来说，意味着用更低的硬件成本就能跑起来。

同时开源的Ling-2.6-flash更实用——104B参数，激活参数只有7.4B，提供了BF16、FP8、INT4三个版本。说白了，企业可以根据自己的硬件条件选：有高端GPU的跑BF16，硬件有限的跑INT4量化版。

开源 Agent 模型把企业自建门槛往下压

坦白讲，我们做企业AI Agent项目最大的感触是：模型能力早就够了，瓶颈在数据和流程。

举个真实的例子。我们帮一家制造企业做AI报价比对Agent——自动抓取供应商报价单，提取关键参数，跟历史数据对比，标记异常价格。技术上用Ling-2.6-flash这种级别的模型绑绑有余，准确率能做到95%以上。

但上线前花了最多时间的不是调模型，而是：

模型只占了整个项目工作量的15%。

企业 Agent 落地路径

基于我们的项目经验，以下场景用开源Agent模型做私有化部署，ROI最高：

文档审阅类：合同审核、标书分析、制度合规检查。这类场景数据敏感、需要私有化，开源模型正好。Ling-2.6的长上下文能力（100万token）意味着可以把整份文档和公司制度库一起喂进去。

客服问答类：产品咨询、售后支持、内部IT帮助台。用Ling-2.6-flash做私有化部署，硬件成本可控，数据不出公司。

数据报表类：自动生成分析报告、数据异常预警、定期报表汇总。Agent可以定时触发，自动跑完整个分析流程。

报价/采购类：供应商报价比对、采购方案推荐、成本趋势分析。这类场景需要调用内部系统数据，私有化部署是刚需。

优先做私有化 Agent 的四类场景

模型开源了，但企业落地还有三块成本要算清楚：

硬件成本。Ling-2.6-1T是万亿参数，私有化部署需要多张A100或同等算力。如果硬件条件不够，先用Ling-2.6-flash的INT4版本，硬件门槛低很多。

数据准备成本。前面说了，Agent项目的最大工作量不在模型，在数据。企业的文档、报表、历史数据不整理好，再强的模型也白搭。这块投入往往占项目40%以上的工作量。

流程改造成本。Agent不是"装上就能用"的工具，它需要嵌入到现有的业务流程里。哪些环节由Agent自动执行，哪些需要人工确认，异常情况怎么兜底——这些都要提前设计好。

如果你正在评估企业AI Agent方案，我的建议是：

别急着选模型。先花一周时间，把公司里最适合做Agent化的三个场景列出来——标准是：数据已结构化、流程可定义、人工确认环节少。

然后评估一下数据准备的工作量。如果数据干净、流程清晰，用Ling-2.6-flash这类开源模型做私有化部署，成本会比你想象的低很多。

如果不确定怎么选场景，可以找我们聊聊，帮你做个Agent场景评估和成本测算。

图博数智介绍