Agent交卷时刻:企业如何跨越“一把手工程”信任关?|甲子引力
甲子光年,2025-12-17 19:27:06
![]()
![]()
五位AI企业负责人直面核心矛盾。
在AI加速渗透各行各业的今天,AI Agent已从炙手可热的概念,迈向价值验证的关键十字路口。它究竟是企业降本增效的利器,还是驱动增长的新引擎?在落地过程中,又面临哪些信任、成本与习惯的深层阻力?
12月3日下午,在2025甲子引力年终盛典中,甲子光年智库院长宋涛作为主持人,对话卓世科技创始合伙人&COO李伟伟、红熊AICEO温德亮、深度原理COO张露阳、蚂蚁数科AI原生科技总经理王磊、零一万物企业解决方案技术负责人王猛,围绕《智能体社会:人与AI共创的产业秩序》这一主题展开了深入探讨。
在这场对话中,零一万物王猛直言,智能体经济时代,Al Agent是推动企业转型的关键执行者,正在重塑以结果为导向的新质生产力:从降本到核心应用增效。同时,AI必须深入核心业务场景,才能成为驱动实际增长的关键引擎;蚂蚁数科王磊则强调金融场景的“风险可控下的价值创造”,严守严谨、专业、遵从的底线;深度原理张露阳从科学研发视角出发,强调AI的长期价值在于提升“创新斜率”,而不仅是优化效率;红熊AI温德亮分享了在客服与营销场景中实现商业化闭环的实战经验,其关键在于通过“记忆”机制解决个性化与准确率难题;卓世科技李伟伟则点明Agent落地需跨越“信任、习惯、费用”三重障碍。
这些观点共同揭示了一个趋势:AI Agent的价值正从技术能力转向真实的商业产出——它必须深入业务,解决问题,并交出可衡量的价值答卷。
以下为本场圆桌的文字实录,经「甲子光年」编辑,在不改变原意的基础上略有删改。
宋涛(主持人):感谢各位嘉宾的到来,先请各位嘉宾简单的用一句话做自我介绍,介绍一下个人和你们的公司。
王猛(零一万物企业解决方案技术负责人):我在大模型独角兽公司零一万物在负责打造万智企业大模型一站式平台,这是一款端到端的平台型产品,覆盖从模型训练、工具链构建到应用开发的全链条。核心目标是推动大模型深入企业核心生产场景,在核心业务系统中创造真正价值。
![]()
王磊(蚂蚁数科AI原生科技总经理):大家好我是王磊,来自蚂蚁数科,蚂蚁集团科技商业化的独立载体,去年四月开始独立运营。我们会把蚂蚁集团多年沉淀的科技产品及解决方案(包括底层的智算调度以及金融大模型、金融智能体、金融知识工程等)面向产业进行输出。
金融领域是我们的锚点,而非终点。我们也将这些能力拓展至其他注重严谨性的行业,比如能源、电力、工业制造、出行与交通等,与各行业共同打造解决方案,共享数字化与AI智能化带来的红利。
![]()
张露阳(深度原理COO):我是张露阳,来自深度原理,我们是2024年成立于杭州的AI For Science公司,主要运用AI模型和智能体去解锁新材料和科学发现。
![]()
温德亮(红熊AICEO) :大家好,我是红熊AI的创始人兼CEO温德亮,我们这家公司是通过AI+原生应用的方式,通过Agent重构客服、营销、教育整个商业板块。
![]()
李伟伟(卓世科技创始合伙人&COO):我是卓世科技的创始合伙人李伟伟,卓世科技一共做三件事:
第一件事,在做行业垂类模型。
第二件事,给学校或者有能力搭Agent的企业,提供Agent和MaaS工具。
第三件事,在工业、企业,包括大健康方向,会提供人工智能的应用超市,他们没有办法自己做技术,我们会提供应用。
![]()
1.AI Agent的价值共识与落地之困
宋涛(主持人):第一个问题,Agent在服务企业的时候,到底给企业解决什么问题,帮助他们降本增效、提高人力的生产效率、还是解决怎样样的实际问题?
李伟伟:“降本增效”四个字涵盖广泛,但它背后其实藏着很多元素:
第一,涉及人员岗位的调整。在Agent应用过程中,部分岗位可能被替代,比如助理、法务岗等等;
第二,推动流程优化。尤其在国资、央企包括政府机构中,存在非常繁琐的工作流程。人工智能的介入可以有效优化这些流程。比如要出差,就这一件事背后,会藏着你要去哪里、天气怎样、酒店订什么、机场在哪里、审批报告是什么、预算多少等等,Agent会帮你做所有要做的事。
第三,时间会被优化,大大提升工作效率。所以总结了看似四个字,其实背后藏了1万件事。
温德亮:因为我见过董事长级别的人比较多,大概问过他们很多降本增效最关注什么问题,统一的反馈结论是不太喜欢降本,只喜欢增效,只有公司不行的情况下,才会考虑降本这件事。
因此,在总结“增效”的过程中,我们也总结了一套方法论:
第一,原有的业务流程AI化,AI重构整个业务流程,这并不是每一家企业都能做到的。
第二个逻辑,是强化AI的集成能力,以往的AI+软件、软件+AI的概念是不一样的。但是怎么通过现有的数字化系统,与AI更好地融合、提升原本的业务效率,比如经营效率、决策效率。
第三个逻辑,激活企业的核心数据资产。每家企业在经营中都会沉淀独特的资质与数据,这是很好的数字资产。
所以我们在整个过程当中,其实按照三段式的方法论,来跟客户做完整的交付,从而量变出来整个AI营销和AI客服等产品。
张露阳:我们行业有两个关键点:
第一,客户既想让我们实现降本增效,解决原来人力做起来比较繁琐、效率较低的工作,但是长期来看,更希望我们能解决的是,解决一些原来解决不了的问题。
第二,如果说的抽象一点,客户长期需要在战略层面看到AI能够提升创新斜率,而不仅仅是提升效率。效率是从A到B点速度更快,斜率更多是加速创新进度。
王磊:降本增效是人类发展史中科技进步的代名词,也不是只有AI时代才出现。AI本身也并不是新词。在过去十几年,深度学习发展比较快速,简单来说有三个阶段:
第一阶段是2012年,AlexNet在竞赛中凭借卷积神经网络大幅领先,极大提升了图像识别的速度与准确率,并由此引发了一系列产业变革。如今各类摄像头技术及以视频为核心的科技公司(如海康威视)的兴起,都源于该技术带来的降本增效,但影响还不是很大。
第二阶段是2016年、2017年左右,那个时候大家一定听到一个词叫Alphago下围棋,人类的竞技是棋类竞技的掌上明珠,也被AI攻克了。这说明了AI的决策模型已经比人更精准、更有效。此类决策模型随后被广泛应用于风控、营销等领域。蚂蚁集团的互联网金融产品,比如余额宝、花呗、借呗、网商贷等,之所以能服务这么多用户,不是靠人来服务,正是依靠这些决策模型进行授信决策。
自那2016年场对弈后,人类已不再寻求与机器进行棋类竞赛,这本身也是一种效率的跃升。
当前ChatGPT所代表的大模型阶段,它降本增效的意义在于极大降低了交互门槛。从计算机领域的GUI、API,到如今的LUI(基于语言的交互界面),每一次交互门槛的大幅降低都引发了巨大的产业革命。比如大家都经历过像鼠标、iphone,这些东西的出现,让一些科技巨头倒下,又诞生一批新的科技巨头,所以大模型带来的交互变革已不再是量变,而是质变的过程。
王猛:相信大部分中国企业和CEO最关注的始终是两件事:省钱和赚钱。在我们与企业客户的实际沟通中,降本增效往往得到认可,但真正令客户兴奋的,是实现规模化增长与营收提升——说到底,企业渴望的是真金白银的收益。
2025年,随着推理AI Agent元年的到来,能够自主规划与智能决策的AI Agent正成为企业的真实生产力。为此,零一万物正式推出万智企业Agent——“超级员工”,让Agent进入客户的核心业务系统,其重点从单纯的“降本”转向更根本的“增效”,帮助企业真正迈向价值增长。
海外的情况也是如此,我们在海外服务的一些大型企业客户中,推动增效尤其具有吸引力。
例如,我们合作的一家全球前三的矿业公司,通过引入强化学习技术,我们能够对其开采流程、设备调度与资源分配进行动态优化与自主决策,从而在确保安全的前提下大幅提升产能与资源利用率。
因此,无论境内还是海外,从“节约成本”到“创造增长”,AI Agent 正成为驱动企业核心生产力的关键。而“超级员工”的使命,正是深入业务场景,将智能转化为每一分真实的收益。
宋涛(主持人):在日常观察中,我们注意到一个现象:许多企业认可数字化转型的价值,但为什么他们不愿意数字化转型?同样,在人工智能领域,很多企业都认可人工智能带来的好处,为什么很多企业他们在实际落地的时候还是不太愿意去用,他们不用的原因是什么?我们来听听各位嘉宾的分享。
李伟伟:我的理解用几个关键词来总结一下:
第一,信任。企业主在考虑要不要上人工智能应用时,他其实会考虑我们是不是信任这个应用体、智能体,它是不是真的可以帮我解决我想要解决的繁琐的流程、工作、智能化,所以我觉得它背后藏的是数据和数据安全性。
第二,习惯。企业经营者通常依赖固有的安全惯性推进公司发展。当具有一定规模的企业面临变革甚至革命时,需要投入大量精力去推动、培训与说服,让大家来跟着一起看,但能干成吗?不知道。
第三,费用。因为新的改革一定是有新的投入,无论企业规模大小,决策者需要有明确的意识与预算批准,才能形成推动变革的完整闭环。
所以有障碍还是需要去清除的,但是好在DeepSeek已经横扫了一批,无论是G端还是B端的领导们,他的意识已经被洗的七七八八了,不用再告诉他什么是应用场景、什么是Agent、什么是基模,他已经很清楚了,只是说他刚才那三个方面是不是做好了准备,做好了准备先行先试,我吃好了第一口蛋糕后面就会有发展。
温德亮:因为我最早在集团里面做CTO,大部分的采购预算是经过我手的,这个我可以直截了当代表一个主流群体的观念,这个观念是什么样的呢?
第一,过往的数字化投入已经花了很多钱,花了2000、3000万,但主要成果更多依赖人力运营和业务方的推动,技术实际处于相对弱势和从属地位,企业内仍以业务方为主导。
在实际应用的时候你怎么在数字化基础之上结合AI产生新的效果,你需要跟业务和技术同时证明一件事,这个事是可行的、可做的。
特别是今年,现在的软件应用包括Agent应用出现的时候,还要通过运营、看老板用的好不好、看这个事做的明不明白、底层的数据清不清楚。这个事对于老板来讲,会引发他不好的联想,又回到了当年数字化时代的事,我要先把信息化搞定才能搞数字化,是不是同样的道理?所以对于老板来讲,他怎么会强调一件事?就是你怎么能通过AI能重构我的生产力,直接给我交付结果,这个是我在整个市场上面临最大的一个需求来源。
从结论上来讲,我觉得数字化其实已经构成了对现在AI智能有一定的阻碍,不是升级它,也不是帮助它,是阻碍的。同时中国一窝蜂的数字化、互联网化、各种化,对于老板来讲,你给我结论和结果就好了。
张露阳:在我们这个行业中,主要问题在于客户对产品的期望值存在差异:购买者(如管理者)与使用者(如工程师)的目标往往不同。使用者更关注解决具体工程化问题,而购买者则期望实现突破性成果(例如研发超导材料)。这是我们需要明确定义AI产品与每个阶段对于客户之间的关系。
其次,在从事这个行业之前,我长期从事自动驾驶与AI安全研究,发现各方对“安全可信”的要求不一样:监管机构侧重对工程化实践的安全能力证明,政府部门需要实际路测结果,而最终用户更重视人机交互的透明、可控与可预测性,对于背后可审计、可验证的冷计算过程反而关注有限。这一差异构成了现实挑战,需要行业对安全可信建立共识性标准。
第三,大模型应用于科学发现是比较严肃的一件事,抛开它的可解释性以外,我们是希望不断地逼近物理世界的真相。大模型有的时候有讨好型的人格,你不停地给它加压,说你算的不对,你再算一下,它可能就屈服了,这时候就让一些决策者认为它是否能够给出启发式的Idea,或者是给出反共识的Insight,我朝着那个方向做下去,因为现在实际上的使用体验是它有可能屈服。
王磊:面向AI的方向,中国乃至全球已形成战略共识,一定会去做,我觉得不会有人怀疑我们在这个方向是不是值得投资,或者是不是要做一些取舍。作为一个企业主更多是考量两件事情:
第一,成本。 企业投入AI的实际成本往往难以估量,许多决策者对此缺乏清晰感知。过去几年,不少企业(包括大型国央企和银行)选择通过预训练构建自有行业大模型,但这条路径成本高昂、迭代缓慢(模型更新周期长达3-6个月),且成效有限。这种高投入、慢回报的模式实际上制约了一把手对AI的认知与决心。
今年这一局面因DeepSeek等开源模型的成熟而发生转折。企业发现,基于开源模型(如蚂蚁开源的百灵模型)进行后续精调,效果已超过自研训练多年的模型,且成本大幅降低。这意味着行业已经从大模型的战争收敛到更上层应用的战争,关键在于后训练投入与业务价值产出是否匹配。
第二,价值。 企业需要判断AI是否值得作为未来十年的战略方向进行投入。当前,由于开源模型显著降低了基础成本,企业能够更聚焦于应用层,以可承受的投入实现业务价值闭环。这也解释了为什么今年成为Agent爆发的元年——成本结构的优化使得价值创造具备了现实可行性,企业能够在可控投入下获得可衡量的业务回报。
王猛:我回应一下零一万物独具特色的“一把手工程”,这一直是我们向公众积极传达的理念:企业AI数智化转型必须是一把手驱动的 “一把手工程”。事实上,大模型已经进入到技术拐点,已经变得更加可用、有用、好用,但当前大模型在企业中的渗透率不高,这在很大程度上受限于各行各业企业家的认知与决心。
我们一直想要去推动的是让大模型在企业的核心业务里产生作用,一旦真正产生了作用,大家的体感会马上就不一样,而不再是说大模型只能帮我们做个PPT,这个大家永远感觉不到渗透的。
所以我们的核心目标是怎么建立一把手工程的信任?这个要求是挺高的,需要企业真正有决心把自己的业务流程打开。现在有个问题是企业不懂模型,大模型公司不懂企业自身的核心业务流,所以两方要合作共创。
合作就要求大模型公司提供无论是咨询还是整套的方案,在这个基础上是企业要把自己所有的数据和流程都跟我们分享,这其实是一个比较大的信任门槛。但一旦企业从上到下决定拥抱AI,以“一把手工程”战略驱动,和我们一起定战略、找场景、调模型、搭应用,双方共创重塑价值生产链条,让企业找到增长的新引擎,创造的价值无疑也会是非常可观的。
总之,“一把手工程”是AI公司与传统企业共创新质生产力的最佳路径。
2.嘉宾拆解:AI Agent如何真正“用起来”?
宋涛(主持人):零一万物是在大模型领域的明星企业,你们如何平衡通用大模型能力与企业具体业务场景中专用Agent的落地需求?在推动企业落地过程中,您提到“一把手工程”的重要性。其中通常存在哪些实际卡点或堵点?针对这些挑战,零一万物有哪些可行的解决方案或实践可供分享?
王猛:我们实际上接触了非常多客户,发现难以总结出普适规律,将模型应用到企业核心业务系统的过程可分解为多个步骤,但其中具体挑战因客户差异极大。
在这一探索过程中,我们深刻认识到:要真正解决客户问题,必须构建一个完整、全栈的技术系统。
如果缺乏数据处理能力,很多客户需求将难以落地;如果没有模型训练支持,应用效果便无法精准达标;而若不具备Agent架构设计,则既不能充分发挥模型潜力,也容易使本可简化的流程变得复杂;包括强化学习在内的多项技术,都必须扎实覆盖。
因此,我们的核心经验是:唯有构建一个全面的全栈解决方案,才能从容、灵活地响应各类客户需求。
事实上,行业也在朝这一方向演进。OpenAI推出了AgentKit,零一万物同样布局于此。基于对行业趋势的共识,我们也开源了自己的解决方案——Open AgentKit(简称OAK),与业界同行并肩探索。
我们坚信,只有这样的系统级方案,才能持续创造深度价值。
从战略面上看,零一万物 “一横多纵”战略布局也正是我们探索出的现阶段解法:
一横是指万智平台: 打造以万智2.0为核心的企业级AI操作系统,将Agent研发门槛降至“零代码”,构筑技术护城河。
多纵是指穿透多个垂直领域的政企客户: 聚焦金融、政务、工业(电力/制造)、办公、销售等重点行业群,与灯塔客户共建场景化解决方案,沉淀行业Know-how。
“一横”代表平台和模型的通用能力,“多纵”则是政务、金融、工业、能源、医疗等领域的行业解法。与此同时,零一万物的战略目标也十分明确,那就是让AI能力可复制、可规模化部署,实现企业级“AI交付闭环”。
宋涛(主持人):接下来这个问题想问问我们蚂蚁数科的王磊总,蚂蚁数科其实一直是在业内首推金融Agent的明星企业。在你看来,金融Agent的第一性原理是什么?这和传统的数字化的产品,或者说是办公助手、AI助手有哪些本质性的区别?
王磊:蚂蚁集团本质上是一家拥有核心业务的公司,而非纯粹的科技输出方。我们的核心扎根于金融行业,因此我们对AI的关注首先聚焦于在自身金融场景中的应用与实践。这背后的第一性原理是“风险可控下的价值创造”。
这意味着,对我们而言,AI绝非仅是辅助工具,它必须能够创造实际、可衡量的业务收益。同时,风险可控是金融行业不可逾越的底线,我们必须极度重视安全、合规与系统性风险的防范。这一原则构成了我们技术体系的基石,也是我们将内部验证过的技术、产品与方法论向更广泛的严谨产业进行输出的根本依据。
基于这一原理,我们在金融领域应用AI时,重点关注价值创造与AI的实时性、事实性、金融价值观及合规安全等底层要求。我们将金融行业对AI的核心诉求抽象为三大特性:严谨性、专业性与遵从性。
金融业常被认为与大模型“天生不对付”,因为他们对幻觉与数据准确性的容忍度极低。但我们所强调的严谨性,并不是要求大模型绝不犯错(这如同要求人永不犯错一样不现实),而是指通过后训练、强化学习等技术手段,系统性地压制幻觉,将其控制在业务可接受的范围内。需要指出,模型的幻觉在某种程度上是其智力水平的双刃剑——例如,从千问切换到DeepSeek时,幻觉率可能从5%升至15%,但这并不意味智力下降,有时甚至成正比。因此,严谨性的核心是管理而非消除幻觉。
专业性则要求大模型与垂直领域的专家判断及专业语言对齐。比如,评估一只过去一年回撤18%的基金表现,金融专业人士与非专业人士的结论可能截然不同。专业分析需结合三年期表现(如累计上涨90%)、市场大盘等因素进行综合判断。这类深度专业知识与数据往往无法完全通过预训练注入模型,必须依靠专业知识库来补足。
遵从性超越了一般的技术性“指令遵循”,特指对监管规则与合规红线的严格遵守。这在金融领域是绝对不可触碰的底线。
基于以上三大特性的考量,我们认为,构建一个真正的金融智能体,仅有一个强大的模型“大脑”是远远不够的。一个智能体应如同一个完整的“人”:它不仅需要“大脑”(模型),还需要掌握高辨识度的数据、专业的领域知识与经验,并配备实用的“工具”来真正解决问题,而非仅仅进行对话或情感陪伴。比如,在金融场景中,智能体应能协助生成资产配置报告,完成实质性工作。
只有当智能体融合了“大脑”、知识经验(高辨识数据)与工具(执行力),它才能成为一个真正可用的“数字员工”。这也正是我们认为今年将成为智能体爆发元年的关键原因——智能体真正从原来的助理Copilot,变成数字员工的跃迁之年。
宋涛(主持人):下面想问深度原理的张总,你们有化学材料研发的专用Agent,这里面客户愿意付费的原因是什么?核心动机是什么?你们帮助客户解决了哪些化学材料研发方面的业务难题?
张露阳:作为一家To B企业,最重要的还是长期陪伴客户成长,并针对客户短期、中期与长期的不同需求提供持续价值。
短期价值体现在通过智能体帮助客户解决那些长期存在、繁琐复杂且短期内难以攻克的问题。例如,利用算法与智能体能力,在数月内协助客户完成材料改进、预测新配方关键性质,并实现实验验证闭环。短期合作重点关注:能否切实解决复杂问题、是否显著缩短研发周期,以及是否提高单个项目的人效比。其核心在于,以更高效、更智能的方式为客户创造即时、可感知的价值。
中期价值则扩展到多个项目乃至整体管线中。
关键在于评估智能体方案能否持续提升每个研发或决策流程的成功率,以及是否具备足够的鲁棒性以抵御突发风险、减少潜在损失。中期阶段需要算“整体账”,衡量智能体带来的成功概率提升与风险控制能力,是否为企业产生了明确的净正向收益。
长期价值着眼于根本性的创新效能提升。通过从短期试点到中期扩展,再到全面深化的合作,最终目标是帮助客户提升研发创新的“斜率”——即加速创新效率、改变价值增长曲线,实现可持续的、跨越式的能力进阶。
宋涛(主持人):下面想问红熊AI的温总,你们服务了很多B端企业,在哪些业务场景中实现了商业化的闭环?你们如何平衡企业在通用场景和专业能力方面的需求?
温德亮:在服务B端商业化场景中,主要涉及客服和营销两个方面。以客服为例,客服本身并非标准化产品,因为每家企业拥有各自的知识体系和业务流程。比如,在处理投诉时,不同企业的关注重点和低满意度处理方式都不一样。
所以,在提升业务准确率和正确率的过程中,我们尝试了多种解决方案,包括参数调优、外挂知识库、业务流程优化以及工作流控制等,但发现准确率、业务精准率以及幻觉率仍难以有效控制。为此,我们研发并开源了名为“记忆科学”的产品,即“记忆熊”。
这款产品的主要目的就是让Agent和模型拥有人一样的记忆能力,通过这种方式,在服务场景个性化能力上来讲,追逐于每一个人的数据记忆,用这种方式处理。
在处理整套方案的时候,我们今年的业务营收,一是AI自助解决率大幅度跃升,现在是98.4%左右,应该算是行业里面指标比较靠前的;二是幻觉率,通用的是0.2%,如果是垂直环境下的幻觉率,基本可以压缩在零或者无限接近零的手段,所以从商业化进程来讲还是比较可观的。
宋涛(主持人):李总,今天的主题是构建一个智能体的社会,那么我们要想真正实现人与智能体的共创,未来还有多长的路?还有哪些难题需要解决?
李伟伟:有几个关键词便于大家的沟通和理解。
第一,懂人。智能体需与人交互,在交互过程中理解人所发出的指令,才能进行回答。懂人这一点十分重要,无论在中小微企业还是央资国资,都存在大量应用场景和垂类领域,如工业、大健康、康养、医疗等。在每个特定场景中,都需要实现人与机器的交互。
第二,懂事。要在行业或应用场景中不断理解其中的Know-How,需要对行业具备充分认知。拥有这些认知、数据和语料库,才能持续完善智能体。
此外还需具备三种能力:
1.自我学习能力,形成类似肌肉记忆的机制。通过ToB、ToC或ToB与ToC结合的方式,持续借助数据循环、问答循环实现能力再造,巩固自身记忆与反应。
2.逻辑推理能力。当被提问时,智能体需经过一系列逻辑推理得出结果。这一过程需要充分理解人、事、数据以及整个应用场景,才能有逻辑地进行数据运算,最终输出合理结果,避免无根据的推断。
3.多模态能力。能够接收音频、视频、文字、图片等多种形式输入并进行处理,同时也可输出这些模态的内容,因此多模态能力也十分重要。
宋涛(主持人):今天几位嘉宾的分享,从不同的层面给大家去做了解析。
第一,解析Agent能够帮助企业解决什么样的问题。
第二,帮助大家简单分析了企业在解决问题的过程中遇到了哪些困难。每位嘉宾也结合企业的特点,给大家简单的分享了一下,企业在做解决方案落地的成功经验,一些实践的好方法,希望我们今天的探讨,能够对行业的发展有一定的帮助。
今天的圆桌论坛到这里结束,再次感谢五位嘉宾的精彩分享,谢谢大家!
(封面图及文中配图来源:2025甲子引力年终盛典)