专家知识 x 技术放大：我在B端智能体落地一线的万字真实复盘

再来聊聊B端智能体落地这件事。

这篇文章是我这两年所思、所闻、所感最全面的一个复盘。不是教科书，也不是成功学，就是一个在一线摸爬滚打的人，把看到的真实情况和踩过的坑分享出来。

我会从几个维度来拆解这件事：先从市场现状聊起，然后说清楚什么是智能体，接着聊B端落地的核心问题——为什么说专家知识比技术更关键，为什么工作流比自主Agent更靠谱，哪些场景真正能落地。

后半部分更主观一些：大B和小B的交付逻辑完全不同，搞混了会死得很惨；现阶段如何构建竞争优势，微调、硬件、专家标注哪个更重要；最后聊聊未来趋势，为什么说"谁会搭工作流"不是核心竞争力。

很主观、很片面，万字长文预警，仅供参考。

一、我所见到的智能体落地的B端市场

最近两年，我一直在智能体落地这个赛道上摸爬滚打。

从最初在扣子平台上瞎摸索，做到平台TOP10的开发者，开始接一些小B的定制单。再到后来入职一家专做B端落地的公司，全职服务企业客户。可以说见证了从小B到大B的不同需求，也踩过了各种规模客户的坑。

目前主要服务央国企和行业头部公司，行业集中在金融和能源化工两个方向。从这些项目里，我看到了一些很有意思的现象。

1.1 企业采购的两种典型路径

从采购和落地形态上看，企业大致分成两类：

A类企业：先买平台，再顺带买几个智能体
典型路径是技术部门牵头采购低代码平台（类似扣子、Dify这类），目标是建一个"集团内通用底座"。采购完成后，业务部门各自拿平台试着搭场景。

实际结果往往不尽如人意。场景非常浅——翻译、OCR、小知识库、简单问答，基本都是入门级应用。工作流节点少、调用链短，几十万买的平台能力只发挥了一点点。更要命的是，业务人员缺乏专家流程和评估标准，导致系统"能跑"但"不好用"。

这类企业不是没投入，而是投入位置不对——买了底盘，却没人会开车。

B类企业：不买平台，直接买智能体项目
这类企业又分成两个极端。

一种是保守派，他们特别务实。从小场景、试验性场景切入，比如在OA系统里集成语音交互功能，让员工用自然语言发起请假、差旅申请。这类客户是最成熟的——先从简单可控的点开始，验证效果后再逐步深入，一点点探索AI的边界。风险可控，容易形成正循环。

另一种是激进派，这类人同样愿意买单，但边界感为零。他们会要求智能体做模型根本做不了的事，比如产品推荐、策略决策，把算法系统和LLM混为一谈。或者把"知识库正确率95%"当作理所当然的目标，却不理解数据质量、检索策略、评价口径这些前提。最让人头疼的是，他们不愿意向流程里投放专家时间，却要求产出达到专家级别。

这类客户交付风险极高，项目常常变成"许愿池"，不是工程。

1.2 市场的真实问题

把这些现象压成一句话：企业端的真实问题不是"缺技术"，而是"缺对能力边界的清醒认识、缺把专家流程写进系统的能力"。

你只要在交付现场待过，就会发现这才是决定项目成败的总开关。技术反倒是相对简单的部分——大模型能力摆在那里，工作流平台也很成熟。难的是如何让企业理解AI能做什么、不能做什么，如何把他们脑子里的专家知识变成可执行的系统流程。

这就是B端智能体落地的现状——机会很大，坑也很多，关键看你能不能找对路径。

二、"好用、能落地"的智能体本质：专家知识 × 技术放大

企业里真正能用起来的智能体，本质只有一件事：把"专家做事的套路"变成"机器可稳定执行的流程"，再用技术把它放大到规模化、低成本、可运维的水平。你可以把它压成一个公式：

好 Agent = 专家知识（业务SOP/判断标准） × 技术能力（提示词/工作流/工具/系统集成）

注意这里是乘法，不是加法。任何一边是0，整体就是0。

2.1 专家知识是什么

很多人以为专家知识就是"资料很多"或"懂行业术语"。错了。真正能落到智能体里的专家知识，是两类东西：步骤拆解和完成标准。

首先是步骤拆解（SOP）。专家知道这件事要按什么顺序做，为什么要这么做。比如法务审合同，外行觉得就是"读一遍合同"，但专家有固定的检查路径——先看主体信息是否完整、是否匹配，再看关键权责与违约边界，然后审付款与交付条件，接着查争议解决条款，最后评估风险兜底与补救路径。这些检查点和顺序就是SOP的骨架，缺一个环节都可能出问题。

其次是完成标准（验收口径）。专家不仅知道要做什么，更知道什么结果算"合格"、什么算"有风险"。还是拿尽调报告举例，专家不仅知道要抽取哪些字段，还清楚哪些字段缺失就不能出报告、哪些数值异常要触发风险提示、哪些结论必须保守表达。如果没有这套验收口径，智能体输出了你也无法判断好坏，只能凭感觉。

所以专家知识不是"文档堆砌"，而是"可操作的套路+可验收的标准"。没有这两样，你的智能体就是个玩具。

2.2 为什么专家知识比技术更关键

企业项目里，技术往往不是第一难点。真正让项目死掉的，是"没人能讲清楚怎么做、做成什么样算好"。

没有专家，你连流程都拆不出来。不知道先做什么、后做什么，就只能丢给模型"自由发挥"。但所谓"自由发挥"在B端等于"不可控、不可交付"。客户要的是确定性，不是创造性。

没有专家，你也没有评估体系。很多人做知识库问答，觉得能回答就算成功。但企业要的是精确的质量控制——这个答案到底是60分还是95分？哪些问题必须100%命中？错一次会造成什么损失？没有专家标准，你只能靠感觉，项目一定崩。

没有专家，提示词也写不出来。提示词不是文学创作，是把专家脑子里的检查表、优先级抽象成方法论，然后写成机器能执行的语言。你让一个不懂业务的人写提示词，就像让一个不会做菜的人写菜谱，写出来也是废纸。

这就是为什么很多技术团队做B端项目失败——他们有技术但没有专家，就像有发动机但没有方向盘，车再好也开不动。

2.3 有了专家也未必好使——两个隐藏的大坑

当然，有了专家也不一定好使，这里头有两个逻辑。

第一个坑：专家不愿意配合

企业专家是不愿意配合的，道理很简单——我把能力交给了AI，就稀释了我在公司的稀缺性，这不是给自己找麻烦吗？

理想很丰满：我们出技术能力，B端企业出专家知识。但实际愿意这么配合的企业少之又少。

企业的想法是："老子花了钱，你就得把事儿办好，不要总是麻烦我。"

第二个坑：专家讲不清楚

即便B端的专家愿意配合，他也很有可能讲不清楚。这是最隐蔽的坑——"知识的诅咒"。

专家做了太久，很多判断已经内化成直觉和肌肉记忆：

你问他"为什么要先看这个字段"，他说"我就是习惯先看"
你问他"什么情况算风险"，他说"看多了就知道"

这种隐性知识如果不经过结构化引导、反复拆解、多轮验证，永远进不了系统。

所以这类B端项目里，有大量时间不是花在写代码，而是花在"帮专家把自己的经验，翻译成可执行的步骤和标准"上。

2.4 两条路径：横着切还是竖着切

如果你真想把智能体落地这个事儿做好，核心问题是：你有没有专家知识。

作为服务商，我们通常有两种做市场的方式——竖着切和横着切。很多人以为这只是市场策略的选择，其实背后是对专家知识依赖程度的不同。

竖着切（深耕行业）
选择你真正懂的行业，深耕下去。比如你懂金融，就专做金融；你懂制造，就专做制造。

这条路看似市场小，但其实更稳。因为专家知识本身就是壁垒。别人想进来，不是买几个模型API就能搞定的，他得花时间积累行业认知、踩过行业的坑、理解行业的潜规则。你有了行业知识，就能帮客户做得更深，真正深入到他的业务里去解决问题，而不是浮在表面搞些花架子。

竞争也小。因为真正懂行的人本来就少，懂行又懂技术的更少。客户也更信任你——"这个团队是懂我们业务的"，这句话值千金。

横着切（通用场景）
找一些通用场景，比如智能问答、内容生成、报告生成，适用于任何行业。

这条路看似市场更大，所有行业都是你的潜在客户。但问题来了——这是个充分竞争的市场。大家都能做RAG，都能接Deepseek，凭什么客户选你？

更关键的是，横着切其实也需要专家知识。拿智能问答来说，看似都是用RAG技术，但有行业经验的团队知道怎么针对特定领域优化分块策略、怎么设计召回逻辑、怎么做领域词表。没有这些，你的问答系统就是个通用玩具，准确率上不去，客户不会买单。

如果你只有技术能力，没有任何领域专长，那你只能拼服务和产品体验。面对大企业，你得提供更好的服务来构建竞争力；面对小企业，你的产品体验要做到极致。但说实话，这都是苦活累活，利润薄、替代性强。

B端智能体落地，本质是"专家流程工程化"

这句话值得反复琢磨。你不是在卖技术，你是在把专家的工作方式变成可复制的系统。

谁能同时掌握两者，谁就能胜出：

有专家知识：知道什么是对的、什么是好的、业务痛点在哪里
有工程能力：能把这些知识固化成系统、做成产品、规模化交付

只靠技术堆模型、堆节点，最后只能得到一个能跑的Demo。只有专家知识没有技术能力，那就还是传统咨询，效率上不去。两者结合，才能得到企业愿意长期付费的生产力系统。

所以选择很清晰：要么选个行业扎进去，用专家知识构建壁垒；要么在通用场景上做到极致，但也得有某个领域的专长打底。纯技术路线在B端很难走通，这是血淋淋的教训。

三、先分清两类东西——自主规划Agent vs AI工作流

企业落地前先做一个硬切分：你交付的到底是"自主规划型Agent"，还是"工作流型Agent"。这俩不是同义词，交付风险差一个量级。

3.1 自主规划Agent是什么

自主规划Agent的特点是你只给一个目标，它自己拆步骤、自己检索、自己选工具、自己执行。

但在企业级场景下，问题就来了。流程由模型临时决定，意味着不可解释、不可审计。今天跑出来是这个流程，明天可能就变了，输出波动太大。这跟企业要的稳定是相悖的。另外调用链一长，不仅慢，成本还高。

其实目前自主规划型Agent真正稳定可落地的场景其实就两个。第一个是Deep Research（深度调研），把散乱的信息整理成可决策的结构化报告，这个场景GPT还是断崖式领先。第二个是AI Coding（代码生成），因为代码能在工程环境里自我校验，有测试闭环，所以可控性远高于其他场景。

除了这两个场景，自主规划型Agent在B端多数场景还停留在Demo区，不是生产区。

3.2 AI工作流是什么

AI工作流走的是另一条路。人先把专家SOP画好：第1步做啥、第2步做啥、每步输入输出是什么，清清楚楚。模型只是流程里的一个"可替换节点"，按既定链路执行。

这种方式在企业级场景下优势明显。全流程透明可控，每一步都能看到，都能监控。输出稳定，今天跑出来什么样，明天还是什么样。可以分段优化，哪一步效果不好就改哪一步。最重要的是，便于算成本、做权限和审计，这些都是企业必须要的。

3.3 为什么企业端选择AI工作流

AI工作流是现在，自主规划型Agent是未来。

为什么AI工作流成为企业端交付的重点？因为企业要的是可控生产线，不是会即兴发挥的演员。

可控性是第一位的。每一步都是预定义的，出问题能快速定位，这对企业来说至关重要。可解释性同样关键，智能体最终输出这个结果，是因为什么，中间过程是否可以追溯。而且流程固定后，可以针对性地优化每个环节，持续提升效果。

当然，这不是说自主规划型Agent没有未来。等大模型能力更强，再配合像MCP或者Skill这种技能体系，才是我们传统意义上说的"智能体"。但在2025年的现实里，想"稳定、可控地产出价值"，工作流是主力形态。

四、智能体五大落地场景

我把这些年交付里最稳、最常见、最容易形成复利的场景分成五大类。

4.1 场景一：知识库问答

定位是把企业已有的知识、制度、经验变成"24小时可问可答的专家"。

为什么这一类最稳？因为需求天然存在——所有组织都有知识传递、制度解释、内部培训、客户答疑的需求。而且可以从小切入，两三个节点就能跑起来，特别适合试点和扩散。

典型的落地形态包括内部专家库（制度、流程、培训资料）、外部客服库（产品说明、使用手册、FAQ）和学习培训助手（课程资料、讲义、题库）。

但这里有个常见错觉："能回答就行"。实际交付里，70分系统只能算Demo，企业要的是逼近专家水准的稳定性。做到70分很容易，但要到90分极难。

难点集中在几个关键环节。首先是数据清洗，企业端的数据杂乱无章，数量庞大，Word、PDF、Excel、PPT、扫描件、手写笔记，格式五花八门，质量参差不齐。光是把这些数据处理成模型能理解的格式，就够你喝一壶的。

其次是切块策略，你得在语义切块、定长切块、滑动窗口之间找平衡，经常要混搭，靠评测找最优组合。

第三个关键点是Query重写。用户的问题往往口语化、不精准，你得把它改写成更适合检索的形式，这一步对召回质量影响巨大。

然后是意图识别。先对用户Query进行分类，判断他到底想问什么类型的问题，然后路由到对应的知识库。产品问题去产品库，政策问题去政策库，别让系统在无关内容里瞎找。

还有混合检索，把向量检索和关键词检索结合起来，各取所长。向量抓语义相似，关键词抓精确匹配，两者互补才能提高召回率。

除了这些，还有重排序、答案生成、引用溯源等等一堆细节。总之，这个事儿做好了真不容易，70分到90分之间有无数的坑要踩。

4.2 场景二：内容生成（文本/图片/视频）

首先谈营销内容生成，这是生财小伙伴中最关心的场景了，因为什么？因为内容=流量，流量=收入。

内容生成可能是普通人认为最好上手的场景——给个主题，AI就能帮你写文章、做视频，看起来谁都能做一做。但实际想做好，也不容易。

很多人有个误解，以为给大模型一个主题就能自动生产出爆款内容。其实这里边有大量的专家知识和隐性工作。最关键的是选题，一个好的选题决定了内容流量的上限，这个AI帮不了你。选好题之后，怎么找角度去阐述？同样的新闻，有人能找到独特视角，有人只会人云亦云。

接下来是素材补充。观点要有支撑，数据要有来源，案例要贴合实际，这些都需要人工把关和补充。最后还有个大难题——稳定模仿写作风格。每个账号都有自己的调性，有的诙谐，有的严肃，有的接地气，有的很专业。让AI稳定输出符合你风格的内容，也需要很多的精细调教。

所以真正的蓝海在于把这整套流程工程化。企业需求极强但自己做不起来，因为缺的不是AI工具，而是完整的内容生产流水线。典型链路包括选题策划、角度切入、素材收集、风格匹配、排版配图、多平台发布。企业愿意为"能稳定跑起来的内容产线"付高客单，99元工作流在企业眼里只是玩具。

另一个容易被大家忽略的内容生成方向，是结构化内容生成，比如公文、制度、教案这类。大模型天生擅长"八股结构"，你只需要拆结构、填属性、组装输出，把模板做成产品就能批量交付。

4.3 场景三：报告生成

这类场景在金融、政企都极其常见——尽调、贷后管理、周报月报、行业简报、会议纪要，都属于"输入杂乱、输出规范"的任务。

举个实际例子，我之前做了一个监控公众号内容并每天定时推送总结到微信的功能，后面陆续有很多小伙伴找到我。这其实是个特别通用的场景——企业需要做舆情分析、竞品监控、政策跟踪。他们要每天盯着政府网站、招标网站、行业公众号，把散落的信息收集起来，总结成报告，分析哪些对业务有影响，然后再深入了解。

这些活儿对人来说就是脏活累活，枯燥、重复、耗时间，但又不能不做。所以当你帮企业把这件事自动化，价值立竿见影，企业特别容易买单。

典型链路是从多源输入开始，包括表格、数据库这些结构化的，也包括PDF、合同、财报、网页这些非结构化的。然后进行信息抽取与规整，填入模板，最后输出Word、PDF或推送到业务系统。整个过程可以完全自动化，定时触发、定时推送。

企业为什么愿意付钱？因为它直接替掉了"高频、低创造、但必须严肃"的蓝领劳动。而且产出即交付物，ROI可以直接算——原来需要一个人每天花2小时做的事，现在5分钟搞定。

更重要的是，内容总结恰好是大模型最擅长的能力之一。不像其他场景可能需要复杂的推理或创造，总结就是把长的变短、把散的变整、把乱的变有序。所以交付起来相对容易，客户预期也容易达到。

4.4 场景四：内容分析（抽取/对比）

这个也是比较容易交付的一类，把非结构化材料里的关键信息变成结构化数据。

先解释下什么叫结构化和非结构化。结构化信息就是已经整理好、有固定格式的数据，比如Excel表格、数据库记录，每个字段都在固定位置。非结构化信息则是自然形态的文档，比如Word合同、PDF报告、扫描件、邮件，你想要的信息散落在文字段落里。

比如发票自动入账，就很典型，现在基本都是电子发票了，但是会计录入还是手动录入，不仅效率低，还容易出错。我们就做了一个智能体，新文件触发后自动OCR识别、抽字段、汇总到表格，"把发票放入文件夹=自动记账"，对财务线是硬价值。

合同字段抽取是另一个典型的脏活累活。企业有大量历史合同，都是Word或PDF格式，里面的关键信息——甲方乙方、金额、付款条件、违约条款、生效日期等等，都埋在大段文字里。原来需要人工一份份打开，肉眼找到这些信息，再手动录入到ERP或合同管理系统。金融行业要抽管理费率、业绩报酬、锁定期，制造业要抽价格、交付周期、验收标准。现在用AI可以批量处理，几千份合同一夜之间全部结构化入库。

更进一步是合同比对与风险提示。我有个客户是大型集团公司，他们有标准合同模板，下属几十家分公司签合同时会根据实际情况修改模板。按原来的流程，分公司改完发给总部法务，法务需要肉眼比对——哪些条款改了？改成什么样？对公司有什么风险？一份合同可能要看一小时。

现在通过智能体自动完成：上传标准模板和修改版本，系统自动标出所有差异条款，不仅告诉你改了哪里，还会解释每个修改的法律影响。比如"付款期限从30天改为60天，将增加公司资金占用成本约XX万元"，"违约金从5%降到3%，降低了对方违约成本，建议保持原条款"。这类系统，让法务的体力审查量会被砍掉一大截，可以把精力放在真正需要人工判断的复杂条款上。

为什么这个场景稳？任务边界清晰——抽什么、比什么、输出什么都很明确。结果可验证，字段准不准、差异全不全一目了然。

4.5 场景五：自然语言交互

最典型的是NL2SQL（自然语言转SQL查询）。简单说，就是让不懂技术的人也能直接查数据库。业务人员问"上个月华东区销售额是多少"，系统自动翻译成SQL语句，查询数据库，返回结果和图表。

价值显而易见——非技术人员可以直接查看数据，不用给技术提工单排队等待。原来可能要等两天才能拿到的数据，现在30秒搞定。这种项目特别容易拿订单，因为老板最关心数据，天天要看各种报表，所以立项阻力小。

但是，这个场景交付太难了。知识问答做到95%准确率，客户得乐的鼻听泡都出来了，但NL2SQL客户的期望是100%准确。为什么？因为查错一个数据，可能会影响老板决策。你告诉老板"上月利润增长30%"，实际只有3%，这个责任谁都担不起。

我再说另一个场景，可能就适合很多。我遇到一个金融客户，他们选择从辅助功能开始做，先不碰核心业务。比如对接到OA系统，员工可以用语音请假："帮我请明天的事假"，系统自动填表单、走审批。或者查询："我还有几天年假"，"报销单批了吗"。这些场景出错成本低，但确实提升了体验。

这种从边缘切入的策略很聪明——先用低风险场景建立信任，再逐步深入核心业务。

五、定价与交付形态——大B逻辑vs小B逻辑

B端落地做不起来，很多时候不是技术问题，而是交付形态和定价逻辑站错了边。你用卖小产品的方式去卖大企业，死；你用做大项目的方式去做中小企业，也死。两套商业逻辑本质不同。

5.1 大B（大型企业）要的是定制化服务

大B的计价单位是人天、人月或项目制。他们买单的不是那套工作流，而是"交付能力+风险兜底+长期运维"，本质上是在买一个确定性。

大企业的需求特别复杂。他们要结果，但更要过程可控——你怎么做、谁来做、怎么验收、出问题怎么兜底，每个环节都要说清楚。系统必须可解释、可审计、可持续运维，谁用了哪些数据、走了哪些步骤、结论依据是什么，这些都要有据可查。这就是为什么工作流形态在大B天然吃香——透明、可控、可追溯。

安全合规是大B项目的第一约束，不是附加项。数据能不能出内网？模型调用是否可追溯？输出是否有审查机制？这些问题答不好，项目直接黄。

更要命的是，大企业的组织协作成本极高。决策链长、多部门拉扯、需求变更频繁，即使试点成功也可能因为内部博弈而卡死。所以大B项目更像"政治工程+业务工程+技术工程"的叠加，你不仅要懂技术，还要懂组织、懂流程、懂人性。

5.2 小B（中小企业）要的是标准化服务

小B的计价单位是元/月、打包价或套餐化。他们决策快、执行猛、离一线近，但没有余力陪你做长期共建。

这里有个关键洞察：小B现在也不仅仅要产品，他们也希望要服务。但问题是，如果你给小B也提供定制化服务，那就必死无疑——他们支付不起定制化的溢价，你的成本也覆盖不了。

所以给小B的正确姿势是"产品+标准化服务"。产品要能直接跑起来，交付当天就能看到效果。服务要能批量化交付，比如标准化的培训包、最佳实践模板。你可以把培训做成可选包，SAAS产品你可以自己摸索，高级版包含培训和答疑。

5.3 不同客户的切入策略

对大B，要从"最脏最累最固定的体力活"下手。为什么？因为大B内部对"裁人降本"极其敏感，你直接说要替代某个岗位，会触发强烈的组织抵触。正确的话术是找那些没人愿意干、纯体力、错误成本可控的环节，先把这些用智能体顶掉。组织阻力最小，价值也最容易量化。

对小B，直接谈"多产出、多成交、少操心"。小B老板不在意你的技术多先进，他只在乎三件事：能不能帮我多赚钱？能不能让我少干活？能不能马上用起来？你的语言要贴着业务结果走，别讲技术，讲效果。

如果你面向大B，核心竞争力是交付体系、行业专家能力、工程化能力和长期运维能力，你得有团队、有积累、有口碑。如果你面向小B，核心竞争力是场景产品化、模板化、可复制性和上手即用，你得把复杂的东西包装简单，让小白也能用。

两边都想吃，就会两边都吃不动。先选一边打穿，建立根据地，再考虑扩张。很多团队死就死在定位不清，大B的项目用小B的方式做，收不到钱；小B的客户用大B的方式伺候，成本爆炸。记住，这是两个是完全不同的生意。

六、差异化怎么打——微调、硬件、专家标注的壁垒游戏

B端智能体落地过了"能跑"这道坎，现在不仅仅是谁能做出工作流的竞争了。要想有更强的竞争力，必须找到差异化。接下来比的不是谁会搭节点，而是谁能把效果、成本、数据闭环做出结构性优势。

6.1 微调模型：从大模型到小模型的降维打击

现在大家都会用大模型做工作流，但这只是起点。真正的竞争力在于谁能用更小的模型跑出跟大模型一样的效果。

最有效的实施节奏是两步走。第一期全用大模型交付，目标是跑通价值链。用最强的模型把"流程闭环+价值可见"先做出来，不纠结单次成本，重点是让业务看见"这玩意儿真能干活儿"。客户认可了价值，项目就稳了。

第二期是关键——当成本压力出现后，切换到小模型加微调固化。用客户的真实数据做微调或蒸馏，32B级别的模型常常已经够用，部分场景甚至可以在CPU上跑。微调小模型好处也很明显，响应速度更快、体验更稳定、成本显著下降。

这一步的商业价值非常硬。如果你能证明"小模型+领域微调≈大模型效果"，企业会把你当成长期供应商，而不是一次性项目方。因为你帮他解决的是"持续可用的成本结构"，而不只是一个POC演示。

这里的技术壁垒在于微调能力和数据积累。谁的行业数据越多、微调经验越丰富，谁就能用更小的模型达到更好的效果。这是后来者很难追赶的优势。

6.2 硬件闭环：掌握数据源头的终极武器

软件可以被替换，但硬件一旦部署就很难更换。硬件不是卖设备，是卖"持续占领场景+持续占领数据"的权利。

以智能工牌为例，这个产品在C端可以类比智能录音笔，都是直接掌握数据源头的设备。但在B端场景下，想象空间更大。

智能工牌天然嵌进业务第一线——销售拜访、客服接待、巡检质检、会议记录，这些岗位每天都在产生高价值的对话和行为数据。设备自动转录、自动结构化、自动挂到场景知识库，让"语料持续流入"变成默认状态，你不用再求客户"把资料给我们"。

更重要的是，它同时创造三层价值。第一层是提升业务，比如话术纠偏、流程建议、质检评分、合规提醒。第二层是反哺企业管理，从一线反馈中抽取共性问题，帮助优化制度、产品和培训。第三层是沉淀你的行业语料壁垒，这是你未来垂直模型的燃料。

我跟车企智能体团队交流时，他们的智能工牌场景特别有启发。4S店的销售顾问戴着智能工牌接待客户，系统定期分析对话内容，提醒销售哪些卖点没讲到、客户关心什么问题、应该推荐哪款车型。同时，所有的销售对话都被结构化存储，用来分析客户画像、优化话术、改进产品。一个小小的硬件，串起了前端销售和后端分析的完整链条。

商业模式也很清晰——卖硬件本身有差价，更重要的是"硬件+智能体订阅"形成长期现金流。一旦硬件铺开，场景就锁死在你手里，竞争对手想进来几乎不可能。

6.3 专家标注：把知识变成可持续的资产

很多乙方害怕让客户参与标注，觉得这样像"把活儿甩出去"。其实恰恰相反，让客户专家参与标注，是B端落地里提升效果的关键。

关键是要把专家参与变的"摩擦成本最低"。不让客户做长时间讨论，而是让客户做"标注、反馈、选择题式确认"。专家只需要告诉你哪些输出合格、哪些不合格、不合格的原因是什么，这样既节省专家时间，又让专家信号进入系统。

通过不断迭代，让AI评判标准逐步接近专家水平。第一轮可能只有60分，专家标注一批数据后变成70分，再标注一批变成80分。最终，AI能够自动判断输出质量，不再需要专家逐个审核。经过这个过程，其实依赖个人的专家经验，就变成了可沉淀的组织经验，这个是最之前的地方。

如果客户不愿意做这个事，那谁自有专家，或者能低成本在外部找到专家标注，谁就更有竞争力。比如做法律场景，如果你团队里有律师，或者能找到愿意兼职标注的律师，你的数据质量就会明显好于纯技术团队。做医疗场景，如果你能搞定几个医生做标注，你的系统准确率就能碾压竞争对手。

这里的逻辑链很清晰：第一期用大模型交付到"能用水平"；客户在真实使用中给反馈和标注；你把这些标注沉淀成任务数据资产；语料积累越多，下一期越容易上微调，成本越低、性能越稳、客户切换成本越高。

七、趋势判断——大模型发展对智能体行业的影响

做B端智能体落地，很多公司都有一个隐忧：哪天会不会被通用大模型给取代了？

这个担心在一年前很真实，但现在我的判断是：这个威胁正在减弱，甚至可能转化为机会。让我从大模型发展趋势来解释。

7.1 文本大模型能力见顶，取代威胁正在减弱

文本大模型的能力提升已经进入平台期。

从GPT-3.5到GPT-4是质变，但从GPT-4到GPT-5更像是量变。不是说没进步，而是这种进步对企业实际业务的影响越来越有限。你会发现，换最新的模型，业务指标可能只提升5%；但如果优化流程、改进数据质量，提升可以达到30%。

更关键的是，无论大模型多聪明，它永远不会自动理解你的业务。它不知道你们公司的审批流程、不懂你们行业的潜规则、不会学习你们专家的判断标准。这些东西必须通过智能体系统来补充。

所以大模型取代智能体的威胁正在减弱。大模型越来越像高智商的通用工具，而智能体是把这个工具用好的专业系统。企业需要的不是更聪明的工具，而是更专业的解决方案。

7.2 垂直化成为大模型公司的新方向

文本大模型这个维度的故事快讲到大模型公司需要新的增长点。

第一个方向是做行业垂直大模型。你看阿里的通义千问推出了"点金"专门做金融，百度千帆推出"慧金"也是金融垂直模型。为什么都盯着垂直领域？因为通用能力的竞争已经白热化，差异化只能从垂直领域找。

这对智能体公司反而是好事。垂直大模型让智能体的整体能力更强，而不是被取代。你用通用模型做金融智能体，准确率70%；用金融垂直模型，准确率能到85%。客户更满意，你的交付质量更高，这是双赢。

7.3 多模态打开智能体新场景

第二个方向是发展多模态大模型。

文本处理能力见顶后，语音、视觉、视频理解成为新的突破口。所以你会看到，不管是带来B站文艺复兴的Suno v5，还是视频能力大幅强化的Sora2，还是图像生成能力逆天的Nano Banana Pro，都是在最近快速进化。

这给智能体带来巨大机会。多模态能力成熟意味着智能体可以落地的场景会爆炸式增长。以前只能处理文档和文字，未来可以：

听懂销售的现场对话，实时给出话术建议，Realtime分析
看懂生产线的监控画面，自动识别质量问题
分析门店的客流视频，优化动线设计

每个新的模态能力，都会解锁一批新的应用场景。而这些场景的落地，不是调用一个API就能搞定的，需要复杂的系统工程——这正是智能体公司的机会。

7.4 工程化能力是智能体的护城河

最重要的认知是：智能体做的工程化部分，永远不会被大模型取代。

企业要的不只是一个聪明的模型，而是一个完整的系统：

权限控制：谁能问什么、谁能看什么、谁能改什么
流程管理：任务怎么拆解、步骤怎么编排、异常怎么处理
运维监控：系统怎么部署、性能怎么优化、问题怎么排查
合规审计：操作怎么记录、结果怎么追溯、风险怎么控制

这些东西大模型做不了，也不应该做。这是智能体公司的价值——把大模型的能力工程化、产品化、可交付化。

所以正确的理解是：大模型能力越强，智能体系统的整体能力就越强。这是协同进化，不是你死我活。

写在最后：潮水的方向

两年前刚入行时，我以为智能体是技术革命——谁的模型强、谁的工程能力好，谁就能赢。

现在回头看，智能体其实是一场认知革命——谁能把人类专家的隐性知识显性化、把显性知识工程化、把工程化的东西产品化，谁才能真正立足。

潮水的方向已经很清楚了——从Demo到生产，从通用到垂直，从技术驱动到价值驱动。这不是一个靠PPT和概念就能赢的市场，而是要真刀真枪在企业场景里创造价值。

智能体不会取代专家，但掌握专家知识的智能体，会取代不愿意拥抱变化的企业。

而我们这些做落地的人，就是这场变革的摆渡人。路还很长，坑还很多，但方向是对的。

共勉。