


大模子正堕入一场“武备竞赛”式的狂欢。参数界限从千亿到万亿,凹凸文窗口从1万到100万,各家厂商你追我赶,仿佛谁投更多算力、堆更大参数,谁就能赢下这场AI竞赛。但商酌标明,单纯加多参数带来的性能提高正在急剧递减。
斯坦福大学发布的《大模子界限定律》指出,当参数进步5000亿后,模子在推理身手、学问领会等中枢主张上的提高幅度从早期的30%以上降至不及5%,而考研老本和能耗却呈指数级增长。
企业着实需要的,是一个参数天文数字的“万能选手”,照旧一个富足明智、富足低廉、能实实在在干活的“专科搭档”?
6月8日,云知声发布自主研发的下一代原生智能体模子U2,一款有近3000亿参数的MoE稀少模子,声称能在普遍任务上并排万亿参数模子。更关节的是,其推理老本权贵低于同尺寸界限大小模子。
当大普遍玩家还在比谁的模子“更大更强”,云知声选拔了一条“强而小、强而省、强而能落地”的各别化旅途。这条旅途的逻辑是什么?底气从哪来?能否撑起“国产第一梯队”的场所?
1
大模子界的
“反内卷选手”
现在主流的万亿参数级别大模子,动辄需要上千张GPU卡身手跑起来,单次推理的电力老本和算力老本高到让大部分企业规避而视。而U2的近3000亿总参数,激活参数目唯有百亿级别,按照MoE架构的稀少特质,每次推理只调用约十分之一的众人参数。
这背后的底层公式,是云知声首创东谈主黄伟提议的一个主见:AI公司行业价值=智能密度×Token价值。
什么叫“智能密度”?黄伟的讲明是:不是单纯强调模子小,而是在模子性能达到大众第一梯队水平后,进一步掂量每单元参数里承载了些许知识、推理身手和任务处理遵守。
用一句更直白的话说:你用十个参数颖异别东谈主一百个参数的活儿,你的智能密度就更高。
而“Token价值”则是另一个被行业淡薄的维度。曩昔两年,大模子厂商心爱比“生成多快”“生成些许”,黄伟把这个逻辑反过来问:如果生成的Token莫得业务价值,那它不是收入,是老本。Token价值不是看数目,是看每次调用能否着实滚动为业务驱逐。
U2是云知声自研、基于快慢想考交融的稀少夹杂众人(MoE)架构通用大语言模子,从设想之初就锚定“为践诺而生”,而非“为生成而生”。

其领有许多本事亮点,举例在高智能密度方面,通过知识高超编码、语义压缩优化,近3000亿参数的U2在普遍纯文本任务接近以至卓越国内万亿参数模子,参数遵守接近后者约5倍。用更少参数承载更高密度知识与推理身手,告别无效参数堆砌。
“Agent+Harness协同演进”是U2的另一个关节标签。
传统大模子实质上是“嘴强王者”,能回应问题、能写著作,但真要让它去完成一个复杂的多圭表任务,比如自主调用器具、计算旅途、践诺操作并验收驱逐,就得在外面包上一层厚厚的“应用壳”。
U2的器具调用、气象料理、多步计算均为模子原生身手,可自主领会场所、拆解任务、调用器具、践诺验收,适配复杂长程任务,而非靠外挂已毕智能体效果。主淌若依赖旅途计算践诺与harness协同演进,改动设想原生推理旅途蒸馏机制,构建筹商-环境探索-践诺-验收全链路闭环身手,高效独霸复杂长程任务。
具体而言,U2将模子原生Agent身手的提高与Harness(任务践诺脚手架)的迭代优化纳入并吞考研闭环,酿成双向强化的协同演进机制。一方面,Harness凭据现时模子身手界限与特质握续迭代,为模子提供更精确的任务环境与响应接口;另一方面,模子诈欺优化后的Harness复返的高质料轨迹数据,握续强化多步计算、器具调用、经过纠错与驱逐验收身手。
这种底层考研机制的夺胎换骨,在直不雅的应用层带来了全新的使用体验。哪怕是在纯当然语言的交互场景下,它的原生践诺力也体现得长篇大论。以我最近测试的一个前端设备任务为例,笔者动作又名文科生,从来不会写任何代码,我只需要在U2对话框里输入一段指示:帮我写一个单文献的网页小游戏,模拟烟花飞到空中然后通达。条目画面尽头炫酷,五颜六色的线条轨迹,况且我不错用鼠标去互动。
令东谈主惊喜的不仅是它在不到2分钟内一次性请托了无Bug的制品代码,更在于它在生成经过中展现出的“原生计算感”——它无需外部请示,便自主完成了从底层canvas逻辑构建、五彩线条轨迹的物理模拟,到鼠标交互事件的精确挂载。全程单次交互便达到验收模范,直不雅考据了其内化的任务阐明与践诺身手。

个东谈主的惊艳体验并非孤例,界限化的评测数据也为这种“高践诺力”提供了严谨的佐证。U2在最新的综合评测中展现了相配求实、面向确实企业级落地场景优化的无边实力。评测深度掩盖了智能体身手(AgenticCapacity)、实战化智能体专项(ClawSpecific)、长文自己手(LongContext)、知识与推理(Knowledge&Reasoning)以及指示罢职(InstructionFollowing)五大中枢维度,掩盖范围与U2的中枢设想取向高度契合。
让东谈主惊喜的是,在6月10日外洋泰斗AI模子评测平台LLMStats更新的榜单中,云知声U2登上两项关节评测:在LLMStatsScore综称身手榜单中干涉模子总榜前30,按厂商最好模子得益位列大众模子厂商第九。此外,LongBench-V2评测排行中,U2的长文自己手以54.4%的准确率卓越ClaudeOpus4.7(53.9%),仅落伍GPT-5.4(55.6%)1.2个百分点,排行大众第二。意味着其中枢的凹凸文信息提真金不怕火、跨段落推理身手已达到大众第一梯队水平。


此外,评测驱逐全面印证了U2“双高+原生智能体”的中枢主张,成就了其动作新一代高效Agent模子的行业地位。领先是三大基础身手全面夺魁,印证“高智能密度”;其次是代码工程与Agent实战稳居第一梯队,彰显“原生智能体”本色;临了是极致能效带来压倒性降本上风,践行“低老本高产出”计策。

「枪弹财经」发现,U2的底层逻辑,是先达到一流智能水平,再把老本打到最低。如同造车不是马力越大越好,而是在保证速率与安全前提下作念到最省油。
黄伟的比方直白又精确:“我不需要一个中国科学院院士来开滴滴。好多任务场景不需要最高智能,硕士博士水平就够了。”
2026世界杯中国线上平台2
十几年的“长征路”
好多东谈主对云知声的印象还停留在“作念语音识别”,这个领悟偏差其实不小。
在AI1.0时期,它的知名度远不如商汤、旷视那批“AI四小龙”。但黄伟有一个很有真谛的不雅点:云知声不是从语音走向大模子,B体育官方网站首页而是从智能交互走向大模子。
翻开时刻轴,不错看到云知声的一条发展干线:语音仅仅进口,背后是意图领会,再背后是任务践诺。
2012年创立,同庚攻克“5米远讲”本事;
2013年发布业内首款语音电子病历,走进协和病院;
2014年推出语义云,业内首提“云表芯”一体化计策;
2018年自研AI芯片“雨燕”面世;
2023年发布山海通用大模子;
2024年山海医疗大模子登顶MMDU、MedBench等大众榜首;
2025年6月,云知声在港交所挂牌上市,被誉为“AGI第一股”。

这十多年里,云知声险些在每个本事周期齐提前下了注,只不外“踩早”是有代价的。黄伟我方说得坦率:“踩早总比踩晚好。踩早了你付出的是时刻老本,踩晚了你连入场的契机齐莫得。”
上市近一周年,首份年报交出的数据颇有看头。2025年全年,云知声总营收12.11亿元,同比增长29.0%。其中大模子干系业求已毕收入6.1亿元,同比增长逾10倍,占举座营收比重攀升至50%以上。大模子业务从早期的本事探索阶段,转折为撑握云知声发展的中枢驱能源。
还有一个值得暖和的数字,2026年5月,云知声Token调用收入的ARR环比暴涨600%,预测6月将链接保握高增长。这意味着公司收入与客户AI使用强度已深度绑定,业务的界限天花板全面翻开。
营业落地的案例最能确认问题。云知声业务聚焦机灵医疗和机灵生涯两大中枢领域:在医疗端,其AI补助病历生成系统已在北京友谊病院等多家三甲病院界限化应用,前年仅顺义院区就生成进步45万份病历,径直援用率超90%;在金融端,其车险理赔AI处理决议匡助头部保障公司控费率提高3%,每年省俭保费约一二十亿元。这些落地后果充分考据了云知声本事的营业价值。
站在更大的视角看,云知声在AI医疗领域的探索还是有近十年。甩手2025年末,公司已累计与寰宇近450家病院合营,寰宇综合排行A++及以上病院掩盖率接近35%。

这些数字背后是一个确实的营业逻辑:模子不是靠参数堆出来的,是靠场景喂出来的。
黄伟将其综合为“模数共振”,模子的性能离不开高质料数据,而好的模子如果不落地,既无法创造价值,也难以在确实场景中取得高质料数据来激动本事迭代。如今,云知声的机灵医疗业务已等闲应用于智能电子病历、临床补助会诊等中枢场景,恰是“模数共振”的典型案例。
这个正响应一朝出手,就很难停驻来。
3
大模子第一梯队,
凭什么有云知声?
大模子下半场的竞争焦点,还是从“谁更强”转向“谁能以更低老本、更踏实样式请托富足强的身手”。在这个新维度上,云知声正凭借多年积攒的数据壁垒、工程化身手和营业化考据,置身大模子第一梯队。
行业形态远不决型——这是黄伟反复强调的判断。他说:“2018年东谈主们也合计形态已定,然后好多公司就死掉了。”AI2.0时期留在牌桌上的公司比1.0时期少得多,但阛阓空间比以前大多了。
黄伟把曩昔三年界说为“热身赛”:2023到2025年,国内企业和OpenAI的差距从3—5年消弱到3—6个月,但Agent仅能完成单步肤浅任务。2026年才是“正赛”的起头,AI从生成式升级为“坐褥力AI”,Agent能孤独完成复杂任务,营业化窗口着实翻开。
开源模子能处理70%—80%的正常问题,但剩下20%专科用户的20%专科问题,才是着实的护城河。高价值行业的“临了一公里”,一定是通用模子加上行业know-how来共同处理。
云知声可能是少数几家着实有阅历这样说,也特别据这样作念的公司之一。
领先是数据壁垒。云知声在医疗领域深耕了十三年,积攒了超10亿条合规脱敏的医疗病历数据,这些数据在互联网上搜不到,是跑过确实业务、经过医师试验使用千里淀下来的。在物联网领域,合营伙伴进步2万家,端侧AI芯片出货量冲破1亿颗。十几年的场景数据不是想买就能买、想抄就能抄的。

其次信任壁垒雷同遑急。云知声行状了进步400家三甲病院,合营病院中85%为三级病院,三分之一合营年限进步3年。在B端阛阓,替换老本极高,一朝切入就锁定了后续收入。这酿成了一种飞轮效应:越多的行业数据,带来越好的模子效果;越好的模子效果,带来越多的客户信任;越多的客户信任,又千里淀越多的行业数据。
临了是工程化壁垒。云知声能把大模子压缩到零点几B的大小跑在离线末端芯片里,车载场景下,大模子蒸馏至0.5B参数即可已毕端侧无损交互。复杂声学环境下的定向识别、多东谈主语言折柳本事,国内能作念到的公司仅两三家。

有了U2,云知声的营业模式正在发生质变。ToB端,兽牙智能体平台正在加快落地,中标掩盖医疗、医保、交通、客服、工牌等多个领域;ToC端,公有云MaaS的OPC生态握续产生Token收入。一个神情请托周期从3个月裁减到1周,老本捏造80%。
4
驱逐
回看云知声走过的十几年,从语音识别到智能交互,从AI芯片到大模子,每一次本事波浪莅临前,它齐在牌桌上。但“踩早”的代价也很现实。
从U2的“智能密度”路子,到年报里大模子收入暴增10倍的考据,再到400多家三甲病院的信任托底,云知声用一种不太“互联网”的样式,走到了大模子第一梯队的门口。它莫得选最扯后腿的路,但选了一条最难被复制的路。
正赛哨声已响。问题不再是云知声能弗成坐上这张桌子B体育(BSports),而是当大模子的竞争从“写得好”变成“干得好”,这张桌子上的法例,会不会被改写?






备案号: