冲刺Token工厂第一股:硅基流动越亏越值钱?

时间:2026-07-04 08:40:46 来源:互联网

硅基流动向港交所递交上市申请,其核心业务是销售Token,宣称要做“Token工厂第一股”。这家成立不足三年的企业,不开发大模型或应用,而是充当AI产业的Token批发商。市场对此产生疑问:卖Token真的香吗?

具体而言,硅基流动将不同芯片如英伟达、华 为昇腾的算力,以及DeepSeek、Qwen、GLM等上百个模型,统一封装为标准化的Token服务。用户按调用量付费,无需关注底层采用的芯片或模型。这个模式听上去颇具吸引力,资本也给予了积极回应。在34个月内,硅基流动完成了7轮融资,估值从天使轮的2.3亿元投前估值,飙升至B+轮的77.4亿元投后估值,涨幅达33倍。阿里、华 为、美团、商汤等多家AI产业链企业均成为其股东,阵容相当豪华。

然而,招股书中的数据揭示了另一番景象。2025年营收5533万元,同比增长653%,但净亏损达3.45亿元,是收入的6倍多。毛利率更是低至-24%,意味着每收入1元,就要倒贴0.24元。一边是资本热捧、估值飙升,另一边却是越卖越亏、毛利转负。硅基流动的Token生意,究竟是AI时代的水电煤,还是又一场烧钱换规模的资本游戏?

img_6a48568ebb19030.webp

“Token工厂”凭什么这么贵?

硅基流动的快速崛起,需要从一个人和一件事展开。

第一个人是创始人袁进辉。这位清华计算机系博士师从中国AI奠基人张钹院士,被视作AI基础设施领域的技术老兵。2008年毕业后,他在微软亚洲研究院担任主管研究员,开发了当时世界最快的主题模型训练算法LightLDA,并获得微软亚研院院长特别奖。2016年,袁进辉离职创办了深度学习框架OneFlow,在分布式训练领域曾被誉为国产之光。2023年,OneFlow被王慧文的公司收购,随后并入美团。但袁进辉拒绝了美团的留任,带领核心团队二次创业,由此诞生了硅基流动。

第二件事,是2025年春节的DeepSeek狂欢。DeepSeek R1发布后,全网争相使用,算力需求瞬间崩溃。硅基流动与华 为云昇腾合作,率先推出国产化部署方案,一夜之间承接了汹涌流量,上线仅10小时便被迫限流。这场爆发使硅基流动一战成名,并稳固了其“中国最大独立Token供应商”的地位。

这个定位精准地踩中了风口。招股书援引弗若斯特沙利文数据,2025年中国词元按吞吐量统计,前三名合计占据约87%份额,硅基流动位列第四,市场份额约1.5%。这1.5%不可小觑。外界推测前三名分别为火山引擎、阿里云、百度智能云。作为创业公司,能在巨头夹缝中占据一席之地,实属不易。运营数据同样亮眼:截至2026年4月,平台注册用户超过1000万,日均Token吞吐量达5785亿次;公有云付费客户从2024年的2455家增至2025年的71.6万家,一年增长约292倍。这正是资本愿意给出77亿估值的底气所在。

然而问题出现了:140倍的市销率(PS),是否过高?对比海外同类公司可知。Fireworks AI在2025年10月C轮融资时估值40亿美元,对应ARR约2.8亿美元,PS约14倍。Together AI刚完成8亿美元C轮融资,估值翻倍至83亿美元,对应年初约10亿美元年化收入,PS约8倍。这两家海外对标公司的PS均在10至15倍区间,而硅基流动的140倍估值是它们的近10倍。这多出的溢价,市场究竟在押注什么?

两条业务线,根都不牢

硅基流动拥有两条业务线,命运迥异。第一条是公有云服务,即MaaS,这是“Token工厂”故事的核心。2025年,该业务贡献营收2926万元,占总收入52.9%,首次超越另一业务。但致命问题在于不赚钱,毛利率为-119%。这意味着每收入1元,硅基流动就要倒贴1.19元,卖得越多亏损越大。许多人首先想到这是“烧钱换客户”,因为2025年仅免费代金券就耗费了5400多万元。但这只是表象,更深层次的困境在于:公有云业务的商业模式本身难以盈利。先看价格。硅基流动上DeepSeek-V3的常规价格曾为输入2元/百万Token、输出8元/百万Token,R1为输入4元、输出16元,加上新用户注册即送2000万免费Token,早期确实比官方便宜三到五成。然而这一优势正迅速缩水:2026年5月,DeepSeek将V4-Pro的限时5折优惠永久化,降幅达75%,缓存命中的输入价格降至0.025元/百万Token,比硅基流动的老价格便宜几个量级。

原厂降价后,中间商的价格优势被削弱。硅基流动的成本结构从根上不占优。对于闭源模型,它无法获得权重,只能通过原厂API或授权渠道转接,充当“二道贩子”,成本理论上不可能低于原厂。对于开源模型,它虽可自行租卡部署并优化推理,但原厂拥有最大规模的调用量、最深入的模型理解和最极致的工程优化,单位成本依然更低。硅基流动的便宜更多源于补贴让利、优化压缩以及比客户自建略低,但这并非系统性的成本优势。一旦价格战打响,原厂有降价空间,它却没有。

用户为何仍选择它?早期用户或许贪图便宜,但真正留下的,更多是看重多模型统一接入。170多个模型可随意切换,代码几乎无需改动,再加上智能路由、容灾、成本管控等企业级功能,省下的不是钱,而是时间和精力。问题在于,这门“省事”生意的护城河究竟有多深?

再看客户比例。招股书显示,2026年前四个月,公有云付费客户约64万家,人均ARPU约22元,高价值付费客户占比不到1%。这表明客户数量主要由长尾用户拉动,但不排除少数大客户贡献了更高金额。真正的问题在于,长尾客户天然价格敏感,迁移成本低,哪家便宜就用哪家。而大客户即便付费更多,也会将价格、稳定性和供应链安全压到极致,议价能力只会更强。

第二条是本地部署解决方案,这才是真正的“利润奶牛”。客户自带算力,硅基流动将推理引擎和调度系统部署到客户数据中心,收取软件许可费、实施费和维保费。2025年该业务营收2607万元,占比47.1%,毛利率高达82.5%。表面风光,但隐患不小。

一是客户愈发集中:本地部署客户数从2024年的28家减少至2025年的20家,2026年前四个月仅新增5家;但平均每客户收益从22.4万元暴涨至130.3万元,涨幅481%,表明收入日益依赖少数大客户。二是规模化存在天花板:本地部署本质是项目制生意,交付周期长、复用率低,更像一家AI工程服务商,而非Token工厂。

两条业务线,一个支撑估值、一个赚取利润,搭配看似精妙。但Token工厂的核心故事主要在2025年才提出。2024年公有云收入仅106.9万元,本地部署才是主力。尴尬之处在于,硅基流动必须继续做大亏损的MaaS业务以维持估值故事,但每扩大一分,亏损便加剧一分。想象力和现金流,短期只能二选一。

“中立第三方”的护城河有多深?

硅基流动的最大卖点是其中立第三方身份。大厂云做MaaS时,通常将自研模型与云生态打包销售,如豆包之于字节、通义之于阿里。大模型厂商将推理任务放在这些云上,难免担心调用数据被用于训练竞品。硅基流动不开发模型或应用,只做中间层,恰好解决了这一信任问题。但这个位置是否稳固?向上看,硅基流动是纯粹的算力租用方,对供应链没有话语权。招股书披露,2025年公司向前五大供应商合计采购1.173亿元,占采购总额70.8%,最大单一供应商占比20.4%。此外,有两名主要业务伙伴同时是客户和供应商。对照股东名单,这很可能就是阿里、华 为哈勃等公司。这些大客户一边通过股权和算力租赁从硅基流动获利,一边旗下云和模型业务又在市场上与其竞争,局势尖锐。更关键的是,硅基流动没有定价权:芯片涨价,成本随之上升;大厂云降价,售价也得跟进,两头受制。

向下看,硅基流动没有自研模型,对产品同样缺乏掌控力。它卖什么、卖多贵,很大程度上取决于开源社区和模型厂商的态度。而其最大卖点“多模型统一接入”,技术门槛并不高。火山引擎、阿里云、百度智能云都在构建模型市场与统一API,一旦大厂将开放做成标配,价格更低,硅基流动的核心价值随时可能被绕过。

国产芯片厂商也是变量。昇腾、沐曦、摩尔线程等芯片的软件栈尚不成熟,需要硅基流动这样的中间层进行适配。但一旦芯片厂商自己推出统一软件栈,中间层的价值将所剩无几。

它的股东名单已说明问题。阿里、华 为、美团、商汤、创新工场等,构成一幅AI产业链地图。其中有些角色既是股东,又是供应商,还是竞争对手。对于这些产业资本,这笔账怎么算都不亏。自家MaaS成功,是主营业务的胜利;独立中间层跑通,则通过股权分一杯羹,横竖不亏。

硅基流动140倍PS的估值,本质上押注的是一个时间差。即在国产芯片自研软件方案成熟前、在竞争对手补齐中立能力前、在大厂完善多模型平台前,先占住位置。但时间差有保质期。招股书显示,截至2025年末账面现金及现金等价物1.72亿元、定期存款1亿元;2026年内公司密集完成A+、B、B+三轮融资,合计约14.8亿元,七轮累计融资约19.5亿元,家底不薄。然而这笔钱能撑多久,仍取决于公有云亏损能否尽快收窄。

综上所述,硅基流动的Token生意从业务模式到估值逻辑均存在诸多不确定性,它究竟是AI时代的水电煤,还是又一场资本催熟的泡沫,或许只有时间才能给出最终答案。