据晚点LatePost,截至上半年,每天2亿多人使用的豆包应用每天收入不足百万元,主要来自电商佣金。而到今年5月,豆包应用每天消耗数千万元,文字聊天成本较低,但推理、图片识别、语音聊天、视频聊天等多模态功能需要的算力成本要贵几倍甚至几十倍。字节跳动计划将2026年的资本开支上调超2000亿元,相当于2025年利润的约六成。
据了解,两个月前字节高层到访Anthropic后,字节开始调整AI资源分配,重心从豆包这类面向大众的产品,转向服务企业的产品。过去半年,Anthropic证明了AI编程能让巨额基建投入产生回报,其Claude Code去年5月上线,半年做到10亿美元年化收入,今年2月翻到25亿,估值冲到9650亿美元。字节Seedance也证明了企业服务这条路走得通,该视频生成模型当前年化收入(ARR)已达20亿美元(约143亿元),单月超10亿元,Seedance绝大多数收入来自企业客户。
目前,Seedance毛利率达70%,每卖出10元API调用,服务器和推理成本约占3元。相比之下,语言模型通常有更多版本、更密集的迭代和更长的训练周期,总体训练成本可能是视频模型的3到5倍。Seedance目前主要押注一个视频生成模型,训练投入更容易被后续收入摊薄。近一年优化后,Seedance 2.0成为第一个完整采用MoE的视频生成模型,参数2000亿,2026年2月上线后迅速成为全球性能最强的视频模型。