朋友们,AI圈昨晚又炸了。中国DeepSeek正式发布V4大模型,API定价比OpenAI最新的GPT-5.5低了整整97%。SCMP的报道里给了详细对照:DeepSeek V4每百万token输入只要0.07美元,输出0.28美元;而GPT-5.5的同口径分别是2.5美元和10美元。简单说,同样跑一千万次推理,用V4只要几十块美元,用GPT-5.5要几千块。
这次降价不是简单"打折"
很多人会以为这是DeepSeek又在烧钱抢市场,但仔细看技术细节就知道背后是真的工程突破。V4用了新的稀疏MoE架构,激活参数比上一代V3少了40%,但综合得分反而提升。换句话说,它的单位算力效率明显高了一截,定价低不是亏本卖,而是成本本来就低。
这跟2024年V3、R1那一轮震动是一脉相承的逻辑——用算法和工程优化对冲算力差距,而不是死磕GPU数量。OpenAI、Anthropic走的是堆卡路线,DeepSeek走的是榨干每一张卡的路线,两条路线现在的成本剪刀差越来越大。
对开发者意味着什么
如果你在做AI产品,或者在公司里负责采购AI能力,这次发布等于给你重新发了一张成本表。原来一个月烧10万美元token的项目,迁到V4可能只要3000美元,节省下来的钱足够养一个工程师团队。
更关键的是能力差距在缩小。V4在主流benchmark(MMLU、HumanEval、GSM8K)上和GPT-5.5的差距已经在5%以内,部分代码任务甚至反超。对绝大多数业务场景——客服、内容生成、文档处理、代码辅助——这个差距是用户感知不到的。
美国厂商怎么应对
OpenAI内部据说在紧急讨论GPT-5.5是否要全面降价。但他们的难处在于,定价一旦腰斩,整个估值逻辑就要重写。投资人按"高毛利SaaS"给的估值,如果毛利结构变成"低毛利token贩子",那融资难度会陡增。
Anthropic相对淡定一些,因为Claude本来就走"更贵但更安全"的差异化路线,企业客户对价格敏感度低。但即便如此,压力一定会从中小客户端传导上来。
Google Gemini和Meta Llama走的是另外两条路:Gemini靠云服务捆绑,Llama直接开源让你自己跑。两家都不太会被V4的API定价直接打穿,但商业策略也得跟着调整。
地缘政治的暗线
不能不提的是出口管制背景。美国对华高端芯片限制了好几年,理论上中国AI公司算力越来越紧张。但DeepSeek V4反而把成本压到97%折扣,这个事实本身就是对"算力即一切"叙事的挑战。
白宫和国防部里已经有声音在讨论:要不要进一步限制美国云服务商托管中国大模型?要不要禁止美国企业用中国API?这些政策一旦落地,会让美国客户的迁移路径变复杂,但也会进一步刺激中国厂商建独立的全球分发渠道。
对北美华人有什么实际影响
第一是创业成本骤降。北美华人圈里搞AI产品的不少,原来跑GPT烧钱烧得心疼,现在用V4可以直接把demo做大、用户规模扩开,融资故事也好讲。
第二是美股AI概念股波动。Nvidia、Microsoft、Palantir这些跟AI捆绑的股票今天开盘可能会有压力,因为V4再次证明"高算力溢价"不是无懈可击。如果你持仓集中在AI硬件,可以考虑分散一点。
第三是中概股反弹。DeepSeek虽然没上市,但港股和中概股里和它相关的算力、应用方都会被资金重新关注。阿里、腾讯、商汤这些都可能短期受益。
接下来要看什么
一是OpenAI会不会24小时内出对应降价;二是Anthropic和Google的反应;三是美国监管层会不会借机推新的限制政策。这三个信号一周内就会陆续出现,到时候市场格局会清晰很多。
这种新闻看着像技术圈八卦,其实是真金白银影响每个用AI的人。把V4的API key先开一个备用,至少多一个选择,这个建议给所有在做产品的朋友。
关键信息
- 事件:DeepSeek发布V4大模型,定价比GPT-5.5低97%
- 具体价格:V4输入0.07美元/百万token,输出0.28美元
- 技术核心:稀疏MoE架构,激活参数减40%但性能提升
- 性能差距:主流benchmark和GPT-5.5差距在5%以内
- 市场冲击:OpenAI、Anthropic面临定价压力,AI硬件股承压