Meta 终于放出了它的新AI武器:Muse Spark。这是一个多模态AI模型,能处理文本、图像和视频,定位是与 Google Gemini 和 OpenAI GPT 系列直接竞争。

Muse Spark 有什么不同?

Meta 的策略一直是开源——之前的 LLaMA 系列就是开放模型。Muse Spark 延续了这个路线,但增加了一个关键能力:实时多模态推理,意思是它可以同时处理你输入的文字、图片和视频,而不是像之前的模型那样一次只能处理一种。

为什么现在发?

因为Meta在AI竞赛中确实掉队了。OpenAI有ChatGPT的先发优势,Google有搜索+云+TPU的生态优势,Anthropic有安全和企业市场。Meta的AI产品(主要是Instagram和WhatsApp里的AI功能)用户体验一直不够惊艳。Muse Spark 是扎克伯格试图扭转局面的关键一步。