IPO前夜再秀一波技术 MiniMax欲夺“中国大模型IPO第一股”？

2025-11-12

近期引人注目的，莫过于在硅谷热议的开源模型MiniMax-M2，这款仅有10B激活参数（总参230B）的轻量级模型，总分冲入全球前五、开源第一，成功跻身全球文本模型的第一梯队。

而据多家外媒报道，MiniMax已经秘密向港交所提交招股书，预计最早于今年登陆港股。这家被称为“中国OpenAI”的公司，能否在激烈的竞争中抢占先机，成为2025年最受期待的AI大模型第一股？答案或许可以从它最新的一波技术“肌肉秀”中找到线索。

可以看到，与其他专注于单一模态的AI公司不同，MiniMax通过构建多模态技术的协同生态，向外界展现出了自身技术与产品的商业化落地潜力。这来源于MiniMax在文本、语音、视觉等多个模态领域积累的自研能力，进而形成了强大的技术协同网络。

人类天生就是多模态的生物——我们同时用眼睛看、耳朵听、嘴巴说，大脑会综合处理这些不同模态的信息。MiniMax正是抓住了这一点，它不满足于只做文本大模型，而是要在文本、语音、视觉、音乐等各个模态都做到极致。其次，多模态协同能够创造更丰富的应用场景。单一的文本模型在国内目前主要适合对话和写作领域，商业化空间有限。但加上语音、视觉和音乐能力后，AI就可以帮助用户创作短视频、播客、有声读物等多元化内容。这种“一站式”的能力组合，让MiniMax在商业化上有了更多想象空间。

最重要的是，多模态技术形成了强大的技术护城河。单一模态的技术相对容易复制，但要在多个模态都保持领先，就需要深厚的技术积累和强大的研发团队。从结果来看，文本模型MiniMax M2全球第五，视频模型Hailuo02击败Google Veo3位居全球第二，语音模型Speech2.5稳居全球榜首，可以说MiniMax在每个模态都做到了业内顶尖，这种综合实力不是简单的“堆砌”能实现的，而是需要深度的技术协同和整合研发能力。

Minimax创始人闫俊杰曾表示：“靠融资是打不死其他人的。拐点只可能来自技术、产品或者是商业化效率的领先。”这也许就是Minimax一直不断死磕技术的最好注脚。

十月的最后一周，MiniMax发布新一代开源文本大模型M2，这次主攻方向是Agent和代码编程。众所周知，这两个领域的竞争是最考验大模型底层技术的。但M2一上线就表现不俗。在短短几天内从全球头部大模型平台OpenRouter调用榜第10名跃升至第3名，同时成为首个进入该榜单前五的中国模型。因为M2远超预期的访问量，甚至一度让服务器宕机，公司不得不连夜道歉并进行紧急修复。

与四个月前发布的M1相比，M2进行了彻底的技术路线采用混合注意力机制，专注于长文本和复杂推理；而M2选择了全注意力+MoE架构，总参数约2300亿，单次激活约100亿参数，将资源集中投入到代码生成、工具调用、浏览器/终端自动化等可执行型Agent任务中。从M1到M2的技术路线转变，反映了MiniMax对市场需求的敏锐把握。这一赛道上，同样在竞赛角逐的还有智谱的GLM4.6、Kimi的K2等。

值得注意的是，M2已经开始在Agent赛道中崭露头角。近日M2在香港大学「AI-Trader」实盘炒股交易比赛中，获得A股第一的成绩。AI-Trader是香港大学黄超教授团队开发的开源项目，旨在测试人工智能在真实股票市场的自主交易能力。该项目通过模拟实盘交易环境，让不同AI模型独立操作股票，观察其盈利能力。

伴随M2发布的同时，MiniMax还公布了极具优势的价格政策。MiniMax维持全球范围的限时免费开放，并为开发者提供了极具竞争力的定价——M2综合成本API价格定为每百万Token输入0.3美元，输出1.2美元，同时在线左右的推理服务。这个价格是Claude Sonnet 4.5的8%，而推理速度快了接近一倍。这种“高性能、低成本”的组合拳，自然也是M2能在短时间内吸引大量开发者使用的关键所在。

M2模型也并非是MiniMax首次打破海外技术垄断。同样在6月推出的视频生成大模型Hailuo 02就曾率先打破了国外垄断。从Hailuo 02到M2，MiniMax在4个月内完成了“视觉”“语言”的双线登顶——这在历史上并没有先例。此次，与M2新模型一同到来的还有Hailuo 2.3、2.3 fast系列模型，再次推高视频产品上限；语音模型Speech 2.6专为商用场景打造；音乐Music 2.0对音乐的理解与表达进一步升级。

Music 2.0新模型支持长达5分钟的完整歌曲创作，从前奏、主歌到副歌、桥段，结构完整度已接近专业音乐人的作品水准。在编曲层面，Music 2.0实现了对多种乐器的独立精准控制，更具革命性的“一人即乐队”全新创作模式，有可能彻底重构音乐产业的生产方式，为创作者经济注入新的活力。另一张主打B端的王牌落在生成语音模型上，Speech 2.6对外宣称代表人机交互效率的显著提升。这款专门为Voice Agent场景优化的语音合成模型，在实时对话的关键指标上同样实现突破。较为引人注目的是其超低延迟性能——首包响应时间仅为250毫秒，这个指标对于AI客服等商用场景的实时语音交互至关重要。

MiniMax的选择也代表了中国大模型的一种典型解法——重落地，这也是它的优势领域。数据更为直观，截至9月份，MiniMax的自研多模态模型及AI原生应用已累计为来自超过200个国家及地区的逾 1.57亿名个人用户，以及来自超过90个国家及地区的50000余名企业客户以及开发者提供服务。

MiniMax的早期投资人曾提到：“相比于国内其他大模型厂商，MiniMax的营收更市场化，现金流更健康。这也是它的估值增长能够领跑的重要原因之一。”这种务实的态度，被资本市场迅速买单：红杉中国、高瓴、IDG、阿里、腾讯、米哈游、明势和上海国资的陆续加注，使 MiniMax估值持续领跑 “AI 六小龙”。

商业化方面，据悉，Minimax年营收已迈过1亿美元门槛。这也让资本市场看到了其更大的潜力。多家外媒持续跟进MiniMax上市进程，称其有望于年底前登陆港股市场。华尔街日报消息显示，MiniMax已秘密向港交所提交招股书，进行首次公开募股(IPO)的申请，计划最早于今年上市。这可能是头部AI公司中最先登陆资本市场的一家。

但这并非没有隐忧，尽管MiniMax技术亮点突出，但其商业化路径在未来仍面临挑战。M2大模型能否持续吸引用户并实现稳定的收入增长；AI Agent产品被寄予厚望，但目前AI对话仍处于免费阶段，如何加速其商业化进程转化为实际的商业收益；Hailuo模型及产品如何在海外持续领跑并与Google、OpenAI等劲敌分庭抗礼稳住市场份额……这一切都有待进一步的出击与突围。

近期，硅谷科技媒体The Information等多家外媒持续跟进智谱和MiniMax 上市进程，称其有望于年底前登陆港股市场。谁能够抢占先机，成为2025年最受期待的“AI大模型第一股”，必然会在资本市场获得先发优势。而此次，MiniMax再次对外界展示技术实力的目的也不言而喻——这一系列动作并非单纯的技术和产品展示，而是为其即将到来的IPO造势，意在向资本市场传递其技术领先性和商业化潜力。

特别提醒：如果我们使用了您的图片，请作者与本站联系索取稿酬。如您不希望作品出现在本站，可联系我们要求撤下您的作品。

阅读剩余

作者：today68

链接：https://www.guzheyun.com/6660.html

文章版权归作者所有，未经允许请勿转载。

THE END

美国国税局：允许质押数字资产！

<<上一篇

协创数据股价跌555%安信基金旗下1只基金重仓持有2300股浮亏损失216万元

下一篇>>