IPO前夜再秀一波技术 MiniMax欲夺“中国大模型IPO第一股”?
近期引人注目的,莫过于在硅谷热议的开源模型MiniMax-M2,这款仅有10B激活参数(总参230B)的轻量级模型,总分冲入全球前五、开源第一,成功跻身全球文本模型的第一梯队。
而据多家外媒报道,MiniMax已经秘密向港交所提交招股书,预计最早于今年登陆港股。这家被称为“中国OpenAI”的公司,能否在激烈的竞争中抢占先机,成为2025年最受期待的AI大模型第一股?答案或许可以从它最新的一波技术“肌肉秀”中找到线索。

可以看到,与其他专注于单一模态的AI公司不同,MiniMax通过构建多模态技术的协同生态,向外界展现出了自身技术与产品的商业化落地潜力。这来源于MiniMax在文本、语音、视觉等多个模态领域积累的自研能力,进而形成了强大的技术协同网络。
人类天生就是多模态的生物——我们同时用眼睛看、耳朵听、嘴巴说,大脑会综合处理这些不同模态的信息。MiniMax正是抓住了这一点,它不满足于只做文本大模型,而是要在文本、语音、视觉、音乐等各个模态都做到极致。其次,多模态协同能够创造更丰富的应用场景。单一的文本模型在国内目前主要适合对话和写作领域,商业化空间有限。但加上语音、视觉和音乐能力后,AI就可以帮助用户创作短视频、播客、有声读物等多元化内容。这种“一站式”的能力组合,让MiniMax在商业化上有了更多想象空间。
最重要的是,多模态技术形成了强大的技术护城河。单一模态的技术相对容易复制,但要在多个模态都保持领先,就需要深厚的技术积累和强大的研发团队。从结果来看,文本模型MiniMax M2全球第五,视频模型Hailuo02击败Google Veo3位居全球第二,语音模型Speech2.5稳居全球榜首,可以说MiniMax在每个模态都做到了业内顶尖,这种综合实力不是简单的“堆砌”能实现的,而是需要深度的技术协同和整合研发能力。
Minimax创始人闫俊杰曾表示:“靠融资是打不死其他人的。拐点只可能来自技术、产品或者是商业化效率的领先。”这也许就是Minimax一直不断死磕技术的最好注脚。
十月的最后一周,MiniMax发布新一代开源文本大模型M2,这次主攻方向是Agent和代码编程。众所周知,这两个领域的竞争是最考验大模型底层技术的。但M2一上线就表现不俗。在短短几天内从全球头部大模型平台OpenRouter调用榜第10名跃升至第3名,同时成为首个进入该榜单前五的中国模型。因为M2远超预期的访问量,甚至一度让服务器宕机,公司不得不连夜道歉并进行紧急修复。

与四个月前发布的M1相比,M2进行了彻底的技术路线采用混合注意力机制,专注于长文本和复杂推理;而M2选择了全注意力+MoE架构,总参数约2300亿,单次激活约100亿参数,将资源集中投入到代码生成、工具调用、浏览器/终端自动化等可执行型Agent任务中。从M1到M2的技术路线转变,反映了MiniMax对市场需求的敏锐把握。这一赛道上,同样在竞赛角逐的还有智谱的GLM4.6、Kimi的K2等。
值得注意的是,M2已经开始在Agent赛道中崭露头角。近日M2在香港大学「AI-Trader」实盘炒股交易比赛中,获得A股第一的成绩。AI-Trader是香港大学黄超教授团队开发的开源项目,旨在测试人工智能在真实股票市场的自主交易能力。该项目通过模拟实盘交易环境,让不同AI模型独立操作股票,观察其盈利能力。
伴随M2发布的同时,MiniMax还公布了极具优势的价格政策。MiniMax维持全球范围的限时免费开放,并为开发者提供了极具竞争力的定价——M2综合成本API价格定为每百万Token输入0.3美元,输出1.2美元,同时在线左右的推理服务。这个价格是Claude Sonnet 4.5的8%,而推理速度快了接近一倍。这种“高性能、低成本”的组合拳,自然也是M2能在短时间内吸引大量开发者使用的关键所在。
M2模型也并非是MiniMax首次打破海外技术垄断。同样在6月推出的视频生成大模型Hailuo 02就曾率先打破了国外垄断。从Hailuo 02到M2,MiniMax在4个月内完成了“视觉”“语言”的双线登顶——这在历史上并没有先例。此次,与M2新模型一同到来的还有Hailuo 2.3、2.3 fast系列模型,再次推高视频产品上限;语音模型Speech 2.6专为商用场景打造;音乐Music 2.0对音乐的理解与表达进一步升级。
Music 2.0新模型支持长达5分钟的完整歌曲创作,从前奏、主歌到副歌、桥段,结构完整度已接近专业音乐人的作品水准。在编曲层面,Music 2.0实现了对多种乐器的独立精准控制,更具革命性的“一人即乐队”全新创作模式,有可能彻底重构音乐产业的生产方式,为创作者经济注入新的活力。另一张主打B端的王牌落在生成语音模型上,Speech 2.6对外宣称代表人机交互效率的显著提升。这款专门为Voice Agent场景优化的语音合成模型,在实时对话的关键指标上同样实现突破。较为引人注目的是其超低延迟性能——首包响应时间仅为250毫秒,这个指标对于AI客服等商用场景的实时语音交互至关重要。

MiniMax的选择也代表了中国大模型的一种典型解法——重落地,这也是它的优势领域。数据更为直观,截至9月份,MiniMax的自研多模态模型及AI原生应用已累计为来自超过200个国家及地区的逾 1.57亿名个人用户,以及来自超过90个国家及地区的50000余名企业客户以及开发者提供服务。
MiniMax的早期投资人曾提到:“相比于国内其他大模型厂商,MiniMax的营收更市场化,现金流更健康。这也是它的估值增长能够领跑的重要原因之一。”这种务实的态度,被资本市场迅速买单:红杉中国、高瓴、IDG、阿里、腾讯、米哈游、明势和上海国资的陆续加注,使 MiniMax估值持续领跑 “AI 六小龙”。
商业化方面,据悉,Minimax年营收已迈过1亿美元门槛。这也让资本市场看到了其更大的潜力。多家外媒持续跟进MiniMax上市进程,称其有望于年底前登陆港股市场。华尔街日报消息显示,MiniMax已秘密向港交所提交招股书,进行首次公开募股(IPO)的申请,计划最早于今年上市。这可能是头部AI公司中最先登陆资本市场的一家。
但这并非没有隐忧,尽管MiniMax技术亮点突出,但其商业化路径在未来仍面临挑战。M2大模型能否持续吸引用户并实现稳定的收入增长;AI Agent产品被寄予厚望,但目前AI对话仍处于免费阶段,如何加速其商业化进程转化为实际的商业收益;Hailuo模型及产品如何在海外持续领跑并与Google、OpenAI等劲敌分庭抗礼稳住市场份额……这一切都有待进一步的出击与突围。
近期,硅谷科技媒体The Information等多家外媒持续跟进智谱和MiniMax 上市进程,称其有望于年底前登陆港股市场。谁能够抢占先机,成为2025年最受期待的“AI大模型第一股”,必然会在资本市场获得先发优势。而此次,MiniMax再次对外界展示技术实力的目的也不言而喻——这一系列动作并非单纯的技术和产品展示,而是为其即将到来的IPO造势,意在向资本市场传递其技术领先性和商业化潜力。
特别提醒:如果我们使用了您的图片,请作者与本站联系索取稿酬。如您不希望作品出现在本站,可联系我们要求撤下您的作品。