大容量AI服务器投资1亿美元谷歌和Meta前高管亲自操刀!

Majestic Labs 的核心业务聚焦 AI 服务器研发,其核心目标是解决当前 AI 数据中心的成本与效率痛点。

公司正在申请专利的芯片设计架构,可实现 “单服务器集成千倍于传统企业级服务器的内存容量”,每台服务器有望取代当前市场上多达 10 个领先机架的功能。

与英伟达等专注 GPU 的厂商不同,Majestic Labs 并不寻求全面替代 GPU,而是聚焦内存密集型 AI 工作负载 —— 针对大型语言模型训练、海量数据处理等场景中 “计算内存比率受限” 的行业难题,通过技术创新压缩数据中心占地面积,降低电力消耗与冷却成本。

目前,该公司团队规模不足 50 人,分别位于以色列特拉维夫与美国加利福尼亚州洛斯阿尔托斯,计划来年扩大团队规模并寻求更多资金;其盒式服务器原型预计 2027 年向部分客户交付,已启动预订洽谈,目标客户涵盖超大规模科技企业及金融、制药等行业的 AI 应用巨头。

另一家人工智能公司基础设施提供商CoreWeave 出租英伟达图形处理单元,并赢得了领先的云基础设施提供商的业务,包括谷歌和Microsoft。该公司的积压订单目前为 556 亿美元,合同电力为 2.9 吉瓦,高于 6 月 30 日的 2.2 吉瓦。

本季度,CoreWeave 宣布与 OpenAI 扩大 65 亿美元的业务,并签订一份为期六年、价值高达 142 亿美元的协议。CoreWeave 还获得了Meta“领先的超大规模企业”的第六份合同。

一是GPU 主导型巨头。以英伟达为核心,其 GPU 是全球多数大型语言模型、AI 工作负载的核心算力支撑,占据市场主导地位。另外,AMD和英特尔也在乏力GPU,不过市场份额很低。

二是科技巨头自研派。如谷歌推出最新张量处理单元 TPU Ironwood,已被 Anthropic 选定用于 Claude 模型;Meta、亚马逊等也在持续加码自研芯片与服务器架构,适配自身 AI 业务需求。中国阿里自研AI芯片也开始有用户。

三是垂直创新型初创公司。除 Majestic Labs 外,聚焦 AI 基础设施细分痛点的初创企业不断涌现,围绕内存优化、能耗控制、定制化架构等方向寻找突破口。

技术差异化:避开 GPU 算力竞争,直击 “内存容量不足” 这一核心瓶颈,通过专利架构实现内存密度千倍提升,单服务器替代多机架,从根本上降低数据中心建设与运营成本。

团队背书:核心团队均为谷歌 TPU、Meta FAST 团队的核心搭建者,拥有从芯片设计到产品落地的全流程经验,且积累了 1500 余名前同事组成的信任网络,为技术研发与人才招聘提供支撑。

场景精准度:聚焦超大规模企业与高价值行业(金融、制药)的内存密集型需求,这类场景对成本控制与效率提升的诉求强烈,且付费能力强,市场空间明确。

随着 AI 技术向更深层次渗透,尤其是大模型参数规模扩大、多模态应用普及,AI 基础设施行业将呈现三大发展趋势:

首先,内存与算力的协同优化。单纯提升算力已无法满足需求,内存容量、数据传输速率与算力的匹配度成为核心竞争力,像 Majestic Labs 这样专注内存优化的技术路线将持续受到关注,“高内存密度 + 低能耗” 成为服务器设计的核心指标。

其次,定制化与垂直化深耕。不同行业、不同 AI 场景(训练 / 推理、大模型 / 小模型)对基础设施的需求差异显著,通用型服务器的市场空间将逐渐被定制化产品挤压,针对金融风控、药物研发等垂直场景的专用 AI 基础设施将迎来爆发。

最后,成本控制成为核心诉求。科技巨头资本支出持续攀升,2024 年谷歌、Meta、亚马逊等企业数据中心相关资本支出预计超 3800 亿美元,企业对 “降本增效” 的需求日益迫切,能够通过架构创新、能耗优化降低 TCO(总拥有成本)的解决方案,将成为市场竞争的关键胜负手。

此外,随着行业竞争加剧,“自研 + 并购” 将成为巨头的核心策略,而拥有核心技术的初创公司有望成为并购热点;同时,跨区域研发与供应链布局将成为趋势,像 Majestic Labs 这样整合以色列与美国技术资源的模式,或将成为行业常态。

阅读剩余
THE END