香港云服务器2核4g5m移动到香港显示无服务器

香港云服务器2核4g5m移动到香港显示无服务器就在昨天,中国内存厂商长鑫存储(便是睿力集成),其悄然变更的股东信息引发了一些媒体和产业骚动。

合”肥长鑫,这家成立于2016年,但注!册资金高“达485.7亿人民?币的“创业公司”,是目前大:陆唯、一一家”拥有D“ram内?存自主:生产能力。的芯:片厂,背负着众多期望。而毫不意外,这个作为服务器“三大物理硬件”之一:的内“存芯;片类型,对云计“算巨头有多重要香港云服务器2核4g5m,自然不必多说。

易失性,存储器 D!ram,与NAND”闪存同为存储产业最为流行的芯”片类型,是一个全球规模约为900亿美元的市场;(数、据来自Tr:e;ndFo;rce)。这个数字看起来虽然并不庞大,但几乎被”三“星、海力士以,及美光三巨;头瓜分”完:毕。

因此,从供?需稳定来。看,正是由于真正Dram制造厂在国内的稀缺?性等原因,让管理着庞大服务器机群的云计算厂商,需要提高对N种采购备选方案的掌控力。

作“为超大数据中心的运营!者,云厂商们都是Dram芯片的!巨大消耗者。举个例子,亚马逊曾在2019年因三星Dram产品在设计层面存在底层缺陷而取”消订单,对后者!当季营业,利润打击很大。

另一方、面,权威市场“分析机构Digitime?整合业内消息来源认为,2022年云服务器和数据中心应用将成为Dram芯!片,市场主。要增长“动力,恢复:大量出。货势!头,预计整、体市场、需求将增长15-20%;此外,美光在2022第一财季的数“据重”心;业务增幅高达;70%,主要“贡献来自Dram与SSD;产品。

而消息人。士告?诉虎嗅,业内预计从2022年第二“季度开始,数据”中心需求?才能更?加明显。

另一边,毋庸置疑,与CPU、GPU及;各类加“速器一!样,存储芯片;对“服务:器架构创“新与性“能的颠:覆同样:具有极其“重要?的影“响。

对于、云厂商,巨大的计,算并行?处理量:与神经;网络规,模巨?幅增长,必然要求处!理!器更快;从内存获取数据(这一点在文章《干掉英伟达?》里曾多次提及)。但宁畅信息。技术专家告诉虎嗅,当前计算机是冯诺依曼架构,计算数据必须放在Dram内才可计算。所以,程序。的大小决、定,了内;存的大小。

“因此,单个程序:和数据占。用内存“空间。不断增加,导致内存容量:持续扩张。为保持性能不下降,内存速率需与计算核数量同步增!加。但实际已经快做,不到了。”

去年,IEEE研究员兼3D存储“芯片专家,Jo?ungho Kim也曾喊话,内存与处理器之间的性能差距比任何时候都要大,冯诺依曼架构现在应该叫“冯诺依曼瓶颈”。

因此,更多内存!技术创新,在近年来,便围绕“怎样;减少数据。在芯片间”的移动”展开了。

在、阿里”云开发;者社区,数据专家曾详细科普过HB、M(高带?宽内存)、HBC(混合存储立方)等新型服务器内存。这一技术路径的思路比较直接好懂——让内存尽可能靠近CPU或GPU。

(。经提醒,这里需要着重强调一下:这里指的是HBM技术在内存产品上的创新,早在2016年AMD等企业就已经提出过HBM方面的创新点)

更具体一点,就是将处!理器与内存堆叠成一个3D矩阵,然后凿在服务器主板上。

这一技术路径!反应在产品上,便是2021年8月三星发布的内存处理芯片;——“HBM2-P,IM。三星技术专家用一种叫做硅穿孔(TSV)的互联线把Dram垂直连在一起,放在逻辑芯片上(下图)。

通“俗一点讲,就是让一堆,Dram簇拥;着“计算!单元,齐心协力做跟AI任务相关的神经网络计算。

这一技术在2021年曾引起过存储产业内的轰动,但还尚停留在”实验阶段。不过,头部存储企业已纷纷闻风。而动。譬如,美光悄然为一!种3D Dram技术”提交了:专利申请,而半导体材料巨头应用材料也迅速发布了一套3D Dram材料工程方案。

正如,EE“ti、mes所说,这可能需要好几“年,但 Dram 很可能会追随NAND的脚步,走向3D。

而阿里前段时间也曾发布过基于D!ram 的3D 堆叠存算一体芯片,相关论文;还被ISSCC 2022收录。当然,此为研究香港云服务器?2核4g5m,并未投产,但这也是一个非常重要?的信号。

很显然,对于服、务器基:础架构一“直“十分?重视的云;巨头,在以肉眼!可见;的方式,逐步“吞噬”服务“器架构!中的各个核!心关键点——

而阿里等中国云巨头在芯片研发上:获得,启发、的时间,恰好是在AWS发布Nitro; DPU前后。如今,基本!也完成了从服务器CPU、到AI加速器的“同等类别装备”。

香港云服务器2核4g5m移动到香港显示无服务器

基本可以明确的是,自亚马逊开、了先河!后,不断垂直整合云计算从底层到上层业务,把服;务器架构自研能力掌握”在自己手里,如今在顶级云?厂商间已经达成了共识。

一位不具名的服务器专家告诉虎嗅,阿里基础架构事业群AIS,在服务器架构自“研与创新走的挺快,只是因为比较底层所以外界不太了解,知乎上甚至有人直接把他们归为“做运维的”。

由于这个事业群相当于整个阿里云软硬基础设施的“管家”,所以,各类技术专家“集结“在一起,必须在服?务器、内核、容器、JVM、调度、数据库、存储、中间件等,多个数据、中心“节点”上做。迭代与、创新,当然,它也在采、购和销。售上有K,P!I指标。

“在存:储这一块,他们是?有一些想“法的。基本是两;条路, 第一个,当然是买,现”成的三星:海。力士美光,另一个。是从”前年开始!吧,阿里、自己买‘颗粒’(内、存芯片),来自己做,DIMM。” 他说,AI、S在实,验室水:平上应;该没问、题,量产可能会?有。挑战。

“更重要、的是,看,他们的整:合思路——加“速卡(AI, 存储)、网路(D!PU/SmartNIC)。芯片是平头哥或其他部门来做,但需求方;则是AI,S、阿里、云以及蚂蚁金”服。需求方也非,常重要,决定;了用什。么、怎么用,以及怎么用能够让效能发挥到最大。”

他提醒我们!要关注英特尔, IDM,2.0开放战“略,特别是不久:前“要对外授权X86的策略“和猜测”——“我想,很多、人应该,很快会有“动作的”。

此外,根据?虎嗅近。一两年来;从多方了!解到的”信息显示,阿里在云“基础设施硬,件创”新和战略速度层面,虽然存在部分争?议,但在国内的确要胜其他云厂商两三筹。

很明显,对国内存储”市场的重“视和投资,无论是保证?供应链稳定还是技术创“新,都极为有:必要。

在2020年写台积电时,我们;就曾提?过,如果说苹果、高通、英伟达”们高端产品的成功,台积电的先进制程工艺必然是最大助力之一;那么台积电总是能占领最小,制程高地的原“因,前者也必然功不可没——

最好的下游技术与产品给你“导航”和试错,才能、跟竞争对手打出一个漂亮的时”间,差。

譬如谷歌推出TPU时被普遍叫好,并使得GPU厂商产生警惕。很大原:因便是,作为成千上;万;块芯片。并行运、算的使:用者,云厂商太清楚芯片的问题“到底出在哪儿”了,毕竟?样本”实在是丰富。

他们经过多方:周旋,终于从阿贡等大型国家实验室、谷歌和Facebook的大型数据中心取得了大量宝贵样本。让他们感”到震惊的是,关于D”ram的错:误很常见,而一些数据中心的重大宕机事故更是源自Dram失常。

以谷歌;为例,他们发现12% 到”45% 的谷歌机器每年至少会遇到一;次 DRAM 错误,有0.2%到4% 的机器由于 DRAM“ 错误无法纠正而意外关闭。

而在以往,无论是大型数据中心还是个人电脑中,产业内都会把Dram?错误更多归咎于“软性问题”——根据?IE,EE杂志的解释,当物理设备在完全正:常工作下,会受到某种短暂干扰(如宇宙射线产生的粒子)因而破坏了存储数据。

但这个想法此前几乎没有充分的实验支撑,某种程度上就是缺乏样本。没错,企业数据中心不愿透露香港服务器专卖,而实验室的样本”量又少。实际上,经过他?们的。调查,结果令人“震惊,其实大多“数,错误来自“硬性错误”。

调查:者获、得了:谷歌。某些“数据中!心的权限,在调查!后发。现,是一;小部分!机器“造成、了大部分错误。也就是说,错误倾向于!一”次又一,次地!出现在?相同的内存”模块上。

那么我。们试想一下,如果是软性错误,譬如某个射!线?粒子“导。致Dr“am失常,那么应该被击中的几率是相同的。这就意味着移动到香港显示无服务器,以前的论断都是错误的。

IEEE最后给出的解决方法偏向于云计算!厂商,譬如,利用计算机操,作系统来删除!和预测内存错误地址或内存页。

但从硬件角度来思考,云厂,商恰恰能发现那些实验室和消费端产品测试不出的硬件错误,极有利于半导体厂商改进和升级下一代硬件。

这可能也是云厂商一个个被戏称为“已变”成CP、U或、存储”器公司”的最大原因之一。

但无论。如何,从设计、制造、量产“等综合难:度上,硬件需求量庞大的云厂商依然需要强依赖于半导体厂商。而云厂商的自我底层革新,以及与半导体巨头的紧密合作,或许在3~5年里,会对我们国内尚未壮大起来的存储等其他方面的自研能力,有一些实质性,的帮助。

© 版权声明
THE END
喜欢就支持一下吧
点赞0 分享
评论 抢沙发
头像
欢迎您留下宝贵的见解!
提交
头像

昵称

取消
昵称表情代码图片