700字范文,内容丰富有趣,生活中的好帮手!
700字范文 > 世界上最大的“巨型芯片”在美国诞生 面积达到46000平方毫米

世界上最大的“巨型芯片”在美国诞生 面积达到46000平方毫米

时间:2021-01-26 05:53:12

相关推荐

世界上最大的“巨型芯片”在美国诞生 面积达到46000平方毫米

初创企业Cerebras System推出世界上最大的计算芯片

在我们传统的印象里,芯片的大小通常跟我们的手指甲盖差不多。但不知道你有没有好奇过,世界上最大的芯片到底可以有多大呢?

8月19号,著名的科技媒体Venture Beat就报道了一项来自硅谷的初创公司Cerebras的最新成果。这家成立仅仅4年的公司,最近制造出了一款被叫做“晶圆级发动机”的,迄今为止全世界最大的计算芯片。

这款芯片有多大呢?它是一个边长22厘米,面积达到46000平方毫米的正方形硅片,足足跟一本16开的书差不多大。相比之下今年5月,英伟达发布的全世界最大的GPU芯片A100——它的面积只有826平方毫米,还不到这款芯片的五十分之一。

@而且,这款芯片不仅仅是个头大,在很多性能参数上也是强得惊人。比如,在计算内核的数量上,今天一块芯片上一般最多也就是几千个计算内核,而这款芯片拥有40万个计算内核。再比如晶体管的数量,这款芯片也达到了惊人的1.2万亿个,是现在常见计算芯片的100多倍。

可以说,这块芯片都属于芯片家族里的“巨无霸”选手。

听到这里你可能会好奇了:这种跟人脸差不多大的“巨无霸”级芯片,肯定是不能用在手机和笔记本电脑上了,那它有什么应用场景么?

Cerebras这家公司表示,它未来瞄准的应用场景,主要是超级计算机和大型云计算中心。目前,这家公司已经和美国著名的劳伦斯利弗莫尔国家实验室展开合作。这块儿“巨无霸”芯片,将首先被集成到位于这所实验室里,目前全世界性能排名第14的超级计算机“拉森”上。

听到这里不知道你会不会有一个问题,那就是:单纯做个超大号的芯片,这个思路也太简单粗暴了,感觉不符合芯片技术平常给我们的那种高精尖的印象啊。而且要知道,超级计算机以前不都是把上万块传统芯片并联起来用嘛,效果好像也不错啊,为什么还要开发这种“巨无霸”芯片呢?

其实,事情的关键就在芯片之间相互通信的速度上,听我来慢慢给你解释:

首先我们要知道,今天不论是超级计算机还是云计算中心,都是由几十万,甚至上百万颗芯片所组成的复杂系统。系统整体的运算性能,早都已经不仅仅取决于单颗芯片本身的性能了。另外一项非常重要的因素,这些年正在越来越受到重视,那就是芯片之间相互通信的速度。这就像是一家公司的运行效率,不仅取决于每个员工的个人能力,也取决于员工之间回复消息的速度一样。

为什么芯片间的通信速度越来越重要呢?这是因为,今天我们所面临的很多真实的应用场景,比如训练人工智能算法、科研工作中的物理仿真、汽车的自动驾驶,背后所需的计算量都在变得越来越大,都需要依靠越来越多的芯片一起合作完成。比如,全球性能排名第一的超级计算机“顶点(Summit)”就包含了240万颗IBM提供的计算芯片。

如此大量的芯片,在合作执行计算任务的过程中,相互之间就需要传输大量的数据。所以,提高芯片之间的通信速度,能够非常明显地提升超级计算机的整体性能。这就如同,如果公司所有的同事之间都能做到秒回微信,公司整体的运转效率会提升一样。

那如何提高芯片之间的通信速度呢?

传统的思路,是优化芯片之间的通信接口。比如谷歌云服务中使用的AI芯片TPU,就专门在每块芯片上都专门设计了4个用来做芯片之间通信的接口。但是这种思路有一个天花板,那就是以如今的接口技术,芯片之间的通信速度达到每秒钟几百甚至上千GB就已经接近极限了,再要提升,技术上可能会非常困难。

这里要额外提一句,每秒钟几百GB的速度,听起来还是挺快的,但是对于云计算中心而言,依然会成为制约整个系统运算性能的关键因素。那还有什么别的办法继续提高数据传输速度么?诶,这就要说到Cerebras这家公司的“巨无霸”芯片了。

它的思路是,干脆把以前很多块小芯片合在一起,做成一块儿大芯片。这样原来很多需要芯片之间相互通信的任务,就可以在芯片内部进行数据传输了。而要知道,芯片在自己内部传输数据的速度,是远远高于芯片之间通信的速度的。这就如同,我们左脑跟右脑相互沟通的速度,肯定比我们跟别人说话沟通的速度要快。

事实上,按照这家公司披露的数据,这块芯片内部通信网络的整体速度可以达到100PB每秒,是目前最快的芯片之间的通信接口速度的10万倍。如果未来超级计算机都使用这种“巨无霸”芯片,那就能够很好地解决芯片间通信速度——这个制约运算速度的瓶颈对整体性能的制约影响。

那既然把计算芯片做大的好处这么多,为什么以前没有人做呢?——其实,还真不是以前没人做,而是这件事儿太难了,以前还没有人能做到。为什么这么说呢?问题的关键就在“可靠性”三个字上。

你可能也知道,所有的芯片都是在一块圆形的硅片上,经过非常精细的半导体工艺加工而成的。在加工的过程中,难免会有一些加工缺陷和误差,导致硅片上某些局部是失效的。

在过去,一块硅片上通常会切割出几百块小芯片,刚刚的这些局部工艺误差,顶多也就影响其中一部分芯片。我们只需要把剩下一部分完好无损的芯片挑出来,就可以到市场上销售了。

听到这里你可能已经明白了,既然加工过程中难免出现一些工艺缺陷,那一块芯片的面积越大,上面出现缺陷的概率也就越大,所以想要成功把它制造出来的难度也就越高。像这次发布的“巨无霸”芯片,面积是过去芯片的50多倍,对于工艺可靠性的要求,理论上就提高了50多个量级。

这么高的可靠性要求,在过去是很难做到的。这也就是在过去很少有这种超大型芯片的原因。那这家仅仅创业4年的公司是怎么做到的呢?答案就是,它对芯片的结构进行了可靠性优化设计。比如,在芯片内部设计一些冗余和备份的结构,让硅片上即便出现一些加工缺陷,也不会影响芯片整体的正常使用。事实上,这种对芯片进行可靠性优化设计的技术,恰恰就是这家初创公司最核心的技术创新。

听到这里有的同学可能还会想,既然可以通过可靠性设计把芯片变大,未来我们能不能做个更大号的芯片呢?——很可惜,答案是不能,或者说至少短时间内不能。

因为芯片加工的原材料硅晶圆,是有固定尺寸规格的。目前工业界最大号的硅晶圆的直径是12英寸。你有兴趣的话可以自己算一下,在一个直径12英寸的圆形里面,划出一块最大的正方形,面积可以有多大?——你会发现,答案恰好就是大概46000平方毫米,也就是这块儿“巨无霸”芯片的面积。

换句话说,这块芯片已经几乎是当前半导体工艺能够加工出来最大的芯片了。我们未来如果想提高这种巨型芯片的性能,主要的方向还是继续优化工艺和可靠性设计方法。事实上,这也是Cerebras目前披露的第二代“晶圆级发动机”的主要思路。

通过这项硬科技进展,我们可以看出来,芯片迄今为止依然是一个非常活跃的领域。在芯片的设计上,还有很多类似“巨型芯片”这样脑洞大开的思路可以尝试。这同时,也意味着我们国家的芯片产业,除了加速追赶世界第一梯队之外,也依然存在着很多换道超车的可能性。

本内容不代表本网观点和政治立场,如有侵犯你的权益请联系我们处理。
网友评论
网友评论仅供其表达个人看法,并不表明网站立场。