先是国产CPU,后是国产GPU,龙芯的野心究竟有多大?
最近国产CPU厂商龙芯中科又传来好消息,这家企业对外宣布已经顺利完成3C6000、3D6000、3E6000流片,三款处理器将在今年第四季度正式发布。
去年龙科多工作室参加过龙芯3A6000发布会,这款处理器内置4个LA664核IP,属于龙芯自研。如今流片成功的3C6000、3D6000、3E6000还是内置LA664核IP,不过数量有翻倍,分别是16个、32个、64个。核IP数量的不同,处理数据的能力不同,代表着它们适配的设备肯定有不同。
像3A6000内置的核IP最少,主要面向桌面端。3C6000、3D6000、3E6000内置核IP翻倍,主要就是面向服务器。这次流片的三款处理器采用12nm制程,工艺还算先进,够用了。
有人担心哪里代工的,是否可能有卡脖子风险?其实大家不用太过担心,其实龙芯一直在更新CPU内核,努力提升IPC。所谓IPC就是CPU每一时钟周期内执行的指令多少,也就是在固定的时间内能干多少活。
当然很多人会说龙芯处理器主频提不上去,就算IPC高能扛活,但速度慢也影响效率,但这没办法,主频和芯片工艺水平有关。如果龙芯未来能使用7nm、5nm,肯定能把主频提高到3GHz,接近国际主流CPU水平。不过好在服务器CUP主频普遍都不高,普遍都在3GHz以下,这时恰好可以发挥龙芯3C6000、3D6000、3E6000的高IPC优势。
当然更值得一说的是即将面世的龙芯3B6600内置8个核心,不再是LA664,而是更新的LA864,性能进一步提升。作为桌面端处理器,3B6600也跨越一个大台阶,可以比肩英特尔中高端12代酷睿。另外通过二进制的翻译,3B6600还能顺畅的运行Windows软件应用。
另外,3B6600还集成了龙芯自研的GPGPU,准确来说是龙芯自研的第二代通用图形处理器核IP。LG200不但具备图形渲染功能,还支持通用计算,甚至具备AI加速功能。
对于AI加速这部分,龙科多注意到LG200包含了张量加速部件,不过暂时只支持INT8,也就是说能做AI推理,但搞AI训练估计还要等一等。实话实说,龙芯已经非常厉害了,一年只有几个亿人民币的研发投入居然能做出这么多的产品,而且很多是从0到1的工作,已经是非常强了。
龙科多最近调研与龙芯有关的资料时发现了一些有趣的情况。之前龙芯董事长胡伟武先生一直对外强调,龙芯主要任务是赶超英特尔,研制出高性能CPU。但龙科多发现龙芯的野心貌似不止于此,这家公司对大规模并行计算好像也有自己的想法。
·首先前面说了,龙芯自研GPGPU核IP不仅仅是为了图形渲染,还设计大规模加速计算,这显然是为AI大模型(开始做)准备的。
·其次,龙芯在3C6000处理器中首次引入龙链技术,这是用来干什么的?实现片间互联,成倍降低片间访问延迟。而且龙芯也在公开场合直言不讳,这是对标英伟达NVLinK一种处理器间的高速互联技术,实现更高的带宽、更低的延迟。
不过与NVLinK相比,龙链还是非常年轻的,暂时还做不到NVLink那样强大性能。但是与2025年发布的3A5000相比,引入龙链的3C6000片间互联延迟成倍降低,带宽提高了好几倍,大大提高多片协同工作的性能。
当前还只是看到龙芯GPGPU核IP与龙链技术集成在了某一款CPU中。其实龙芯方面已经说了,未来是要基于这两项技术研制专用的GPGPU芯片。这意味着什么?大家可以充分想象,如今我们不能再像以前那样简单把龙芯归类国产CPU公司,面向整个计算产业,龙芯正在储备更多的自研技术,打造更多的可能性。