您当前的位置:中国科学网>资讯>正文

国产CPU新里程碑龙芯3号新一代发布功能追逐AMD

放大字体  缩小字体 时间:2019-12-24 21:22:28 作者:责任编辑NO。卢泓钢0469

芯东西(ID:aichip001)文 | 韦世玮 心缘

芯东西12月24日音讯,今日,龙芯中科发布龙芯4000系列CPU芯片,别离为3A4000和3B4000。功能方面,3A4000/3B4000选用28nm FDSOI工艺,微架构为GS464V中心,通用处理功能进步一倍以上,这将成为我国自主CPU开展史上又一新的里程碑。

据悉,龙芯4000系列进一步完善对虚拟机的支撑,功率到达95%以上。在相同主频下,龙芯4000系列比3A3000的流水线功率进步50%,主频进步至1.8GHz-2.0GHz。

龙芯中科总裁、中科院核算技能研究所总工程师、龙芯CPU首席科学家胡伟武博士介绍,龙芯4000系列是初次全面集成可信模块、国内暗码算法、拜访操控等安全机制的CPU芯片。

也就是说,龙芯4000系列处理器除了功能大幅进步之外,还具有片内安全机制和高效云化的特色。

据介绍,龙芯在2019年的芯片出货量已超50万颗。未来,龙芯中科将侧重进步CPU主频与核数,3A5000和3C5000两款芯片将别离方案在2020年上半年和下半年流片。

龙芯中科总裁、中科院核算技能研究所总工程师、龙芯CPU首席科学家胡伟武博士

01

我国自主CPU开展的里程碑

龙芯中科是国产自主高功能通用处理器技能领先者和产品供给商,搭载龙芯中科CPU的核算机已进入政府收购目录。

龙芯脱胎于我国科学院核算所,曾研宣布我国首枚具有自主知识产权的通用高功能微处理芯片。

CPU芯片长时间被英特尔等国外巨子所独占,龙芯先推出的龙芯1号、龙芯2号,打破了我国缺自主研制CPU芯片的前史,是我国构成自主知识产权核算机工业道路上的一座里程碑。

从2001年至今,龙芯研制了龙芯1号、龙芯2号、龙芯3号三个系列处理器和龙芯桥片系列。

龙芯1号系列为32位低功耗、低成本处理器,首要面向低端嵌入式和专用运用范畴;龙芯2号系列为64位低功耗单核或双核列处理器,首要面向工控和终端等范畴;龙芯3号系列为64位多核系列处理器, 首要面向桌面和服务器等范畴。

今日发布的龙芯3A4000是龙芯3号系列处理器的最新产品,距上一代龙芯3A3000发布已相隔两年。

2017年时,龙芯年营收达1.5亿元,赢利2000多万元,2018年营收和赢利均比2017年翻番,赢利到达前史最高水平,交的税款已超越国家给龙芯各类补助的总和。

胡伟武表明,本年上半年龙芯收入已超越上一年全年,赢利是上一年全年的1.3倍左右,估计到2021年,龙芯交给国家的税将超越之前一切的研制投入。

02

选用GS464v架构,完成三大特色

龙芯3A4000是龙芯第三代高功能处理器核,选用新一代处理器架构GS464V,具有双DDR4-2400/2133内存通道,双HT3.0体系总线,功率进步一倍。

功能方面,其主频为1.8GHz,睿频2.0GHz,选用37.5mm*37.5mm封装工艺,典型功耗为30-40W。

据胡伟武介绍,龙芯3A4000首要有三方面特色:

1、相同工艺功能成倍进步

龙芯3A4000选用28nm工艺,进一步通过规划优化进步处理器功能,反映传统桌面功能的SPEC INT2000的单核base分值,从930分进步到了2090分。

此外,它的科学核算功能与3A3000比较,进步了4倍以上,支撑128/256位向量。而3B4000支撑四路直连,与3B3000双路服务器比较,四路服务器功能亦进步了4倍。

与此一起,龙芯3A4000的虚拟机功率大幅度进步,从原先的88%进步至98%。胡伟武称,其单核功能已高于用14nm完成的Arm处理器。

2、片内安全机制

龙芯3A4000支撑AES、MD5、SHA等加解密算法,片内集成安全可信模块,支撑国密算法。

此外,它支撑操作体系内核栈防护机制,支撑IO防护、安全履行环境等拜访操控,其高功能暗码算法服务才能支撑商密及以上算法。

3、自主研制

龙芯3A4000的一切模块源代码和各类全定制模块均为自主研制,除了厂家供给的规范单元库和内存编译器(Memory Compiler)外,没有一点第三方IP。

除此之外,龙芯3A4000在功耗办理和封装方面也有了进一步进步。

一方面,它第五个核(GS132E)监控主核运转,并进行动态功耗办理。例如,搭载龙芯3A4000的笔记本电脑作业时长比3A3000比较,进步了一倍以上;

另一方面,龙芯3A4000的封装尺度比3A3000更小,支撑一般BGA、LGA和CBGA多种封装方式,一起其桌面主板可支撑四层布线。

值得一提的是,龙芯4000系列用于片间互连及衔接桥片的HT操控器带宽进步了一倍以上,内存操控器从DDR3晋级至DDR4,SPEC CPU2006定点和浮点单核分值进步到20分。

但胡伟武也指出,龙芯4000系列处理器仍然存在两大问题。

一是DDR4内存频率不行高。DDR4规则的速率规模是1600至3200,而龙芯4000系列最高DDR4作业速率为2400/2133,与规则规模还存在必定距离。

二是功耗偏大。其非向量形式的典型功耗为30至40W,首要在于工艺不行先进,规划优化比较极致,主张科学核算环境下运用256位浮点向量时,恰当下降电压和频率。

03

未来要点打破主频与核数

胡伟武谈到,龙芯的下一步将会把研制要点放在进步主频与核数上。

一方面,龙芯3A5000将进步主频至2.5GHz,选用12nm工艺,单核功能将进步至30分左右,方案于2020年上半年流片。

一起,其内存操控器推迟/宽带进一步优化,LLC添加一倍,完成操作体系级二进制兼容。

另一方面,龙芯3C5000将添加核数,相同选用12nm工艺,支撑4至16路服务器,方案将于2020年下半年流片。

在胡伟武看来,现在国内CPU企业开展中心技能首要有两个途径,一是商场换技能,如汽车工业;二是商场带技能,如航天工业,而龙芯中科走的则是第二条路。

龙芯中科通过体系内商场引导,带动技能进步后,再进一步参加体系外的商场之间的竞赛。一起,龙芯CPU自主编写CPU源代码,在运用中不断演进,并重视自主CPU的自主生态建设,以逐步进步产品功能和完善生态。

尽管,龙芯开展至今现已为我国半导体工业的兴起供给了不可或缺的力气。但胡伟武以为,我国自主CPU与国外先进水平比较,在通用处理才能、单核功能和规划才能三大方面还存在较大距离。

“龙芯需求练好内功,通过规划优化进步单核通用处理功能。”胡伟武说到,3A4000和3B4000已根本添补单核通用处理功能的缺点,功能进步2至3倍(约20-30分),到达AMD的水平。

而现在,商场干流CPU运用GCC编译的单核分值为20至40分。

04

龙芯操作体系支撑软件生态建设

胡伟武谈到,龙芯的操作体系现在具有两种商业和技能形式。

面向专门企业,龙芯供给桌面和Windows服务器体系;面向设备企业,龙芯则根据根底版开源OS保护,支撑OS、整机和运用企业。

实际上,龙芯已面向三大不同的渠道开发相应的操作体系:

1、面向通用信息化体系的Loongnix。该体系根据通用Linux渠道进行完善和优化,为一致操作体系UOS龙芯版供给支撑。

2、面向高牢靠实时终端的LoongOS。该体系根据Linux/RT-Linux构建了简练高效的OS。

3、面向实时嵌入式运用的LoongWorks。该体系针对前史运用,根据VxWorks内核,完善图形和网络等API。

另一视点看,龙芯操作体系针对不同的硬件和运用,亦别离提出了两种不同的二进制兼容。

除此之外,胡伟武也说到,龙芯将进一步一致体系架构,构建规范规范体系,完成操作体系跨主板整机兼容和CPU代际兼容。

从龙芯3A4000开端,龙芯也将参阅规划全面支撑一致体系架构,开发支撑ACPI主板、固件、内核及OS的参阅规划,以及根据ACPI/EC笔记本规范的解决方案。

05

结语:我国自主CPU研制的里程碑

龙芯中科通过近二十年的开展,渐渐的变成了我国国产自主高功能通用处理器的技能领先者,不只打破了我国缺少自主研制CPU芯片的前史,一起也是我国构成自主知识产权核算机工业道路上的一座里程碑。

近二十年来,龙芯的自主CPU和OS现已趋于老练。胡伟武称,龙芯CPU通用处理功能已到达AMD水平,OS老练度也已挨近Windows XP。

但是,龙芯没有丰厚的运用和工业不配套,无疑是摆在自主CPU和OS未来开展道路上的一个阻止。未来,龙芯怎么完善根底软件环境和配套芯片,推进CPU和OS生态的进一步老练开展,这非常值得咱们等待。

全球AIoT工业立异峰会

材料引荐

社群招募

芯片半导体技能社群」正在招募!群内有:

职业分析解读、陈述材料共享、业界大V沟通

点个「在看」吧!

“如果发现本网站发布的资讯影响到您的版权,可以联系本站!同时欢迎来本站投稿!