当前位置: 首页 > news >正文

免费网站建设模版下载网页开发与网站开发

免费网站建设模版下载,网页开发与网站开发,东莞模块网站建设方案,网站建设 小程序开发1. 引言 前文介绍了Arm公司近几年在移动处理器市场推出的Cortex-A系列处理器。Cortex-A系列处理器每年迭代#xff0c;性能和能效不断提升#xff0c;是一款非常成功的产品。但是#xff0c;Arm并不满足于Cortex-A系列每年的架构小幅度升级#xff0c;又推出了X计划#x… 1. 引言 前文介绍了Arm公司近几年在移动处理器市场推出的Cortex-A系列处理器。Cortex-A系列处理器每年迭代性能和能效不断提升是一款非常成功的产品。但是Arm并不满足于Cortex-A系列每年的架构小幅度升级又推出了X计划也就是Cortex-X产品线。Cortex-X系列处理器采用了激进的架构设计大幅度提升移动处理器的性能俗称超级大核本文将重点介绍Arm的Cortex-X系列产品。 2. X计划起源 Cortex-X计划起源可以追溯到2016年当时Arm推出了一个新的客户Licence叫做“Build on Cortex”允许用户请Arm基于Cortex核心做一些定制优化如可以增加或者减少Cache数量等客户如高通公司一直是该计划的使用方用于开发和迭代每年的Kyro系列处理器。到了2020年Arm公司正式宣布推出Cortex-X这一全新的高性能处理器设计计划。Cortex-X计划的目标是为高端移动平台、云服务场景、边缘计算和高性能计算设备提供更快、更强大的处理器核心。 Cortex-X系列定制处理器计划相比2016年的定制方案要更加深入Cortex-X系列处理器的目标是给用户提供足够强大性能的核心在此计划下芯片厂商可以早期参与Arm的Cortex处理器架构设计并基于 Cortex-X 核心进行定制优化以适应自己的产品需求。但是从产品的表现看由于Arm每年都在迭代Cortex-X系列处理器2023第四年预计会更新Cortex-X4迭代速度和周期都非常快芯片厂商并没有针对X系列处理器特殊定制微架构而是通过搭配不同尺寸的缓存设计出面向不同价位段的产品。 Cortex-X系列的出现和市场竞争日益激烈芯片厂商有较强需求相关。市场上苹果公司坚持自己研发A系列处理器 苹果的A系列处理器是专为iPhone和iPad设备设计的自研处理器基于Arm指令集苹果自己设计并优化了微架构。从2010年推出的A4处理器开始推出第一款量产产品当前苹果A系列处理器已发展到A162022年。A系列处理器一直采用较为激进的微架构设计通过强大的计算能力领先行业。最新A16还是保持Armv8指令集没有升级到Armv9指令集最后我们会简单对比下Cortex-X系列和苹果的A系列处理器的差异。 2017年至2022年的Arm系列处理器 3. Cortex-X1第一代Cortex-X处理器 2020年5月Arm发布了基于Armv8.2架构的最后一款处理器Cortex-A78同时还发布了一颗性能更强大的Cortex-X1处理器。Cortex-X1 处理器比之前的 Cortex-A77 提升了 30% 的性能由于采用大缓存的设计架构还提升了 23% 的芯片能效。简单总结下X1提供了更强的性能整体更优秀的能效但是极限功耗高于Cortex-A78。 Cortex-X1性能强大能效有明显改善但是由于增大了缓存和处理单元使得芯片的整体面积增大不少厂商往往出于成本考虑一般在处理器中只会放置一颗Cortex-X系列处理器来提升单线程的峰值性能。从Cortex-X1出现后市场上的旗舰处理器架构发生了变化逐步从44架构演变成有一个超级大核心的134架构。 下图是一个典型示意图在5nm工艺下如果仅升级到A78性能提升20%面积可以减少15%在5nm工艺下升级到1个X13个A78L3增大峰值性能可以提升30%但是面积要增加15%一来一回差异30%芯片面积这样看来旗舰芯片要涨价也情有可原了。 我们看一下Cortex-X1的微架构细节相比A78Cortex-X1具体有以下提升 1、BPU分枝预测单元的L0 BTB从64提升到96增加50% 2、前端Decode从4路提升到5路 3、MOP通路从6路提升到8路 4、MOP Cache从1.5K提升到3K增大一倍 5、ROB缓冲从160推测提升到224参考AMD的Zen2处理器的ROB是224 6、L1\L2\L3都较大分别是64KB起、256KB起、最多8MB 7、执行单元整数和存储部分变化不大浮点单元相比A78提供了2倍的NEON单元可以同时提供4个128bit运算能力 8、存储单元通路虽然没有变化但是其Load\Store的缓冲数量增加了33%。 下面用一张表格列举了一些微架构的核心变化 第一代的Cortex-X1还是使用的Armv8.2的指令集并没有升级到Armv9似乎Arm觉得要在2021年同时发布Armv9和全新的Cortex-A、Cortex-X系列压力有点大所以提前将Cortex-X1的发布放在了2020年。 可惜Cortex-X1的命运可谓生不逢时2020年采用Cortex-X1的典型旗舰处理器有三星的Exynos 2100和高通的Snapdragon 888这两款处理器都搭载了三星的5nm工艺5LPE这一次三星工艺翻车了架构的提升得不到工艺的补偿导致这两款处理器的性能和功耗的表现都不是很好。目前2023年市面上还活跃着不少采用A78处理器架构的芯片如MTK的天玑8100、8200等处理器但是已经鲜少看到搭载Cortex-X1处理器的芯片了。 4. Cortex-X2第二代Cortex-X处理器 2021年5月Arm的Cortex-X2系列处理器如期而至。这一次Cortex-X2正式升级到了Armv9新架构搭载了SVE2指令集并且只支持运行64bit软件。还记得A710的产品代号叫做Matterhorn么这一代Arm为了更好的记忆产品代号将Cortex-X2处理器的产品代号命名为Matterhorn-ELP后续Cortex-X系列应该也是基于同期Cortex-A系列的产品代号增加ELP后缀ELP的全称是Enhanced Lead Partner的意思。 第一代的Cortex-X1由于搭配工艺的原因导致整体不佳的表现并没有掩埋Cortex-X系列微架构的成功Arm计划将Cortex-X系列发扬光大后续我们看到的也是每年一更新的快速迭代节奏。如此快速的更新节奏芯片厂商也很难深度定制后续各大厂商发布的几款采用Cortex-X系列处理器的产品还是采用了Arm的公版架构基于产品的价位段在Cache容量上做一些差异化的配置。 从上图中可见Arm对于两个系列的策略有所不同Cortex-A系列主打均衡能效并小幅度改善性能 Cortex-X2相比Cortex-X1在性能上有更明显的提升进一步拉开了A系列和X系列的性能差距由此可见Cortex-X系列的目标是推进Arm核心架构的算力提升和突破。 从互联网上可以找到Cortex-X2的微架构框图我们可以此对比Cortex-X2和Cortex-X1的微架构差异并分析影响性能提升的因素。Cortex-X2相比Cortex-X1在微架构上有以下变化 1、将分支预测和Fetch解耦提升并行度 2、指令流水线从11级减少到10级dispatch从2个时钟周期减少到1个时钟周期 3、ROB缓冲从224提升到288提升了30% 4、支持SVE2 SIMD指令集 5、ML能力支持Bfloat16 6、取消了Aarch32支持 7、Load\Store结构体缓冲提升33% 8、d-TLB从40提升到48提升了20% 再来看看具体性能数据Arm宣称Cortex-X2相比Cortex-X1在整数性能上提升了16%在ML能力上提升了2倍。回顾一下A710Arm宣称的数据是相比A78提升了10%的整数性能。从能效曲线上看Cortex-X2的最大性能和功耗都有增加能效在低频率区间和Cortex-X1差异不大在中高频率区间相比Cortex-X1有改善。由于极限功耗持续增加对于散热能力和发热策略改善提出了更大的诉求和压力。 2021年第一代搭载了Cortex-X2的处理器高通8Gen1由于采用了三星4nm LPX工艺性能功耗的表现不是很理想后续高通将工艺切换到台积电4nm工艺在2022年推出了同样设计的8Gen1处理器宣称CPU功耗降低了30%这才发挥出了Cortex-X2的实力目前有多部热门手机搭载当前也是Cortex-X系列产品中卖的最好一代。 5. Cortex-X3第三代Cortex-X处理器 2022年6月市场上还在关注升级新工艺的Cortex-X2系列处理器产品时Arm发布了当年的新品Cortex-X3Cortex-X3的代号是Makalu-ELP和同期Coretex-A715的代号Makalu保持一致。2021年的Cortex-X2肩负着升级Armv9指令集的任务在微架构上的修改上相比第一代并不是很多。新一代的Cortex-X3在微架构上的升级和变化要更多一些后续我们会详细分析。性能上Arm宣称Cortex-X3在性能相比上一代IPC提升11%综合性能有22%的提升包含工艺的提升。 从Cortex-X2开始X系列处理器就不再支持32bit应用这一代Arm继续针对64bit进行微架构的优化通过剔除和优化一些陈旧的32bit兼容设计进一步提升64bit应用程序的执行效率。 下面我们具体看一下Cortex-X3微架构相比上一代的变化 1、MOP Cache尺寸变化。随着半导体工艺的持续演进接下来的3nm新工艺将继续缩小半导体器件的尺寸但是在半导体中SRAM的尺寸并没有随器件尺寸缩小而同步缩小。如何减少SRAM的占用是对先进工艺设计提出的一个考验。在Cortex-X3的前端设计中Arm将L0的MOP Cacha的SRAM从上一代的3K减少到1.5K推测也是为了减少未来在先进工艺中SRAM的占比。同时Arm提出通过优化Cache的填充算法来做到尽量不影响性能。记得MOP Cache在A77引入时就有讨论过1.5K的容量就可以达到85%的命中率增加容量带来的边际效益也增加所以增大Cache带来的效果提升会越来越小所以这次Arm将Cortex-X3的MOP Cache降低到1.5K同期的A715则是取消了MOP Cache。 2、Fetch-decode通路从5路提升到6路Fetch能力提升了20% 3、在ROB重排序缓冲区上上一代Cortex-X2是228个Cortex-X3继续提升11%达到了320 entries 4、Arm继续提升Cortex-X3的分支预测能力L1 BTB从64提升到96L2 BTB从16384提升到24576。分支预测单元通过解耦合设计和Fetch形成两条核心指令通路大幅提升同步执行效率一旦发生了分支错误可以快速从BTB缓冲中拿到需要的指令进行快速切换。通过这些优化Arm宣称平均分支预测延迟周期数减少了12.2%整体执行流程中Stall占比降低了3% 5、在分支预测模块上持续优化Cortex-x3中为indirect branches新增了一个独立预测单元并提升了conditional branches的准确率Arm宣称平均的分支预测错误率可以降低6.1% 6、流水线的优化Cortex-X3继续优化了流水线从10级优化到9级主要是优化了MOP Cache的读取周期 7、执行单元上这次Cortex-X3大幅度提升了整型ALU的数量从4个提升到6个是一个比较大的变化整体从2个branch2个ALU变化为2个branch4个ALU主要是提升了整型性能 8、访存单元上因为提升了ALU的数量相应的整型读取带宽也从24提升到了32并且增加了两个额外的数据预取模块。 上面是Cortex-X3的微架构框图我们把X1至X3放在同一张表中对比 6、Cortex-X3和苹果处理器的对比 Cortex-X系列处理器通过三代的迭代不断升级微架构提升性能其单核心有明显提升已经在拉近苹果A系列处理器和Intel台式机处理器的差距。图中对比了不同处理器的单核心的性能可以看到Cortex-X3相比Cortex-X2有进一步的提升距苹果的A15处理器还有一些差距。目前我还没有找到苹果A15处理器的微架构但是有找到2020年A14处理器大核心Firestorm的微架构下面通过表格做了一个对比。 从Cortex-X系列和苹果A14的对比可以看出苹果在设计A系列处理器时对于微架构的调整更加激进采用了更大的L1、L2缓存Decoder数量更多而ROB缓冲的尺寸几乎是Cortex-X系列的一倍这也对于指令重排序的效率和算法优化能力提出了更高的要求。 虽然Cortex-X系列每年迭代相比苹果的A系列激进的设计目前还存在一定的差距。但是随着Cortex-X系列处理器的每年迭代更新我们也希望看到在微架构能力上打平甚至超过竞品的那一天。 由于苹果在A系列处理器采用大缓存大尺寸设计在智能手机产品中一般是放置两颗大核心采用24的架构。采用Cortex-X系列处理器的安卓手机一般采用八核心的架构例如最新的高通8Gen2处理器采用1个Cortex-X32个A7152个A7103个A510的组合架构提供了5个大核心的算力在多核心算力上相比6核心有多2个核心的优势一定程度上弥补了多核心的差距。 7、总结和对Cortex-X4处理器的期望 距2023年中Arm发布Cortex-X4处理器的时间不远了下一代的Cortex-X4处理器的代号叫做Hunter-ELP期望这一代的“猎人”能给我们带来更多的惊喜新的架构改了什么地方有多少性能提升我也会第一时间关注和分享。 Arm公司通过三年时间迭代Cortex-X系列处理器每年的性能上都有两位数的提升切实让消费者使用上了更快更强的处理器和产品这半年来采用Cortex-X2和Cortex-X3系列架构的高通8Gen1、8Gen2、MTK的天玑9200等处理器的市场口碑都很不错。 此外高通的8Gen2处理器还第一次打破了传统4颗大核心的架构提供了143的5颗大核心配置组合。期望未来的产品不但可以看到Arm的最新架构而且可以看到更多有意思的CPU核心架构组合如果可以在一个处理器中放置多颗Cortex-X核心相信基于Cortex-X系列的Arm处理器也可以挑战苹果 A系列处理器综合性能。 参考链接 1、https://www.anandtech.com/show/15813/arm-cortex-a78-cortex-x1-cpu-ip-diverging 2、https://fuse.wikichip.org/news/3543/arm-cortex-x1-the-first-from-the-cortex-x-custom-program/ 3、https://en.wikipedia.org/wiki/ARM_Cortex-X1 4、https://en.wikipedia.org/wiki/ARM_Cortex-X2 5、https://fuse.wikichip.org/news/6855/arm-unveils-next-gen-flagship-core-cortex-x3/ 6、https://www.techinsights.com/blog/cortex-x3-powers 7、https://www.hwcooling.net/en/cortex-x3-the-new-fastest-arm-core-architecture-analysis/ 8、https://twitter.com/Cardyak 点击链接可查看往期系列文章从A76到A78——在变化中学习ARM微架构 Arm微架构学习系列2——开启Armv9时代 长按关注内核工匠微信 Linux内核黑科技| 技术文章 | 精选教程
http://www.hkea.cn/news/14311598/

相关文章:

  • 网站建设费如何做账wordpress 医院模板
  • 北京海淀区居家办公网站功能优化
  • 兰州网站的建设网页设计师面试
  • 广州外贸网站建设 open购物网站建设市场调查论文
  • soso网站提交入口国外优秀的字体设计网站
  • 做网站推广的销售电话开场白大连微信公众号开发
  • 企业网站建设中存在的问题分析设计师发布作品的网站
  • 一个好的网站怎么建设网站设计网站开发优化
  • 章丘环保网站建设 中企动力asp.net 怎么做网站
  • 专门做童装的网站有哪些民间it网站建设
  • 网站运营发展前景wordpress代码显示头像
  • 宝安的医院网站建设h56wcom什么网站
  • 软工毕设做网站wordpress 说说 主题
  • 网站里的动效怎么做广东网站建设系统
  • 网站优化哪里可以做网站做网络营销
  • 网站宽度980 在ipad上 左对齐了物流网站的建设实训
  • 中台网站开发江阴做网站哪家好
  • 学网站开发要什么基础短视频运营是做什么的
  • 网站开发与设计实训心得网络科技公司企业简介
  • 做好网站wordpress oyester
  • 厦门关键词seo排名网站企业品牌网站开发制作合同
  • 企业网站视频栏目建设方案flash网站优缺点
  • 用来做微网站的怎么判断网站有没有做百度商桥
  • 青岛建站行业广告词
  • 做网站各个流程做软件去哪个网站
  • jsp网站开发参考文献建设企业网站开发公司
  • 东莞seo整站优化火速公司网站建设合同要交印花税吗
  • 网站建设的展望重庆网站建设齐重庆零臻科技
  • asp.net 网站开发 ppt网络软文推广案例
  • 郑州网站制作哪家便宜物流网站建设案例