全国服务热线 4001334566
语言
关于我们

Company Profile

[行业动态]首颗SSD主控镇岳510,构建数据中心巅峰存力!

11-02

日前,在2023年云栖大会上,平头哥半导体发布首颗SSD主控芯片镇岳510。自布局倚天710 CPU、羽阵RFID射频标签等芯片之后,平头哥这次将产品线拓展到存储领域。

镇岳510 SSD主控芯片支持先进的PCIe 5.0接口,支持DDR5.0技术,内置玄铁910 RISC-V多核CPU,采用平头哥自研芯片架构,同时针对云计算场景专门优化存储设备,能够发挥更佳的性能。

为什么平头哥会选在这个时间点发布企业级SSD主控芯片?平头哥产品总监周冠锋表示,SSD每隔三四年会进行一次产品迭代。2023年是SSD从PCle4.0到PCle5.0的重点演进节点。因此平头哥提前规划这颗PCle5.0接口协议的芯片来顺应市场趋势,同时满足平头哥在数据中心的业务发展需求。

至此,面向数据中心、云计算领域,平头哥实现了存力这一不可或缺环节的高阶部署。

软硬件协同创新,核心指标业界领先

我们知道数据中心的存力就是存储设备的能力,一般来说包括性能、能效、可靠性、时延等主要指标。以SSD来看,主要体现在,提供的读写带宽和IOPS(每秒的读写次数),SSD每消耗一瓦功耗可以提供的性能,SSD纠错的能力强度也就是UBER(即每读取多少笔数据会有一笔数据可能纠错失败),以及SSD从收到命令到返回响应的时延。从这几个维度来看,平头哥镇岳510已达到业界领先水平。
图片

从性能上来说,平头哥镇岳510 SSD主控芯片可以支持3400K IOPS的能力,在业界属于第一梯队。一枚镇岳510的性能相当于1万块高性能HDD的性能总和。在能效比方面,镇岳510 每瓦功耗可提供420K IOPS,也是业界领先水平。以一个部署10万块SSD的数据中心为例,相比目前主流的PCIe 4.0 SSD,镇岳510在相同的性能下仅主控芯片即每年节省260万度电,按照一度电排放0.785千克二氧化碳计算,每年可减少二氧化碳排放2千吨。

同时,镇岳510内置创新的IO自动化处理机制,前端IO解析与处理,由专用硬件模块自动完成,实现了业界领先的超低的时延(4μs),可以带给应用极佳的体验,比业界SSD降低30%以上。不仅如此,镇岳510芯片内实现了IO/SYS/GC的全链路隔离,极大的降低这些任务之间的相互干扰,提供了既低又稳定的时延表现。

可靠性方面,镇岳510内置了平头哥自研的高性能LDPC纠错算法,编码效率逼近香农极限,同时ErrorFlow相比业内SSD更优一个数量级;同时借助平头哥自研闪存电压预测算法,可以在各种闪存的不同工况、寿命、温度等条件下,准确预测闪存电压漂移,进一步降低LDPC解码器的输入误码率。其实现了低至10^-18的UBER,相当于每读取百亿亿笔数据,才可能有一笔数据纠错失败。这样的指标同样处于业界领先水平。

自研SSD设计架构

目前在业界SSD主控芯片的架构设计主要有两种方案,一种类似于纯SoC,由软件主打。也就是从主机的命令接收到解析到拆分,到各种表象的管理,再到芯片后端应用的组装和下发等等都是由CPU来完成。

另一种方案是软硬件结合,可以大幅卸载硬件负载。平头哥SSD团队经过长时间的验证,结合计算性能以及能耗的权衡,最终选定了软硬件结合的方案。

周冠锋分析,在这颗SSD主控芯片里使用了比较独特的硬件加速模块,进行了卸载加速,实现较好的性能和低功耗。同时还采用了自研的数据纠错算法,可以把数据恢复的可靠性再优化一个数量级。此外,我们还跟阿里云联合定制一些特性,使得这颗芯片在云上应用时整个存储系统的性能、能效和服务质量更好。

区别于消费级芯片,企业级SSD主控芯片要求连续数年工作,7*24小时全天在线,企业级SSD的工作环境并不需要承担大量的应用访问,但对性能带宽IOPS有着更高要求。除了读写速度外,企业级SSD主控还要支持端到端的数据保护,支持虚拟化以及一些新的协议比如ZNS。现在平头哥已经掌握了SSD主控芯片设计的全部技术。

与数据中心、云计算业务高度耦合

为了满足云上业务的迅猛发展,以CPU为代表的通用算力,以GPU、NPU为代表的的AI算力,呈指数级增加;网络也从25GE、100GE、200GE快速演进,并进入400GE、800GE时代。而以SSD为代表的存力,需与算力、网力相匹配发展。但数据中心SSD存储在高读写吞吐速率、复杂负载下的稳定时延、更优的TCO、更高的存储密度等方面都存在着挑战。例如,云上为了提高并发能力,业务请求通常会被拆分为多笔子请求分散到众多SSD并发执行。任何一块SSD的时延发生抖动,都会造成整个业务请求的延迟。

平头哥对阿里云业务有着更深刻的理解,SSD主控芯片的设计与云应用场景高度耦合,从而提供更好的性能体验。对于此,周冠锋表示镇岳510主要做了几方面的适配优化。

首先是消除SSD接口税。在传统的系统方案中,SSD与存储系统分离设计,也就是存储语议、闪存数据排布和启停SSD后台任务等动作相对割裂,给整个存储系统的性能与寿命带来了额外消耗。
图片

为了消减“SSD接口税”,2021年5月,ZNS协议被收入NVMe规范2.0版本中,并得到了SPDK、Linux以及各设备商的支持。ZNS协议是通过将盘内FTL层(即闪存转换层)上移至存储系统,达到了存储系统与闪存特性的匹配。

镇岳510完美实现了ZNS协议,通过灵活的硬件表项加速保持了高IO性能,Zone分区状态交由玄铁910维护,保留了对新协议的灵活性。同时,镇岳510定制了Last Sector(最后一个扇区) 随机写功能,实现了小报文的多次反复下盘,简化了ZNS的应用难度。

总之,镇岳510通过存储软件与NAND特性完美契合,达到数据排布的最优化,后台操作的最小化,从而消除SSD接口税。

其次是全链路QoS优化(QoS即服务质量,代表SSD性能稳定性的指标)。NVMe规范中制定了以队列为粒度的标准SQ(即用户队列)调度机制,但其灵活性较差,对于业务种类复杂、追求灵活可配的云存储系统来说,它并不是最佳选择。

镇岳510在支持NVMe标准的SQ调度机制的同时,额外定制了基于IO粒度的优先级调度机制,允许系统按IO打标,优先级种类多达8级,结合云存储系统,能够更好的保障延迟敏感型业务的服务质量。

再者是智能卸载。镇岳510以IO为粒度,遵循上层存储语义进行校验,补齐了整个存储系统的数据链路校验的最后一环。不仅如此,镇岳510还支持以存储语义对内部数据进行后台巡检,而无需再读出至服务器,节省了宝贵的PCIe带宽、服务器内存带宽与CPU算力。

为AI计算、数据爆炸时代而生

平头哥镇岳510 作为一款高端企业级SSD主控芯片主要应用于比如AI计算、大数据分析、在线交易以及高性能数据库等场景。据悉,这颗芯片很快将进入量产阶段,并首先在阿里云上线使用。同时,它不仅适用于阿里云,也同样适用于外部的不同云环境。
图片

今年以ChatGPT为代表的AI大模型对数据量、对SSD设备的读取带宽等提出更高要求,也带来更多存储机遇。周冠锋提到,存储方案设计需考虑数据源和数据落地情况,例如AI推理注重存储的带宽、时延。AI训练注重IOPS。总之底层的SSD主控芯片在设计时要充分考虑上层应用的IO模型。

每一年全球数据量呈指数级增长,数据爆炸的趋势下存储设备担负更多数据存储和实时分析的功能,这也为数据中心存储带来巨大的发展潜力。

小结

从PCle3.0开始,几乎每演进一代都大约花费四年的时间,如今数据中心来到PCle5.0时代,平头哥与时俱进推出PCle5.0 SSD主控芯片,提前卡位下一个黄金发展期。周冠锋预计PCle5.0会是一个长周期的协议。而平头哥的SSD主控芯片产品线将延续高性能企业级路线,不断满足数据中心、云计算的需求。

Copyright © 2011-2023  北京天华中威科技有限公司 版权所有 京ICP备2023011416号-1 All Rights Reserved