论文部分内容阅读

NAND闪存分类
我们都知道,目前NAND闪存可以分为SLC、MLC、TLC、QLC四种架构的存储颗粒,它们的性能与可靠性依次降低。其中,SLC闪存的每个Cell单元只能存放1bit数据,也就是电压只有0和1两种变化,由于结构简单,使得SLC闪存拥有超过10萬次的可擦写寿命(P/E次数)和更好的性能。

MLC、TLC和QLC闪存的每个Cell单元分别可以存放2bit、3bit和4bit数据。以QLC闪存为例,虽然它在相同单元数量下可以做出4倍于SLC的容量(电压状态),但由于它的电压变化高达16种(2的4次方),管理起来愈发困难,导致其读写速度大幅下降,可擦写寿命也骤降至不足1000次(图1)。因此,作为QLC的接班人,每个Cell单元可以存放5bit数据的PLC闪存,哪怕它可以帮助SSD进一步扩容并降低成本,但其可靠性就更加令人难以放心了。
那么,对SSD来说成本、容量与可靠性就真的难以兼顾吗?通过英特尔2021年主打的670P SSD(QLC闪存颗粒),我们不难找出想要的答案。

QLC如何逆天改命
提起英特尔,很多朋友可能只知道这是一家专业的处理器制造商。实际上,英特尔在闪存技术的研发方面也有着超过30年的历史,早在20世纪80年代中期就开始进军NOR闪存,并在2005年左右挥师应用更广泛的NAND闪存战场,参与见证了从6 5 nm→1x nm工艺、2DNAND→3D NAND、SLC→QLC在内的各种技术迭代(图2)。
3D NAND技术
想要弥补SLC→QLC闪存架构变迁过程中,在性能和可靠性方面的损失,最有效的方法就是提高单位面积的容量。于是,3D NAND堆叠技术便出现了。
简单来说,传统的2D NAND只有平面上的2个维度,单位面积就那么大,想要提升容量只能指望制程工艺的升级。而3D NAND则可以像搭积木一样,将无数个2D NAND一层层的堆起来(图3),此时再结合更先进的制程工艺,可以在单位面积堆起摩天大厦,从而实现更高的存储密度以及更高的可靠性。
英特尔在2016年便搞定了第一代3DNAND技术,可以进行32层的堆叠。2017年,英特尔发布了使用第二代3DNAND技术,可进行64层堆叠的QLC颗粒,存储密度增加了133%,并于第二年(2018)实现QLCSSD的量产上市。随后,2019年的96层第三代3DNANDQLC进一步将存储密度提升了50%,2021年最新发布的144层第四代3DNANDQLC再度提升了50%的存储密度,较之第一代3DNAND翻了数倍(图4)。

就大家最关心的闪存可擦写寿命,这个P/E次数也不是一成不变的,它会随着算法、技术和NAND的优化升级而不断增加的。多年前东芝QLC试验中的P/E次数只有500次,但实际量产QLC的P/E次数却可达1000次。同理,随着垃圾回收、TRIM、坏块管理、错误纠正等技术和功能的引入,QLCSSD的可靠性也会不断转好。以英特尔670P为例,其512GB容量版本的耐用性已经达到了185TBW,虽然依旧不如同容量高端TLCSSD的300TBW,但较之消费者最早的预期已经有了巨大的提升。
垂直浮栅闪存结构
前文我们提到了,每个单元可保存4bit的QLC拥有16种电压状态,未来的PLC更是拥有高达32种电压状态,后者在如何保持数据稳定性、持久性面临更大的挑战。为了解决这个问题,英特尔的方法是优化闪存的底层结构设计。

简单来说,英特尔的3D NAND闪存一直都在走浮动栅极(FG)结构+阵列下CMOS设计(CuA)的路线。而其他友商的3D NAND闪存则多为替换栅极结构,或者说电荷撷取闪存结构(CTF)路线。通过对比来看,英特尔浮动栅极的Cell单元是均衡的,拥有更紧密、对称的堆栈层,没有额外单元开销,而友商的替换栅极则会浪费一些空间,从而影响Cell单元的堆叠效率以及密度(图5)。从英特尔给出的数据来看看,英特尔3 DNAND的面存储密度可以高出最多10%,每块晶圆可以切割出更多容量,成本也能得到更好控制。
为了提升可靠性,英特尔3 DNAND闪存还采用了垂直浮动栅极单元技术,它通过浮动栅极技术存储电子路径,不同的Cell单元之间都是分离的,可最大限度降低单元之间的干扰,更好地防御漏电(图6)。与此同时,英特尔还利用离散电荷存储节点,具备良好的编程/擦除阈值电压窗口,可以有效保障存储单元之间稳定的电荷隔离,以及完整的数据保留(图7)。

随着SLC→QLC闪存单元从可存储bit以及电压状态的增加,它们的“读取窗口”也会越来越小,从而降低读取准确性,一不小心就会分不清到底是1还是0,最终会影响到可靠性上。英特尔3DNAND闪存主打的FG浮动栅极结构,较之CTF电荷撷取闪存结构,在长时间使用过程中的电荷损失程度更小,哪怕FG结构在5年后的电荷保留程度都堪比CTF结构在5年前的初始状态(图8)。

未来PLC閃存的读取窗口将更进一步收窄,将对电荷损失的控制力度提出更高要求,而这恰好就是英特尔3D NAND技术所擅长的。
理性看待QLC SSD
回到英特尔最新推出的670P系列身上,这款QLC SSD定位于桌面、笔记本的日常计算、办公、内容创作、主流游戏场景,采用标准的M.2 2280接口形态,PCIe 3.0×4通道并支持NVMe协议,容量可选512GB、1TB、2TB,单面设计的兼容性更好。其顺序读写最高可达3.5GB/s、2.7GB/s,对比上代同样采用QLC闪存的660PSSD分别提升了94%和50%,随机读写有了大幅提升(图9)。需要注意的是,无论是670P还是其他TLC和QLC SSD,它们的标称性能其实都来自SLC缓存的读写。
英特尔670P系列SSD的SLC缓存包括静态和动态两种。其中,其静态SLC缓存恒定不变,动态SLC缓存则会根据总容量、可用容量而智能调整,相比上代增大了最多11%(图10)。具体来说,512GB版的670P静态缓存6GB+动态缓存最多64GB=70GB;1TB、2TB则是最多12GB+128GB=140GB、24GB+256GB=280GB。

换句话说,英特尔670P在SLC缓存容量以内的读写速度表现并不逊于同价位的TLCS S D,但在缓外写入速度方面则会出现比TLC SSD更大的断崖式下降,因此购买该系列或其他QLC SSD的用户切忌将硬盘填满,每个硬盘分区都要留出15%以上的剩余空间。在预算允许时,最好一步到位,挑选1TB容量起步的型号,从而获得足够的SLC缓存冗余。
EVO是英特尔针对第11代酷睿(移动版)制定的高端认证平台,而670P SSD则是该平台的推荐组件之一,这也从侧面证明了其性能与可靠性,为QLC SSD正名(图11)。

实际上,从近10年闪存发展的历程来看,SLC→MLC→TLC→QLC虽然它们在技术层面的(相对)性能下降了,但是绝对性能却是在不断增长的—— 最新的Q LCSSD无疑可以秒杀最早的SLC SSD。时至今日,别说SLC了,采用MLC闪存的SSD也变得凤毛麟角,哪怕是三星980 PRO这种旗舰级SSD,也开始倒戈TLC。随着时间的推移,QLC取代TLC也是大概率事件。
以英特尔670P为代表的QLC SSD之所以还没被市场接受,是因为它没有达成消费者的心理预期——理论上QLC较之TLC的成本更低,但同容量QLC S SD的价格却没能与TLC SSD拉开差距,在价格相近时,大家为什么不选择更可靠的TLC?