QLC SSD 如何提供价值、性能和密度

Solidigm 出席 Gestalt IT 的 Storage Field Day

Gestalt 的 Storage Field Day 期间,Solidigm 介绍了如何设计 QLC SSD 以实现价值、性能和密度。每天产生的数据量和数据的应用都在不断增加。流服务、数据挖掘和机器学习只是需要创新存储解决方案的读取密集型工作负载的几个例子。

Computer code with speed-oriented graphics to depict density and performance in SSD storage for data centers.
Computer code with speed-oriented graphics to depict density and performance in SSD storage for data centers.

本文探讨了如何使用 QLC SSD 来满足不断变化的工作负载和读取密集型存储需求。它概述了 QLC SSD 的主要特性和功能,然后介绍了 Solidigm D5-P5336。 工作负载的变化导致存储需求的变化 数据正在改变存储和消费所涉及的工作负载类型,以及数据的存储位置。例如,人工智能和内容交付网络(CDN)增加了对后端读取密集型存储的需求,凸显了对大容量、高密度存储的需求。另一个例子是边缘计算,其中数据存储得尽可能靠近源。图 1 反映了这些不断变化的应用及其需求。

该图比较了边缘和数据中心的数据用例和需求。

图 1. 与数据中心、边缘基础设施和边缘设备相关的不断变化的数据需求概览。

图 1 显示了存储需求不断变化的三个领域:数据中心、边缘基础设施和边缘应用。尺寸和重量会影响边缘设备,包括本地服务器、物联网 (IoT)、台式机、笔记本电脑和其他便携式设备。当您从数据中心向边缘设备转移,对低功耗解决方案、出色的可靠性和在不可预测的条件下的运行效率的要求也会越来越高。

该图显示了以读取为主的工作负载的数据传输大小。

图 2。现代数据中心的数据需求图。

如图 2 所示,当今数据中心和云环境中许多最常见的工作负载都以读取为主。这些近似的工作负载特征是基于在全球范围内收集的云和企业环境数据。图表左侧显示了从 4KB 到 1MB 及以上的传输大小。图表底部显示的是读/写混合情况,右侧显示的是从小规模/随机到大规模/顺序的数据模式。

图 3 中所示的应用程序类型的关键存储需求包括:

  • 仍可调整的读取密集型存储
  • 大容量存储
  • 高密度存储
  • 可扩展存储
  • 可靠的存储

不过,其他需求涉及电源要求和服务便利性。过去,此类存储需求的主要解决方案是机械硬盘 (HDD)。但包括固态硬盘 (SSD) 在内的新解决方案正在不断涌现。

SSD 替代传统 HDD

对于许多应用来说,QLC NAND SSD 是 HDD 的有效替代品。QLC 代表四层单元,每个单元 4 位,NAND 是不需要电源来保留数据的闪存驱动器,SSD 代表固态驱动器。

1. QLC SSD:提高容量和成本效益

QLC NAND SSD 非常适合读取密集型工作负载,其数据容量比单层存储单元(SLC)、多层存储单元(MLC)和三层存储单元(TLC)NAND 固态硬盘更大。此外,QLC NAND SSD 可以与每单元存储较少位的闪存产品竞争,因为它们既能提供高密度存储,又能保持经济性。

2. QLC SSD:每 GB 成本更低

QLC NAND 固态硬盘的另一个优势是在相同空间内提供更大的容量,每 GB 成本更低。除了低延迟之外,与 HDD 相比,它们还具有出色的可靠性,[1] 部分原因是 QLC NAND SSD 没有移动部件(与传统 HDD 不同)。

当需要长期存储数据时,QLC NAND SSD 是数据备份和存档的绝佳选择。对于这些应用,QLC NAND SSD 是一个强大的解决方案,因为它需要在性能、成本和容量之间取得平衡。

QLC SSD 的应用

QLC SSD 的应用多种多样。例如机器学习 (ML) 和人工智能 (AI),在这些应用中,硬盘主要捕获数据,并从硬盘中提取数据,同时在不同的工作负载中进行分析处理。

其他依赖 QLC SSD 的应用包括在线分析处理 (OLAP),例如零售工作负载、地震和高性能计算 (HPC) 的数据挖掘。此外,还有金融服务行业 (FSI) 工作负载、超融合基础设施 (HCI) 和 CDN。

这些应用需要快速、高带宽的数据访问以及低延迟、读取优化的性能。Solidigm 的一款新产品满足了这些密集型现代存储需求。

Solidigm QLC SSD

Solidigm D5-P5336 是一款读取性能优化的存储解决方案,容量至高可达 61,44 TB。作为 Solidigm 的超值耐用 QLC SSD 选项,D5-P5336 以较低的总体拥有成本 (TCO) 为读取密集型工作负载提供大容量。

在支持读取密集型存储方面,D5-P5336 的读取速度可达 7,000 Mbps,写入速度可达 3,300 Mbps,并可通过软件进行调节,以更有效地满足各种工作负载需求。它在负载情况下具有出色的延迟、低错误率和 3,000 P/E 周期的耐用性。 [2]

  • E3.5,容量范围覆盖 7.68 TB 至 30.72 TB
  • U.2,容量范围为 7.68 TB 至 61.44 TB
  • E1.L,容量范围为 15.35 TB 到 61.44 TB

回顾图 2,图 3 显示了 Solidigm D5-P5336 在读取为主的工作负载中提供最佳性能的位置。

该图显示了 Solidigm D5-P5336 在以读取为主的工作负载的读取和写入方面的性能。

图 3。该图说明了现代数据中心的数据需求以及 Solidigm D5-P5336 最适合的位置。

该 QLC SSD 解决方案以更小的占用空间存储更多数据,访问速度更快,同时提供大规模可扩展性和极高的数据密度。[3] 这也使得这些 SSD 具有高度的可扩展性。例如,配备 24 个 61.4 TB 驱动器的 Solidigm D5-P5336 可提供的服务器总容量为 1.47 PB。

使用可靠的、以 Solidigm SSD 为基础的存储基础设施,Taboola 能够更加自信地扩展其推荐引擎业务,并确保存储随时可用。

Pisetsky 继续说道:“此类 SSD 在 Taboola 的分散式、超融合存储架构中具有很高的可靠性,从而控制了维护成本。”

严格测试下的可靠性

最后,图 4 总结了 Solidigm D5-P5336 的可靠性。请注意,这款 QLC SSD 进行了严格的测试,并实现了业界领先的数据可靠性。

可靠性和 D5-P5336 SSD 可靠性测试

图 4。Solidigm D5-P5336 的内在质量和可靠性。

最高容量 PCIe SSD

Solidigm D5-P5336 是世界上容量最大的 PCIe 4.0 SSD,[2] 其主要特点包括:能够在广泛采用的读取和数据密集型工作负载中加速数据;面向高密度存储环境的大规模可扩展性;[2] 在超大规模环境中大幅降低总体拥有成本和提高可持续性。[2,4]

如需了解有关这些主题的更多信息,请点击此链接观看完整的 Gestalt Storage Field Day 视频。

 

注释

[1] https://arstechnica.com/gadgets/2022/09/five-years-of-data-show-that-ssds-are-more-reliable-than-hdds-over-the-long-haul/

[2] https://www.solidigm.com/products/technology/d5-p5336-product-brief.html

[3] “温暖存储空间需求至多缩减 20 倍”声明基于对 4 TB 机械硬盘与 30.72 TB Solidigm SSD D5-5316 E1.L 或 U.2 驱动器的比较,4 TB 机械硬盘需要 10 个 (2U) 机架空间才能装满 1 PB 存储,而后者仅需要 1U 机架空间即可装满 1PB 存储。机架整合率提升多达 20倍。

[4] https://estimator.solidigm.com/ssdtco/index.htm

图4 注释

  1. 端到端数据保护。来源 – Solidigm。增强型电源故障预警 – 额外的固件检查以验证数据在电源恢复时被正确保存。尚不清楚其他产品是否提供此附加的固件检查。强大的端到端数据保护 - 内置冗余,可以同时使用 ECC 和 CRC。保护控制器内的所有关键存储阵列 - 指令缓存、数据缓存、间接缓冲区和物理缓冲区。SRAM 的 ECC 覆盖率超过 99%,在业界名列前茅。
  2. UBER 测试。来源 – Solidigm。不可纠正的误码率 (UBER) - 测试到了比 JEDEC 规范高 10 倍的量级。Solidigm 在驱动器整个生命周期的各种条件和循环次数下测试到了 1E-17,比 JEDEC 固态驱动器要求和耐用性测试方法 (JESD218) 中指定的 1E-16 高 10 倍。https://www.jedec.org/standards-documents/focus/flash/solid-state-drives。静默数据损坏(SDC)- 模拟 1E-25。典型的可靠性验证测试包括使用 1000 个 SSD 测试 1000 小时,以建模至 1E-18。Solidigm 驱动器在 Los Alamos 国家实验室的中子源经过测试,以测量静默数据损坏 (SDC) 易感性至 1E–23,并建模至 1E–25。
  3. SDC resistance. SDC 抗性。来源 – Solidigm。在洛斯阿拉莫斯国家实验室的中子源处对驱动器进行测试,以测量静默数据损坏对 1E-23 的敏感性,并建模为 1E-25。测试使用特定的数据模式预填充驱动器。接下来,中子束聚焦在驱动器控制器的中心,同时连续发出 IO 命令并检查其准确性。如果驱动器出故障并卡住/变砖,测试脚本会关闭驱动器和中子束。驱动器随后重新启动,并检查数据完整性以分析故障原因。在运行过程中,可能会出现静默数据损坏(SDC),从而导致关机命令的执行,或者如果中子束击中控制逻辑导致在途数据损坏而卡住驱动器并导致重启。因为驱动器无法保证数据完整性时会进入禁用逻辑(变砖)状态,因此变砖年化故障率被用作错误处理有效性的衡量标准。Solidigm 驱动器已经在 4 代产品中使用了这种测试程序。累计测试时间跨越了几代,相当于超过 600 万年的运行寿命,期间没有发现任何 SDC 错误。最近的测试使用了 Solidigm D5-P5520 驱动器作为 Solidigm D5-P5430 驱动器的代理,因为它们共享相同的控制器和类似的固件。测试的竞品驱动器包括三星 983 ZET、三星 PM9A3、三星 PM1733、美光 7400、美光 7450、Kioxia XD6、东芝 XD5 和 WD SN840。
  4. 行业领先的 AFR:来源 – 截至 2023 年 3 月的 Solidigm AFR 数据。Solidigm 将年故障率 (AFR) 定义为客户退回的较少设备数量,经评估发现其功能完整且可供使用。
  5. 真实世界的性能。来源:Solidigm。有关详细信息,请参见附录 – D5-P5336 性能测试。
  6. 客户支持满意度来源 – Solidigm。基于对 2021 年呼叫中心所有工单的分析。

关于作者

Solidigm 产品营销经理 Jeniece Wnorowski 在数据中心存储解决方案领域拥有 14 年以上的经验。Jeniece 最初在英特尔从事技术营销工作,后来加入了 Solidigm,并继续与多家公司和合作伙伴一起推广数据中心 SSD 创新技术。工作之余,Jeniece 喜欢与孩子共享欢乐时光,参加柔道训练,探索户外活动。