分享自:

利用字节可寻址元数据提高SSD寿命

期刊:MEMSYSDOI:10.1145/3132402.3132420

本文是一个基于原始研究的学术报告,主要阐述了通过字节可寻址元数据(Byte-Addressable Metadata, BAM)设计改善固态硬盘(SSD)寿命的新方法。这篇文章由Yanqin Jin(现供职于Alluxio)、Hung-Wei Tseng、Yannis Papakonstantinou和Steven Swanson等学者完成,分别隶属于University of California, San Diego和North Carolina State University的科研机构。文章发表于2017年10月2日至5日在美国弗吉尼亚州亚历山大的Memsys 2017会议。

背景与研究目标

固态硬盘(SSD)因其高性能和低功耗在存储领域广泛应用,但NAND闪存的固有限寿性限制了其应用的可持续性。现有的SSD通常使用FLASH-Translation Layers(FTLs)来管理映射逻辑地址到物理地址的复杂过程。然而,传统FTL将元数据存储在闪存页面的Out-Of-Band(OOB)区域,这样的设计共享了FLASH存储的局限性(如需要页级及块级操作),导致频繁更新元数据会增加冗余写入,从而加速闪存磨损。

为了消解这些问题,作者提出了一种名为PebbleSSD的体系结构,将非易失性、字节可寻址的随机存储器(NVRAM)用作SSD的元数据存储区域。这允许通过BAM构建更灵活且高效的元数据管理机制,从而减少不必要的FLASH写入,使得SSD寿命得以延长。

研究方法与工作流程

研究的核心是将PebbleSSD的实现与实验测试相结合,研究步骤主要包括:

  1. 硬件架构设计: 在基于PCIe/NVMe接口的商业SSD开发平台上实现PebbleSSD架构,NVRAM被用于储存元数据,闪存充当数据主存储介质。该硬件平台包含多核控制器和2GB的设备内存(DRAM),具备高带宽并发处理能力。

  2. BAM设计与功能实现:

    • BAM存储了物理到逻辑地址映射的映射表,支持动态修改。比如通过remap命令即时更新映射条目,从逻辑地址视图上移动数据,而无需写入新的闪存页面。
    • BAM还扩展了文件块元数据的能力,通过fs_write命令同步写入数据块内容和相关元数据信息(如文件偏移量和inode编号),从而能够优化文件系统的写入操作。
  3. 文件系统适配改造:

    • 针对两类日志结构文件系统(Log-Structured Filesystem, LFS),即Nilfs2和F2FS进行了改造,以便支持PebbleSSD的新功能。
    • LFS能够利用remap实现清理日志时无写操作的高效数据迁移。通过fs_write优化文件数据块写入,避免“wandering tree”问题,即递归更新索引节点的问题。
  4. 实验流程与数据收集:

    • 在实验中通过基准测试和实际工作负载,评估PebbleSSD新指令对于性能的提升和写入量的减少。
    • 比较改造前和改造后的文件系统性能差异,量化两种情况下的写放大效应(Write Amplification, WA)以及日志清理效率。

主要研究结果

通过改造后的日志结构文件系统与原始版本的对比,研究发现:

  1. 日志清理性能提升显著: 对于高级指令remap,改造后的文件系统(如F2FS-opt)能在Log Cleaning环节减少最多99%的闪存写入量,同时需要的清理时间平均减少33%。

  2. 文件写放大的降低: 使用PebbleSSD的fs_write命令进行文件块写入优化,F2FS-opt和Nilfs2-opt对比基线版本的写放大分别下降了28%和24%。这种优势在数据库应用等写敏感性工作负载中尤为显著。

  3. 高效数据迁移: 与常规的SSD相比,通过remap进行物理页的逻辑地址重新映射操作,在写入密集的测试中,吞吐量提升了3.7倍,延迟降低了87%。

  4. 存储利用率优化: PebbleSSD的大部分元数据存储在NVRAM中,相比传统方案,存储空间利用率最高提升至80%,支持多达百万级并发文件的元数据追踪。

研究亮点与创新

  • 创新性:“字节可寻址元数据” 是研究的核心,解决了传统元数据设计中面临的灵活性不足和更新写入成本较高的问题。
  • 系统性优化: PebbleSSD设计的BAM和新指令从根本上优化了FTL与文件系统的协作方式,特别是日志结构文件系统中新指令的应用效率令人印象深刻。
  • 实际落地能力: PebbleSSD的实现架构充分利用当前能商业化的硬件平台(如NVMe SSD),与现有文件系统的兼容性较高,改造成本较低。

研究意义与展望

该研究不仅提供了一种显著提升SSD寿命和性能的有效方法,也为数据存储领域的SSD设计方向提供了重要启示。在元数据的存储与访问方面,引入NVRAM和BAM的理念具备较高的推广价值。此外,PebbleSSD架构在未来存储密集型计算任务和云存储中具有广泛的应用前景,例如广覆盖高效文件系统优化、低成本异构存储设计等。

尽管其原型系统在某些方面仍存在可进一步优化的空间,例如BAM的元数据清理策略或设备内存的动态管理,但PebbleSSD体系结构已为高效、可靠的数据存储架设了一座桥梁,也为固态存储研究界和工业界带来深远价值。

上述解读依据用户上传的学术文献,如有不准确或可能侵权之处请联系本站站长:admin@fmread.com