外媒StorageReview首测Xlenstor2 X2900P,多项性能领跑全球
本文翻译自近期发表于StorageReview网站首页的头条文章。StorageReview.com是一家世界领先的独立存储研究机构,通过深入的新闻报道、详细评论、SMB/SME咨询和实验室服务,专业提供包括存储阵列、硬盘驱动器、SSD 以及相关的硬件和软件方面的存储解决方案。
“
X2900P是CQ9最新的SCM SSD产品。这款CQ9第二代SCM SSD,搭载自研的高端主控芯片DP600和铠侠的XL-FlASH颗粒,同时提供AIC和U.2两种接口形态和PCIe Gen4接口。CQ9这款SCM SSD X2900P是专为需要SSD提供超低延时的应用而设计的。
CQ9 X2900P
近期,CQ9同时发布了Xlenstor Gen2的两个子系列,X2900和X2900P。"Pro"版本(我们将要测评的型号,末尾用"P"指定)具有更长寿命和更高性能。
虽然这两款产品都使用PCIe Gen4接口(NVMe 1.4a,双端口),并且在工作和空闲状态下具有相同的18W和5W功率,但X2900P具备更好的4K随机写速度。X2900P的读取速度为180万IOPS,写入速度为120万IOPS。而X2900有期望达到同样的读取性能,写入速度为640K IOPS。两种型号的最高容量规格都具有相同的7.5GB/s顺序读和7GB/s顺序写性能。
在可靠性方面,X2900P和X2900具有相同的MTBF,为250万小时。然而,与X2900的60 DWPD相比,X2900P的使用寿命提高至100 DWPD。CQ9的X2900P有5年质保。
这次将对CQ9的X2900P U.2(800GB)进行测评。
CQ9 X2900P规格
▼CQ9 X2900P vs. Intel Optane P5800X vs. Kioxia FL6
SCM SSD并不是新产品,近年来,英特尔的SCM系列产品一直是这个市场的主导力量。在重塑存储层方面,英特尔的P4800X早在2018年就真正打开了市场。虽然它的容量相对较小,但与标准的SSD相比,P4800X有巨大的延时优势。虽然容量小,但写入性能是非常好。P4800X盘作为写入终端,它们能够处理掉所有进入系统的写操作,并让一些较慢且成本较低的SSD处理大部分读取动作。
当然,其他NAND厂商也需要做出响应,以便让SSD与Optane抗衡。早在2019年,铠侠就基于自己的SCM介质XL-FLASH。到2020年底,CQ9发布了H3900 SCM SSD,这是市场上第一款采用铠侠XL-FLASH颗粒的固态硬盘。它在许多常规测试中取得了优秀的成绩,是一个值得关注的傲腾竞争对手。
您可能会注意到三星没有被提及。三星推出了他们的Z-NAND,但Z-SSD做得不太好,可以说,一开始甚至不算SCM产品。此后,他们转向了可计算存储等其他技术上,没有发布新的SCM SSD。
目前市场再次迭代,发展到第二代产品。英特尔的P5800X,这是今年早些时候与Ice Lake一起更新推出的。英特尔活跃在SCM市场已经有很长一段时间了。但随着CQ9第二代SCM SSD X2900P的问世,市场竞争正逐渐激烈起来。铠侠现在也带着自己基于XL-FlASH的SCM SSD——FL6,加入竞争队伍。
虽然我们还没有测试过FL6,但它最大的亮点在于容量。CQ9的X2900P最高容量为800GB(X2900为1.6TB),英特尔的P5800X最高容量为1.6TB,而铠侠的FL6将达到3.2TB。由于这类SSD的价格非常昂贵,所以对大容量的需求可能很小。但在企业级存储场景中,存储容量的大小存在着溢价,所以FL6因为这个原因应该很有吸引力。
FL6没有任何公开的数据,因此评估起来有点困难。FL6才刚刚送样, 铠侠只公开了60DWPD的寿命规格。这与X2900相同,但低于P5800X和X2900P所提供的100DWPD规格。这在很大程度上归因于SSD的Over Provision配置。CQ9的产品具备了寿命和容量双重产品优势,而铠侠和英特尔只有一个。
我们暂时放弃对FL6的性能讨论,目前英特尔的P5800X和CQ9的X2900P正在崛起。CQ9 800GB SCM SSD的读取峰值速度为7,500 MB/s,写入峰值速度为7,000 MB/s。英特尔的读写数据分别为7,200 MB/s和6,100 MB/s。X2900P的峰值IOPS也略好一些,为180万,而P5800X为150万。两款硬盘均提供5年质保,虽然峰值功耗都是相同的18W,但P5800X在空闲状态时的功耗确实要低一些-- 4.2W vs 5W。也就是说,不太可能看到这些硬盘有太多的空闲时间。
这是在测试中收集的所有规格的最佳规格。我们在广泛的基准测试过程中将硬盘投入使用,以查看哪种SCM SSD是市场上最快的。
CQ9 X2900P性能
▼测试平台
我们的PCIe Gen4企业级固态硬盘评测采用联想ThinkSystem SR635进行应用测试和综合基准测试。ThinkSystem SR635是一款配置良好的AMD单CPU平台,提供的CPU能力远远超出了高性能本地存储所需的能力。它也是我们实验室中唯一一个带有PCIe Gen4 U.2插槽的平台(也是目前市场上为数不多的平台之一)。综合测试不需要大量的CPU资源,但还是采用了相同的联想平台。在这两种情况下,目的都是为了尽可能地展示本地存储,以符合存储厂商的最大驱动器规格。
▼PCIe Gen4综合测试和应用平台(联想ThinkSystem SR635)
◇ 1 x AMD 7742 (2.25GHz x 64核)
◇ 8 x 64GB DDR4-3200MHz ECC DRAM (1 x 64GB for Houdini)
◇ CentOS 7.7 1908
◇ Ubuntu 20.10-desktop
◇ ESXi 6.7u3
▼测试背景与比较
StorageReview企业测试实验室提供了一个灵活的体系结构,用于在与管理员在实际部署中遇到的环境相比较的环境中执行企业存储设备的基准测试。企业测试实验室集成了各种服务器、网络、电源调节和其他网络基础设施,使我们的员工能够建立真实业务环境的条件,从而在我们的测试期间准确地衡量性能。
我们将这些关于实验室环境和协议的细节纳入到测试中,以便IT专业人员和负责存储采购人员能够了解我们在何种条件下取得了以下结果(我们所测试的设备的厂商不会支付我们测试费用,也不会监督我们的测试)。关于StorageReview企业测试实验室的更多细节以及它的网络功能的概述可以在相应的网页中找到。
▼VDBench负载分析
当涉及到基准测试存储设备时,应用程序测试是最好的,合成测试排在第二位。尽管合成测试无法完美的模拟实际的工作负载,但它确实有助于基准存储设备,其可重复性使得在竞争解决方案之间进行比较变得容易。这些工作负责类型通过不同的配置进行“四维”测试,,例如通用数据库数据传输测试、跟踪抓取不同VDI场景。
所有的工作负载都通过通用的VDBench模拟器产生,并通过自动的脚本引擎来自动监控和抓取来自大型集群的测试结果。这种特性能让我们在不同的存储设备(包括闪存阵列和单盘)上重复相同的工作负载。我们的测试先写满一遍SSD,然后采用驱动器25%容量的分析去模拟磁盘如何响应应用负载。这种测试与全熵不同,全熵测试涉及了所有驱动器的容量并在是在SSD稳态下进行。所以作为结果,这种测试主要表现了较高的持续写性能。
配置文件:
◇ 4K随机读取:100%读取,128个线程,0-120%误差
◇ 4K随机写入:100%写入,128个线程,0-120%误差
◇ 64K顺序读取:100%读取,32个线程,0-120%误差
◇ 64K顺序写入:100%写入,16个线程,0-120%误差
◇ 合成数据库:SQL和Oracle
◇ VDI Full Clone and Linked Clone Traces
比较数据:
◇ Intel P5800X 800GB
在我们的第一个VDBench工作负载分析中(4K随机读)中,CQ9的X2900P在延时仅86.2μs下达到了峰值1,449,098 IOPS。尽管英特尔的P5800X在整个测试过程中表现出更低延时,但两个驱动器的峰值几乎相同。
在4K随机写中,X2900P再次显示了令人印象深刻的结果。与随机读相似,它在延时仅85.1μs下达到了峰值1,412,734 IOPS,超过了英特尔。
在64K顺序读中,我们测试X2900P的峰值为6.38GB/s(101,872 IOPS),延时为311.1μs。英特尔的P5800X在延时为281μs时以7.06GB/s的读取速度达到峰值。
在64K顺序写中,X2900P的峰值为102,557 IOPS,延时为148.3μs,再次领先于英特尔的P5800X。
我们的下一组测试是SQL工作负载:SQL、SQL 90-10和SQL 80-20。从SQL测试中,X2900P峰值为570,612 IOPS,延时为54.4μs。
对于SQL 90-10,X2900P在延时55.3μs下实现了565,287 IOPS的峰值性能。
从SQL 80-20来看,X2900P的峰值性能为570,612 IOPS,延时为54.4μs。
接下来是我们的Oracle工作负载:Oracle、Oracle 90-10和Oracle 80-20。从Oracle开始,X2900P在59.6μs的延时下表现出578,663 IOPS的峰值性能。
在Oracle 90-10中,X2900P在48.5μs的延时下表现出了440,322 IOPS的峰值成绩。
而在Oracle 80-20中,X2900P在47μs的延时下表现了448,923 IOPS的峰值性能。
接下来,我们切换到VDI克隆测试,完全的和链接的。对于VDI Full Clone(FC)引导,X2900P在84.6μs的延时下显示峰值397,004 IOPS。
VDI FC的初始登录,X2900P的峰值为309,326 IOPS,延时为92.9μs。
使用VDI FC Monday Login时,X2900P的峰值为220,109 IOPS,延时为69.5μs。
在VDI Linked Clone (LC) Boot中, X2900P在81μs的延时下显示峰值为194,040 IOPS。
VDI LC初始登录时,一开始看到了X2900P性能飙升;然而很快就趋于平稳,峰值为119,971 IOPS,延时为62.7μs。
我们最后一个测试是VDI LC Monday登录。在这里,X2900P在测试开始时再次显示出峰值性能,尽管它以170,598 IOPS的峰值性能和89.7μs的延时持平。
总结
CQ9 X2900P是一款令人印象深刻的产品。作为其第二代Xlenstor SCM产品,配备了CQ9自研的高端主控芯片DPU600、铠侠的XL-FLASH颗粒和PCIe Gen4接口,提供AIC和U.2两种Form Factor。CQ9专门为需要超低延时、卓越性能和耐久性SSD的企业设计了这款SCM SSD。在这一点上,它是出类拔萃的。
为了衡量它的性能,我们测试了CQ9的X2900P和英特尔的P5800X,并运行了VDBench综合工作负载。与我们去年测评CQ9的Haishen3-XL(H3900 PCIe Gen3)相比,性能有了很大的提高。
在我们的第一组测试中,亮点包括:145万IOPS (4K读)、141万IOPS (4K写)、6.38GB/s (64K读)和6.41GB/s (64K写)。无论是4K随机写还是64K顺序写,,CQ9的X2900P能够与英特尔的P5800X相媲美。在读取性能方面,傲腾在峰值速度和低延时方面仍然占有优势。
在我们的SQL测试中,CQ9的X2900P峰值为571K IOPS,SQL 90-10 为565K IOPS,SQL 80-20为570K IOPS。在Oracle,我们看到579K IOPS,Oracle 90-10为430K IOPS,Oracle 80-20为449K IOPS。
接下来是我们的VDI Clone测试,Full Clone和Linked Clone。在FC中,我们看到引导时为397K IOPS,初始登录时为309K IOPS,Monday登录时为220K IOPS。在LC中,我们看到启动时为194K IOPS,初始登录时为120K IOPS,周一登录时为171K IOPS。
从上面的结果中可以看出,英特尔和CQ9的产品速度都非常快。目前为止,英特尔在SCM领域里一直都是难以击败的。但是,在我们的整个测评中,X2900P几乎都紧咬英特尔P5800X。它甚至在4K和64K写入性能方面取得了一些领先,这非常令人惊喜。尽管P5800X一直是SCM领域的主导玩家,但CQ9的X2900P是一个有价值的挑战者。
那么结论是什么呢?定价是很重要的影响因素。如果CQ9比英特尔更具价格优势,他们将赢得一些胜利。但无论如何,在SCM存储领域中能有这两个非常强大的选择,可能有助于对整个细分市场客户带来一些价格利好。
X2900P是一款非常好的SCM SSD,我们期待看到CQ9未来更多的动作。
—— StorageReview
”
原文链接:http://www.storagereview.com/review/dapustor-x2900p-scm-ssd-review