别让低性能存储拖后腿!教你一招驶入AI快车道( 二 )


综合来看 , 随着企业AI应用的快速发展 , 传统存储架构成为制约瓶颈 , 性能、容量无法满足需求 , 管理和扩展复杂 , 存储效率问题凸显 , 很难胜任各种AI应用场景的要求 。
针对AI应用 , 如何在数据存储层面通过一套方案覆盖AI应用所有存储工作流 , 并且能够全面平衡性能、容量、扩展性和易用性?目前 , 通过新型存储软件来满足AI应用对存储的需求 , 成为越来越多高成长性企业的选择 。
杉岩数据MOSFS , 为AI应用提速增效
MOSFS , 就是一款由杉岩数据为AI应用量身打造的智能分布式存储解决方案 。
别让低性能存储拖后腿!教你一招驶入AI快车道
文章图片

图2MOSFS多源汇聚兼容多种存储
首先 , MOSFS的底座基于杉岩数据自研的海量分布式对象存储(MOS) , 支持通过横向扩展硬件节点线性增加系统容量与性能 , 满足EB级存储规模需求 。 系统提供File Ingestor、DB Ingestor等数据汇集功能 , 支持各种格式、各类来源的数据 。 同时MOSFS还支持对现有NAS存储、对象存储和HDFS存储的纳管 , 既充分利用客户既有投资 , 又满足客户的业务规模增长需求 。
其次 , MOSFS不仅能够容纳汇聚各类数据 , 同时还可对上层应用提供标准POSIX接口 , 兼容Amazon S3协议接口 , 以及大数据服务接口 , 一套存储支持多种协议接口 , 满足AI训练各阶段对数据的访问诉求 , 支撑AI数据处理的全套流程 , 构建了一个安全、共享、高效存取的“数据湖” 。
最后 , MOSFS针对AI训练的特性 , 开发了多级分布式缓存架构 , 将热点数据(如正在训练的数据集)缓存在高性能介质中 , 如NVMe SSD、MEM等 , 将非热点数据存储在大容量介质中 , 既保证了极致的响应时延 , 充分释放出GPU等特殊硬件的算力 , 横向扩展带来的近似线性增加的容量和性能又保障了高带宽和超大的容量 。
如下图所示 , 在国内某AI领域独角兽企业的选型测试过程中 , 通过采用杉岩数据MosFS存储解决方案 , 相比采用传统分布式NAS存储 , 训练时长缩短了5倍 , GPU利用率提升了近3个百分点 。
别让低性能存储拖后腿!教你一招驶入AI快车道
文章图片

注:训练计算节点相同 , 数据集ImageNet分别存于本地(4TB SATA SSD)、MOSFS(960GB SATA SSD + 4T*10 SATA HDD)和某商用分布式NAS(6TB SAS)时 , 进行AI训练 , 模型采用ResNet18 。
【别让低性能存储拖后腿!教你一招驶入AI快车道】随着科技的进步 , AI作为新一轮产业变革的核心驱动力 , 将催生新技术、新产品、新产业、新业态、新模式 , 实现社会生产力的整体提升 。 MOSFS作为杉岩数据针对AI、大数据等新型业务场景而打造的智能分布式存储解决方案 , 针对传统存储在新业务场景下的痛点 , 全新设计优化 , 实现了在性能、容量和扩展性之间的全面平衡 , 将助力企业进一步释放数据潜能 , 加速数字化转型 , 为AI在国民经济各行各业中更好的落地开花贡献力量 。

特别声明:本站内容均来自网友提供或互联网,仅供参考,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。