亚马逊云科技迭代服务器芯片,加码云基础设施竞争

亚马逊云科技迭代服务器芯片,加码云基础设施竞争
文章图片

图片来源:亚马逊云科技

采访人员 | 彭新
【亚马逊云科技迭代服务器芯片,加码云基础设施竞争】由于服务器芯片战略获得成功 , 亚马逊云科技(AWS)正乘胜追击 。
北京时间12月1日 , 全球最大的云厂商亚马逊云科技在re:Invent大会上发布了公司定制设计的云端芯片Graviton 3和Trainium , 称除了使用成本低外 , 效能也更加优化 。
Graviton 3是亚马逊云科技Graviton系列的最新一代的芯片 , 基于Arm架构 。 据称较前一代Graviton 2相比 , 通用运算力约可以高出25% 。 但如果特别专注在科学领域、加密领域等使用浮点运算的话 , 性能最快可达2倍 , 若是机器学习的话甚至能支持多达3倍性能 , 且节能最高可达60% 。
亚马逊弹性运算云端副总裁Dave Brown表示 , 预计Graviton 3的性价比将大大超过英特尔芯片 。 目前 , 云端CPU绝大部分都是英特尔X86架构的处理器 。
Trainium芯片专供机器学习训练(Training)任务 , 该芯片主要用于训练机器学习运算模型 , 并针对图片分类、语义搜索、翻译、语音识别、自然语言处理、推荐引擎等深度学习训练工作进行了优化 , 成本较英伟达的旗舰GPU芯片低40% , 预计在不久后推出 。
AI计算大致分为两个层面 , 首先是对模型进行训练(training) , 整个过程可能耗时数天;之后是训练出的模型响应实际请求 , 做出推理(inference) 。 目前 , 英伟达旗下的GPU(图形处理器)占据训练市场 , 多数推理任务则仍由传统的英特尔CPU承担 。
此前亚马逊云科技已推出基于机器学习推理的服务器芯片Inferentia , 支持主流深度学习框架 , 包括谷歌开发的TensorFlow、Facebook开发的PyTorch和MXNet等 。
至此 , 亚马逊云科技对云端机器学习计算进行了完整的芯片布局 。 亚马逊云科技大中华区云服务产品管理总经理顾凡解释称 , Trainium和Inferentia是相辅相成的芯片 , 可以为客户提供从推理到训练一整套端到端的机器学习计算流程 。 而且由于Trainium和Inferentia共享相同的神经网络SDK , 原本就熟悉Inferentia的开发者很快就能上手Trainium 。
不过 , 亚马逊云科技仍与英特尔、AMD和英伟达保持合作 。 比如其将Graviton处理器与英伟达GPU搭配使用 , 为安卓游戏开发商服务 。 在大会上 , 亚马逊云科技还宣布采用AMD第三代服务器芯片 。
但即使使用英伟达或AMD的芯片 , 即使算力足够快 , 亚马逊云科技仍然认为 , 在机器学习端 , 训练持续变大的AI模型仍然是非常昂贵和耗时的 , 自己需要向上游延伸 。
亚马逊云科技将其运算能力出租给客户 , 如今已成为世界上最大的云运算服务提供商 , 也是服务器芯片最大买家之一 , 其2020年销售额达453.7亿美元 。 2015年 , 亚马逊云科技收购了以色列芯片公司Annapurna Labs , 目的就是为了设计定制化芯片 , 来支持不同的云服务需求 , 上述的Arm芯片和AI芯片都得益于这一收购 。
本次re:Invent大会上 , 亚马逊云科技除了发布Graviton 3和Trainium两款逻辑芯片外 , 还有一款SSD(固态存储驱动器 , 即固态硬盘)产品 , 用于云端的数据存储和读写 。
芯片产品发布后 , 亚马逊盘前股价上涨1.22% , 至每股3550美元 。

    特别声明:本站内容均来自网友提供或互联网,仅供参考,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。