新入坑的SageMaker Studio Lab和Colab、Kaggle相比,性能如何?

选自benjaminwarner.dev
机器之心编译
编辑:小舟、陈萍

SageMaker Studio Lab 将是免费计算资源领域一个强有力的竞争对手 。
一周前 , 亚马逊启动了 SageMaker Studio 的免费简化版 SageMaker Studio Lab , 提供了一个时限为12小时的 CPU 实例和一个时限为 4 小时的 GPU 实例 。 SageMaker Studio Lab 成为继 Google Colab、Kaggle 和 Paperspace 之后的又一个免费深度学习计算空间 。
Studio Lab 为用户提供了所有入门 AI 所需的基础能力 , 包括 JupyterLab IDE、CPU 和 GPU 模型训练算力以及 15 GB 的永久存储 。
那么 , SageMaker Studio Lab 如何与竞争对手抗衡?它是否值得使用?
现在一位名为 Benjamin Warner 的博主已经申请使用了 SageMaker Studio Lab , 并为大家撰写了一篇博客「开箱测评」 。 以下是博客原文 。
本文我使用图像和 NLP 分类任务 , 比较了在 SageMaker Studio Lab 和 Colab、Colab Pro 以及 Kaggle 上训练神经网络的效果 。
与 Colab 和 Kaggle 的比较
与 Colab 和 Kaggle 一样 , Studio Lab 提供 CPU 和 GPU 实例:运行时间为 12 小时的 T3.xlarge CPU 实例和运行时间为 4 小时的 G4dn.xlarge GPU 实例 。 比较结果如下表所示:
新入坑的SageMaker Studio Lab和Colab、Kaggle相比,性能如何?
文章图片

在测试比较中我发现:
  • SageMaker 只有持久存储 , 但与 Google Drive 不同的是 , 它的速度足以训练;
  • Colab 暂存盘因实例而异;
  • Colab 的持久存储是 Google Drive 免费分配的;
  • Colab Pro 可以分配 Tesla T4 或 Tesla K80;
  • 免费版 Colab 也可以分配 Tesla T4 或 Tesla P100;
  • Kaggle 的持久存储为每个笔记本 20GB;
  • Kaggle 有一个每周 GPU 运行时间上限 , 它根据总使用量而变化 , 每周大约 40 小时 。
启动 SageMaker Studio Lab 后将获得稍有修改的 JupyterLab 实例 , 其中安装了一些扩展 , 例如 Git 。
新入坑的SageMaker Studio Lab和Colab、Kaggle相比,性能如何?
文章图片

SageMaker JupyterLab 环境 。
在我的测试中 , SageMaker Studio Lab 的 JupyterLab 的行为与在自己系统上正常安装 JupyterLab 完全相同 。 甚至之前对 JupyterLab 做的修改和已安装的 python 包都还在 。
例如 , 我能够从 Jupyterlab Awesome List 中安装 python 语言服务器和 markdown 拼写检查器 。 但这也带来了一个问题 , 即亚马逊是否会更新像 PyTorch 这样的预安装包 , 或者维护更新的环境是否完全依赖于用户 。
亚马逊后续可能会销毁我的实例 , 或者将来会升级底层映像 , 删除自定义安装的包和扩展 。 但就目前而言 , 相比于 Colab 和 Kaggle , Studio Lab 是三者中可定制程度最高的服务 。
基准
数据集和模型
我选择了两个小数据集来对 SageMaker 和 Colab 进行基准测试:Imagenette 以及 IMDB 。 Imagenette 数据集用于计算机视觉 , Hugging Face 的 IMDB 用于 NLP 。 为了减少训练时间 , 在训练 IMDB 时 , 我随机抽取了 20% 的测试集 。
对于计算机视觉 , 模型选择 XResNet 和 XSE-ResNet , 即 ResNet 的 fast.ai 版本;对于 NLP , 我选择 Hugging Face 实现的 RoBERTa 。
  • Imagenette 地址:https://github.com/fastai/imagenette#imagenette
  • IMDB 地址:https://huggingface.co/datasets/imdb
  • fast.ai 地址:https://docs.fast.ai/
训练设置
训练 Imagenette 采用 fast.ai, 其在进行数据扩充时 , 可以对图像进行随机调整 crop 和随机水平翻转 。

特别声明:本站内容均来自网友提供或互联网,仅供参考,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。