新型人工智能平台 人工智能平台能力( 二 )


如果我们从AI模型生命周期角度拆分, 那么就有:
1)数据标注平台
面向数据接入、清洗、标注等和训练数据有关的工作 。 数据接入、清洗的工作其实和大数据的关联性比较强, 有些标注平台甚至是大数据系统的组件 。
对于AI标注/数据平台来说, 一个思路是类似百度的EasyData, 针对模型训练数据提供一部分预处理功能(如缩放、翻转图像提高模型鲁棒性, 或者对图像进行滤波、降噪等增强操作)和智能标注功能(先利用已经训练好的模型自动标注一把, 然后再由人工校准或微调), 正是这些功能支撑起了数据标注平台 。
另外一个不错的思路是更侧重“标注”这个动作本身, 类似basicFinder, 做数据需求方和数据标注商的撮合生意并提供标注工具 。
2)模型设计平台
这个一般不会作为单独的产品, 个人猜测原因主要是模型结构设计门槛高、需求小 。 从我自己的经验来看, 使用开源框架开发和使用平台提供的工具效率差别不大 。
模型设计的功能大多是作为开发平台一个模块, 通过可视化拖拉拽、notebook等方式进行模型结构设计 。
3)模型训练平台
提供模型训练的算力、环境, 这个是AI平台中比较常见的产品, 由于模型训练对硬件资源的高消耗, 通常会租用云计算资源来完成模型训练, 所以很多模型训练平台是与云平台捆绑的, 完成包括负载均衡、并行训练等工作 。
4)模型部署平台
提供把模型从训练环境部署到推理环境(云端、边缘端等)的工具 。 这个功能相对简单, 较少单独作为一个产品, 一般是也是作为开发平台的一个功能模块 。
一个例外是边缘/嵌入式环境部署平台(如百度EasyEdge), 由于硬件适配比较繁琐, 所以目前看到百度是做成一个相对独立的产品的 。
5)模型推理平台
提供各式各样的模型接口, 供用户直接调用, 一般还提供包括模型调用管理、接口管理等功能, 这种推理平台主要是以模型作为核心竞争力的 。 另一种推理平台则以算力作为竞争力, 类似云平台, 用户将模型部署在平台上可获得弹性扩缩容等能力 。
参考蚂蚁AI平台的一篇分享, AI平台按照不同层级的业务需求可以分为5级:功能嵌入、API调用、数据训练、模型定制、算法开发 。
把5级业务需求和生命周期对比来看, 业务的按需分层和模型生命周期的各个阶段基本是呈对应关系的 。 需求越高级, 追溯到的生命周期越靠前 。
功能嵌入和API调用级需求只涉及模型推理, 数据训练级需求涉及数据标注、训练、部署以及推理过程, 模型定制和算法开发级需求就涉及全流程的功能了 。
上图给出了一些AI开发平台产品的AI模型生命周期覆盖情况, 可以看到大部分产品其实都是提供全生命周期的功能的 。 当然不是说以上的分析没有意义, 按生命周期或者按需求层次拆解还是可以帮助我们捋清产品架构的 。
个人觉得其中百度的功能架构是最舒服、逻辑性最好的 。 百度的AI开发平台包括BML和EasyDL两个, BML是全流程的开发平台, 覆盖了AI模型全生命周期;EasyDL定位是零门槛开发, 所以只支持到数据训练级别的开发 。
这样的拆分其实就是依据前边所说的业务需求等级进行的, 拆分之后目标用户要清晰很多 。 BML中相对独立的数据相关功能和边缘部署相关功能又都拆成组件/小平台, 可以供用户单独调用, 从而提高灵活性 。
TI系列的其他两个平台TI-Matrix和Ti-EMS分别是“AI应用服务平台”和“无服务推理平台”, 个人感觉都更偏向云服务一些, 主要是服务调度、扩缩容等能力 。


特别声明:本站内容均来自网友提供或互联网,仅供参考,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。