AI大模型还能走多远?( 三 )


2、大模型走向多领域通用
大模型的初心 , 是令训练出来的模型具备不同领域的认知力 , 既能有泛化的能力 , 又能有自我进化的能力 。 比如NLP 领域内的大模型 , 复用到 CV 领域已被得到极有效的证实;GPT-3 同样展现出了从海量未标记数据中学习 , 且不限于某一特定任务的通用能力 。 近期兴起的多模态预训练大模型就是最好的证明 。
大模型的未来需要创新 , 大模型将致力于构建通用的人工智能算法底层架构 , 将模型的认知力从单领域泛化到多领域融合 , 在不同场景中自我生长 , 向可持续、可进化的方向发展 。
3、更易用的开源平台
大模型开放开源是大势所趋 , 这也是不少机构所致力推动的 。 微软、IDEA、智源研究院等大多机构的开源还处于浅层次 , 只是能调用算法包、排队等待训练的状况 。 未来的大模型要走出实验室 , 就需要走向算法体系、标准体系、基础平台、数据集、工程化测试等全方位的开放 。
4、标准易用的工作流程
“预训练大模型+微调”的方式的确加速了 AI 开发者的步伐 , 但如果把与之相适应的工作流程给搭建起来 , 大模型将会在更多场景大放光彩 。 另外 , 大模型的评估未来会有标准化成熟的体系来衡量 , 这个体系也会是行业内公认的标准 , 规范模型的通用性、易用性 , 同时用这个标准来衡量大模型的优劣而不是如今自卖自夸式的标榜 。
5、大模型能力的端侧化
未来 , 将大模型的一些运算存储等能力像芯片一样固化在一些端侧硬件设备中 , 在使用的过程中不用在重装的模型中耗时调用算力与数据 , 可以实现随时调用随时使用 。 现下的模型多是重装大模型 , 使用的话需要调用庞大的算力和运行时间 , 未来的大模型会逐渐改变这种模式 。
大模型会有哪些商业模式 更多人关心大模型未来会有哪些商业模式 。 可以从三个层面想象:
1 , 把大模型作为底座 。 既可以把底座出售或租售给国家的创新中心、政府机构 , 也可以与之联合合作 , 做上层开发 。
2 , 做开源 。 大模型涉及的许多技术问题单靠一家企业来解决是比较难的 , 可以通过开放技术的方式 , 用社区的力量共同解决 , 共享IP , 互惠互利 。
3 , 提供给一般的ISV(独立软件开发商) 。 让大模型从实验室走出来 , 直接去面对千行百业的客户 , 不太可行 。 通过把能力开放给 ISV , 他们再去接触下游更多客户 。 有两种接触方式:一种是通过流量计费、或按项目计费;再一种是让使用者免费使用 , 通过流量广告变现 。
总结展望 现如今 , 大模型的这种盛况 , 就与深度学习时代极其相似 。 然而 , 作为通向认知智能的高阶探索 , 大模型此后的路还有很远 。 能否持续提升自身的创新能力、泛化能力、落地能力 , 将会成为突破变革的关键 。
【AI大模型还能走多远?】也许在未来几年内 , 会逐渐形成这样一种状态:大模型作为基础的产业生态 , 用大算力训练出最高水平的智能 , 为各种 AI 应用提供源源不断的智能服务 。 而这一切 , 都需要时间去证明 。

特别声明:本站内容均来自网友提供或互联网,仅供参考,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。