在大模型研发过程中 , 我们初步定义了大模型需要具备的 9 种机器认知能力(T9 准则):
1. 适应与学习能力:机器具有一定的模仿能力 , 能够通过模仿和反馈学习人的语言和行为;
2. 定义与情境化能力:机器能够根据感知上下文场景做出反应(语言和行为反馈) , 并保证反应的一致性;
3. 自我系统的准入能力:机器具有一个稳定的人设(如:稳定的心理大五人格) , 在生成对待事物的观点时 , 不会随意改变自己的观点和情感倾向;
4. 优先级与访问控制能力:机器具有能发现自我观点的矛盾和纠结 , 但最终能做出一个选择 , 并在后续行为中保持一致;
5. 召集与控制能力:机器能主动搜索与自身人设一致或者符合自身利益的内容(新闻) , 并对其进行正面评论;反之也能搜索与自身人设相违背的内容 , 并对其进行反驳;
6. 决策与执行能力:机器能主动搜索内容信息、统计其他机器与人的观点与倾向 , 根据自身人设做出对自己有利的决策并执行;
【2022前展望大模型的未来,周志华、唐杰、杨红霞这些大咖怎么看?】7. 错误探测与编辑能力:机器能自动对无法判断的事物进行假设 , 并进行追踪 , 如果发现假设错误或者假设不完备 , 能自动进行编辑修正;
8. 反思与自我监控能力:机器具有自动校验能力 , 如果发现执行的操作不正确 , 具有自我监控和修正的能力;
9. 条理与灵活性之间的能力:机器能够自动规划和保证执行操作之间的条理性;同时如果发现条理不正确的时候 , 具有一定灵活性 , 可以修正自己的行为 。
要全面实现以上 9 种机器认知能力还有很长的路要走 , 但我们坚信下一个人工智能浪潮的兴起必然伴随着认知智能的实现 , 让机器具有推理、解释、认知能力 , 在多项人类感知与认知任务中超越图灵测试 。 大模型已经在认知智能发展上进行了一年的探索 , 并取得阶段进展 。
三、大模型的未来
《达摩院 2022 十大科技趋势》提出 , 大小模型将在云边端协同进化 。 大模型向边、端的小模型输出模型能力 , 小模型负责实际的推理与执行 , 同时小模型再向大模型反馈算法与执行成效 , 让大模型的能力持续强化 , 形成有机循环的智能体系 。 这一观点富有启发性 , 而且有助于大模型从实验室走向规模化的产业应用 。
在我看来 , 未来大规模研究将更加注重原始创新 , 围绕认知智能以及高效应用等多个角度展开 。
在认知智能方面 , 模型参数不排除进一步增加的可能 , 甚至到百万亿、千万亿规模 , 但参数竞赛本身不是目的 , 而是要探究进一步性能提升的可能性 。 大模型研究同时注重架构原始创新 , 通过模型持续学习、增加记忆机制、突破三元组知识表示方法等方法进一步提升万亿级模型的认知智能能力 。 在模型本身方面 , 多模态、多语言、面向编程的新型模型也将成为研究的重点 。
在高效应用方面 , 将大大降低大模型使用门槛 , 让大模型用起来 , 促进中小企业形成 “大模型 + 少量数据微调” 的 AI 工业化开发模式 。 主要实现:
1)降成本:降低模型在预训练、适配下游任务、推理过程中的算力消耗;
2)提速度:通过模型蒸馏、模型裁剪等手段提升千亿或以上规模模型推理速度 2 个数量级;
3)搭平台:通过搭建一站式开发及应用平台提供从在线模型构建、在线模型部署、应用发布的全流程预训练服务 , 能够支持成百上千个应用的开发与部署 , 相信后续大模型的广泛应用将成为赋智我国经济高质量发展的关键助推剂 。
特别声明:本站内容均来自网友提供或互联网,仅供参考,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。
