文章图片
数据分析不同于传统的软件行业 , 也不同于互联网、咨询、运营分析、商业分析 , 我们理解的数据分析包括了两个部分:
1、数据的顶层设计 。 顶层设计包括我们对这个数据的业务需要理解 , 每个行业的业务是不一样的 , 比如说我们现在会帮助部委去做事 , 我们做海关 , 做外汇、做药监、做水利 , 其实都是不同的行业 。 只有理解业务 , 才能通过数据看出这个数据有什么特征 , 找到数据的关系 , 基于现在已有的工具去建模 , 把模型训练好 。
2、工程实践 。 工程实践就是跟现有的业务去连接 , 做开发、做集成、做落地 , 实际为业务去解决问题 , 这样才是数据分析的完整体系 。
最后介绍一下我们公司 , 我们主要做面向政府的数据分析 。 主要解决贸易犯罪、反洗钱、反欺诈等问题 , 同时还要落地 , 因为数据分析价值的体现就是帮助业务解决问题 。
李卓桓:这个时代有这么多的语言 , 迭代如此之快 , R语言还能屹立不倒一定是有非常大的魅力 。 我是AI方向的MVP , 我关心的领域是聊天对话机器人 , 或者我们叫对话式人机交互界面 。 通过这种方式 , 我们把过去所有的应用都能够用自然语言对话的方式实现 。 这里介绍一下两本书 , 第一本是我和佳芮写的《Chatbot从0到1》 。 这本书会告诉你基于产品经理角度怎样去做对话 , 怎样去设计一些更符合用户体验的对话来完成任务 。
文章图片
另外一本是关于算法的 , 叫《简明的 TensorFlow 2》 , 如果想要对 TensorFlow 2有入门的了解 , 这本书是很好的 , 在网上我们有公开的一个版本 。
比特熊: 李卓桓老师先回顾了一下人工智能这些年的进展 。
李卓桓:
1、ImageNet 是一个典型的图片识别任务 , 10年前程序识别率不到70% , 2015年准确率超过了人类 。
2、2016年的时候 , AlphaGo 4 : 1击败李世乭 。
3、2017年 AlphaZero 诞生 。 Zero 的意思是说它在成长的过程中 , 没有学习任何人类的知识 , 而是通过规则自己领悟 , AlphaZero 和 AlphaGo 打起来的成绩是100:0 。
文章图片
4、2018年 , OpenAI 在5v5的电竞中击败了人类的世界冠军队 。
5、有一个AI的评测叫 GLUE Benchmark , 有各种各样的任务 , 比如理解、填空等等 。 没错 , 2019年的时候AI在这个测试上超越了人类 。
6、2020年的时候 , 波士顿动力做出了会跳舞的机器人 , 当然从这些机器人的舞姿可以看出 , 已经骚到绝对不是只会跳舞那么简单 。 2020年还有一个震惊世界的自然语言模型 GPT-3 , 据说训练这个模型就花了1000万美元 。 它的能力是你给它起一个头 , 它就可以顺着往下写 。
文章图片
7、Open AI也没有停下脚步 , 它在GPT-3的基础上增加了图像学习 , 说一个你想要的东西 , 程序能给你画出来 , 这个模型叫DALL-E 。
文章图片
GPT-3既然有自然语言这么强的能力 , 所以微软把它集成到了GitHub里面 , 推出了一个叫CoPilot的产品 , 也就是结对编程 。 你的结对编程对象是一个人工智能的模型 , 图里所有灰的地方就是这个程序自动帮你补齐的 。 这个功能我已经用了三四个月 , 非常好用 , 现在我每天写的代码里面 , 有10%~20%是它自动帮我生成出来的 。
特别声明:本站内容均来自网友提供或互联网,仅供参考,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。
