创业100联盟 创业服务联盟(16)

  
第二个 , 从我们技术角度来讲 , 大数据目前还是存在一定的技术风险 , 主要来源于目前做的所有大数据的分析 , 包括这些算法 , 在我们看来都是基于关联 , 也就是说以前有大量的数据证明 , 发生A就是发生B , 下次发生了A我就预测会发生B , 将是这样的逻辑 。但这样的逻辑 , 当我们真正应用到一些实际问题 , 尤其在某一些领域我们需要做一些严肃的决策 , 在做决策的时候 , 我们知道你做所谓的预测都是有一定的精度 , 如果在某些情况下 , 比如预测的结果并没有像我们预测的发生 , 整个过程是一个黑盒子我们是没有办法控制的 , 所以当时提出大数据这个概念的人 , 你问大数据的风险是什么 , 他会讲大数据就是本身性不可解读性 , 它会出现一些不可控的风险 。所以从2011年开始 , (英文)拿到图灵奖 , 他是一个有名的做因果推理的人 , 而不是关联性的分析拿到的图灵奖 , 这也预示着计算机技术的发展从黑盒子模型打开变成一种可解释的 , 可以推理的一类模型 , 这个跟我们目前的大数据是两条线 。  
今年我们看到一个标志性的事件 , 就是2015年10月份《科学》杂志新出现的文章 , 只需要非常少量的样本 , 只用了几百个样本的数据 , 加上人的推理能力在里边 , 它的性能比(英文)用数十万的样本得到的效果还是好 , 所以这也预示着我们从技术的发展来讲 , 当然现在大数据很热 , 我们很高兴看到它在很多领域的应用 , 但实际上这并不是一个进口 , 如果从前瞻性的投资角度来讲 , 应该要关注更前沿的技术的发展 。  
崔鹏:请问吴总 , 吴总也是英特尔中国研究院院长 , 相信在国际前沿的角度对这方面有非常多的见解 。  
吴甘沙:在大数据这块可能有几点 , 我就多讲讲工具这个层面 。一个是它跟具体领域的结合 , 其实你给出太计算机化的工具 , 绝大多数用户是不会用的 , 你如何给出一个用户能够用的这么一个工具 , 这是我觉得现在很多厂商在试图解决的问题 , 从某种程度上来说 , 过去几年大数据是从最底层的存储开始 , 去解决分布式运算的基础设施的问题 , 现在就是要进入到运用的问题 。这块我不觉得有一个(英文) , 最终肯定还是需要很多不同领域的客户用的 , 要提取价值的 , 所以怎么把工具做好 , 这是第一个 。  
第二个 , 我觉得大数据当中大家说的比较少的就是数据治理这块 , 在传统的数据分析的流程当中 , 数据清洗花的时间很长 , 可能占到60%70%的时间 , 现在我看到有一些好的研究 , 并且有一些产业化的尝试 , 它能够通过机器学习的方法从非结构化的结构中学习出结构出来 , 通过机器学习的方法 , 把一些歧义消除 , 我个人非常看好 。这块未来和人工智能有一个交汇点 , 大数据可能解决了通古晓今 , 见微知著的问题 , 人工智能解决了认知的问题 , 把这两者结合起来可能是未来一些重要领域里的发展 。IBM发明出一个词叫认知商业 , 某种程度上是人工智能和大数据的结合 , 未来在这方面可能会有很好的发展 。


特别声明:本站内容均来自网友提供或互联网,仅供参考,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。