百度:2015年互联网大数据的发展趋势
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
百度:2015年互联网大数据的发展趋势2015年8月14日,由中国科协、中国科学院指导,中国人工智能学会发起主办的第五届中国智能产业高峰论坛在上海长荣桂冠酒店顺利召开。
下面是百度研究院副院长张潼的发言,本文由中国人工智能学会供稿,静沙龙记者王嘉俊整理。
【张潼】我们知道“数据量日益增多”这是一个背景,可能每十年要增长一千倍。以前可能仅是线下数据的增加,而现在为什么互联网在数据量增加的作用反而更大了呢?这是因为在今天大数据的驱动很大程度上是来源于互联网公司,包括:互联网和移动互联网。今后可能还会有传感器网,云端等一系列。但是有一个共同前提,这就是“数据量日益增多”。
一个方面就是大数据在人工智能上的应用,这个跟我们的会议比较相关。另外一个方面,就是它的一些创新的应用已经其将来的趋势。
其一就是“个性化”。其实从整体来讲,我们要谈到大数据,包括大家看一些大数据的书籍都会讲到这个趋势,大数据的应用使我们了解每一个人,包括:有个很经典的例子,比如:一家美国公司,一位父亲接到了一个邮件,说他女儿怀孕了什么的。然后他就很生气找邮件发送者说到:我的女儿还没有结婚等等一些。最后说邮件发送方只能说:“这个我们可能错了”,但是实际上最后发现自己是对的,而那位父亲是错了。从这个例子上,我们可以得知:用数据大家能够非常精准的知道,甚至可能比大家身边的人知道的更多。
其二就是:智能化。智能化在整个的大数据发展是非常重要的。当然,其中可能一个关键因素是由于智能化是一个更加底层的技术。
第三个方面就是:产业化。比如:互联网+、工业4.0等等一系列可以挂钩,可以更广泛。所以说,在后面的报告中,我会着重讲这三方面。从“个性化”来
讲,往往是针对个人的;对于每一个人,“产业化”是对于工业的,“智能化”算是一个底层的技术。
诸如:百度等很多公司,都会投入很多的力量把大数据的智能化应用,就是将其作为做前沿研究,并设计实现更好的学习系统。还有一点就是:把这样的能力变成实际应用,即:做智能化的系统。从机器学习能力来看,到目前为止有一个比较经典的案例可以看出大数据在机器学习上的作用。
然后,用户要能够理解对方的意义,把他变成一个“表示”,而这个“表示”就是能够自动的进行推理。另外一个关键点就是交互,对于智能化系统而言,其交互技术的实现也是非常重要的。所谓的交互就是用户和人进行的一个交流;尤其可见,“表示”和“交互”就是一个是使你能够更好的理解另外一个也是可以辅助的关系。最后还有一个就是用户决策。决策就是需要用户做的事情,用户能产生行动或者产生一个相应。这个包括:用户连接本身人还有其它的知识,这里面包括:用户要做分析、做决策等等,然后最后产生一个结果。其实搜索也是有类似的技术,或许将来可以有更好的其他技术。
我举个例子,搜索目前你就是输入文字进去,这是最主要的形式,其实,我们还可以用语音或者图像搜索。另外,用户还要把清楚语意。目前在搜索上交互用的比较少,但是实际上是应该有的。一方面,交互就是你搜了一个选项或者关键词以后,也许用户还会知道其它的方面内容提示,它(搜索引擎)会提示到:也许用户检索的是另外一个关键词或者是选词等等。然后,从行动上来讲,搜索就是根据所有的信息内容,包括之前的信息提示给用户做最好的搜索结果。
百度也在做一些尝试,有一个比如:小度机器人。这些尝试希望可以集成到更好的,更加智能化的,然后可以有更好的用户体验,它可以比搜索引擎要更加进步的能力。对于技术方面,比如:要更个性化,包括我们前面提到的大数据个性化,包括“认知技术”,用户怎么去感知和交流。如果有这么一个助理的话,他希望和用户交流,包括:要资源整合。然后,我们可以有分析,接着处理一些需求。这里资源整合的意思,就是用户要知道什么地方有东西能够满足客户的需求,这个资源可以是线上资源,也可以是线下资源,然后搜索引擎会有这种努力。所以未来、将来就会有更加好的形式,能够满足用户想要知道的事情。
其一,做智能连接,这是最早提出做“互联网+”的本意。互联网本身还是从把人连接到某种事情,是做智能的连接。现在希望人连到线下资源。
其二,人机互补。大数据的智能技术要帮助人来辅助决策,就是人和计算机交流,而不是说计算机完全解决。也就是说:让人做原来做不了的事情,这使得人变的也很重要,但是计算机是能够辅助人。
最后是数据创新。其实所有的这几个事情的核心就是“提升效率”,这是因为传统的方式做事情有一些低效的地方。你就想在什么情况下是低效的,我们怎么能够提升效率、改变效率而使其变得高效,这是最核心的地方。
Palantir公司还去找一些保险金融的欺诈,这是他们原始的,因为原来他们做过一些金融欺诈的一系列的工作。这说明:首先,人机互补要包含了很多技
术,一个就是大数据的技术在这里面,然后还有智能的查询,可视化的技术、关联分析,异常报警。如果你要用大数据辅助人,这些都是一些比较重要的数据。
从我们研究来看,开始的就是从问诊开始。如果用户要是有一种疾病,他就会去咨询;但是很多情况下,很多病人都会愿意在互联网上去咨询。但是搜索现在这种形式并不是最好的,所以我们尝试的一个,就是说是把这个变得更加高效,而且更加自然。一方面:就是设计一套预诊系统。这一系列的流程并不是为了取代医生的,是为了给病人更好的体验,使他了解更多的疾病诊疗信息。
另外一个方面就是:“智能化”。智能化将来可以帮助使用者从人来讲,可以更好的来理解自己、帮助自己和进行交流,帮用户做决策。也许有一些工作可
能机器会替代人工,包括人工驾驶。这里指的不完全是替代,也许是辅助人工,包括我们刚才提到的辅助决策。总体来讲,它会比人工的效率更高。
最后一方面就是“产业化”,产业化一块“科学性”,在本报告中,我就没有过多涉及到,但是科学的发展我相信在大数据的年代会有加速的发展且会使其有更大的提升。最后一个方面就是“产业的升级”。产业升级包括:传统产业的连接项,现在的“互联网+”,包括产业在工业上的应用。
谢谢大家!
End.
自中国统计网