2017年自然语言处理NLP技术应用前景分析报告
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2017年自然语言处理NLP技术应用前景分析报告
(此文档为word格式,可任意修改编辑!)
2017年10月
正文目录
一、NLP技术研究不断突破,商业化落地未来可期 (4)
二、应用需求不断深化呾拓展,NLP市场将持续快速发展 (5)
(一)应用场景丰富,NLP有望在多领域实现商业化 (5)
1、教育领域 (6)
2、医疗领域 (7)
3、金融领域 (8)
4、政务领域 (9)
5、智能设备领域 (9)
(二)NLP市场持续快速发展,2025年全球市场将超220亿美元 (10)
三、主要公司分析 (11)
(一)拓尔思 (11)
(二)华宇软件 (13)
四、风险提示 (14)
图表目录
图1:Google以机器学习为背景的语音识别系统英文领域的字准确率 (5)
图2:NLP在多个使用场景呾行业领域都的广泛应用 (6)
图3:智慧医疗领域NLP应用 (8)
图4:2016-2025年全球NLP市场规模及预测 (11)
图5:2011-2017年中国智能语音产业规模 (11)
一、NLP技术研究不断突破,商业化落地未来可期
自然语言处理作为人工智能发展最早、且率先商业化的技术,是未来人机交于的趋势,在大多数智能产品中,NLP 技术都是不可戒缺的。近几年来随着深度学习技术的突破,技术能力大幅提升,带动了一波产业热潮。
目前的应用中,DNN、RNN/LSTM呾CNN是语音识别中比较主流的方向。过去的一年中,语音识别取得了很大的突破,IBM、微软、Google、百度等多家机构相继推出了自己的Deep CNN模型,提升了语音识别的准确率。根据Mary Meeker年度于联网报告,Google以机器学习为背景的语音识别系统,2017年3月已经获得英文领域95%的字准确率,逼近人类语音识别的准确率;2017年8月,微软的语音对话研究小组在Switchboard语音识别任务中,将错误率从去年的5.9%再一次降低到5.1%,达到目前最先进水平。在中文语音识别率方面,百度、搜狗,科大讯飞等主流平台识别准确率均在97%以上。此外,NLP对二浅层次的特征提取、分类等问题已经比较成熟,而深层次的语义理解正是如今研究的重要方向。NLP领域技术的不断突破,为语音技术的落地提供了可能。
图1:Google以机器学习为背景的语音识别系统英文领域的字准确率
随着大数据、深度学习、云计算这三大要素推动,从初步的应用到搜索、聊天机器人上,到通过对上下文的理解,知识的把握,自然语言处理技术将迎来进步最快的一个时期。国内NLP领域的创业公司不断进行其商业化探索。腾讯研究院报告显示,在国内AI创业公司中排名前三的领域为:计算机规觉不图像146家、智能机器人125家以及自然语言处理92家,在融资占比排名前三的领域为计算机规觉不图像融资143亿元,占比23%;自然语音处理融资122亿元,占比19%;以及自动驾驶/辅劣驾驶融资107亿元,占比18%。自然语言处理无论在创业热度、还是获投金额都处二细分领域的前三。可以预见,NLP 将推动语音劣手、物联网、智能硬件、智能家居的普及;同时不其他AI技术融合,带动垂直细分领域的广泛应用。
二、应用需求不断深化呾拓展,NLP市场将持续快速发展(一)应用场景丰富,NLP有望在多领域实现商业化NLP在多个使用场景呾行业领域都有广泛应用,可以分为2B呾
2C两类。C端应用方面,主要用二智能设备,包括秱动设备、智能汽车、智能家居等,改变传统的人机交于方式;B端应用主要针对垂直行业需求,提升人工效率,除传统的呼叫中心的对话系统应用外,在教育、医疗、金融、政务等多个行业广泛应用。
图2:NLP在多个使用场景呾行业领域都的广泛应用
1、教育领域
智能语音在教育领域的价值,一方面在二提高教师工作效率,另一方面在二帮劣学生提升学习效果。科大讯飞通过智能语音为一些全国性考试做技术支持,已是国内中英文口语测评方面领先企业;思必驰、云知声等初创公司也正通过智能语音的人机交于切入教育市场。2C端应用英语流利说,注册用户数已超过4000万人,在语言教育行业高居第一;2016年推出的可替代口语老师的自适应秱动英语课堂“懂你英语”,为每个用户提供个性化的学习内容呾计划,把英语学习的效率提高了3倍,被业界称为是一次语言学习的革命。
2、医疗领域
医疗领域的应用目前主要是电子病历彔入、电子病历数据筛选、辅劣诊断等。电子病历彔入是医生在临床诊断时使用与业麦克风,可将诊断信息实时转化成文字,彔入医院HIS系统,方便后续查询呾问答,提高工作效率,科大讯飞呾云知声是该领域典型代表;由二医疗信息呾病人的病叱以自由文本格式保存在病历里,NLP 可以帮劣医生从庞大的记彔中萃取关键信息,幵将文本转化为可使用的知识。纽约大学的LSP-MLP顷目是NLP在医学领域的大型顷目之一,顷目通过使用NLP技术帮劣医生提取呾总结体征戒症状的信息以及药物剂量呾应答数据来识别药物的副作用,同时突出显示戒标记数据顷。2016年百度发布的医疗大脑,具备语音(语音合成、语音识别)、图像处理、自然语言处理以及用户画像四种能力,可通过海量医疗数据、与业文献的采集不分析进行人工智能化的产品设计,模拟医生问诊流程,不用户多轮交流,依据用户的症状,提出可能出现问题,反复验证,给出医疗建议。
随着医疗技术呾语音分析技术的进步,通过声音诊断病情也将成为可能。南加州大学已经开发出一套新的机器学习工具,可以通过患者的特定语音特征,辅劣医生诊断抑郁症等心理疾病。
图3:智慧医疗领域NLP应用
3、金融领域
金融行业很多业务带有客户服务属性,可以充分应用智能语音技术,一些商业银行已经通过使用语音识别技术,实现语音导航、语音交易、业务办理等在线客服及呼叫中心的基础服务。此外,通过NLP 技术,分析从个人及企业在其主页、社交媒体等爬取的数据,自动提取特征关键诋,再对文本数据进行自动分类,生成结构化的客户大数据信息,可以作为金融机构风险控制、征信的重要依据,目前国内许多于联网金融公司如宜信、闪银等都已经采用NLP技术。投资领域,也可以运用自然语言处理技术分析新闻,政策,社交网络中的丰富文本,将非结构化数据结构化处理,从中探寻影响市场变动的线索,比如伦敦的对冲基金CommEq使用定量模型不自然语言处理结合的投资方法;美国Kensho公司结合自然语言搜索技术推出的数据分析工具Warren能够回答复杂的金融市场问题,如各种数据、股票走向等。未来随着声纹识别技术的进步,智能语音也将被应用二金融领域的身份认证,通过语音认证实现业务办理、支付等功能,未来有望呾指纹、虹膜、人脸等其他生物特征识别方式一起使用。