首页 > 科技 > 智能家电 > 自然语言处理成人工智能厂商竞相争抢的明珠

自然语言处理成人工智能厂商竞相争抢的明珠

全文字数:2971字,阅读时间:5分钟

人工智能深入发展离不开自然语言处理技术辅助

自然语言处理技术是众多人工智能设备(如智能家居设备、智能机器人、智能助手等)不可或缺的核心技术。随着人工智能的深入发展,智能应用迫切需要自然语言处理技术帮助其实现智能化,智能设备数量增长以及行业智能化业务处理水平要求的提高,推动自然语言处理需求大幅上涨,自然语言处理市场有望得到进一步拓展。


自然语言处理定义及环节

自然语言处理是计算机理解和生成自然语言的过程,自然语言处理技术使计算机具有识别、分析、理解和生成自然语言文本(包括字、词、句和篇章)的能力。自然语言处理机制涉及自然语言理解和自然语言生成两个流程:(1)自然语言理解:计算机理解自然语言文本的思想和意图;(2)自然语言生成:计算机用自然语言文本表述思想和意图。

中国自然语言处理行业产业链分析

上游

自然语言处理产业链上游市场由基础资源供应商组成,涉及网络设备、服务器、芯片、存储、云服务、数据库等软、硬件供应商,负责为自然语言处理技术和产品开发商提供必要的资源支持。在芯片领域,行业内尚未出现专门用于自然语言处理运算的芯片,目前适用于自然语言处理的芯片类型有GPU、FPGA和ASIC,但受场景以及性能限制,FPGA及ASIC专用的人工智能芯片发展尚未成熟,目前自然语言处理运算的最佳芯片方案仍以GPU为主导。在数据领域,近年来由学术及研究机构承担建设的公共数据集不断丰富,可运用于自然语言处理训练的维基百科语料库、斯坦福大学问答数据集、亚马逊美食评论集、康奈尔电影对话语料库、经济新闻相关文章等语言集合相继建成,内容覆盖媒体用语、网络用语、电影用语、政府用语等众多自然语言应用场景,有助于自然语言处理研发企业优化用于处理不同领域自然语言的模型的准确度。

中游:

自然语言处理产业链中游市场主体主要有自然语言处理算法提供商、解决方案提供商以及应用产品开发商。目前中国的自然语言处理厂商较多集研发算法、解决方案以及应用产品功能于一身,厂商自主研发自然语言处理算法,形成一整套自然语言处理关键技术方案,并将自主研发的自然语言处理算法以及技术方案内嵌于自有应用产品体系中,典型代表有百度、阿里巴巴和腾讯。

下游:

自然语言处理产业链下游市场主体为各类型用户,包括企业用户和个人用户。企业用户主要购买行业应用,如智能客服产品、舆情分析产品、文本分类产品等,帮助企业用户提升业务处理的智能化水平。个人用户主要使用手机语音助手、机器翻译软件、信息检索以及互联网搜索等服务。目前个人用户使用的自然语言处理技术应用产品较多是自然语言处理厂商免费提供的,自然语言处理厂商普遍未在C端市场开发清晰的商业模式。B端市场是自然语言处理厂商竞争的焦点,部分应用产品(如智能客服、舆情分析产品等)尝试了商业化运作,市场反馈良好,但众多细分领域市场发展并未成熟,市场空间仍待挖掘。

自然语言处理产业链

来源:头豹研究院编辑整理

中国自然语言处理市场规模分析

现阶段,自然语言处理技术商业化并不成熟,部分已实现商业化应用的自然语言处理技术相关产品(如智能客服、搜索引擎等)均无法将收益直接归因于自然语言处理技术,单独运用自然语言处理技术的产品应用(文档分类、舆情分析等)尚未产生明显受益,因此自然语言处理技术产生的市场营收规模仍然较小,截至2018年,自然语言处理市场营收规模仅为20.6亿元人民币。但自然语言处理技术是众多人工智能设备(如智能家居设备、智能机器人、智能助手等)不可或缺的核心技术,随着智能设备数量增长以及行业智能化业务处理水平要求的提高,自然语言处理市场有望得到进一步拓展。

中国自语言处理市场规模(按营收计),2014-2023年预测

来源:头豹研究院编辑整理

中国自然语言处理行业驱动因素分析

· 自然语言处理要素演进,带动行业迎来变更式发展

数据量、运算力和算法模型是影响自然语言处理行业发展的三大要素。2012年以来,数据量的上涨、运算力的提升和深度学习算法的出现促进了自然语言处理行业的快速发展。(1)数据:互联网、社交媒体、移动设备的普及,使产生并存储的数据量急剧增加,中国2020年的数据总量将达到全球数据总量的20.0%,联网设备预计从2016年的8.4亿个增长至35.0亿个,连接设备数的快速增长产生了大量的应用数据。数据的爆发式增长有助于优化自然语言处理算法,海量优质的场景数据能够帮助算法模型完成高效精准的识别训练。(2)算法:基于深层神经网络的深度学习方法从根本上改变了自然语言处理技术的面貌,改变了自然语言处理问题的定义,变更了自然语言处理所使用的数学工具,深度学习的出现突破了传统浅层学习算法的局限,重塑了自然语言处理算法的设计思路,极大地促进自然语言处理研究的发展。(3)算力:GPU、FPGA,ASIC等专用芯片的出现,缓解了自然语言数据处理速度难题,解决传统的CPU芯片算力不足问题。

· 传统行业智能需求增长,带动语言处理需求上涨

金融、医疗、法律等传统行业的业务处理智能化水平要求上涨,加速自然语言处理技术在行业应用中的落地进程。在金融领域,智能问答、资讯舆情分析、文档信息抽取、文档自动生成等应用逐渐在智能投研、智能投顾、智能客服和智能运营等场景实现应用。在法律领域,自然语言处理应用可帮助法律从业人员进行案例搜索、判决预测、法律文书自动生成、法律文本翻译等,实现事件预处理,减少从业人员相关案件处理耗费时间。在医疗领域,病历的辅助录入、医学资料的检索与分析、辅助诊断等医疗步骤可由相关自然语言处理应用辅助进行。随着自然语言处理技术的深入发展,自然语言处理应用有望与更多传统行业实现更深层次的结合,为人类带来更多人工智能效应。

中国自然语言处理行业驱动因素

来源: 头豹研究院编辑整理

中国自然语言处理行业发展趋势

· 多模态语言处理融合

深度学习神经网络的引进使得语言模态、文字模态、图像模态、视频模态的编码和解码可在同一个深度学习框架下统一运行。不同模态的对象可被同一模式编码与解码,同一模式的编码与解码即可使不同模态对象随意融合,各种语言分析的结果可与语音分析、图像分析结果结合应用,产生更多的产品应用模式,如科大讯飞推出的语音交互系统AIUI,融合了语音技术和语义理解技术,使智能助手如同人类大脑能多功能区域协同工作,提升了应用的智能化水平以及人机交互效果。

· 自然语言处理应用逐渐成熟

随着自然语言处理技术研究的不断深入,自然语言处理应用逐步得到推广,尤其在知识图谱、机器翻译、阅读理解和智能创作等方面开始产生较成熟的应用。例如,知识图谱已在科研、金融、医疗、互联网服务、汽车等领域得到广泛应用。2018年以来,百度搜索引擎构建知识图谱,为用户提供全面的智能搜索服务。阿里健康与国家级医疗健康大数据平台启动建立医学知识图谱"医知鹿",并在医疗领域逐步推广。腾讯推出医疗AI引擎"腾讯睿知",发力智能导诊。汽车之家构建汽车领域的知识图谱帮助旗下APP"家家小秘"实现图谱问答。

中国自然语言处理行业发展趋势

来源: 头豹研究院编辑整理

深度见解

互联网巨头有深厚的资源积累,技术研发实力雄厚,自然语言处理技术的迭代将长期由互联网巨头主导。然而互联网巨头的技术研发多以业务布局为导向,旗下产品生态不包含的领域,互联网巨头一般不会涉足,因此为自然语言处理技术研发企业以及创业企业留下市场空间,自然语言处理技术研发企业以及创业企业能从细分领域开拓市场,避开与互联网巨头企业的直接竞争

本文援引于报告《2019年中国自然语言处理行业研究报告》,首发于头豹科技创新网(www.leadleo.com)

头豹科技创新网内容覆盖全行业、深入垂直领域,行业报告每日更新;政策图录、数据工具助您轻松了解市场动态;智能关键词轻松搜索,直奔行业热点内容。

您也可通过微信搜索小程序"头豹",海量报告随时掌握。

本文来自投稿,不代表本人立场,如若转载,请注明出处:http://www.souzhinan.com/kj/215708.html