语音识别技术是最早落地的人工智能技术
语音识别的目标是以电脑自动将人类的语音内容转换为相应的文字,其应用包括语音拨号、语音导航、室内设备控制、语音文档检索、简单的听写数据录入等。
直到第三次人工智能热潮来临,深度学习的崛起、高性能计算和大数据的迅速发展才使语音识别从实验室走出并开始实现商业落地。2013年,谷歌的语音识别系统单词识别错误率还在23%左右,而到了2015年5月,谷歌在其举办的谷歌I/O年度开发者大会上宣布其语音识别系统的单词识别错误率已经降到了8%。2016年9月,Microsoft基于深度学习的语音识别系统将错误率降到了6.3%。2016 年11月,搜狗、百度、科大讯飞相继宣布其中文语音识别率达到了97%。
2015 年,Nuance 和 Google 两家占据了全球智能语音市场半壁江山,合计份额为 59.3%。同时,谷歌、苹果、微软等科技巨头合计所占份额超过 55%,而 Nuance、科大讯飞两家传统技术厂商所占份额大约 37%。这说明,在智能语音市场,传统技术厂商有
深厚的技术和用户积累,科技巨头可通过综合的科研实力、资金支持、应用场景等多角度切入竞争。预计到 2017 年,全球智能语音产业规模将达 112.4 亿美元,CAGR 为 35.1%。而在中国市场,科大讯飞独占半壁江山,市场份额为 49.6%,与百度一起占据中国智能语音市场约 75%的份额。中国智能语音市场仍处于寡头垄断的阶段,未来可能将向垄断竞争过渡。2016 年,我国语音产业规模达到 59.3 亿元,同比增长 47.1%,预计 2017 年中国语音产业规模将突破百亿。
语音识别作为人工智能核心技术之一,目前各科技巨头都将其作为切入点,积极布局人工智能。在智能语音领域方面的布局,科技巨头和初创公司的打法有所差异,具体表现为:
科技巨头:围绕主业,开放应用平台,同时通过收购、战略合作等手段补齐短板,打造人工智能生态圈;
智能语音成熟公司:基于原有技术优势,从单一技术厂商向人工智能产业生态构建者进军;
其他创业公司:深耕细分领域,重点布局家居、车载、机器人。
计算机视觉是最主要的人工智能基础技术之一,主要包括信息采集、模型训练及识别。目前,计算机视觉在图像识别和人脸识别两大领域都已经取得了较高的准确率。2014 年3月,香港中文大学汤晓鸥教授团队的GaussianFace算法在人脸识别数据库LFW上准确率达98.52%,在全球首次突破人眼识别能力(数据来源:光明日报)。2015年,图像识别大赛ImageNet ILSVRC冠军ResNet识别分类的错误率仅有3.57%,已超过人眼极限。
人脸识别技术经历了人脸检测与分析、人脸检索、人脸五官匹配、活体检测阶段,目前根据LFW发布最新名单,来自腾讯优图实验室的人脸识别程序在无限制条件下人脸验证测试中提交的最新成绩为99.8%,为目前全球最高(数据来源:腾讯科技)。
认知计算
认知计算与传统计算不同之处在于传统计算技术处理的都是结构化数据,而认知计算主要是使用人工智能和机器学习算法来对海量的结构化和非机构化数据进行培训,以便感知、预测、推断和思考,从而扩展人类或机器可亲自执行的操作,包括辅助人类进行决策。
认知计算主要有三类应用:产品类、流程类和分析类。
产品类:通过将认知技术嵌入到产品中,为产品提供智能行为、自然界面及自动化。增强产品的服务;
流程类:将部署了认知技术的产品整合到讹误流程中,可以使业务流程得到扩展或自动化。例如,使用优化算法来自动化规划及调度、使用语音识别、自然语言处理等技术来自动化客户服务。
分析类:认知计算可以进行分析预测,从而辅助客户进行决策。例如,辅助诊断、并购标的识别等
据预测,全球认知与人工智能系统市场规模2017年将增长59.3%至125亿美元,其中最大的一块是认知应用领域(45亿美元)。未来该领域的市场规模将保持年均54.4% 的增速增长,到2020年市场规模将达460亿美元。
从地理分布来看,美国依然是该领域最大的市场,2017 年的市场规模将达 97 亿美元,欧洲、中东及非洲(EMEA)是第二梯队,但是在2020年,增速强劲的亚太地区市场(日本的CAGR达109%)规模将超过EMEA。
【版权提示】观研报告网倡导尊重与保护知识产权。未经许可,任何人不得复制、转载、或以其他方式使用本网站的内容。如发现本站文章存在版权问题,烦请提供版权疑问、身份证明、版权证明、联系方式等发邮件至kf@chinabaogao.com,我们将及时沟通与处理。