比你更有钱、有技术、有资源、有市场、有人才,这就是现在的传统语音技术公司面对互联网巨头竞争时的困境。
在当下的汽车业,语音基于其交互的自然性,被认为是未来人与车交互的主要入口路径,以致业内普遍认为,“以语音为入口连接各种服务,构建车联网生态”。
作为人工智能应用最成熟的技术之一,目前语音交互的核心环节也取得重大突破,语音识别环节突破了单点能力,从远场识别,到语音分析和语义理解有了重大突破,呈现一种整体的交互方案。
不过,虽然大多数新车可以用语音开启车载导航,设置行车路线,进行信息查询,实现一些诸如空调、天窗等功能控制,但距离“以语音为入口连接各种服务,构建车联网生态”的理想仍然较远。
比如,在真实使用场景中,距离麦克风的远近、交谈时是否说方言,以及噪音、断句等,都会让语音识别的准确率大打折扣。
目前,业内普遍宣称的97%识别准确率,更多的是人工测评结果,只在安静室内的近场识别中才能实现。
更难的是,在交互的过程中,机器对于语音的理解,以及人机多人的交互对话,都存在问题。
人在说话时,往往会一词多义,人会基于已有知识储备和上下文环境进行理解,但现在的智能语音技术很难做到。
它对于说话者的口误,容错做得也不理想。用户往往会追求多样性,包括使用过程中偶然状况的多样性以及场景的多样性等,因此容错技术显得尤为重要。
显然,目前智能语音的发展远未成熟,有着巨大的提升空间。再加上智能语音技术的巨大市场空间,互联网巨头已经争相进入这一市场。
在中国,《汽车商业评论》注意到,百度、阿里巴巴、腾讯等诸多互联网巨头已经入局,并先后推出自己的产品,以抢得智能语音信息流入口先机。
随着互联网巨头进军智能语音领域,转为全栈的语音技术创业公司,类似科大讯飞这样的传统智能语音技术巨头的不可替代性也受到了不可忽视的打击,更多这几年新兴的语音技术公司更是命运叵测。
互联网巨头虽然入场较晚,但凭借着自有的雄厚资金和互联网行业的大数据资源,他们发展自家的人工智能技术,迅速抢占智能语音市场。
那么,在未来的车联网智能语音领域,谁将是主宰?
以百度为例,这家以搜索起家的互联网巨头,正在转型为人工智能公司,并在通用技术、算法和平台开发等领域发展,对话式AI操作系统百度DuerOS是其语音技术的重要平台。
从2010年年开始百度就将智能语音作为战略方向,如今,百度语音技术已经形成从模型算法、开发组件、场景覆盖到行业应用的全链条。
2018年4月,北京车展上,博泰联合开发搭载百度DuerOS的人工智能车机系统——东风风神WindLink3.0,在学习能力、计算能力和数据储备上极具优势,可极快听清并真正听懂人复杂语言,并秒级提供用户所需答案。
比如,只要用正常甚至很快的语速说“好热”“帮我看看附近带泳池和WIFI的酒店”,系统就可以自动调节空调温度、搜索出对应的结果,直接完成房间的预定,然后再导航到该酒店。
作为人工智能时代开放赋能的生态系统,DuerOS通过自身三大核心技术“唤醒”你的车:让车听清你在说什么;让车听懂你想要什么;让车满足你所提出的需求。
互联网巨头之所以能够在AI语音上发展如此迅速,跟其大多是市场驱动的企业有关,明显的特点就是他们有自己更好的产业落地环境,关注客户,注重长期,由客户需要驱动产品发展。
这正是传统语音技术提供商所欠缺的。
比如百度拥有百度搜索,腾讯拥有微信、QQ及游戏等庞大的产业落地环境,而阿里拥有淘宝及其线下的零售店,所以在AI语音产业落地上,互联网巨头会更有优势。
而像科大讯飞这样传统语音技术提供商是由技术推动业务发展的企业,产品开发期间并不知道最终用户是否会使用,相对市场驱动来说具有较高风险。
它以B to B模式和B to G模式为主,对全产业提供语音技术,主要聚集在教育、司法、医疗、智慧城市等行业领域布局。2017年这些业务占公司营收的比例约为80%。
虽然车联网也是科大讯飞发展方向之一,也取得了不小的成就,但未来要往前再走一步并不容易,需要它在语义识别方面的人工智能技术方面进一步突破。
人工智能本身是高度的资本密集型、知识密集型产业和数据密集型企业,投入金额巨大,没有足够的数据、人员和资金,根本无法在核心赛道上坚持下来。
百度宣布语音技术全系列永久免费,包括近场语音识别、长语音识别、远场语音识别、语音合成、语音唤醒等百度语音核心功能等,并且支持IOS、Android等多平台接入。
这些百度人工智能开放平台的核心基础技术,都是需要长年的纯投入,不计回报,只有拥有其他大规模的获利途径,才能支撑这样的研发投入和人才梯队。
百度选择了将平台级技术开放出来之后,令整个行业都在加速,同时也终结了国内基础技术的重复投入。
类似于开源软件,开放是一种战略选择,是领先者对于后来者的规范制定。行业后来者,必须与百度接轨,融入百度生态。
随着互联网巨头在智能语音上面大范围布局,如今在智能语音技术上它们都是使用自家的语音产品——阿里用自己的阿里YunOS语音识别技术,腾讯的腾讯云也有自己的东西。
大客户转身成为竞争对手,而且他们有自身的现金流业务、场景、数据和用户,他们会更有竞争优势,最终可能会在车联网语音领域形成寡头格局。如此,传统智能语音技术企业可能被收编,也可能被消灭。
正是因为担心这样的结局发生,《汽车商业评论》注意到,2017年11月,科大讯飞比较在意地宣传腾讯的小Q机器人采用的是自己的语音识别技术。
或许在这方面,腾讯目前还并不强大,但趋势已经十分明显。5月23日,腾讯董事会主席兼CEO马化腾公开表示,为了抓住万物互联时代的机遇,腾讯近年来在语音识别、语义理解、计算机视觉等AI技术上投入大量的精力。