真正好用的智能语音在哪里?

王长胜 2017-12-30 8:08:00 互联网+, 阅读 • 来源: 自媒体圈 0

移动互联网时代,智能语音已经攻占了几乎所有的智能终端,一个的角落都不肯落下:语音输入、语音导航、语音拍照、...

移动互联网时代,智能语音已经攻占了几乎所有的智能终端,一个的角落都不肯落下:语音输入、语音导航、语音拍照、语音拨号……

如果把视角放到国际范围内来看,Google Now、Siri、Cortana已经形成三足鼎立之势。然而,对于中国用户来讲,这三家巨头并没有什么卵用,他们并没有花多少力气在中文语音上,这就使得中文用户为其买单却无法使用。这就导致了一个结果,智能语音的使用频率并不高,因为它既不便利,也非无可取代,也就是说,并不存在非智能语音不可的操作。

那么,说起中文智能语音,第一个想到的应该是科大讯飞。上周,科大讯飞召开了主题为“AI复始,万物更新”的年度发布会,作为2015“人工智能年”的收官之作。无可否认,在中文智能语音技术领域,科大讯飞是毫无争议的业界翘楚,行业未来有哪些发展,亦可以从这次发布会中窥出一些端倪。

实际上,讯飞虽然没有正式提出,但是已经在某些场合已经表达出了一个使命,那就是“连接人与机器”,这个事情,讯飞做正合适。就在这场发布会上,科大讯飞一口气发布了好几款新品,这是它的一贯作风,to B端的就不用多讲了,简直是行业横扫,就算是在to C端,也是领先了好几条街。

先来看看一款名为“讯飞听见”的产品,这是一种综合的知识管理解决方案,提供硬件录音笔、软件录音宝,同事,为完善应用的讯飞听见网提供的如在线同步转写等服务。应用场景就是:用手机(装载了录音宝)或是讯飞的录音笔录制下语音,上传到讯飞听见网,网站会对语音进行处理,转化成文字呈现出来;或者是录制一段视频,将视频上传到听见网,网站会进行字幕同步加载,并且是可编辑的。

这样简单高效的语音文字转换方式,简直是切中了许多职业所需(这里仿佛能听到许多记者同学的欢呼声)。但实际应用起来效果是不是靠谱呢?这不禁让人想起微信语音转文字的这一应用,几乎没什么用处——除了出错率很有笑果。

不过从这次发布会来看,这事靠谱——这次发布会的字音是同步直播的,也就是说,台上演讲的内容,通过讯飞的语音识别技术,实时转换成文字投放到大屏幕上。这是这次会议直观感觉上最引人赞叹的亮点,据观察,除了个别的英文和西方人的名字识别有误,其他的文字转换几乎是没有错误的。

现场请来了五位持证的速记人员现场记录,跟讯飞技术拼正确率,让人联想到多年前珠算和计算器的比拼,又有几门手艺要被机器淘汰的感觉。

如果说“讯飞听见”算是一款人人可用的产品,那么下面这个产品就有点高深了,她叫“AIUI”,即人机交互。去年的8月20号,讯飞宣布成立超脑计划,是人工智能的整体战略。事实上,自启动超脑计划以来,讯飞的所有产品都可以算得上是超脑计划的成果,因为它充当的是“智商担当”,决定了产品的高度。经过一年多的发展,超脑2.0登场了,今天的AIUI就是它的成果。

说远一点,自从人类发明有机器以来,人和机器的交流大致经历了物理操作、电子操控和现在的大屏幕。操作方法越来越傻瓜,其实就是对机器的调教——变得更像人。虽然现在大家都盯着屏幕,但我们都知道这种方式也不算自然便利,比起语音交流的话。触控操作已经成为终端的标配,如果技术成熟之后,那么语音将会替代触控。现有的智能语音无论是Siri还是Google Now更像是一件装饰或是一次占坑,对用户来说只有娱乐性。还有山东大哥的安吉星,在实用方面只能让人生气。

从实用到可用,是接下来要解决的问题。AIUI应此而生,目的就是使人和机器的交流更加顺畅。科大讯飞董事长刘庆峰在此次大会上定义了“万物互联”时代的人机语音交互标准,其基本能力应该包括三方面:远场识别、全双工、多轮交互。这就使AIUI定义了人机交互的标准,开发者和使用者都可以方便有效地使用。

AIUI集成了包括双全工技术、麦克风阵列技术、声纹识别技术、方言识别、语义理解技术和和内容服务等等——科大讯飞一些列尖端科研成果和完善服务,代表业界最高水准的技术产品。

其实,产品牛不牛逼,不能只看产品本身,真正支撑产品的是理念。这次发布会将人工智能的介绍和历史回顾作为开篇,引出科大讯飞的重量级产品AIUI,可以看出讯飞未来的布局是在人工智能领域。今天,人工智能再次成为瞩目的焦点,各大科技巨头纷纷进行战略级投入,人工智能领域的创业公司也开始兴起。

超脑开放云平台和AIUI的发布,都意味着科大讯飞已经超越对手步入世界先列,在业内有足够的话语权来进行行业规范。事实上,在像人工智能这样艰深的领域,是不容易有“对手”的。

一方面,所有的参与者都处于一种苦苦探求的状态——就像学生都在苦思一道超级难题的解法,何来竞争?另一方面,人类发展的尖端领域,常常是不得其法而只能停滞,此时恨不得集全人类之力集体攻破,根本无暇顾及私心。作为一个企业是盈利的,作为一项事业是在实实在在为人类做出贡献,也是完满。

再说深点,人工智能有三个层次:计算智能、感知智能和认知智能。前两者,机器已经超越了人类,而后者却一直不太能摸得到头绪——这是可以料想得到的。人类自己对后者都不甚了解,只是凭借本能熟悉了它,又怎么教机器这项技能呢?就连许多科幻大片都对AI的安全问题进行了思考,这种熟悉的感觉可能来源于小时候发愁同时被北大清华录取该如何抉择……前段时间看了Google举办的“机器人开门大赛”(名字我乱起的),几乎每一个机器人都掌握不了拧门把手时带来的平衡问题而一头栽倒——你指望它们威胁人类?

科学顶峰每一步的前进都异常艰难,想要达到真正的智能是极难的吧,不过也许未来真的像刘庆峰所言,人工智能未来会像水和电一样无所不在,而这个未来会比我们料想的更快到来。

作者是《中国企业家》、《彭博商业周刊》前科技主笔

我的文章还将发布到百度百家、今日头条、新浪科技、腾讯科技、网易科技、搜狐客户端、一点资讯、虎嗅、钛媒体等数十家网站

我的一个微信公众号是“王长胜”ID:wangchangsheng110

我的另一个微信公众号是“科技观察”ID:kejiguancha

(本文系作者@ 授权自媒体圈发表,并经自媒体圈编辑,转载请注明出处和本文链接)

第一时间获取媒体狗新鲜资讯和深度商业分析,请在微信公众账号中搜索「2548648067 」或者「mon-sun」,或用手机扫描左方二维码,即可获得媒体狗每日精华内容推送和最优搜索体验,并参与编辑活动。

0条评论