新技术,语音查询......我们的声音

想象一下,只需通过声音即可进行生活导航。对某些人来说,虽然这听起来似乎是一件很遥远的事情,但对其他人来说这是可实现的。

据官方消息,技术已赶超最基本、但同时也很强大的人类能力:声音

如何解释Siri、Google Assistant、Cortana、Alexa以及新兴的Samsung’s Bixby等数字助理应用程序的迅速崛起?这些系统依靠语音指令而不是触摸来控制设备或应用程序,为用户提供近乎无缝的信息、服务、购物等一系列令人目眩的阵列访问。

我唯一能说的是…是时候了。历经多年,技术巨头们似乎因为直观的导航、乏味的界面和糟糕的下拉列表而阻碍了设备访问,他们最终接受了既简洁又优雅有力的人声控制(人们猜测他们这样做会持续多长时间。但后续可能会更久)。

与此同时,贯穿至生活每个部分——从我们最喜欢的音乐到订购披萨、滴滴打车——这一切仅需通过单纯的语音指令即可实现。

即将推出更多其他功能,包括声控冰箱、干衣机、吸尘器,当然,还有汽车。市场调研公司IHS Markit表示,事实上,到2020年年底,预计将有超过70亿的消费类设备通过声控数字助理程序进行管理。

工程学奇迹

当我们停下来思考人类的声音是多么不平常时,苹果公司(Apple)、亚马逊公司(Amazon)和微软公司(Microsoft)等公司已经将此用作他们的网关技术,这点不足为奇。也许唯一的问题是需要多长时间?

人类的声音是工程学奇迹,它代表了大脑、肺部、咽喉、舌头、上颚、脸颊和嘴唇之间复杂的相互作用。它是一种人类独有的巧妙工具,促进了数万年的文明发展。

人类语言的复杂性使我们超越地球上的其他生物。虽然我们倾向于将其视为是自然发展的产物,但我们能够有效、连贯和有说服力地说话的能力实际上是通过多年的倾听、接触和实践来获得。

利用语音传达思想、指示和命令,使其成为一种访问当今技术的高效工具。从某种意义上说,我们的声音已经成为最终的免提设备,我们只需作出很少的努力。我们的大脑能够将单纯的思想转化为清晰明了的单词,然后将它们传输到设备,这一快速转变消除了菜单导航、命令输入或手指滑动屏幕过程中存在的耗时且易出错的问题。

人类语言与人类发展的技术之间的相互作用还使得如今的数字助理应用程序变得准确,尽管偶尔会出现记录不完善的故障。我的一位工程师朋友(同时也是语音识别专家)说,最新一代的辅助应用程序的复杂算法和巨大处理能力使它们能够通过先进的学习和情景知识来弥补差距。这意味着,与人类相比,它们往往更能够理解人类所说的话。

我们该何去何从?

这是一款令人称赞的产品,它解释了技术巨头们为何不顾一切地进入语音驱动设备领域。当然,如果仅花费几十年就使得技术真正赶超了需要花费数百万年才能发展成功的技术,那么,这将令我怀疑未来会是怎样的。

并且我想知道它是否涉及人类的声音。

可能是新一代技术——比如无人驾驶汽车——将完全绕过语言,接进入我们的大脑,从而在我们能够表达它们之前理解命令。这对我来说似乎有些可怕,但我确信,只能用语音命令从互联网上购买产品的概念似乎也是几十年前的事情了。

但是,我认为,所有这些都是未来几年的发展趋势。与此同时,令人高兴的是使用最基本和最强大的人类能力我们的声音对我们的生活进行导航。正如我刚才所说,现在是时候了。