苹果在2011年推出语音助手Siri的时,所有人都非常的震惊。不过随着用户的使用发现,siri一旦涉及到智能服务,并不是十分的好用。于是大家就开始期待微软这类有深厚储备的公司会不会推出类似产品。近日,微软宣布开通定制语音服务(Custom Speech Service),而在VR圈里,Human Interact公司推出的VR游戏《星舰指挥官》已经宣布接入微软的服务,这也让VR游戏有了语音输入的可能。
微软大力推出语音智能服务
微软此次推出的定制语音服务Custom Speech Service属于微软认知服务Microsoft Cognitive Services类别,后者是微软推出的一系列和AI相关的机器视觉和机器学习的服务产品。定制语音服务是一套实用性非常强的语音转文字程序,据说使用起来要比iri和谷歌的Google Assistant要智能许多。
定制语音服务由两个尖端科技支撑,来实现下一代运算能力。第一个就是CRIS,定制识别智能服务Custom Recognition Intelligent Service,微软称这个服务能够做到:
为实现给客户提供定制化的语音识别,开发者上传语音以及文字文件,识别器可以被细化定制到相关具体情境。同时这种识别能够用于非常规环境,例如工厂或者户外。
基本上来说,开发者可以利用CRIS创造一套特别的语音控制词汇表,使得“语音转文字”控制在定制情境下取得更好的控制效果。
定制语音服务的另一个组成技术是LUIS,语言理解智能服务Language Understanding Intelligent Service。微软称LUIS是“意图引擎”,即能够让电脑理解语言背后的真正意思。例如,目前的语音控制是赋予某个特定的词语或者句子一个程序,来触发一个行为。“寻找咖啡”或者“我要喝咖啡”的句子,会让手机显示附近的咖啡馆。有了LUIS,用户大可以直接说“找咖啡”、“我需要咖啡”,“我得来点刺激”或者“我眼睛都睁不开了”,来实现相同的功能。
有了LUIS,电脑能更容易识别用户的语音背后的真实意图,这极大拓宽了语音控制的使用场景,同时也大大缓解了开发者这边的工作量。
和很多大公司一样,微软不可能自己利用这套系统制作内容,这些工具是要提供给更多的合作伙伴来用的。定制语音服务的一个使用者,就是VR内容工作室Human Interact,他们制作的《星舰指挥官》是一个完全由语音驱动的VR游戏。工作室使用微软语音服务制作出了一套十分复杂的语音互动引擎系统。
相对于VR游戏,《星舰指挥官》更像一部互动VR电影。玩家在游戏中扮演的是一个星际飞船的舰长,与其互动的是一台超智能电脑和一个上级指挥官的全息影像。玩家完全通过语音来进行互动和控制,来实现游戏中的动作。例如,在游戏中玩家可以直接说出“电脑,启动自动导航,咱们走起”,游戏中的电脑就会表示自动导航已开启,并且飞创开始启动。
相比于只能说出特定的短语或者词句,有了微软LUIS服务的协助,用户可以使用更随意更生活的语句,来实现更多更多控制动作。当然,有一些特定词句是开发者首先制定好的,例如《星舰指挥官》中设置了一个外星敌人种族Eknian,普通的语音识别系统不能识别这些特定词语,但是开发者可以通过LUIS来定义特殊词汇如Eknian,让玩家和系统能够识别这些特殊词汇。
大概从VR重新掀起热潮开始,对于交互的探讨就没有结束过。从游戏手柄到Vive和Oculus Touch控制器,VR输入和交互依然不能令人十分满意,至少没有人愿意在VR中打字。语音输入由于识别问题仍然没能成为主流交互方式,而微软提供的这个服务虽然不能马上将语音变成官方输入方式,但确实打开了一扇内容创作的大门。想想以语音作为主要输入方式,游戏或者影视作品的玩法将会产生怎样的变化。
我们非常期待《星舰指挥官》这款VR游戏。
from:in2
0