数字尾巴:除了按键输入,手机输入法还能做到更多

2020-06-02 13:37:21   来源:新浪VR

  前言:从 Symbian 时代到如今的 iOS 和 Android,在手机上,我们已经经历了一次从物理键盘到虚拟键盘的轮回。键盘从屏外到屏内,但手机输入法依然还是那个输入法,只是它已经从单纯的文字输入工具,进化成了以文字输入为核心卖点的‘百宝箱’式的 APP。

  它不只是能帮你打字,还能帮你搜索、帮你斗图,甚至帮你翻译。

  有人会嫌弃说‘手机输入法变得越来越臃肿了’,但实际上手机输入法的功能变得越来越强大和全面,也是不争的事实。输入法之所以会向功能全面化进化,显然是离不开中文输入法这个大环境下的激烈竞争。

  尤其是搜索巨头的进场,搜狗输入法、塞班末期借壳点讯的百度输入法和收购 A4 完成布局的 QQ 输入法,为了‘搜索截流’这个目标布局手机输入法市场的搜索巨头,直接推动了输入法的功能进化。

  搜索巨头之所以看中输入法,是因为‘输入’是用户表达自我的基础需求——你可以不使用任何一个手机 APP,但键盘任何人都必不可少——布局输入法既能为用户精准画像,也能从用户点击输入框的第一时间,就截取用户的搜索流量。把输入法用作一个可以无视时间和空间的 Launcher,做搜索引擎的百度、搜狗、腾讯瞄准输入法是这个思路,做 AI 的讯飞瞄准输入法,同样也是这个思路。只是百度在打字之余位用户提供了搜索入口,而讯飞为用户提供了AI。

  AI,正是讯飞的拿手好戏

  2010 年发布时,讯飞输入法更像是专长智能语音和人工智能技术的科大讯飞的 to C 先行者,拿出最新的技术在市场上试错。而在逐渐迭代的过程中,讯飞成长成国内用户增长第一、市场份额次席的手机输入法,靠的正是科大讯飞在智能语音和人工智能领域的 20 年沉淀。如果跟熟悉手机输入法的手机用户提起讯飞,他们的第一印象一定是:语音无敌。

  科大讯飞的‘智能语音’和‘人工智能’,落地在讯飞手机输入法上,理所当然会是语音输入。在联网状态下,讯飞输入法目前可以支持除了普通话之外的粤语、闽南语、四川话等 23 种方言,以及英语、日语、韩语、和俄语等外文,甚至中英混输也能无压力识别。

  这中间涉及到的一系列复杂的机器翻译、自然语言理解、机器推理、知识发现,而且几乎每一种方言 / 语言基本上都是一套独立的语言系统,都既需要长时间的大量机器学习积累,也需要技术积累。而这恰好是背靠科大讯飞的讯飞输入法的优势所在。一方面,其背靠有 20 多年智能语音技术沉淀的科大讯飞,拥有超过 20 万小时训练数据积累;另一方面,科大讯飞有太多的国际赛事顶尖荣誉,比如2018年的国际权威英文语音识别大赛“CHiME-6”中,科大讯飞包揽了两项第一名;2019 年在 ICDAR2019 举办的场景文本视觉问答挑战赛 ST-VQA 中,科大讯飞包揽了三项冠军。

  在 2018 年讯飞输入法就已实现 1 分钟 400 字的高速输入,而且能够将识别率保持在 98% 以上。98% 的识别率意味着识别出错的概率会非常小,而即便是因为主观或者客观原因识别出错,也可以简单手输修改几个字词调整,易用性相当可观。

  要知道,在保证输入准确的前提下,我们普通人在手机上手输文字的速度大概在每分钟 60 字以内,所以讯飞的语音输入速度,基本上是手动输入的 6 倍左右——这种输入速度上的碾压,往往能显著地提高效率,尤其是在那些需要大量输入文字的场景里面,比如商务对接工作。

  而且,在手机大屏化趋势导致手机的握持手感和输入体验都不够理想的背景下,语音输入不只是更高效,而且体验也会更加自然,毕竟,同样是输出文字,按住空格键‘说话’毫无疑问要比抱着手机‘打字’更加自然。

  在更开放的 Android 上,讯飞能直接调起键盘录入语音实时转换文字,而不需要在当前 APP 和讯飞输入法的 APP 之间跳转,体验非常流畅,逻辑清晰、使用也简单。而且不管你是习惯用什么方言,讯飞都能精准识别,这就非常符合国人的方言众多、习惯不一的现实了。主流的方言,包括粤语、四川话、闽南语、上海话、武汉话等超过 23 种方言,延伸出的藏语、维语 2 种民族语言,都能直接在讯飞里面语音输入,而不需要从日常的语言氛围里面切换到普通话之后再语音输入,消除了体验痛点。

  当前的语音输入不可能不出错,距离100%准确最后“一公里”,讯飞输入法也拿出了解决方案——智能纠错的语音候选词。实际体验可以感知,在语音输入过程中自动纠错,AI提供了中、英候选建议,大大节省修改和重输的时间。

  但在讯飞输入法上,落地科大讯飞智能语音和人工智能技术的并不只有语音输入这个功能,而是铺开为更广义的语音转文字、文字识别在内的一些列工具性质的功能,比如文字扫描、语音便签、实时翻译。

  OCR拍照取字有奇效 

  在讯飞的工具箱中启用之后,我们可以直接在 APP 内工具栏上直接启动讯飞的 OCR应用——也就是文字扫描功能。

  OCR 主要涉及到为计算机视觉技术(包括了图像识别和图像理解),也是属于人工智能的主要技术之一,基于语义分割的文字检测方案,讯飞输入法通过在特征图上对每个像素进行前景和背景的分类,可以实现任意方向、任意形状的文本行检测。得益于此,讯飞输入法的 OCR 拍照取字的速度和成功率也非常可观,基本上可以做到立拍即取,而且取字之后还支持后续的翻译操作,所以用作出国旅行的实时翻译工具也有奇效。

  语音便签功能实际上是讯飞输入法语音输入的翻版,核心功能仍然是语音转文字,但它不是用作文字输入而是用作备忘,可以直接把临时产生的思考直接转换为文字存储起来。

  实时翻译对大众而言为刚需中的刚需。输入法如何让翻译更普及,着实做了有用功。譬如,讯飞输入法搭载了快捷翻译(文本翻译文本)、随声译(语音翻译文本)以及面对面翻译(线下场景的语音翻译文本并支持语音播报)。和线上的‘翻译器’一样,随声译是通过语音识别 - 翻译转换实现实时的双语互译,目前讯飞输入法内支持的互译语言包括英、日、韩、俄等多种语言与中文互译。也就是,说中文译外文,说外文译中文,说是语音输入的加强版也不为过。

  输入,讯飞同样可圈可点

  这些基于智能语音和人工智能的功能,是讯飞输入法相比其他竞品的相对优势,不过作为目前市占率第二的中文输入法,讯飞的基础功能——也就是文字输入,也非常强大。

  影响中文输入法按键出字效率的,包括这几种因素:

  1。输入方式

  2。词库(包括候选词)

  3。选词效率

  4。输入辅助 

  如果分开各项来看,讯飞在分项中即便不是在所有输入法中没有做到最好,也至少是处于主流水准,并以肉眼可见的速度提升。

  输入方式,丰富趁手

  输入方式上,以国内用户典型的中文输入为例,讯飞支持既支持主流键位比如 9 宫格拼音、全键盘拼音、笔画、手写和语音,而且它还可以支持拼音双键这种小众的键位;支持点划、经典布局,或者 iOS 系统布局;支持全拼或者 7 种双拼、繁简输入……

  词库,助力输入效率

  而至于词库,讯飞这种头部的输入法都有大量的分类词库、同时支持云输入,所以专用词汇以及热点词汇的输入效率都非常高,基本上不会出现自带输入法非常用词需自造的情况。

  选词效率,智能调频

  讯飞在候选词上仍然使用了自己拿手的机器学习,在海量数据训练优化之后,讯飞能智能预测用户的输入习惯,结合字频词频和上文语义,智能调整候选词。

  输入辅助,戏也很多

  在偏娱乐化的社交场景中,讯飞输入法还支持辅助输入一些流行等的表达方式,比如火星文、刷屏模式、咆哮模式,专门的‘BiuBiu 工具’,来收纳所有包括 emoji 聊天在内的趣味聊天方式,无论你是不是这些聊天方式的受众,偶尔尝试一下也会非常有趣。

  所有这些输入功能,让讯飞输入法具备有高效输入工具的能力,再加上公认的强大的语音输入能力,讯飞至少在中文相关的输入场景下,称得上是输入效率最高的中文输入法之一。

  当然,因为有科大讯飞的智能语音和人工智能技术的加持,讯飞手机输入法不只是一款做得不错的‘中文输入法’,而是一个以智能语音功能为核心的、加入了大量输入辅助功能的Launcher,它所能提供的,已经远超过中文输入而已。

  这款输入法,远不止输入法。

新浪声明:新浪网登载此文出于传递更多信息之目的,并不意味着赞同其观点或证实其描述。

微博

HOT RECOMMEND

关于新浪VR | 论坛社区 | 网站合作 | 广告服务 | 联系我们 | 免责声明 | 招聘信息

Copyright © 1996-2015 SINA Corporation, All Rights Reserved 京ICP证000007  京网文【2017】10231-1157号

北京幻世新科网络科技有限公司 版权所有