华体会体育·(中国)官方网站

400-060-1992
网站首页 关于我们 课程设置 华体会体育新闻 造型团队 华体会体育风采 教学成果 在线留言 联系我们
课程设置CURRICULUM

华体会体育新闻

当前位置: 首页 > 华体会体育新闻

科大讯飞:你的一华体会体育网址般话再“塑料”我也能听懂

发布时间:2023-05-11 16:33:08 点击量:

  俗话说“君子动口不动手”,对于文字工作者来说更是如此。譬如,刺猬君在写这篇文章时文思泉涌,千言万语都堆到嘴边了,最终还是得用键盘敲到屏幕上。

  虽说现在市面上是个输入法就有麦克风图标,但能一字不落听懂人话的语音输入法并不多见。如果遇到刺猬君这样带点南方口音的人,这些语音输入法呈现出来的文字简直是对我的羞辱。

  6月12日,在科大讯飞媒体见面会上,刺猬君见证了最听话的语音输入法。讲台上,“讯飞输入法之父”翟吉博手持麦克风口若悬河,“讯飞输入法到今天已经达到了6亿用户!”一旁的大屏幕上立刻出现了这句话。翟吉博越说越兴奋,几分钟之后,一篇演讲稿就呈现在了大屏幕上,有了它,似乎人人都可以出口成章。

  值得一提的是,在翟吉博演讲过程中,讯飞语音输入法不仅能够识别诸如“嗯、啊、哦”之类的语气词,并将其省略,还能智能断句,为文字配上恰当的标点符号。

  事后,工作人员只需对文章稍加调整,即可发布,这不愧是一项让速记师下岗的工具,媒体老师再也不用在活动结束后催讨速记稿了。不信,您看台下各家媒体都在认真听讲,没有噼里啪啦的键盘声,现场一片宁静祥和。

  然而解放人们双手的讯飞输入法并不是近几年才出现的黑科技,它于2010年10月28日面世,那时的名字还叫“讯飞语音输入法”。讯飞输入法诞生之初,便确定以语音为核心,可以说是业界第一个吃螃蟹的。这么多年过去,语音输入已经成了各家输入法的标配,但说到语音识别效果哪家强,还属讯飞这块老姜辣。

  虽说已经在语音输入深耕多年,但讯飞输入法一直相当低调,真正让它声名鹊起的还是罗永浩。谁也想不到, 2016年的锤子M1手机发布会上,老罗竟会介绍起一款全平台公用的APP来。

  不得不说,酒香也怕巷子深。老罗在现场用很快的语速随口说了一段内容,讯飞输入法瞬间“打”出文字,识别结果一字不差,惊艳全场。

  发布会后华体会体育网址,锤子新机没见激起多少水花,这款老罗推崇备至的讯飞输入法却意外地火了。随后的几天,这款输入法甚至成功登顶了App Store 免费榜。

  在锤子发布会上,老罗身后的PPT显示,讯飞输入法的通用语音识别率为97%,如今这一数字变成了98%。2年时间,别看只有1个百分点的变化,背后攻克的技术难关数不胜数。翟吉博表示,“识别准确率的提升主要有三个难点,一是使用场景多样化、二是用户习惯、三是中国汉字和文化的特殊性华体会体育登陆。”

  首先是使用场景,人们不可能总是在安静环境中使用输入法,如果身处闹市,则需要更精准地语音识别。要想实现“闹中取静”,离不开数据和算法。讯飞输入法从人脑神经科学入手对人类记忆进行仿生,独家研发了一套语音识别框架,相比传统语音输入,能有效降低信息损失,在嘈杂的马路边它也能准确识别你在说什么。

  其次是用户习惯,由于每个人从事的职业不同、文化背景不同,说话方式、使用的词汇也千差万别。讯飞输入法针对用户习惯和个性化,推出了个性化的训练模型,最直观的莫过于中英文混合输入。比如刺猬君尝试说了这样一句话,“Hello,请你帮我转告Jack,我later要去参加一个group meeting。”最终整个语句一字不落地显示在了手机屏幕上。

  最后是同音字和方言。翟吉博以“他、她”为例,展示了讯飞输入法的AI智慧。讯飞输入法能听懂语句中人物的性别,出现“张阿姨”,输入法就会自动使用“她”,出现“王先生”,输入法就会自动使用“他”。

  比起识别“他”和“她”这样的同音字,方言识别难度显然更大。中国地大物博,南腔北调,就连各地地普通话都有着自己的味道。讯飞为了让全国人民都能平等地使用语音输入,也是操碎了心,为此还专门创造了一套方言语音输入方案。

  目前,讯飞输入法支持22种方言,其中粤语、四川话、东北线%。本月底,讯飞输入法还将新增苏州话识别。不过看到温州话还没有被收录在内,刺猬君表示,“全世界最难懂方言”真是名不虚传。

  光说不练假把式,刺猬君分别尝试了“天津话”、“四川话”、“武汉话”、“河南话”、“上海话”、“东北话”,发现讯飞输入法均能准确识别。在刺猬君“方言达人”的称号得到认可的同时,也彰显了讯飞输入法强大的语音识别能力。

  在尝试“粤语”语音识别时,为了加大难度,刺猬君特意唱了一段粤语歌——琪的《喜帖街》,没想到有音调的粤语也能被讯飞输入法完美识别。

  随着讯飞输入法支持的方言越来越多,一项重大的计划也提上了日程,这就是科大讯飞发起的 “方言发音人招募”公益行动。为什么要发起这样一项活动呢?科大讯飞多语种高级研究员祖漪清在现场讲述了方言势微的现状。

  “随着经济、文化活动的全球化现状以及区域经济的迅速发展,导致主流语言或通用语言更加强势,同时也使得弱势语言的交际功能不断衰弱,甚至濒临消亡。目前世界上的语言大约有6000—10000多种,据语言学家预测,大部分语言将于本世纪末消失。”祖漪清说。

  她表示,利用人工智能技术进行濒危语言、方言系统地研究一个语言的语音结构、语言结构,实现对一个语言的完整“复制”迫在眉睫。毋庸置疑,通过“方言发音人”采集标准方言语料有着极大的文化和社会价值。

  乡音未改的小伙伴们也不妨对着讯飞输入法说上几句家乡话,看看自己的发音还标准不,如果自认为方言等级十级,不妨毛遂自荐成为“方言发音人”,为子孙留下一份珍贵的方言语料。

  抛开方言语音识别的社会意义,它对于语音识别率的提升也大有裨益,99%的语音识别率也将在不远的将来得以实现。不过,语音输入的识别率线%吗?翟吉博表示,“目前是做不到的,因为声音并不能百分之百传递文字。”

  翟吉博认为,目前的输入法还没有做到极致。“假如有一天技术成熟了,我们通过意念或者脑电波输入文字,打开微信,盯着屏幕看两秒,文字就发出去了,我想这会是一个更加极致的输入法。”

Copyright © 2012-2023 华体会体育·(中国)官方网站 版权所有 电话:400-060-1992 手机:19766754281  ICP备案编号: 
网站地图