您的位置:首页 > 互联网

云知声原创技术再获肯定:多篇论文被国际语音顶会 INTERSPEECH 2020 收录

发布时间:2020-10-23 00:00:00  来源:互联网     背景:

  近日,全球语音顶会INTERSPEECH 2020 公布了论文接收结果,云知声联合上海师范大学、安徽大学等高校发表多篇论文成功入选。分别在中英文混合语音识别、大词汇量连续语音识别和多模态虚拟形象生成等领域取得突破,代表着云知声在语音及多模态交互领域持续的底层技术创新。同时,云知声也是今年会议的金牌赞助商,致力于加强工业界和学术界的技术协作,支持会议顺利举行。

  INTERSPEECH 是世界上规模最大、最全面的顶级语音领域会议,由国际语音通信协会 ISCA(International Speech Communication Association)组织。该会议每年举办一次,今年大会是第 21 届 INTERSPEECH 会议,也是第二次在中国举办。本届会议以“Cognitive Intelligence for Speech Processing”为主题,内容涵盖信号处理、语音识别、自然语言处理、神经机器翻译等领域,收到超过 2100 篇投稿论文。会议研究成果代表着语音相关领域的最新研究水平和未来的技术发展趋势。

图片1.jpg

  作为 INTERSPEECH 会议的一部分,国际语音合成比赛 Blizzard Challenge 2020 研讨会将于 10 月 30 日举行。Blizzard Challenge 是当今全球规模最大、最具影响力的语音合成领域顶尖赛事,在今年的 Blizzard Challenge 比赛中,由云知声-上海师范大学自然人机交互联合实验室申报的系统在强敌环伺的赛场中突出重围,首次参赛即斩获中文普通话、上海话多项关键指标第一。在 10 月 30 日的研讨会上,研究团队会通过 live online oral presentation 的形式对参赛系统进行详细解读,欢迎参与和讨论。

  中英文混合语音识别

  在中英文混合语音识别方向,针对混合语言语音 (code-switching) 场景,研究团队提出了一个基于Transformer模型的多编码器-解码器结构的语码转换混合语音识别方案(Multi-Encoder-Decoder Transformer for Code-Switching Speech Recognition),该结构具有两个对称的与特定语言相关的编码器,以捕获各种语言的特有属性,从而改善每种语言的深度声学表示。这些深度表示被进一步在解码器模块中使用特定于语言的多头注意力机制进行有效整合,以最终提升整个端到端识别系统的性能。同时,团队还使用了大规模单语言语料库对每个编码器及其相应的注意力模块进行了预训练,旨在减轻语码转换训练数据不足的影响。借助预训练方式,研究团队的模型分别在 SEAME 中以中文和英文为主的评估集上达到 16.7% 和 23.1% 的词错误率,刷新了在此数据集上的最好成绩,相对之前论文的最佳成绩提升了12.5%的性能。

图片2.jpg

  语码转换语音实例及多编码器的输出

  大词汇量连续语音识别

  研究团队提出了一种新颖的带深度声学结构和 Self-and-Mixed 注意力解码器结构(Self-and-Mixed Attention Decoder with Deep Acoustic Structure for Transformer-based LVCSR),其利用具有深度声学结构的 Self-and-Mixed 注意力解码器,以改善基于 Transformer 的大词汇量连续语音识别的声学表示。具体来说,研究团队引入一种自注意力机制,以获取深层的声学表征。研究团队还设计了一种混合注意力机制,该机制可以在共享的特征空间中同时学习不同层次的声学表征及其对应的语言信息之间的对齐关系。本项研究工作在 AIShell-1 数据集上曾刷新最佳成绩,字符错误率降低至 5.1%,相对之前的最佳成绩提升了 24% 的性能,显著提升了识别效果。

  多模态虚拟形象生成

  如何在提高虚拟人面部动作的丰富和自然度,是目前虚拟人生成的热点问题。研究团队提出了一种基于面部关键点和改进的 GAN 模型的两级模型生成方案,实现从语音到虚拟人形象的生成,在本方案中,利用面部关键点作为语音特征到视频生成之间的信息表达中介,同时引入 attention 机制,解决在虚拟人生成过程中不同区域因子对视频效果质量的影响。实验生成的视频结果表明本方法保持了丰富的面部细节、精确的嘴部动作和自然的头动效果。在娱乐应用、拟人化交互等领域有广泛的应用和落地场景。

  人工智能成功的关键在应用,而所有应用皆源自底层技术。为不断拓宽自身基础能力边界,云知声深入布局了语音、语言、视觉图像、机器翻译、AI芯片等诸多方向,形成丰富的具备全球领先的原创技术积累,相关研究成果多次在 NIPS、NIST、WMT、ACL 等全球顶会与赛事中得以印证。

  本次在 INTERSPEECH 2020 大会上这些原创技术的提出,也将进一步夯实云知声全栈+硬核的人工智能技术“底座”,提高云知声在智能语音和多模态人机交互领域的技术领先性,推动人工智能系统以更人性化、高效的方式服务于千行百业,为用户带来更好的交互体验。

特别提醒:本网内容转载自其他媒体,目的在于传递更多信息,并不代表本网赞同其观点。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,并请自行核实相关内容。本站不承担此类作品侵权行为的直接责任及连带责任。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。


返回网站首页

本文评论
“‘智能+’学院”区块链系列培训中国互联网协会专场顺利举办
党中央、国务院对区块链技术的发展应用高度重视。总书记在第十八次集体学习时强调,把区块链作为核......
日期:12-24
不跟风不动摇的李彦宏,教你挖掘磨难的价值
它是全球最大的中文网站、国内搜索引擎市场占有率排行榜第一;它在2018年获得营业收入1023亿元,首次......
日期:05-23
vivo与百度达成CarLife+合作 打造便捷、流畅智能车载体验
2020年9月15日,北京 —— 2020百度世界大会上,vivo正式宣布与百度达成CarLife+合作,共......
日期:09-15
“如程”酒店数量突破200家 ,上线4个月帮会员省下1个亿
10月12日,会员制特色度假酒店预订平台“如程”再次上线新酒店,令平台合作酒店总数突破2......
日期:10-14
OpenAI宣布多项目转向PyTorch构建 网友:喜大普奔!
1月31日消息,OpenAI宣布将Spinning Up in Deep RL等项目全面转向基于PyTorch进行构建。...
日期:01-31
极光:超八成用户每天通过移动端浏览资讯
极光(Aurora Mobile, NASDAQ:JG)发布《“新资讯”行业系列报告——疫情篇》,......
日期:06-01
数据赋能 万位智联-万位科技亮相2019上海5G创新发展峰会
3月23~25日,2019上海5G创新发展峰会暨中国联通全球产业链合作伙伴大会在上海成功举行。作为中国联......
日期:04-26
阿里百联开“便利店”
(原标题:阿里百联开“便利店”,会是下一个盒小马吗?)...
日期:03-20
创维盛邀媒体品鉴“幸福”, 将以旺季幸福风暴造福千万家庭
2019年12月9日,创维在深圳召开了以“放大每一幕幸福”为主题的活动,盛情邀请各大媒体品......
日期:12-12
虎牙星火计划:“70%分成+千万流量”赋能主播公会
近日,为鼓励公会积极招募且培育新主播,虎牙直播正式对外宣布推出“虎牙星火计划”。此......
日期:09-01
格兰仕宣布推出两款芯片,首款芯片已应用到家电产品中
9 月 29 日讯,格兰仕副董事长梁惠强在格兰仕大会上宣布推出两款家电芯片,同时宣布了格兰仕与 RISC......
日期:09-29
降噪黑科技聆听新静界 索尼新款降噪豆WF-1000XM3
索尼新款降噪豆WF-1000XM3采用全新的外观设计,大幅优化佩戴体验。利用人体工学的三点固定结构,配......
日期:12-03
携手共话抗癌科普 百度“百科医典”助力2019中国肿瘤学大会
由中国抗癌协会主办,重庆大学附属肿瘤医院、重庆抗癌协会承办,国际抗癌联盟(UICC)、中国整合医学......
日期:08-18
PP体育启动双十一:更好“看”、“玩”互动、“买”得值
10月21日,苏宁易购召开“双十一全民嘉年华”发布会,首度揭晓了苏宁十年全场景布局。PP......
日期:10-25
北京卫视报道指出百度地图推出急诊床位拥挤等级提示功能, 疫情下提供就医参考
3月31日0时至4月1日12时,北京再次迎来既无新增境外输入病例,......
日期:04-03
为全新的自己代言,红米K30曝光,网友:好看又好用
毫无疑问,今年将是是红米历史上最重要的一年,不仅推出了新旗舰红米K20系列,还升格成为了独立运行......
日期:07-30
2020母婴适用家电推荐产品线上发布会成功举办
2020年6月6日(周六)下午14:30-16:00,由知电实验室主办,中国家用电器研究院技术支持的“守......
日期:06-10
36氪与日本经济新闻Nikkei宣布结为全球合作伙伴,加强亚洲地区的科技新闻覆盖
36氪与日本经济新闻 Nikkei 宣布结为全球合作伙伴。围绕亚洲创业公司,特别是中国创业公司,双方将......
日期:05-22
双11必败指南:抢购之余别忘了给孩子入手一款360儿童手表
眼瞅着就要进入11月,可凛冽的秋风和日渐走低的气温,却难挡我们广大人民群众那不断高昂的心绪。为......
日期:10-30
2019全球卓越成就奖隆重揭晓!快问中医荣获“2019年度最佳投资价值企业”
10月31日,快问中医受邀参加了由广东省通信管理局指导,广东省互联网协会主办、艾媒咨询承办的&ldqu......
日期:11-01