您的位置:首页 > 互联网

日均调用量超155亿次!百度世界2020秀出百度智能语音产业化成果

发布时间:2020-09-15 00:00:00  来源:互联网     背景:

  9月15日,AI领域的行业盛会“百度世界2020”大会于线上隆重召开,一大波硬核技术袭来:百度创始人、董事长兼CEO李彦宏与总台央视主持人康辉“虚拟人”亮相、颠覆搜索形态的“度晓晓”、没有驾驶员的“全自动驾驶”、各行各业赋能案例……既有硬核技术,又有“接地气”的落地应用。

(百度世界2020央视新闻直播间)

  在当天的百度大脑分论坛上,百度语音首席架构师贾磊重点讲解了百度端到端语音交互技术。他表示,百度语音交互技术持续迭代升级,已发展成为基于深度学习技术的端到端的语音识别和语音合成技术。在语音识别层面,百度推出端到端信号声学一体化建模的技术,语音合成方面,最新的Meitron和单人千面合成个性化技术亮相。同时交出了百度语音技术最新成绩单:日均调用量超过155亿次,广泛应用在移动端、智能家居、和语音IoT等场景,智能语音产业化成果丰硕。

(百度语音首席架构师贾磊)

  会上,贾磊分别从语音识别和语音合成两个技术维度详解了百度语音技术的发展迭代和最新成果。在语音识别方面,百度语音识别技术持续创新,从2012年首推深度学习技术,到2019年在业内首先把注意力模型应用于在线语音识别,推出流式多级的截断注意力模型 SMLTA;再到如今全面进化为端到端的信号声学一体化建模技术,在助力百度自身业务发展的同时,更好地赋能多场景、多产业应用。

  作为百度语音识别技术的最新成果,端到端的信号声学一体化建模技术很好地解决了传统数字信号处理和语音识别级联系统的各种问题,抛弃了各自学科的学科假设,通过端到端的建模,大幅提升了远场语音识别率。

  据贾磊介绍,端到端的信号声学一体化建模技术由模型波束技术和模型AEC技术组成。前者进化为多分区融合的模型波束建模技术,在国际上由百度首次提出,较单分区技术进一步提升识别性能15%以上;后者是升级为基于双LOSS实值掩蔽的模型AEC技术,可以解决设备有非线性情况下的回波消除问题,使得设备即使在播放音乐的时候,也能够进行成功的打断和高精准的语音识别。

  此外,贾磊还在会上介绍了百度今年推出的端侧全双工语音交互技术。据他介绍,百度端侧全双工语音交互技术将复杂的建模过程转化为3个端到端的深度学习过程,即信号声学一体化建模、声学语言一体化建模以及语义置信一体化建模。通过端到端的建模,该技术能够将整个复杂的端侧交互转变成若干个深度学习计算,使得依靠一颗AI芯片就能完成端侧的全双工语音交互,从而大幅度提升车载手机等语音交互性能,显著改善用户体验。

  而在语音合成方面,百度自2013年启动语音合成研发,历经参数合成、拼接合成、深度学习语音合成和端到端的语音合成,到如今全新升级为包含个性化、多风格多角色、单人千面的语音合成系统,百度语音合成技术始终处于升级迭代中。

  会上,贾磊依次介绍了百度语音合成技术的最新成果——个性化TTS,多风格、多角色,单人千面。个性化TTS是个性化定制的Meitron语音合成系统的最新演进,是基于子带分解和GAN_loss的端侧神经网络声码器,也是业内首个在手机端多人通用的端侧的基于神经计算的声码器。个性化TTS相较于传统的基于信号处理和参数的声码器,ABX提升可以达到65:35,其已应用于地图导航,目前每日的导航播报超过1亿次。

  多风格、多角色的语音合成,则是针对娱乐内容产业(例如小说)中存在的多个角色交替、多种情感需求并存的播报需求而研发的新技术。此前,用单一音色播报缺乏表现力,播报语音和文字本身的角色情感不一致,用户长时间听感到单调疲倦。百度通过深度学习技术对小说文本进行分析,判断出角色、身份、情感,再借助多风格、多角色语音合成技术去合成小说中的声音,从而实现声音自然流畅、情感表现力丰富、用户体验优美的效果。

  针对一个发音人需要用不同风格播报文本的应用场景,百度推出单人千面语音合成技术。该技术能够把说话人的语音、文本、风格、内容、音色都进行分离,在进行语音合成的时候自由组合,从而能够让一个发音人同时去播报新闻、小说、脱口秀、读书、诗歌等不同风格。

  “百度智能语音交互的产业化成果丰硕,目前百度智能语音的日均调用量超过155亿次,广泛应用于移动端、智能家居、智能车载、智能服务以及语音IoT,极大地提高了中国社会的智能化程度。”贾磊表示。语音技术作为百度大脑的重要AI能力之一,不但应用于百度搜索、百度输入法、百度地图、小度音箱等百度系列产品,更通过百度大脑AI开放平台广泛赋能众多行业和场景的合作伙伴。未来,百度还将持续创新升级语音交互技术,推进语音技术应用落地,助力更多产业智能化转型升级。

特别提醒:本网内容转载自其他媒体,目的在于传递更多信息,并不代表本网赞同其观点。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,并请自行核实相关内容。本站不承担此类作品侵权行为的直接责任及连带责任。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。


返回网站首页

本文评论
五维递进学习法锻炼口才,智伴小Y便携机器人让孩子能说善道
语文是锻炼综合素质的基础,它不仅可以帮助孩子提高表达能力、自信心,还能让孩子的组织能力、思维能......
日期:08-15
降低网络安全风险 BSA丨软件联盟在行动
9月17日至23日,以“网络安全为人民,网络安全靠人民”的2018年国家网络安全宣传周博览会......
日期:09-26
三星官宣健身手环Galaxy Fit 2:可续航2周
三星有望推出新款健身追踪器-- Galaxy Fit 2。作为 Galaxy Fit 的继任者,它不仅提供了更大的显示屏......
日期:09-03
堪用了!ARM Win10补足短板:能跑64位exe程序了
微软上周宣布,自Windows 10 v2004(20H1)部署开始,将停止向OEM提供32位操作系统镜像,不过普通消费......
日期:05-18
积木宝贝在线互动课堂,将线下课搬到家,打造家庭全游戏场景
在抗击新型冠状病毒这场战役中,我们没有局外人。积木宝贝响应国家一级病毒预防措施,全面暂停所有......
日期:02-24
壮丽70年 | 深耕研发是华云数据云服务的基石
今年是新中国成立70周年,也是云计算产业进入的第二个十年,云计算从开始培育、到加快建设、最后全......
日期:09-30
百度Q4营收289亿数据背后的百度“温度”更令人动容
北京时间2月28日,百度(Nasdaq:BIDU)公布了截至2019年12月31日的第四季度未经审计的财务报告。财报......
日期:02-28
张大奕因被爆婚纱照上热搜,恶意诋毁还是真实曝光?
从初次的绯闻事件之后,似乎网红张大奕总是因为一点小事登陆热搜榜单,甚至于经常会被爆出各种各样绯......
日期:05-21
新华三荣登“2019年中国新增长创新实践”榜单 自身数字化转型成果赢得赞誉
12月21日,由《哈佛商业评论》中文版主办的“2019中国新增长大会”在北京嘉瑞文化中心隆......
日期:12-23
经纬M300 RTK和禅思H20是如何革新电力巡检效率的?
无人机巡检现已成为电力行业不可或缺的重要运维手段。然而,使用无人机巡检输电线路,作业人员在控制......
日期:07-03
论异见的表达:多少罪恶假自由之名
7月3日,2019百度AI开发者大会在北京国家会议中心举行。本是开发者们的技术盛宴,然而却发生了一个......
日期:07-04
智能物联时代,炬芯携手CEVA成就中国的好声音!
炬芯(珠海)科技有限公司董事长兼 CEO 周正宇博士也受邀参加 CEVA 2019 研讨会。芯片多核架构已经是......
日期:11-21
开仓计划后,苏宁冰洗撒亿元补贴助力“焕新”
疫情的持续影响,打乱了人们的生活节奏。线上购物、直播购物成为当下热门的消费方式。2月10日,作为......
日期:02-21
时尚不等于珠光宝气,Garmin腕表带你引领潮流
每逢换季,都是一次穿搭功力大考查。可搭配的单品并不少,却总觉得欠点儿火候?从不随波逐流的潮人往......
日期:04-23
软银计划继续持有芯片设计公司 ARM 的股份
8 月 2 日消息 据《日经亚洲评论》报道,软银集团公司 将保留旗下芯片公司 ARM Holdings Ltd 的股份......
日期:08-02
换新5G不用愁 4月京东手机换新季推30天价保
移动互联网的时代,无论是外出用餐,打车出行,或是线上支付、跑腿代购……服务已然成......
日期:04-01
新特性:华为 EMUI 11 支持畅连视频报警和地震预警
IT之家 9 月 13 日消息 据IT之家网友投稿,根据华为官网显示,EMUI11 将支持打 110 时选择畅连视频......
日期:09-14
千元续航之王发布,vivo Z5x对比OPPO K3,看完知道谁更值得买了
最近千元机市场竞争异常激烈,今天又有一部新机加入了这场战斗,那就是vivo今晚刚刚发布的vivo Z5x......
日期:05-25
《隐秘的角落》火了,顺便带火了京东的这个手机壳
最近,各大社交平台和朋友圈都在讨论着同样一个话题:《隐秘的角落》~这部已经完结多日的网剧不仅没......
日期:07-02
颠倒黑白岂无代价?继腾讯联想等之后,科大讯飞宣战黑公关
面对黑公关的恶意诽谤、肆意抹黑,国内语音识别一哥科大讯飞终于不再沉默。3月14日,一则来自&ldquo......
日期:03-15