您的位置:首页 > 移动互联

深度解读思必驰语音合成技术,干货满满

发布时间:2021-06-04 11:14:00  来源:互联网     背景:

  语音合成(Text to Speech,TTS)又称文本语音转换技术,顾名思义,是把文本信息转化成语音信息。它是对话式人工智能的最后一环,也是关键一环,它的效果直接影响着人机语音交互的体验。

  思必驰作为国内领先的对话式人工智能平台公司,它的语音合成技术表现究竟如何?

  语音合成的“前世今生”

  人的语音,本质上是发音器官震动,产生声波传出。模仿人声,最古老的方法是使用乐器。到19世纪,就可以用机械方法产生语音了。那时,科学家们会制作出一些精巧的气囊和风箱去搭建发声系统,合成出一些元音和单音。

人类发音示意图

  进入电子时代的1939年,贝尔实验室H·杜德利制作出第一台电子合成器,这是用共振峰原理制作的语音合成器,该技术使用固定频率,以电子复制我们改变口型时所发出的元音声,也这正是英国剑桥大学著名物理学家斯蒂芬·霍金教授所使用的声音合成器。

  上世纪90年代,随着计算和存储能力大幅度提升,基于大语料库的单元挑选与波形拼接合成方法出现,可以合成出高质量的自然人语音。

语音合成技术演变

  进入21世纪,随着深度学习技术的兴起和快速发展,以语音合成为代表的语音处理技术得到了极大的飞跃。神经网络语音合成在近几年来取得了显著突破,合成⾳的⾳质和⾃然度越来越⾼,运⾏速度也越来越快。思必驰目前所使用的,也正是这种方法。

  思必驰TTS,魅力何在?

  早在2007年于英国剑桥大学创立时,思必驰关于语音合成技术研究就已开启,该项工作由思必驰联合创始人兼首席科学家、上海交通大学教授俞凯领头。

  语音合成系统主要分为文本处理、声学模型、声码器三个部分。文本处理负责对文本进行转写和phoneme序列转换;声学模型使用深度神经网络,可以在文本特征与声学特征之间学习到更复杂的非线性关系;声码器负责将声学模型输出的声学特征,通过卷积运算,转换成音频。

  经过10多年的研究积累,思必驰在建模方法上,涵盖了从传统的统计参数模型到最新的基于神经网络的方法;对声码器的研究,涵盖了从传统的基于信号处理的方法到最新的基于神经网络的方法。

  语音合成的质量与效果,既有赖于语音厂商的算法模型,还取决于音频语料的质量,即数据质量。思必驰有着丰富的声优资源以及声优挑选的经验,在苏州建设有专业录⾳棚并与国内多个城市的录⾳棚有着长久合作关系。与此同时,思必驰数据团队也对数据标注有着严格的质量把控。

位于思必驰苏州总部的专业录音棚

  经过多年的技术积累,思必驰已逐步形成了⼀套成熟的技术⽅案,业务涵盖了⼤数据语⾳定制、⼩数据快速定制、声⾳克隆、歌声合成、⼩语种合成、⽅⾔合成、情感合成等,可选公有云、私有云以及离线三种部署⽅式,经典⾳⾊可在思必驰官⽹实时体验。

  2017年、2020年,思必驰还先后参与国家标准《中文语音合成互联网服务接口规范》与行业标准《中文语音合成服务系统评估规范》的制定,并成为全国首批通过评估测评的公司之一,获得“TTS-4S(Standard Similarity Scene System)服务证书”。该测评从合成质量、定制能力、场景表现力和系统安全可靠等维度,全面评估合成水平和服务能力。

2019年11月,思必驰首批通过“中文语音合成水平测试”

  未来世界,百“声”争鸣

  为能快速提供语音合成定制服务,思必驰全程提供音色选择、录音指导、音频处理、模型训练、服务部署等专业服务,赋予产品开口讲话的能⼒。

  截至目前,思必驰语音合成已建设的⾳⾊库内包含音色接近200个,涵盖多种⾓⾊、多种风格,以及各个年龄层次。

  思必驰语音合成服务,也已在车载、⽩电、机器⼈、智能客服等诸多领域成功落地,为众多终端产品赋予声的魅力,使得万物皆可沟通,并逐渐走入人们的工作与生活。

  当你在家里“躺平”,来自如影智能的语音管家“Edison”,用他温暖、绅士的声音(文章开头的音频A),为你带来踏实与慰藉;当你在爱车中驰骋,车萝卜的语音助理“萝卜”清脆、简明的声音,如同车水马龙路途中的一股清流;当你接起顺丰95338服务热线的外呼电话,智能客服“丰小蜜”亲切又不失严谨的声音,配合高效的工作能力,带给你最省心省力的服务体验……

  镜头切换到泛娱乐领域,思必驰团队打造的“小驰机器人”在央视《机智过人》中,现场用撒贝宁的声音生成了一曲《好久不见》。在《经典咏流传》中,思必驰携手栏目组共同推出 “读诗成曲”线上互动小工具,提供实时读诗成曲的能⼒。用户仅需读几句简单的诗词,便可快速生成有腔有韵的歌声,互动总量超过821万人次。

思必驰联合创始⼈兼⾸席科学家俞凯参与节目录制

  在个性化定制上,思必驰不仅可以提供普通话定制、歌声定制,还可以通过迁移学习方法,提供更高难度的方言、小语种TTS定制,如粤语、上海语、四川话、⼭东话、东北话、德语、法语等。

  而思必驰的情感合成技术,则赋予美妙音色丰沛的情绪,让声音更具表现力与感染力。

  此外,思必驰声音复刻技术也已在斑马智能、爱驰汽车、岚图汽车、仙豆智能等车联网客户以及IoT领域落地,仅需录音20句话约400汉字,10分钟之内便可以完成模型生产,MOS 合成音/录音达到90%,相似度合成音/录音达到80%。

  人类的声音,是人类语言的物质外壳,却承载着重要的信息和真挚的情感,拥有着无穷的魅力。人工智能突飞猛进地发展正不断催化人机交互方式的巨变,“万物可沟通、万事可打理”的语音互联未来世界,正加速到来……

特别提醒:本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,并请自行核实相关内容。本站不承担此类作品侵权行为的直接责任及连带责任。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。


返回网站首页

本文评论
怎一个“快”字了得 三星携手中国移动展示5G应用
为更好更快推出5G终端,探索5G应用,2018年初,中国移动联合终端产业顶级合作伙伴发起“5G终端先行者计划”(英文名...
日期:05-16
镭速云传双十二狂欢盛宴来袭!
最近这天儿是越来越冷了 只想高效率完成工作任务 赶在低气温蔓延前回家钻进暖烘烘的被窝!...
日期:12-11
Nutanix企业云助力嘉里大通提升核心竞争力
物流巨头嘉里大通部署软件定义IT基础架构以推动企业未来增长 企业云计算领导者Nutanix近日宣布,物流行业领导企业嘉里大通 (...
日期:01-14
飞书获得 SOC2 Type2 报告,为用户提供安全可靠的企业协作云服务
近日,飞书正式获得安永会计师事务所出具的SOC2 Type2服务审计报告。SOC报告是全球公认最具权威性、......
日期:01-06
5G+VR直播XRACING,新华网咪咕5G富媒体实验室探索科技+体娱跨界融合
5G时代赛车怎么看?XRACING汽车拉力赛给出答案。 11月22日,新华网·中国移动咪咕5G富媒体实验室携手XRACING中国汽...
日期:11-24
从根源提升企业营销效果——全渠道媒体的互联互通
现如今,企业做营销很容易陷入花“冤枉钱”的尴尬局面。在竞争激烈的市场环境下,企业投......
日期:07-17
大开粮仓:爱立信拿下35亿美元5G大单 向全球市场进发
(原标题:斩获35亿美元5G大单:爱立信5G攻略首开“粮仓”)...
日期:09-13
“战疫”一线|云天励飞AI赋能精细化疫情防控
2020年的新年,足以载入史册。 继2003年的SARS病毒之后,新型冠状病毒感染的肺炎成为又一......
日期:02-03
“全民刷脸”时代,你的脸安全吗?
刷脸支付、刷脸安检、刷脸取快递、刷脸住酒店……人脸识别正在替代钥匙、公交卡、身份......
日期:11-21
拼音输入内有大智慧?讯飞输入法A.I.赋能全新体验
近些年,手机输入法逐渐发展为工作与生活场景密不可分的一部分,是最贴近用户的产品之一。主流手机......
日期:11-20
从天气应用到气象服务平台 墨迹天气实现C端+B端全方位布局
当前,随着互联网流量红利的日益衰退,越来越多互联网平台开始面临C端发展的瓶颈,如何突破行业&ldq......
日期:12-17
还在羡慕歪果仁?MIUI“来电留言”功能全版本上线
8月9日消息,小米的MIUI系统一直以来被认为是安卓深度定制系统中最好用、最受欢迎的系统之一,时不......
日期:08-10
亚信科技NFV助力中国移动5G网络虚拟化
日前,中国移动发布2019至2020年5G NFV融合短信网关设备集中采购结果公示,亚信科技成功中选集团南......
日期:07-29
支付宝小程序接连放大招 “高转化”成杀手锏
这个夏天,能和酷暑高温相匹敌的只有火热的小程序了。 7月31日,支付宝宣布在APP首页上线“小程序收藏”入口,...
日期:08-08
共享充电宝“江湖救急”,腾讯手机管家提醒注意信息泄露等安全风险
现在,共享充电宝遍布商场、餐厅、电影院等公共场所,已成为用户外出手机“救急”刚需。......
日期:01-26
三大运营商5G预约用户超千万 vivo已成领跑5G终端销售主力军
尽管运营商的5G套餐尚未正式发布,但随着三大运营商在9月底全面开启5G套餐预约,截止到10月11日,全......
日期:10-12
结束支持已4年,Windows XP系统该抛弃了
早在2014年4月份,微软就已经正式结束了对Windows XP操作系统的支持,同时微软希望用户也能立即放弃......
日期:07-30
达梦数据库+XSKY,释放数据价值
日前,武汉达梦数据库有限公司(以下简称“达梦公司”)与星辰天合(北京)数据科技有限公司(X......
日期:01-02
最新移动支付市场份额出炉!支付宝53.78%份额远超微信
日前,独立第三方研究机构易观发布的《中国第三方支付移动支付市场季度监测报告2018年第4季度》数据......
日期:03-28
科学防疫,大数据显威力 | 我们的战“疫”之大数据服务篇
在当前疫情防控的关键时期,内防扩散、外防输出的任务仍然严峻。在人群密集的公共场所,传统人工近......
日期:02-12