您的位置:首页 > 互联网

端到端识别、增量学习…思必驰DUI标注训练一体化平台的封神级操作

发布时间:2021-05-19 17:24:00  来源:互联网     背景:

  坊间总会流传些他们的段子

  格子衫、双肩包、沉默且不苟言笑

  当然,还有岌岌可危的发量(没有,不是我说的)

  那只能说,这些都是表象

  堪称新时代的中流砥柱

  每天家住回龙观,征战新中关

  浑身散发出高级又内敛的气质

  究竟是什么塑造的?

  (一切为了工作 挣钱)

  小驰捕捉到一位思必驰程序员小哥哥

  今天去看看

  他日常的那些“封神级”操作!

  Q:一句话形容你正在做的事情?

  A:人类之光…在宇宙中心呼唤AI…反正很Cool就对了

  Q:最近有什么新成果吗?

  A:你光顾着关注我们发际线,不关注我们的精神成果,扣鸡腿…

  最近发布了DUI标注训练一体化平台,具体干啥的,来补课!↓↓↓

  DUI标注训练一体化平台全场景应用,识别体验持续提升!

  https://mp.weixin.qq.com/s/GaVP0XvAgwxrrdFT3fuqRQ

  思必驰DUI标注训练一体化平台,让服务赋能走向能力赋能:

  https://mp.weixin.qq.com/s/voKIm5uPzSceYmiHdiJWeA

  Q:如果我中英文掺着说,语音识别TA能听懂吗?

  A:不同场景、环境下的语音识别效果多少会受噪声、专业术语、多语言混合影响。契合场景来提升语音识别率,自然就能准确许多。

  Q:让场景识别率能持续提升,你们有什么“神技”傍身?

  A:我们融进了最新的「端到端识别技术」来提升识别准确率,通过大规模预训练模型技术提升语音识别后处理效果。结合「增量学习」、「主动学习」、「联邦学习」和「小样本迁移」等技术手段,提升用户体验。同时开放「端点检测模型自训练」、「标点断句自训练」等功能,让用户自己拥有自主权,来解决实际问题。

  Q:呃…

  A:好,说点你能听懂的

  高能,划重点!

  第一,关于端到端识别技术。

  过往严格意义上的端到端识别技术,如基于LAS的端到端系统,虽然可以较明显地提升通用语音识别的准确率,但受限于计算复杂、自定制语言模型技术不成熟等原因,不能大规模的商用。思必驰去年推出新一代端到端语音识别建模技术,在实现通用识别准确率相对提升10%-15% 的同时,也提升了模型计算速度,更可以满足快速有效的语言模型自定制。

  第二,关于大规模预训练模型技术。

  要知道,语音识别系统中除了核心的语音识别(ASR)模型部分,语音识别的后处理模型也是十分重要的,它直接影响到识别结果的可读性。思必驰语音识别系统支持「智能纠错」、「智能标点断句」、「智能口语顺滑」、「智能语义分段」、「智能语义纠错」等语音识别后处理技术,能进一步提升语音识别的效果与可懂度。模型采用大规模预训练模型,结合多任务学习(Multi-Task Learning)和知识蒸馏(Knowledge Distillation)方法。在降低70%以上模型规模的条件下,提升了模型效果,运算效率大幅提升同时降低了内存开销。

  例如在智能会议场景中,通常转写结果是篇章段落,且多含有口语化的表达,通过我们的识别后处理功能,可以将会议转写结果整理成格式化,易读易懂的会议记录。

  第三,增量学习。

  受限于深度神经网络技术中的灾难性遗忘问题,采用深度学习方法的ASR建模在权衡“既要保障模型原有识别效果,又要提升新的目标场景识别效果”时,通常采用基于新旧数据混合训练的方法。弊端是,该方法增长了模型优化的周期,又会带来数据安全隐患。基于思必驰自研的KDF-IL增量学习方法,在语音识别优化时,可以仅用新增数据进行模型训练,缩短开发周期同时,也有效保障数据安全。 第四,小样本学习。

  自研的小样本迁移学习技术,使用少量数据就可快速实现场景体验优化。例如使用少量带标注的文本数据,即可对标点断句模型进行优化,相对传统模式调优,节省了83%的数据量。例如,在真实的航空质检场景中,通用的标点断句模型面对特殊的专业术语和断句方式,一定会水土不服。得益于小样本迁移学习技术,在使用少量的标注文本情况下,即可实现F值40%左右的绝对值提升,完成体验效果从不可用到可用的转变。 最后,咳咳….(这个氛围是不是该升华了)在功能层面,我们深知不同用户的使用场景复杂多样,单靠赋能用户自主训练ASR模型不能满足需求。

  我们!(升华来了)秉承以解决用户实际问题为核心的产品理念,开放端点检测模型自训练、标点断句自训练等功能,使得用户可以通过我们的产品,完成识别系统中几乎所有模块功能的自训练,最大程度优化用户体验。

  Q:啊,真不愧是“人类之光”。求问,没经验可以用吗?

  A:平台建立的出发点就是降低 AI 使用门槛,只要企业有数智化转型的需求,我们就能匹配提供高可用定制的模型。平台的私有化部署能力,也能将自主权交给企业自己,非AI专家都能使用,”零“学习成本。

  Q:怎么合作呢?

  A:平台同时满足「模块化输出」+「支持 UI可视化界面 /API输出」这两点,可以根据业务需求灵活配置,选择使用一体化平台的全部功能,或者只使用其中几个模块的功能。

  Q:可以拓展使用吗?

  A:当然可以,「全场景覆盖」是平台的一大优点。适用于各类行业场景,如会议办公、航空通讯、智慧医疗、城市交通、数字化门店、智慧园区、线下质检、政务、庭审等等,可以快速从当前项目复用到新项目中,形成规模化生产定制,满足多样化的业务需求。

  Q:怎么联系你们呢?

  如有合作意向,请发邮件

  Q: 好,不愧是气质不凡的你们!今天收获颇丰!

  A:总结下,就是我们在一个科技开放和包容的时代,和一群特别Cool的人,做了些特别Cool的产品和事情。如果你想更了解我们,欢迎随时交流。

特别提醒:本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,并请自行核实相关内容。本站不承担此类作品侵权行为的直接责任及连带责任。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。


返回网站首页

本文评论
某制造企业因钓鱼邮件损失20万美元!2019年钓鱼邮件同比激增近7成
最近,奇安信联合Coremail发布了《2019中国企业邮箱安全性研究报告》(简称报告)。报告披露:2019年7......
日期:01-21
冠绝全行业的vivo,究竟赢在哪里?
自7月8日正式发布以来,关于vivo X50 Pro+的赞誉之声便从未停歇,在竞争惨烈的5G手机市场,vivo X50......
日期:07-13
每天回家就能享受大师级按摩,荣泰按摩椅太让人上头了
人就像一张弓,拉得太满就会疲惫。日益加快的生活和工作节奏,逼迫我们每天不得不将自己这张弓拉得......
日期:12-11
国旗图案服装全球首发 安踏天猫超级品牌日缔造时尚盛宴
7月27日,安踏开启首个天猫超级品牌日,在此次活动期间安踏2022冬奥会官方特许商品国旗系列运动服装发......
日期:08-07
转转二手手机以品质把控构建未来之路
如今,手机在现代生活中的重要性已经不言而喻,离开手机人类几乎寸步难行。然而科技在进步、市场在......
日期:04-29
开年喜报!国双首批获颁电子标准院“知识图谱产品认证“
今日,由工信部直属事业单位——中国电子技术标准化研究院(以下简称“电子标准院&ld......
日期:01-11
李彦宏个人账号曝光猛吸粉,网友:原来不是高仿号!
短短8个字,30万点赞。昨日,百家号自媒体上一个叫“李彦宏”的账号引发关注。经过万能的......
日期:03-13
“产学合作协同育人项目”启动 蚂蚁助力科技育
近日,“2020年教育部产学合作协同育人项目对接会”在北京召开。据悉,由教育部牵头发起的...
日期:01-18
20家投行齐给“买入”评级 腾讯年报能否一扫阴霾?
腾讯即将在3月21日发布2018年的第四季度财报以及全年财报。这也是腾讯自2018年9月宣布战略调整以来......
日期:03-17
什么样的早教机更适合宝宝?各项测评显示:亲宝小伴优势明显
现在市面上可供选择的早教机实在太多了,一打开某宝,各种造型、各种价格的早教机,简直都要挑花眼......
日期:12-06
首届“开源软件供应链点亮计划-暑期2020”项目申请开启
[中国北京,2020年6月1日]今日,“开源软件供应链点亮计划-暑期2020”活动项目申请正式启......
日期:06-01
新石器亮相《新闻联播》 无人售卖车服务雄安
国庆期间,全国人民在欢度国庆和享受假期的同时,仍有不少劳动者仍旧坚持在服务一线,保证游客的安......
日期:10-03
向往的生活3还没开播,但有一个连续霸屏12期的嘉宾已经提前曝光了
盼望着,盼望着~《向往的生活3》就要开播了!确认过眼神,这是我今夏要追的重要综艺节目~怀念何老师......
日期:04-22
时尚不等于珠光宝气,Garmin腕表带你引领潮流
每逢换季,都是一次穿搭功力大考查。可搭配的单品并不少,却总觉得欠点儿火候?从不随波逐流的潮人往......
日期:04-23
快成物流为什么总能“快人一步”
科技的进步总会给我们带来很多意料之外,比如,没有一辆汽车的 Uber 却可以在全球范围内完成 100 亿......
日期:12-16
德国电信重申多供应商战略:不会依赖也不会拒绝
北京时间 7 月 10 日消息 德国电信(Deutsche Telekom)近日在其官网发表题为《多样性而非依赖性》的......
日期:07-10
三星电子成为T1俱乐部官方显示设备合作伙伴
与Faker掌舵的三次LOL全球总决赛冠军战队合作开启 全球电竞显示器市场佼佼者三星电子,宣布与T1电竞俱乐部正式合作。位于...
日期:05-27
时间紧,任务重!TCL空调为中高考学子打造清凉舒适考场环境
由于受疫情影响,今年的高考时间将推迟到7月7日-7月8日进行,与往年逢高考就下雨的凉爽天气相比,今......
日期:07-06
还没法出境游?空姐们也来做主播,网红旅游国家都来天猫国际“赶集”了
疫情后的第一个618,对跨境电商来说是危是机?天猫国际用一场跨界空姐、导游的直播,给了我们答案。...
日期:06-09
点外卖有新选择了:顺丰推出企业团餐平台“丰食”
坐拥覆盖全国的网点以及从事物流配送的经验能力,顺丰悄然进入送餐行业。...
日期:05-09