您的位置:首页 > 互联网

腾讯云小微&腾讯云TI-ONE联合团队获RACE 数据集深层阅读理解冠军

发布时间:2020-11-27 00:00:00  来源:互联网     背景:

  近日,腾讯云小微及腾讯云TI-ONE联合团队在大型深层阅读理解任务数据集 RACE 数据集(ReAding Comprehension dataset collected from English Examinations)上登顶第一。据了解,在此次比赛中,腾讯云小微及腾讯云TI-ONE联合团队在基于ALBERT预训练模型上,取得了单模型90.7%和集成模型91.4%正确率的成绩。

  采用全新训练策略,腾讯云小微及腾讯云TI-ONE联合团队展现AI实力

  RACE 是一个来源于中学考试题目的大规模阅读理解数据集,包含了大约 28000 个文章以及近 100000 个问题。它的形式类似于英语考试中的阅读理解(选择题),给定一篇文章,通过阅读并理解文章(Passage),针对提出的问题(Question)从四个选项中选择正确的答案(Answers)。

  据了解,深度阅读理解的难度在于,正确答案的文字并没有直接使用文章中的话术来回答,不能通过检索文章获取答案,而是要从语义层面深度理解文章来作答。想要提高阅读正确率,就需要机器模型通过分析文章中的线索并基于上下文推理,选出正确答案,这对参赛团队的算法技术提出了更高的要求。

  因此,腾讯云小微团队通过全新的训练策略来实现突破。他们跳出从现有的四个选项中选出一个正确答案的固定模式,采用独立地考虑每一个答案是否合理的方式,同时利用多种其他形式的阅读理解数据进行迁移学习,大大提高了阅读理解的准确率,并在基于ALBERT预训练模型上,取得了单模型90.7%和集成模型91.4%正确率的成绩,赢得了本次比赛的冠军。

  除此之外,在本次比赛上,腾讯云TI-ONE联合腾讯优图和机智团队在单机性能优化、分布式多机扩展和AutoML收敛优化方面也作出了诸多开创性贡献。

  在单机性能方面,基于ALBERT的原生代码,TI-ONE引入了Nvidia的APEX的混合精度训练,并采用动态loss scaling进行正确的权重更新,保证最终模型的精度没有因为低精度训练而有所损失,最终,单卡性能提升为原来的3.6倍。

  在多机扩展方面,由于PyTorch原生的DDP通信框架在公有云VPC网络扩展性不好,团队采用自研的TI-Horovod通信加速框架,利用2D-AllReduce和多流通信等技术,把多机训练ALBERT性能提升为原来的5.5倍。

  另外,AutoML收敛方面,腾讯自研的TI-AutoML框架解决了模型集成困难和大规模长任务调参效果差的问题,便捷地与ALBERT模型集成,同时针对ALBERT模型pretrain和fine-tune两阶段训练的特点,采用了不同的自动调参策略,最后在腾讯云海量算力的加持下,调参效率相对人工调参提升了8倍,彻底把算法工程师从繁琐的手工调参中解放出来,让精力更多的聚焦在更有意义的模型算法创新工作上。

  技术突破让AI应用日渐广泛,在多行业领域落地应用

  深度阅读理解是目前AI领域中最受关注、进步最快的技术方向。如何提高机器深度阅读理解的正确率,是业内一直在关注和探索的问题。此次腾讯联合团队创新的训练策略,和在单机性能优化、分布式多机扩展和AutoML收敛优化等方面的技术提升,将给AI技术领域带来新的突破。

  不止是在深度阅读理解领域有所突破,此次参赛的腾讯云小微团队专注于AI技术领域,在机器翻译、人机对话、阅读理解、自动摘要等领域内都有所研究,其相关技术多次获得业内的认可。在AIIA2020人工智能开发者大会上,腾讯云小微获得多项技术评测认证;在DSTC第八届对话系统技术挑战赛中,则获得四项第一;在CAIL2019司法人工智能挑战赛阅读理解第一名的好成绩。

  当前,人工智能作为经济发展的新动力以及新一轮产业变革的核心驱动力,机器翻译、人机对话、阅读理解等AI技术正在教育、文旅、出行等多个领域内落地应用。在这种背景下,腾讯云小微团队凭借全栈AI语音能力,以及腾讯内外部丰富的内容和服务生态,为各行各业输出完整的AI解决方案,不断渗透智慧生活各个场景。据了解,目前已在智能网联汽车、智慧文旅、智慧教育、智能家居等多行业领域落地应用,服务广泛的用户群体。

特别提醒:本网内容转载自其他媒体,目的在于传递更多信息,并不代表本网赞同其观点。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,并请自行核实相关内容。本站不承担此类作品侵权行为的直接责任及连带责任。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。


返回网站首页

本文评论
爱就投承办的第二届“江都杯”中国双智创业大赛武汉分赛亮点集锦
10月17日,在武汉华美达安可酒店会议中心,成功举办了第二届“江都杯”中国智能制造智慧城......
日期:10-22
315放心购,苏宁“随时会员”开放五大福利
抱着手机盯着时间,疯狂戳手机屏幕抢购商品的这一幕你肯定不陌生,宅家的特殊时期,无论是生鲜还是......
日期:03-10
洞悉用户需求,ColorOS 7.2 带来更人性化游戏体验
近日,电视剧《穿越火线》又一次引发大众对电竞行业的关注。剧中的主人公们在参加比赛时通常会自带......
日期:08-07
疫情信息真假难辨?百度输入法输入关键词可接入官方平台权威辟谣
新型冠状病毒感染的肺炎疫情在非典结束的17年后,再次将“野味”的严重性带到大众眼前。......
日期:02-04
新款iPhone唯一的亮点可能就是A13处理器了
每年的下半年才是手机市场最为动荡的时候,因为无论是苹果三星还是华为都会在下半年推出主打旗舰机......
日期:07-10
眼科教授繁忙的一天,临床诊断像破案
时钟指向早上8点,河南省立眼科医院眼遗传病诊区2号诊室内雷博教授开始了一天......
日期:07-29
为爱美用户隐私安全保驾护航,更美APP加入移动应用程序安全委员会
变美已经成为消费者普遍的需求,为了能够拥有自己心目中的美丽容颜,很多人都会通过医美项目来完成自......
日期:07-28
CoinAll首发Pivot免手续费一周,平台为何赔本赚吆喝?
随着互联网的发展,个体表达和寻求认同的需求与时俱进,协作平台成为获取信息、相互连接的主要方式......
日期:06-13
应对疫情挑战,低代码助力立雅展示自主搭建会展企业管理系统
突如其来的新冠肺炎疫情对会展行业带来了诸多挑战,相关企业该如何应对?广州立雅展示设计制作有限公......
日期:04-02
玄武.即信融媒体管理平台一站式解决“采编发统” 开启主流媒体互融时代
媒体融合 未触及本质 CTR曾对38家电视台、十大央媒的融媒体传播力进行了盘点,形成了CTR......
日期:03-30
腾讯自我革命进入ToB期:“微软式”转型到来在即?
企业发展最大敌人往往是自身,这句话对腾讯而言恰如其分。 据媒体报道,腾讯正在掀起史上第三次的重大组织架构调整,腾讯...
日期:09-29
暴风集团:存在股票被暂停上市、无法按期披露年度报告的风险
11月19日消息 深交所公告显示,11月18日,暴风集团发布了关于股票存在被暂停上市风险的提示性公告。...
日期:11-19
《极限挑战6》阵容曝光,极限团成员开启云聊天模式 当贝影视精彩抢先看
说起《极限挑战》这档综艺节目,也算是大家的老朋友了,从2015年开播,不知不觉已经播出了五季,不仅每......
日期:05-07
永无止境的贝佐斯:亚马逊的发展关键词便是不拒绝
亚马逊创始人杰夫·贝佐斯已成为当今世界公认的商界奇才。其最令人瞩目的成就便是将亚马逊从......
日期:09-29
助力长沙打造“中国软件名城” 湖南云天励飞首批签约
5月8日,长沙市软件和信息技术服务业促进会正式成立,将推动当地软件业发展,助力长沙打造“中国软件名城”。...
日期:05-12
发烧夜全明星阵容曝光!苏宁携手多平台,让你看够爱豆的颜
今年八月,来得比往常更燃一些。苏宁率先打响的818战役燃力十足,先后推出了拼购日和家电主场狂欢,......
日期:08-16
苹果公布iOS13发布时间!新系统有大变化
(原标题:苹果公布WWDC 2019开幕时间:iOS 13等新系统要来了)...
日期:05-23
百度智能云数据众包率先推出自动驾驶行业的AI数据整体解决方案
自动驾驶技术近年来倍受资本和行业市场关注,越来越多的车企、零部件供应商和解决方案供应商投身其中......
日期:05-26
中国移动:携号转网改造投入超10亿元,携入欢迎携出感恩
11月29日消息 据腾讯一线消息,今日,针对11月27日正式开启的携号转网服务,中国移动表示,这是一项......
日期:11-29
以智变引质变,新华三主动安全战略2.0正式发布
9月17日,2020 HCS合肥网络安全大会成功举办。紫光股份旗下新华三集团在会上宣布正式开启主动安全2.......
日期:09-21