您的位置:首页 > 互联网

2020语言与智能技术竞赛:云知声认知智能团队获机器阅读理解任务冠军

发布时间:2020-11-09 00:00:00  来源:互联网     背景:

  11月6日,由中国中文信息学会(CIPS)和中国计算机学会(CCF)联合主办的“第五届语言与智能高峰论坛”在线举行。大会同期为“2020语言与智能技术竞赛”五大任务领域优秀团队授奖,凭借在阅读理解技术方向的深厚积累,云知声认知智能团队摘得机器阅读理解任务冠军奖牌。

1604892106464259.jpg

  “2020语言与智能技术竞赛”由中国中文信息学会(CIPS)和中国计算机学会(CCF)联合主办,百度公司、中国中文信息学会评测工作委员会和中国计算机学会中文信息技术专委会联合承办,设立机器阅读理解、面向推荐的对话、关系抽取、语义解析与事件抽取五大热门竞赛任务,并提供面向真实应用场景的大规模数据集。

  今年的参赛规模创历年新高,五大任务领域累计报名参赛队伍超5300支,参赛选手超6000人,大赛累积收到有效提交结果近15000份,成为中文NLP领域参赛人数最多的赛事。除整体参赛人数规模翻倍之外,参赛队伍阵容亦堪称豪华,覆盖了海内外知名高校、科研机构以及诸多知名企业。

1604892118809556.jpg

  作为本次竞赛的核心任务之一,机器阅读理解 (Machine Reading Comprehension)是指让机器阅读文本,然后回答和阅读内容相关的问题。阅读理解是自然语言处理和人工智能领域的重要前沿课题,对于提升机器的智能水平,使机器具有持续获取知识的能力等方面具有重要价值,近年来受到学术界和工业界的广泛关注。本次大赛机器阅读理解评测是连续举办多年的一个任务,吸引了包括中国科学技术大学、中国科学院大学等一千多支知名校企队伍参加。

  本次大赛的机器阅读理解任务注重阅读理解模型在真实应用场景中的鲁棒性,挑战模型的过敏感性、过稳定性以及泛化能力。比赛过程中,云知声认知智能团队依托自身雄厚的技术积累,以及在医疗等领域的产业化实战经验,所提交系统取得F1值较基线提升26%的佳绩,在预赛和复赛F1值和EM值在均位列第一。

1604892128236634.jpg

  比赛中,云知声认知智能团队针对阅读理解系统存在的过敏感、过稳定和泛化性不足三个问题进行了有针对性的优化,增强了阅读理解系统在真实场景中的鲁棒性;团队还借助云知声预训练语言模型平台UniPLM,对模型进行了快速迭代和高效训练;最后利用模型集成的方法进一步提高了阅读理解模型的性能指标。

  1. 利用数据增强的方法来处理过敏感、过稳定问题。针对过敏感问题,使用问句生成和相似度匹配模型两阶段过程后生成候选样本,用来攻击训练好的阅读理解模型,若攻击成功则生成过敏感类型的增强样本。针对过稳定问题,使用实体识别方法从文章中识别与答案相关实体,与问句信息结合融入篇章中生成候选样本,用来攻击训练好的阅读理解模型,若攻击成功则生成过稳定类型的增强样本。

  2. 利用领域外数据来增强模型的泛化能力。增加了包括DuReader、CMRC等通用领域的语料。还增加了证券公告、五种学科的教育领域数据。

  3. 借助云知声预训练语言模型平台UniPLM来进行模型的快速迭代和高效训练。UniPLM基于Huggingface的transformers库进行开发,支持各类主流的预训练语言模型以及分类、序列标注、阅读理解等NLP任务。UniPLM融合了TensorBoard和微软NNI框架,支持可视化训练和自动调调参。它还可以高效地在分布式训练平台Atlas上进行多机多卡训练。

1604892140126409.jpg

  让机器理解人类语言是人类长期以来的梦想,也是人工智能应用必须迎接的挑战。作为云知声全栈技术版图的重要模块,经过多年的持续投入与潜心研发,当前云知声认知智能技术已处行业领先水平,由云知声与中科院自动化所合作完成的项目——“大规模知识图谱构建关键技术与应用”亦荣获2019年北京市科学技术进步一等奖。相关技术成果也已先后应用至医疗、家居、车载等诸多垂直领域。

特别提醒:本网内容转载自其他媒体,目的在于传递更多信息,并不代表本网赞同其观点。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,并请自行核实相关内容。本站不承担此类作品侵权行为的直接责任及连带责任。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。


返回网站首页

本文评论
共享单车不能任性了
(原标题:多城公布考核成绩单—— 共享单车不能任性了 )...
日期:04-17
用友企业云服务助力企业全面提升数字化能力
历经了浅水区的摸索,熟悉了“水性”,饱尝了初见成效的“小欢喜”后,企业数......
日期:09-09
灿谷荣获2019中国新经济创新势力榜“最佳车主服务平台”大奖
3月12日,由iiMedia Research(艾媒咨询)主办的2019出行超级沙龙在北京圆满落幕,同期举行“201......
日期:03-15
物流行业用泛微OA系统,轻松应对“双11”
“双十一”将至,物流行业大考,划重点:速度、速度、速度,重要的事情说三遍!...
日期:11-11
家居行业用户隐私保护虚拟小号一招解决
家居是人们生活的必需品。工业化和城市化的推进,人民生活水平的提高,给家居产业造就了日益扩大的......
日期:08-29
数字虚拟人亮相,腾讯云小微AI语音技术再升级
9月9日-11日,“2020腾讯全球数字生态大会”首次在云端以线上方式对外呈现。在11日的AI论......
日期:09-11
滴滴蛰伏、Uber和Lyft抢上市 全球出行市场大变局
2008年冬天,卡兰尼克与他过去的创业伙伴并肩站在巴黎街头的寒夜中。在这之前,他们刚刚参加完一场L......
日期:04-11
小葫芦CEO曹津:2020年聚焦机构价值 网红经济是新的价值洼地!
距离第三届中国网络红人大会暨2019小葫芦全平台颁奖礼大会开幕仅剩1天!...
日期:01-08
网龙产品矩阵亮相中国教育装备展 展示未来创新教学
2019年10月12-14日,第77届中国教育装备展示会在山东青岛召开。网龙旗下教育子公司网龙华渔教育为公......
日期:10-12
推动教育公平发展和质量提升 腾讯教育助力优质资源共享
5月22日,第十三届全国人民代表大会第三次会议在人民大会堂举行开幕会。在国务院总理李 克强作政府工......
日期:05-25
苏宁小店销量暴增,无接触服务大获好评
为响应防控政策,人们在家隔离,对生鲜蔬菜、米面粮油等民生必需品的囤货需求也随之增长,记者走访......
日期:02-03
深度读图时代 新浪新闻app推《看见》等IP聚焦大中国的小人物
碎片化阅读时代,相较文字,图片是用户更“青睐”的信息获取方式。新浪新闻app通过《看见......
日期:03-26
京东11.11专场福利vivo iQOO Pro不到4000元! 买5G手机不用再等一年!
进入11月以后,京东11.11每天都不间断的放出“超级百亿补贴千亿优惠”重磅福利,钱包都要......
日期:11-05
凤凰之眼照耀王者峡谷,这才是最适合王者荣耀的手机!
随着《王者荣耀》、《和平精英》这类型游戏的火爆,很多用户在换手机时都很看重手机的游戏性能及上......
日期:11-22
便利店研究报告出炉:苏宁小店构建“到家+到店”综合模式
11月27日下午,在2019WISE新经济大会“全民消费”论坛上,36氪线下发布了《连锁零售便利......
日期:11-28
哔哩哔哩布局电视盒子,会步入优酷盒子的后尘吗
B站是现在国内一家非常有潜力的互联网科技公司,有着非常强大的优势,独特的UGC氛围,是现在少有的一个......
日期:05-12
中国新一代网络安全厂商奇安信亮相世界级安全大会RSA2020
美国当地时间2月24日—28日,作为全球网络信息安全行业最受关注的年度盛会,RSA2020大会将在美......
日期:02-14
东方卫视报道丨2019智慧餐饮新趋势,送餐机器人广受关注迎来爆发
8月29日,2019世界人工智能大会(简称2019WAIC)即将在上海世博中心召开,1200多平方公里的浦东正绘就......
日期:08-28
驱动人生开学季 一起畅享会员嘉年华
2020年驱动人生装机节来咯!! 一起畅享会员嘉年华套餐~ 超丰厚奖品拍了拍你 惊喜嗨翻天! ......
日期:08-31
Spencer暗示Xbox Game Pass Platinum和xCloud电视棒即将上线
次时代游戏主机 Xbox Series S|X 即将上市发售,不过微软在游戏领域的真正核心是 Xbox Game Pass。......
日期:10-24