您的位置:首页 > 互联网

平均mAP大幅提升,百度研究院夺得CVPR SoccerNet-v2足球视频理解竞赛双冠

发布时间:2021-06-29 19:37:00  来源:互联网     背景:

2021欧洲杯足球赛近日“姗姗来迟”,牵动了无数球迷的心。精彩的球赛视频背后,令人意想不到的是AI技术正在重塑体育视频产业的内容生产方式。

在近期举办的国际计算机视觉与模式识别顶会CVPR 2021上,视频理解领域最具影响力的International Challenge on Activity Recognition (ActivityNet) workshop旗下多个竞赛公布榜单。竞赛吸引了百度、阿里、字节跳动、腾讯、华为等知名企业和清华、北大、斯坦福、麻省理工学院、中科院等国内外高校和机构参与。其中,全球首个以足球比赛视频的全方位理解为目标的SoccerNet-v2足球视频理解竞赛中,百度研究院以绝对优势夺取了全部两项任务的冠军。

百度拿下全部两项任务冠军

本届竞赛所使用的 SoccerNet-v2数据集在足球理解领域规模最大,包括500场来自2014到2017年三个赛季的欧洲足球五大联赛和欧洲冠军联赛的视频,视频总时长达到764小时,人工标注达30万个,成为国际AI团队间衡量足球视频理解能力的重要标准。

双任务项目夺冠 大幅提升基线平均mAP

本届SoccerNet-v2竞赛下设了事件定位(action spotting)和回放溯源(replay grounding)两个任务。其中,事件定位(action spotting)是从足球比赛实况转播视频中找到一些关键事件并确定其发生的时刻。关键事件包括17个类别,涵盖进球、点球、任意球、红牌、黄牌、角球等重要事件,以及犯规、越位、射正、射偏等人类也难以立刻分辨的事件。同时有一部分事件甚至并未被直接拍摄到,需要根据上下文来推测,这也是对视频动作识别和事件检测能力的一个挑战。

回放溯源是(replay grounding)是把足球比赛转播视频中的回放片段和原始事件进行匹配。在足球比赛视频中一个精彩事件发生之后往往有多次回放,且回放和原始事件之间可能会相隔长达上百秒,拍摄视角也经常不同,能否将回放片段和原始片段匹配是对超长距离视频理解能力的一项考察。

百度研究院图文转视频VidPress团队专注于算法研究和应用创新,此次拿下两项任务的冠军,展现出了超群的技术实力。系统采用两阶段的方法,首先特征提取器提取足球视频特征,再将提取出的特征作为第二阶段具体任务模块的输入,进行事件定位或者回放溯源。

事件定位和回放溯源的系统流程

在特征提取阶段,团队认为在足球视频上微调过的特征提取器更有利于提升事件定位和回放溯源两个下游任务的表现,因此在SoccerNetv2数据上微调了五种预训练的特征提取器模型:TPN、GTA、VTN、irCSN和I3D-Slow。这五种特征提取器模型均是最近年来视频理解领域在分类任务上表现优异的模型,在标准数据集Kinetics-400上的成绩也名列前茅。

在五种特征提取器模型之上,团队也充分利用数据,设计了多种微调特征提取器模型的策略、开发了提取特征的新方法。得到每种特征提取器在足球视频上提取的特征后,将五种特征连接起来并做了归一化处理,使得优化后的特征对足球比赛视频具有强大表达能力,为后面的下游任务打下了坚实基础。

在事件定位和回放溯源阶段采用了Transformer结构。Transformer架构的特点是更清晰、更标准化、模型容量大、扩展性强,能适应计算机视觉、自然语言等多种业务。Transformer结构在这两个任务中体现了对视觉语义特征的精确的时序处理能力,优于基线算法中Siamese网络的学习能力和训练速度。在训练过程中,事件定位采用了mix-up数据增强,更高效利用了训练数据、降低过拟合。在回放溯源的任务上,模型结构的更换使得训练时间减少到原来的八分之一。

结合前述的视觉信息语义化特征,以及为新的任务订制的Transformer结构,百度研究院在竞赛成绩上取得了较大幅度的领先。在事件定位任务上,把基线的平均mAP由52.54%提升到74.84%,提高了22.3个百分点,是第二名提升的近两倍;在回放溯源的任务上,把平均mAP由基线的40.75%提升到了71.90%,提高了31.15个百分点,比第二名63.91%的成绩高出8个百分点。

技术“照进”现实应用 智能视频生成工具应运而生

百度研究院之所以能够在该项竞赛中脱颖而出,离不开基于大规模视频数据的算法能力技术积累。

该项技术有非常高的实用价值,可以大规模应用于体育赛事视频中,通过对全场比赛进行智能识别,可以在不需要人工介入的条件下,精准、实时地切分出进球、射门、犯规等动作片段。

基于此项能力,团队开发出了一系列应用工具并成功落地。

首先是行业领先的自定义足球精彩集锦生成工具。输入球员后选定比赛场次,即可自动生成这个球员的精彩瞬间视频集锦以及慢动作回放。目前这一系统已经落地在百度百科400多个足球球员和球队页面。

输入球员名称+比赛名称,生成该球员的视频集锦

其次,将文本语义理解与视频图像理解贯通,团队还搭建了足球图文战报一键转换视频平台。输入文字直播内容或者直播间地址,就能智能聚合生成对应的视频内容,提高了战报的生成效率和可读性。

根据文字直播内容智能生成对应的片段视频

此外,团队还建立了基于图像场景识别的智能视频生产线,该生产线可以快速理解上传的长视频,检测是否有进球、精准定位视频中的进球瞬间,并完成自动剪辑。

上传一段比赛视频,自动识别生成进球片段

基于在智能视频技术上的不断创新和积累,百度研究院在2020年初孵化推出了智能图文转视频工具VidPress,是业界首个支撑通用型、大规模的全自动视频生产技术。VidPress能够支持图文链接一键导入,自动自动实现配音、字幕、画面的视频内容生产,降低素材搜集、整理、匹配的时间成本。目前VidPress已作为百度大脑智能创作平台中的核心能力,为人民日报等多家媒体机构的智能视频生产赋能;为秒懂百科智能生成上千条球员精彩瞬间视频;为百家号和好看视频等平台的终端用户提供一键视频生成服务。百度大脑智能创作平台基于自然语言处理、知识图谱、视觉、语音的整合技术能力,为创作者提供多项能力,助力新闻生产的策、采、编、审、发全流程,全面提升内容生产效率。

全视频时代到来,各行各业对视频的应用、体验和效能都提出了全新升级需求,智能视频变化趋势背后的驱动力少不了AI的身影。无论是足球比赛视频,还是其他内容丰富、形式多样的视频内容,未来百度也将持续在相关领域的技术上不断突破迭代,并持续赋能应用与产品落地,为视频行业的发展与变革注入充足动力。

特别提醒:本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,并请自行核实相关内容。本站不承担此类作品侵权行为的直接责任及连带责任。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。


返回网站首页

本文评论
不知道怎么选购电动车?明星沙溢在线科普
哈喽!小铃铛们 由台铃作为官方指定电动车 和爱奇艺网络总冠名的《奔跑吧》 ......
日期:05-27
一张厕纸的流量创新 天九共享赋能纸巾宝快速崛起
在目前的互联网+背景下,大数据已经渗透到人民群众的方方面面,互联网巨头通过各种线上APP应用进行......
日期:03-23
梦洁集团董事长姜天武:让高品质床品成为美好生活的载体与桥梁
“我觉得视野要开放、培养人才要舍得,把设计做得更具有全球化视野,好的资源会引进来,也邀请设......
日期:06-10
抓住短视频红利,更美APP视频面诊成为新发力点
“请朝左边转下让我看一下侧面”,北京一家医美机构的王医生正在更美APP为一位大四学生小......
日期:05-15
《中超进行时》改变直播生态,PP体育告诉你未来还能怎么玩?
恒大成为中超历史首个八冠王,国安创下中超亚军最高积分记录,本赛季中超又创下多个纪录。一边是九......
日期:12-03
天津市首批产教融合型企业公布!曙光满分入选
为深化产教融合、校企合作,充分发挥企业在技术技能人才培养和人力资源开发中的重要主体作用, 天津......
日期:04-08
今日头条CEO朱文佳:做搜索基于产品使命
11月15日,今日头条生机大会在京举办,今日头条CEO朱文佳在演讲中表示:对于头条来说,做全网搜索更......
日期:11-18
成贵高铁正式开通,成都与贵阳最快2小时58分可达
12月16日消息 根据西南铁路的官方消息,成贵高铁的宜宾至贵阳段开通,全长372公里,从贵阳北站出发......
日期:12-16
2019年Q1家电消费趋势报告发布,新兴家电增长迅速
继5月15日的苏宁618年中大促媒体发布会召开后,5月17日,2019年一季度家电消费趋势报告发布会在南京......
日期:05-17
华为Mate 30系列发布会再选慕尼黑 难道这地儿不一般?
(原标题:华为Mate 30系列发布会为何再次选择慕尼黑 )...
日期:08-20
抓紧领取!苏宁免费请客吃霸王餐啦!
进入11月,天气愈发寒冷,夜幕降临,寒气逼近,华灯初上的城市里,想象从冰冷的世界回到温暖的室内,吸上......
日期:11-09
媒体报道 | 奥佳华主导按摩椅国家标准修订,助推行业创新发展
为进一步规范按摩椅行业的发展,优化产品品质,保障消费者的权益,《家用和类似用途保健按摩椅》推荐性......
日期:02-03
点燃希望传递梦想 空中网2019红色电波公益助学项目圆满举办
10月27日至11月2日,空中网“红色电波”公益助学项目2019年支教活动圆满举办,本次支教地点......
日期:11-05
抢跑5G时代不止于快 中国移动咪咕要做5G+超高清生态助推者
6月28日,MWC 19在上海正式落幕。这是中国正式颁发5G牌照后的首次行业盛会,也是一次全球最大5G网络......
日期:06-29
支付宝上线全国首个夜光收钱码 5万份一夜抢光
夜经济彻底火了! 支付宝数据:截至6月22日,全国已超过600万家小店夜间收入超过去年同期,......
日期:06-23
物联网向智能物联网升级 场景智能不再只是想象
2019年的《政府工作报告》指出,打造工业互联网平台,拓展“智能+”,为制造业转型升级赋......
日期:03-28
2019,进击的云智慧
2019年,刚刚度过十岁生日的云智慧驶入了发展快车道,围绕数字化运维体系打造的DOCP系列通用IT运维......
日期:01-16
RPA 开启企业智能新时代 | WISEx 企业智能行业峰会
企业正在迎来更加“自动化”的未来,RPA正在开启智能办公新时代。...
日期:09-12
旅游业发展方兴未艾,东方园林运营你的乡愁
文化旅游区的打造,不仅可以吸引来八方游客,同时可以带动当地餐饮、住宿等产业发展。而东方园林作为......
日期:10-21
首届“青鸿鹄”长三角数字经济创业创新大赛60进30复赛名单揭晓
9月26日,首届“青鸿鹄”长三角数字经济创业创新大赛初赛在杭州丽水数字大厦举行,旨在更......
日期:10-03