近日,计算机视觉领域三大顶会之一ICCV于韩国首尔落下帷幕。在此次的ICCV VOT 2019单目标跟踪国际竞赛中,百度大脑视觉技术团队&华中科技大学电信学院团队击败了来自全球知名企业、高校研究所的46支团队,凭借跟踪算法ATP,在测试集上以27.5%的成绩夺得冠军,这也是百度首次在VOT中参赛。百度在计算机视觉领域的深厚积累正在扩展到更多的细分技术方向。
VOT (Visual Object Tracking challenge)是国际目标跟踪领域最权威的测评平台,赛事以其跟踪难度和代表性著称。VOT竞赛评估视频并不以量取胜,而是精选出60个视频,内容涵盖快速运动、光照变化、目标形变、遮挡等主要目标跟踪难点,VOT竞赛也被视为视觉跟踪领域最难的竞赛。自2013年开始,VOT竞赛每年都在计算机视觉领域的顶级学术会议上举办。
今年的VOT赛事在ICCV 2019中举办,吸引了来自腾讯、微软亚洲研究院、商汤、滴滴出行等知名企业,北京大学、中国科学院大学、牛津大学、剑桥大学、瑞士联邦理工学院、加州大学等高校研究所在内的46支队伍挑战。百度提交的结果在最终指标EAO(Expected Average Overlap)中,在测试集上以27.5%的成绩夺得本次单目标短时跟踪测评的冠军,这也是百度首次参加VOT赛事。
据悉,本次的冠军方案ATP跟踪算法采用逐步递进的方式,以获得鲁棒的跟踪和精准的定位。如下图所示,在给定一张测试图片后,ATP首先裁取一小块搜索框,然后依次定位其中心、矩形框、分割掩模,最后得到其旋转框。通过解耦跟踪的各个阶段,可以更灵活地实现和调试ATP的单个模块,且大大减少了算法学习的复杂度。另外,现有跟踪算法在目标快速运动时依然面临极大挑战,百度针对目标快速运动提出一种有效的处理机制,根据目标的运动速度动态调节算法的搜索范围。
通过上述设计,ATP算法能够有效处理目标快速运动的情况,且能精准得到目标旋转框。下面是一些快速运动和目标旋转变化的例子,其中红色框是算法结果,黄色框是baseline结果:
百度在计算机视觉领域拥有深厚技术积累,并在不断扩展更多的细分技术方向。
目前,百度大脑领先的视觉技术能力均已通过百度AI开放平台(ai.baidu.com)面向开发者开放,开发者数量和日均调用量在业内保持领先。其先进的算法也通过飞桨(PaddlePaddle)对外开源。百度正在不断为智能时代的生态构建贡献力量。
未来,百度大脑将持续秉持AI普惠的价值理念,一面在产业实践中不断打磨进化、勇攀高峰,一面开山辟路,为开发者构筑完善的AI生态。以技术改变生活、服务社会,加速产业智能化升级的步伐,为世界科技发展贡献中国力量。
特别提醒:本网内容转载自其他媒体,目的在于传递更多信息,并不代表本网赞同其观点。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,并请自行核实相关内容。本站不承担此类作品侵权行为的直接责任及连带责任。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。