您的位置:首页 > 互联网

2020 Techo开发者大会召开,腾讯多媒体实验室推出AI媒体内容生产平台“智媒”

发布时间:2020-12-21 00:00:00  来源:互联网     背景:

  12月19日至20日,由腾讯主办的年度技术盛会2020Techo Park开发者大会于北京顺利召开。本次大会邀请了200多位海内外专家和和数千位参会者就人工智能、多媒体等前沿技术话题展开交流。在视频通信云分论坛上,腾讯多媒体实验室总监李松南进行了《智媒-多模态与内容生产》的主题分享。

1608440538827052.png

腾讯多媒体实验室总监 李松南

  智慧媒体是指用人工智能技术重构新闻信息生产与传播全流程的媒体,由智能媒体、智慧媒体和智库媒体三部分构成。近年来,以主流媒体机构为代表的各媒体、企业等积极寻求媒体智慧化的演进策略,围绕媒体信息采集、媒体内容生产等方面,对智慧媒体的发展路径做出了一系列探索。日渐成熟的5G、人工智能、云计算等新一代呈现技术,正逐渐成为支撑智慧媒体发展的核心技术群。

  作为腾讯旗下顶尖科技实验室,也是全球多媒体技术的领先者,智慧媒体是腾讯多媒体实验室的重点研究领域之一。李松南表示,近期多媒体实验室推出了AI媒体内容生产平台——智慧媒体,可以通过搭建基于跨模态(图像、音频、文本、语音)算法的多媒体内容分析和理解框架,实现媒体标签、分类、检测、摘要、内容描述等功能。

  论坛上,李松南重点介绍了智慧媒体的内容生产。他指出,媒体内容包含视频、图片、声音及文字等多种形态,综合使用这些媒体形态的技术即为多模态技术。智慧媒体内容生产,就是通过人工智能的方式,自动化、批量化的生产这些不同模态的内容。

  李松南用“无中生有”、“浴火重生”和“斗转星移”三个词来形容智慧媒体的内容生产方式。所谓“无中生有”是指从0到1,从无到有的创作过程,比如给AI模型一些随机的噪声信号,AI模型可以生成一首诗或一段钢琴曲。浴火重生”即同模态间的转化,比如输入一段音乐,输出也是一段音乐,只是弹奏这段音乐的乐器发声了变化,比如从钢琴变成了琵琶。 “斗转星移”是指不同模态之间的匹配或转化,比如视频与音乐之间的互相匹配,图片与文字之间的相互转化等。

  截至目前,腾讯智媒的媒体内容生产能力已覆盖12种技术能力,部分能力已在腾讯云上的产品进行应用。李松南表示,未来,腾讯多媒体实验室会持续深耕多媒体技术,服务好腾讯内部产品的同时,通过腾讯云将技术进行输出,为社会创造更多价值。

  以下为李松南演讲实录:

  大家好,我是腾讯多媒体实验室的李松南,很高兴能参加腾讯Techo大会,为大家汇报多媒体实验室新近推出的AI媒体内容生产平台-智媒。汇报的副标题是多模态与内容生产。首先我来介绍一下多模态与内容生产的关系。

  大家都知道,媒体内容包含多种形态,比如视频、图片、声音、文字等等。

  做技术的同学把综合使用这些媒体形态的技术,叫做多模态技术。AI媒体内容生产,就是通过人工智能的方式,自动化、批量化的生产这些不同模态的内容。

  这里,为了方便记忆,我们把AI媒体内容生产方式,归纳为三种,并且给每种方式分别起了一个符号化的名字,分别是“无中生有”、“浴火重生”和“斗转星移”。

  下面我来分别介绍一下这三种方式。

  首先是“无中生有”,顾名思义,是一个从0到1,从无到有的创作过程:给AI模型一些随机的噪声信号,AI模型可以生成一首诗,或者一段钢琴曲,或者一副高清的人脸图片,或者一段视频。

  第二种方式,我们把它叫做“浴火重生”,是指同模态间的转化,比如乐器转换,输入是一段音乐,输出也是一段音乐,只是弹奏这段音乐的乐器发声了变化,比如从钢琴变成了琵琶。

  最后一种方式,我们把它叫做“斗转星移”,是指不同模态之间的匹配或转化,比如,视频与音乐之间的互相匹配,或者图像与文字之间的转化。

  第一种方式,实验室做了一些初步的尝试,正在寻找合适的落地场景,这里就不介绍了。接下来我会针对第二和第三种内容生产方式给出一些更具体的例子。

  第二种内容生产形式,我们把它叫做“浴火重生”,指的是相同模态内容之间的转化。因为多媒体实验室的主要工作在视频上,所以下面我以视频作为例子进行说明。算法的输入是视频,输出也是视频。

  视频处理就是这样一个过程,输入是一段视频,输出也是一段视频,是经过处理后的一段视频。这个处理过程可能包括了这段demo中展示的多种操作,比如减小压缩失真、提高分辨率、提高帧率、色彩增强等等;把高清的内容变成4K甚至8K,把普通的视频变成HDR的视频;甚至修复一段老电影,去掉老电影中经常出现的划痕、雪花,让老电影中的人物更清晰等等。视频处理是实验室长期投入的方向之一,我们正在与腾讯视频云、腾讯影业一起,通过画质重生、智能影视等产品,向外部企业提供优质的视频处理服务。

  另外一个例子是视频的横屏转竖屏。我们现在看到的很多短视频内容都是竖屏的,而很多优质的视频内容都是横屏拍摄的。我们通过分析画面的显著区域,设计了一个自动的裁剪算法,将大量的横屏视频自动的转换为竖屏视频。这里给出了几个例子,大家可以看到,视频的主体内容在竖屏画面中都被保留住了,同时镜头的运动也很自然。我们通过大量的主观实现,与市面上的类似产品进行了对比,证实了我们算法的优越性。

  还有一个例子是视频拆条与视频集锦。这里以足球视频举例,给算法一段90多分钟的足球比赛视频,算法可以分析出不同事件发生的时间段,比如角球事件、射门事件、进球事件等等,然后把这个长视频拆分成很多一段的一段的短视频。我们还可以把我们认为是精彩的短视频拼接在一起,形成一个精彩集锦,比如,对于足球来说,我们可以把射门、慢动作、进球等事件拼接起来,自动生成一段针对一场足球比赛的精彩集锦。

  第三种媒体内容生产形式,我们把它叫做“斗转星移”,指的是不同模态之间的匹配或者转化。这张PPT里给出的两给例子,分别是图片到文字、视频到文字的转化。左边是一张图片,里面是一个商品,我们可以用算法生成对这个商品的描述,帮助商家更好的吸引顾客。右边是一段游戏视频,我们可以用算法自动生成对游戏中精彩事件的描述。

  最后一个例子是视频配乐,输入一段短视频,根据对这段视频内容的分析,找到适合这段视频的背景音乐。自己做过短视频的朋友都知道,给短视频找一段称心如意的背景音乐很麻烦,而背景音乐推荐算法可以帮你节省很多时间。

  好的,上述所有例子都来自多媒体实验室的智媒平台,这页ppt里例举了智媒平台目前提供的所有媒体内容生产能力,其中的一部分已经开始服务于腾讯云上的产品。实验室会通过腾讯云,持续的对外输入我们的技术能力。

  感谢大家的聆听!多媒体实验室会持续深耕技术,服务好腾讯内部产品,同时通过腾讯云将技术进行输出,为社会创造更多价值。谢谢大家!

特别提醒:本网内容转载自其他媒体,目的在于传递更多信息,并不代表本网赞同其观点。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,并请自行核实相关内容。本站不承担此类作品侵权行为的直接责任及连带责任。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。


返回网站首页

本文评论
匠心细作 卓尔不凡DEVELOP德凡ineo+ 250i荣膺2020国际质造节“杰出产品奖”
(2020年8月3日,上海)2020年7月29日,以“质‧创未来”为主题的首届国际质造节颁奖典礼在......
日期:08-03
双十一投影仪攻略,坚果G9和极米Z6X哪个好,对比当贝D3X怎么样?
随着投影仪的普及,市场的受众群体也越来越广泛,从电影发烧友到普通家庭,投影仪的价位也层出不穷,而......
日期:10-27
慕展2021战略正式启动,productronica China规模将扩大100%
“慕展”旗下的重要品牌展会——慕尼黑上海电子生产设备展(productronica Chi......
日期:12-10
诺基亚宣布获得37个5G合同 但称“5G交付晚了几个月”
[摘要]诺基亚首席执行官苏里表示,诺基亚已经在全世界获得了37个5G建网合同,其中20个合同来自知名......
日期:05-22
成贵高铁正式开通,成都与贵阳最快2小时58分可达
12月16日消息 根据西南铁路的官方消息,成贵高铁的宜宾至贵阳段开通,全长372公里,从贵阳北站出发......
日期:12-16
移卡今日在港交所成功上市 首日涨幅6.13%
6月1日,支付科技平台移卡于香港交易所主板正式挂牌上市,股票代码为9923,首日收盘价为17.66港元,......
日期:06-02
湖北移动AI技术助力东风本田打造智慧园区
丢失、忘带工作证进不了公司怎么办?重要客户来访,需要一再确认身份怎么办?近日,记者从中国移动湖......
日期:05-07
富士施乐深圳工厂荣获国家级“绿色工厂”称号
(10月28日,北京)近日,富士施乐位于深圳的生产基地——富士施乐高科技(深圳)有限公司被......
日期:10-28
强强联合!国双与航班管家携手赋能智慧出行
9月17日,北京国双科技有限公司(简称国双)与航班管家母公司——深圳市活力天汇科技股份有......
日期:09-19
“酷开圈”联动大屏+小屏 酷开网络开辟OTT行业价值新蓝海
近年来一直高举高打、突飞猛进的OTT大屏市场,近期发生了一件看似平淡无奇的小事:...
日期:04-30
华硕ROG手机2与黑鲨2谁更强
年轻人选购手机时都比较注重游戏体验,近几年国内出现了很多专注于电竞游戏的手机厂商,比如黑鲨、......
日期:07-30
奥维云网2019年会议平板市场报告:MAXHUB市场份额再获桂冠
近日,调研机构奥维云网发布了《2019 Q4中国商用平板市场研究报告》,报告显示商用平板市场2019年全年......
日期:05-19
平安云加速金融行业数字化转型
在“金融+科技”大趋势推动下,传统金融面临国家政策与市场的双轮驱动,金融行业开启了数字......
日期:01-02
聚力创新,群智合助力行业走向“云化未来”
企业数字化的时代已经来临,各行业面临智能化、云端化的升级。2018年2月工信部印发了《推动企业上云......
日期:10-17
《荒野大镖客2》戴尔G7带领带你体验快意西部世界
经历了一年的等待,玩家们翘首期盼的《荒野大镖客2》终于登陆PC平台了。作为2018年的无冕之王,本作......
日期:01-08
汪峰化身“带货达人” 明晚京东直播间带来会赚钱的路由器
提到汪峰,想必大家都不会陌生,现在他又有了新的称号——“京东秒杀首席直播官&rdq......
日期:12-09
孩子开学在即状态没回来?讯飞智能学习机助力孩子不掉队
眼看着开学的日子越来越近,忙活了一假期的家长们进入了新的焦虑中——孩子的学习状态还......
日期:03-31
2019(第三届)新三板品牌峰会专家评审会即将召开
2019(第三届)新三板品牌峰会专家评审会将于3月22日在北京顺义赵全营镇新三板产业加速器召开。这标志......
日期:03-22
从算法到智能,智能运维的实践之路
随着企业数字化转型的不断深入,利用AI技术改善运维和IT服务水平成为当前运维管理的主要关注方向。......
日期:06-05
线上线下无缝衔接,华为云与三体云共建在线教育直播课堂
前不久,华为云宣布与百余家教育行业合作伙伴共同成立“随时学教育联盟”,一起为广大师......
日期:02-28