您的位置:首页 > 互联网

百度世界2020大会NLP技术全面升级 文心ERNIE加速启动产业落地

发布时间:2020-09-15 00:00:00  来源:互联网     背景:

  语言与知识技术的相关研究进展,影响着人工智能理解世界的方式。9月15日,一年一度的科技圈盛会百度世界2020大会于线上召开,总台央视主持人康辉,与百度创始人、董事长兼首席执行官(CEO)李彦宏的“虚拟人”在千万观众面前亮相,不仅动作自然、栩栩如生,更与真人进行多轮流畅交互,引发网友惊叹,满足了人们对未来时代“智能管家”的许多想象。

  而为虚拟人理解世界、理解语言起到关键作用的,正是语言与知识技术。在当天下午举办的百度大脑分论坛上,来自百度的杰出架构师、文心(ERNIE)负责人孙宇登台演说,介绍知识增强语义理解框架文心(ERNIE)在语言理解、语言生成和跨模态语义理解等能力上的重大突破。此外,百度大脑提出了基于多流机制的预训练语言生成技术ERNIE-GEN和知识增强跨模态语义理解技术ERNIE-ViL,其中,ERNIE-ViL首次将场景图知识融入到跨模态的预训练模型中。孙宇还介绍,百度文心语义理解技术平台可为企业提供一整套NLP定制与应用能力,目前已累计支持2万余名开发者,覆盖金融、通信、教育、电商等行业。

百度杰出架构师、文心(ERNIE)负责人孙宇

  语义理解核心技术升级,文心多项NLP技术全球领先

  据了解,知识增强语义理解框架文心(ERNIE)于去年发布,大幅提升机器理解语言的水平,更在国际权威的通用语言理解评估基准 GLUE上首次突破 90大关,超越人类三个点,获得全球第一。文心的创新点在于,将大数据预训练与多源丰富知识相结合,持续学习海量文本中词汇、结构、语义等方面的知识,实现模型效果不断进化,如同人类持续学习一般。

  分论坛上,孙宇介绍,百度文心语义理解技术包括基于预训练的语义表示、文章理解、文本匹配、文本生成等技术,以及可识别理解法律、金融文本的领域语义理解技术,并布局了跨模态、多语言、图理解等前沿技术,形成了涵盖基础、应用、领域、拓展四大层面的全景图。

  在常识知识、多粒度语言知识、场景图知识等多源知识学习的支持下,文心语义理解能力、语言生成能力和多模态语义理解能力都得到了进一步提升和拓展。同时,基于海量数据,百度大脑构造了多粒度自编码任务和指代消解任务,推动文心在情感分析、文本分类、阅读理解等八项典型自然语言理解任务效果上获得进一步显著提升。

  自然语言生成方面,文心提出了基于多流机制的预训练语言生成技术:ERNIE-GEN,在摘要生成、问题生成、多轮问答等自然语言生成任务上效果突出。同时,文心设计了多流注意力机制,融合逐词生成和逐片段生成学习目标,学习语言中多粒度知识后,全面刷新了语言生成任务的世界最好效果,在学术界和产业界具备非常大的研究价值与应用价值。

  文心更在多模态语义理解上取得重大突破,视觉推理技术ERNIE-ViL可以通过物体识别体育运动图片中的运动场地及图中人物,进一步区分人员衣服颜色,根据知识判断穿出裁判和运动员的身份。理解细粒度语义的能力在这个推理的任务中发挥了关键的作用。ERNIE-ViL是业界首次将场景图知识融入到跨模态的预训练模型中,已广泛应用于工业场景。

  能力平台化,百度大脑文心实现语义理解技术工业级应用落地

  在人工智能技术落地的进程中,实际需求往往呈现出应用复杂、成本高企、耗时过长、可迭代性差等痛点。对此,文心语义理解技术平台应运而生。

  孙宇介绍,文心平台基于领先的语义理解技术,可为企业提供一整套NLP定制与应用能力,让开发者更加简单高效地定制企业级NLP模型。在文心平台化服务中,提供了针对数据处理、模型训练、模型评估、模型部署等环节的“工具箱”,一站式满足开发者各类应用需求。此外,文心还提供了零门槛AI开发平台EasyDL和全功能AI开发平台BML两种平台支持方式。



返回网站首页

本文评论
智能电视怎样用U盘安装健身软件?当贝市场教程分解
对于喜欢健身的朋友来说,如何给电视安装健身软件是一个必备技能,今天我们就一起看看怎样给家里的电......
日期:02-25
UCloud优刻得与招商银行总行战略合作 联合金融和科技赋能产业
6月25日,UCloud优刻得(以下简称“UCloud”)与招商银行股份有限公司(以下简称“招商......
日期:06-26
云牵包头 “宜居梦”照进现实
作为“草原钢城”、“稀土之都”,包头已久负盛名,但近些年,它正悄然向着宜......
日期:12-02
心系抗疫!梓濠供应链捐赠物资送达湖北5家医院
2020年2月12日,为支援湖北省的抗疫工作,梓濠供应链通过紧急协调采购,筹集到5000只符合国家标准的......
日期:02-14
全球电压等级最高变电站变身中国联通5G基站
9月3日消息 据中国联通官方消息,8月25日,新疆联通携手国网新疆电力成功在世界电压等级最高的电力......
日期:09-03
美国两大运营商直言:高速的5G网络不会那么快到来
4月27日消息 并不是所有的5G网络都是相同的。5G有超快速、无瑕疵的毫米波5G网络,但它难以覆盖广阔......
日期:04-28
“直播看车”大有星火燎原之势,靠谱不靠谱?
突如其来的疫情给各行各业带了前所未有的挑战,随着疫情逐渐被控制,众多行业开始复工复产。根据前日......
日期:03-17
《中国移动2019年智能硬件质量报告(第一期)》权威发布
6月27日,GSMA全球终端峰会在上海隆重召开,备受业界期待的《中国移动2019年智能硬件质量报告(第一......
日期:06-28
词条总量远超英文维基百科,百度百科打造最大中文百科全书
2019年过去,百度百科显示其收录的词条正式迈过1600万大关,达到1640万条。相较之下,维基百科英文......
日期:01-09
博观而约取 厚积而薄发 创芯慧联致力于国内小基站市场
12月11日,这一天的北京寒风依旧却也阳光明媚,创芯慧联总经理倪海峰一行人接受了媒体专访,对目前5......
日期:12-16
海盗船发布 4TB 高容量 SSD,读取速度可达 3.5GB/s
6 月 3 日消息 根据外媒 TechPowerUp 的消息,海盗船公布了其 MP510 M.2 SSD 的 4TB 高容量版本。...
日期:06-03
制定不同区域“停课不停学”,科大讯飞在线学习全方案正式出炉
2020年春节刚过,全国的新冠肺炎疫情便引发了社会各界人士的广泛关注。为避免疫情向校园传播,教育......
日期:02-17
博锐体育牵手百胜MC3云中台,共创企业发展新未来
近日,石狮市博锐体育用品贸易有限公司签约上海百胜软件股份有限公司,使用MC3云中台进一步支撑企业......
日期:04-14
“双十一”的狂欢带给实体店什么启示?
“叮咚”一声,“数据导入完毕”几个大字伴着清新、悦耳的提示音跳出,让曲面......
日期:11-21
苏宁健康码背后的大数据逻辑
疫情之下的网格化管理,让社区变得可防可控,但也让社区与社区、人与人之间成为相对封闭的“孤......
日期:02-22
360新品618首发:车充C8能充能放,智能语音对话解放双手超安心
对于开车族来说,看地图、接电话、听音乐等很多时候都离不开手机,如果这时候有一个既能给手机充电......
日期:06-01
企业上云的极速存储挑战,华为云全新极速IO云硬盘性能评测
借助华为云全新一代极速IO云硬盘开启邀测的时机,至顶网评测实验室展开了一次华为云极速IO云硬盘与......
日期:07-23
九大板块全景呈现!掌通家园全方位护航防疫“开学季”!
根据教育部最新通知,4月全国各地大中小学纷纷迎来疫期“开学季”,教育将迎来回潮“......
日期:04-08
央视315曝电话骚扰滥用中立AI技术 科大讯飞躺枪并倡合法利用
3月15日,央视“315”晚会对违反消费者权益保护法的一系列现象做出全方位曝光。其中,利......
日期:03-16
人工智能人才标准发布,助力A.I.人才培养
8月27日,由中国国际智能产业博览会主委会主办、科大讯飞(002230)股份有限公司承办,以“你的......
日期:08-28