您的位置:首页 > 互联网

百度飞桨框架2.0正式版重磅发布,一次端到端的“基础设施”革新

发布时间:2021-03-15 00:00:00  来源:互联网     背景:

  在人工智能时代,深度学习框架下接芯片,上承各种应用,是“智能时代的操作系统”。近期,我国首个自主研发、功能完备、开源开放的产业级深度学习框架飞桨发布了2.0正式版,实现了一次跨时代的升级。

  这次2.0版本的发布对于飞桨来说,可以说是一次“基础设施”的全面更新换代!生活中,我们看到过很多基础设施建设工程,例如西电东送、南水北调、高铁建设等等,这些在保证生产生活设施正常运行、推动整个社会的经济发展和人们生活水平改善的过程中,以一种 “润物细无声”的形式扮演着关键基础性角色!此次飞桨升级就是以这样方式悄然为整个产业及生态的发展繁荣奠定基础、积蓄能量、增添后劲!下面将为广大开发者详细介绍飞桨都做了哪些“基础设施”级别的关键工程。

  使用飞桨框架2.0更高效地开发AI模型

  成熟完备的动态图模式

  此次升级,飞桨将默认的开发模式升级为命令式编程模式,即大家常说的动态图。飞桨框架2.0支持用户使用动态图完成深度学习相关领域全类别的模型算法开发。动态图模式下可以让开发者随时查看变量的输入、输出,方便快捷的调试程序, 带来最佳的开发体验。为了解决动态图的部署问题,飞桨提供了全面完备的动转静支持,在Python语法支持覆盖度上达到领先水平。开发者在动态图编程调试的过程中,仅需添加一个装饰器,即可无缝平滑地自动实现静态图训练或模型保存。同时飞桨框架2.0还做到了模型存储和加载的接口统一,保证动转静之后保存的模型文件能够被纯动态图加载和使用。

  在飞桨框架2.0版本上,官方支持的动态图算法数量达到了200+,涵盖计算机视觉、自然语言处理、语音、推荐等多个领域,并且在动态图的训练效率和部署效率方面都有所提升。2.0版本的动态图支持了自动混合精度和量化训练功能,实现了比静态图更简洁灵活的混合精度训练接口,达到媲美静态图的混合精度和量化训练效果。无论从功能还是性能角度,飞桨的动态图在国产深度学习框架中都处于领先地位!

  同时,为了推进各个主流场景的产业级应用,飞桨的系列开发套件也随飞桨框架2.0完成了升级,全面支持动态图开发模式。从开发、训练到预测部署提供优质体验。如视觉领域的图像分割套件PaddleSeg,随飞桨框架2.0升级后,涵盖了高精度和轻量级等不同特点的大量高质量分割模型,采用模块化的设计,提供了配置驱动和API调用两种应用方式,帮助开发者更便捷地完成全流程图像分割应用;又如自然语言处理领域的PaddleNLP,与飞桨框架2.0深度适配,拥有覆盖多场景的网络模型、简洁易用的全流程API,以及动静统一的高性能分布式训练能力,非常便于二次开发,大大提升建模效率。具体可以参见下面链接中的项目示例。

  飞桨框架2.0动态图模型:

  https://github.com/PaddlePaddle/models/tree/develop/dygraph

  全新PaddleSeg项目应用实例:

  https://aistudio.baidu.com/aistudio/projectdetail/1339458

  全新PaddleNLP项目应用示例:

  https://aistudio.baidu.com/aistudio/projectdetail/1329361

  API体系全新升级

  API是用户使用深度学习框架的直接入口,对开发者使用体验起着至关重要的作用,飞桨一直以来对API设计以及整体API体系的完善给予高度重视。飞桨框架2.0对 API体系进行了全新升级,让开发者们在使用飞桨研发的过程中可以体验到随心所欲、畅通无阻的愉悦感觉。

  体系化: 基于长期的产业实践积累与用户使用习惯的洞察,飞桨重新梳理和优化了API的体系结构,使其更加清晰、科学,让广大开发者可以更容易地根据开发使用场景找到想要的API。此外可以通过class和functional两种形式的API来模块化的组织代码和搭建网络,提高开发效率。同时,API的丰富度有了极大的提升,共计新增API 217个,优化修改API 195个。

  简洁化:提供更适合低代码编程的高层API。像数据增强、建立数据流水线、循环批量训练等可以标准化的工作流程,以及一些经典的网络模型结构,在飞桨框架2.0中,都被封装成了高层API。基于飞桨高层API,开发者只需10行左右代码就可以编写完成训练部分的程序。最为重要的是,高层API与基础API采用一体化设计,即在编程过程中可以同时使用高层API与基础API,让用户在简捷开发与精细化调优之间自由定制。新API体系完全兼容历史版本,同时飞桨提供了升级工具,帮助开发者降低升级迁移成本。

  飞桨开源框架2.0 API参考文档:

  https://www.paddlepaddle.org.cn/documentation/docs/zh/api/index_cn.html

  使用飞桨框架2.0更高效地训练AI模型

  训练更大规模的模型

  众所周知,飞桨框架的英文名Paddle便是并行分布式训练学习的缩写,分布式可以说是飞桨与生俱来的特性。飞桨支持包括数据并行、模型并行、流水线并行在内的广泛并行模式和多种加速策略。在飞桨框架2.0版本中,新增支持了混合并行模式,即数据并行、模型并行、流水线并行这三种并行模式可以相互组合使用,更高效地将模型的各网络层甚至某一层的参数切分到多张GPU卡上进行训练,从而实现支持训练千亿参数规模的模型。

  业内首个通用异构参数服务器架构

  飞桨框架2.0推出了业内首个通用异构参数服务器技术,解除了传统参数服务器模式必须严格使用同一种硬件型号Trainer节点的枷锁,使训练任务对硬件型号不敏感,即可以同时使用不同的硬件进行混合异构训练,如CPU、GPU(也包括例如V100、P40、K40的混合)、AI专用加速硬件如昆仑芯片等,同时解决了搜索推荐领域大规模稀疏特征模型训练场景下,IO占比过高导致的计算资源利用率过低的问题。通过异构参数服务器架构,用户可以在硬件异构集群中部署分布式训练任务,实现对不同算力的芯片高效利用,为用户提供更高吞吐,更低资源消耗的训练能力。

  图 异构参数服务器架构示意图

  通用异构参数服务器架构之所以被称之为通用,主要在于其兼容支持三种训练模式:

  1、可兼容全部由CPU机器组成的传统参数服务器架构所支持的训练任务。

  2、可兼容全部由GPU或其他AI加速芯片对应机器组成的参数服务器,充分利用机器内部的异构设备。

  3、支持通过CPU机器和GPU或其他AI加速芯片对应机器的混布,组成机器间异构参数服务器架构。

  异构参数服务器拥有非常高的性价比,如下图所示,仅用两个CPU机器加两个GPU机器就可以达到与4个GPU机器相仿的训练速度,而成本至少可以节约35%。

  分布式训练教程:

  https://fleet-x.readthedocs.io/en/latest/paddle_fleet_rst/distributed_introduction.html

  使用飞桨框架2.0更广泛地部署AI模型到各种硬件

  全面深度适配各种人工智能硬件

  AI产业的广泛应用离不开各种各样的人工智能硬件的繁荣,飞桨可以说深谙其道,持续努力打造繁荣的硬件生态。当前包括英特尔、英伟达、ARM等诸多芯片厂商纷纷开展对飞桨的支持。飞桨还跟飞腾、海光、鲲鹏、龙芯、申威等CPU进行深入适配,并结合麒麟、统信、普华操作系统,以及百度昆仑、海光DCU、寒武纪、比特大陆、瑞芯微、高通、英伟达等AI芯片深度融合,与浪潮、中科曙光等服务器厂商合作形成软硬一体的全栈AI基础设施。当前飞桨已经适配和正在适配的芯片或IP型号达到29种,处于业界领先地位。

  图 飞桨硬件生态路线图

  在百度直接搜索“飞桨”进入官网,或者github搜索“PaddlePaddle”,立即体验飞桨开源框架2.0版本

  飞桨框架2.0安装:

  https://www.paddlepaddle.org.cn/install/quick?docurl=/documentation/docs/zh/2.0/install/pip/linux-pip.html

  10分钟快速上手飞桨框架2.0:

  https://www.paddlepaddle.org.cn/documentation/docs/zh/guides/02_paddle2.0_develop/01_quick_start_cn.html

  飞桨框架2.0使用教程:

  https://www.paddlepaddle.org.cn/documentation/docs/zh/guides/index_cn.html

  飞桨框架2.0应用实践:

  https://www.paddlepaddle.org.cn/documentation/docs/zh/tutorial/index_cn.html

  如果您想详细了解更多飞桨的相关内容,请参阅以下文档。

  飞桨官网地址·

  https://www.paddlepaddle.org.cn/

  飞桨开源框架项目地址·

  GitHub: https://github.com/PaddlePaddle/Paddle

  Gitee: https://gitee.com/paddlepaddle/Paddle

特别提醒:本网内容转载自其他媒体,目的在于传递更多信息,并不代表本网赞同其观点。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,并请自行核实相关内容。本站不承担此类作品侵权行为的直接责任及连带责任。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。


返回网站首页

本文评论
百度透露618将在四川直播带货, 5家企业市值应声上涨133亿
618电商节在即,直播带货无疑是今年618的最大看点,各大电商平台“扎堆”直播间,也为企......
日期:06-09
饿了么代理商:借助阿里生态力量,提升自身数字化能力
餐饮和生活服务行业亟待复苏,这一过程中,饿了么持续推动的“新服务”数字化升级,正成......
日期:02-20
桔多多“双11”亿元补贴送大礼
与往年相比,今年“双11”明显预热较早,从目前各个平台发布的数据来看,火爆程度值得期......
日期:11-09
大学延期在家学习 金山文档升级学霸体质
全国高校陆续发布了2020年春季开学日期,开学时间推迟已成定局。有些高校表示2月底前不开学,有些高......
日期:02-18
2019全球卓越成就奖隆重揭晓!锦江WeHotel斩获三项大奖
10月31日,由广东省通信管理局指导,广东省互联网协会主办、艾媒咨询承办的“2019全球未来科技......
日期:11-06
“停课不停学”,百度文库开放7590门课程、2亿资源让武汉学子在家免费学
受到疫情的影响,全国各高校、中小学校都推行了延迟开学的政策。为了弥补假期延长带来的学时不足问......
日期:02-02
高交会前瞻:华为将以智能体理念续写智慧城市春天
2020年11月11-15日,主题为“科技改变生活,创新驱动发展”的第二十二届中国国际高新技术......
日期:10-26
《安家》中介还在发语音?网友:着急!百度输入法的语音输入用起来
最近电视剧《安家》引起不少热议话题,剧中许多情节让网友们看着“干着急”。其中一幕便......
日期:03-11
网信办拟出台新管理办法:禁止发布恶意程序源代码及制作方法
11月20日消息 据国家网信办官网消息,为规范发布网络安全威胁信息的行为,有效应对网络安全威胁和风......
日期:11-20
动态心电仪测评对比:Hipee心电仪VS粒恩心电
我妈年纪大了,身体各项机能下降,心脏也不大好,时有不适症状发生。我刚给她买了个HiPee无线心电监......
日期:11-19
映射自定义,微软Windows 10正在开发键盘快捷管理器
Windows 10确实允许用户通过一些注册表调整来重新映射键盘上的按键,但是注册表编辑器并不是自定义......
日期:02-07
小米首款熨烫产品 米家手持挂烫机众筹仅需99元
小米生态链的产品,一般都是性价比高,颜值高,实用性强。众筹产品都能让消费者感受到“低价买......
日期:05-07
科技赋能智媒转型 新浪新闻入选人民网《内容科技白皮书》优秀案例
近日,人民网发布了《2019,内容科技(Contech)元年白皮书》,明确了内容科技对全媒体时代媒体格局、......
日期:03-30
钱客多助力“浑南之夏”主题夜市开启刷脸支付
提到夏夜,人们会想的词:撸串、夜市、冰啤酒、燃……在沈阳,这个夏天最火热的,当属......
日期:07-07
克拉克拉刘子正:新互动场景下,虚拟偶像“破圈”的新机遇
大家好,今天很高兴有机会来到上海做分享。我分享的主题是《新互动场景下,虚拟偶像的新机遇》。...
日期:06-13
华为 1-9 月实现营收 6713 亿元,同比增长 9.9%
今日上午,华为发布了 2020 年第三财季财报。 财报显示,2020 年前三季度,公司实现销售收......
日期:10-23
B 站发布 33 部国产动画,今年国创付费会员订单同比增长 450%
11 月 21 日,B 站举办了 2020-2021 国创动画作品发布会,宣布推出 33 部动画作品新内容。《元龙》......
日期:11-22
悦淘三周年庆典 三年新生持续领跑社交电商3.0时代
7月31日,悦淘三周年庆典在杭州钱塘江湖畔如约召开!这是迎来集团母公司上市喜讯后悦淘的首度公开亮......
日期:07-31
继格力之后又一家电巨头推出亿万补贴
昨日,创维电视官方微博发布《关于启动元春亿万健康补贴的公告》,继格力之后宣布加入这场家电补贴......
日期:12-12
任泽平:新基建迎接智能新时代 百度华为有望成领军力量
人工智能作为新一轮科技竞赛的制高点,各国纷纷加码,激烈角逐。 4月30日, 恒大集团首席经济学家、......
日期:04-30