您的位置:首页 > 互联网

国内唯一受邀AI公司!云知声出席第2届数据编排峰会并作技术分享

发布时间:2020-12-03 00:00:00  来源:互联网     背景:

  作为人工智能“三驾马车”之一,高效智能的计算能力对 AI 技术的演进至关重要。如何针对不同 AI 数据场景下,实现计算效率的提升,是各大计算技术研究机构、云厂商以及相关开源社区的研究热点。

  12 月 8 日-9 日,第 2 届数据编排峰会(DATA ORCHESTRATION SUMMIT 2020)将在线上召开。在为期两天的开源社区会议中,大会将围绕如何基于最新的开源技术,如Alluxio、Apache Spark、Apache Airflow、Presto、TensorFlow、Kubernetes 等,构建云原生或混合云数据和 AI 平台这一话题展开讨论,并重点关注其中关键性数据工程方面的挑战和解决方案。

1606987514589513.jpg

  本次峰会的演讲嘉宾邀请到诸多云、数据和 AI/ML 等领域富有远见的专家学者,包括来自加州伯克利大学的 Apache Spark 创始人 Ion Stoica 教授,英特尔 CTO Parviz Peiravi 以及 Alluxio 创始人李浩源博士。同时,来自云知声、阿里巴巴、Comcast、Electronic Arts、Facebook、Google,京东和腾讯等公司的技术专家也将先后带来精彩的技术报告,分享业界领先的数据架构、现实案例、现场演示以及从业人员最佳实践。

  云知声很早就开始布局建设业界领先的 GPU/CPU 异构 Atlas 计算平台和分布式文件存储系统,该计算集群可为 AI 计算提供高性能计算和海量数据的存储访问能力,在公司向 AI 多领域技术横向扩展和纵向迭代中发挥了至关重要的作用。

  本次峰会,云知声作为国内唯一受邀 AI 公司将带来名为“Speeding Up In Atlas Deep Learning Platform with Alluxio+Fluid”的分享,系统阐释云知声在人工智能基础建设与云原生原创技术领域的创新发展路径。

1606987524708689.jpg

  本次分享中,针对目前深度学习训练平台非结构数据训练过程中 I/O 瓶颈问题,云知声提出在存储层和计算层引入 Alluxio 缓存层的解决方案,技术团队通过和 Alluxio、阿里巴巴以及南京大学合作开源项目 Fluid 对Alluxio 缓存引擎进行统一的编排管理。架构图如下图所示:

1606987534168785.jpg

  在新架构的加持下,三种典型 AI 非结构化数据类型:大文件、中等文件和海量小文件均取得大幅的加速效果。针对海量小文件语音降噪任务、以及大文件 OCR 任务加速效果如下。其中,在海量小文件训练场景中,读取缓存相对于直接读取底层存储平均增速 10 倍。

1606987545787485.jpg

  在大文件场景,在训练任务早期阶段,读取缓存相对于直接读取底层存储平均有 30 倍的加速效果,当数据集全部加载到内存时,两者速度基本一致。

  在加速训练的同时,新架构可以大幅度减少 I/O 带宽的占用并进一步提升 GPU 使用率,针对海量小文件降噪任务、以及大文件 OCR 任务 I/O 占用及 GPU 使用率如下:

1606987555619351.jpg

  在海量小文件训练场景中,读取缓存相对于直接读取底层存储计算节点 I/O 由 230Mb/s 下降到 0Mb/s,表明海量小文件训练前已全部加载到缓存中,训练过程中无需占用 I/O;GPU 平均使用率由 82.76% 提升到90.24%,表明消除 I/O 瓶颈可以提高海量小文件训练资源使用效率。

1606987564346531.jpg

  在大文件训练场景中,提前预热相对于读取底层存储到缓存,计算节点 I/O 由 1300Mb/s 下降到 0Mb/s,表明海量小文件训练前已全部加载到缓存中,无需占用I/O;读取缓存相对于直接读取底层存储计算节点 GPU平均使用率由 69.59% 提升到 91.46%,表明消除 I/O 瓶颈可以提高大文件训练任务资源使用效率。

  针对不同的数据场景,基于 Fluid 和 Alluxio 缓存加速引擎已经在 Atlas 计算平台进行充分验证。不但缓解了集群 I/O 压力,而且极大的提高了模型训练的速度以及 GPU 使用效率,为实现 AI 算法的快速验证和迭代奠定计算基础。

  云知声在实现内部计算平台技术迭代的同时,也积极参与和拥抱开源社区,是 KubeFlow、Istio、Fluid 社区的积极关注和贡献者,为开源社区技术进步贡献自己的力量。

  截止 2020  年,Atlas  计算平台已经超过一亿亿次每秒的浮点计算能力,为在人工智能新领域的拓展奠定了强大的计算资源基础。通过协同利用 AI 底层计算平台资源,也支撑起云知声从语音识别、语义理解到机器翻译、计算机视觉等多维人工智能技术领域的持续快速突破。

  大会直播入口:

  https://www.alluxio.io/data-orchestration-summit-2020/

特别提醒:本网内容转载自其他媒体,目的在于传递更多信息,并不代表本网赞同其观点。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,并请自行核实相关内容。本站不承担此类作品侵权行为的直接责任及连带责任。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。


返回网站首页

本文评论
彰显人文关怀,ColorOS 11 多项能力帮助用户高效换机
随着 5G 的逐渐普及,许多用户也趁着双十一活动期间为家中的长辈更换了新的手机,然而有报道指出,......
日期:11-18
百度/腾讯/头条 买云相册会员之前你需要了解这些事儿
近期,郭麒麟“抠门”一事登上了微博热搜,作为“富二代”却自爆不舍得冲会员......
日期:06-08
“紫光系”66亿元竞得北京地块,建设紫光全球智能科创总部
紫光股份昨日晚间公告称,公司第七届董事会第三十二次会议和2019年第三次临时股东大会审议通过了《......
日期:12-04
极光:“超职季”招聘行业报告—年轻人篇
极光(Aurora Mobile, NASDAQ:JG)发布《“超职季”招聘行业报告—年轻人篇》,从年轻......
日期:08-06
Cocos-BCX:DApps和数字资产的跨越式发展环境
编者按:本文为全球影响力最大的区块链门户网站之一 CoinSpeaker 近日对 Cocos-BCX 做出的报道。...
日期:04-09
任务重成员多,项目复杂难把控?全新百度如流AI驱动高效办公
方案改了好几遍,现在该看哪一版?手里同时进行五个项目,各自进度到哪了?每次开会人员都不齐,会议......
日期:07-13
自由女性主义者李银河做客西瓜视频《好奇心是什么》
西瓜视频品牌升级,从“给你新鲜好看”到“点亮对生活的好奇心”,可以看出西瓜......
日期:09-18
比特智能开启酒店智能客控系统新模式——“混打”
近年来,数字化、智能化成了住宿业的热门词,新老酒店都面临着理念、模式上的挑战。如今,酒店已经......
日期:04-25
如影智能首发18件新品,直击智能家居市场痛点
智能家居行业高速发展,用户不再满足于单一的智能设备带来的体验,而是更加期待整个家居环境下智能......
日期:09-15
丁磊带货的有道词典笔,功能到底如何?看完糖猫词典笔才知道答案!
词典笔要火了。 6月11日,网易CEO丁磊在他的直播首秀上,向大家推荐了有道词典笔2 专业版......
日期:06-12
长虹爱联联手上海海思积极推动5G建设
2019年伴随5G牌照的正式发放,中国正式进入5G商用化元年,三大电信运营商齐头并进共同发力我国5G网......
日期:03-28
智能音箱夜市卖货视频火爆全网 原来小度还能这么用!
小店经济已经成为了社会热门话题,近日,杭州一位95后小伙的“摆摊姿势”就让其爆红网络...
日期:06-09
物联网步步为营,传感方阵或将成“最强辅助”
近些年来,我国的发展速度让人为之一惊,成功跻身世界强国之列,在国际社会上的地位日益提高。这一......
日期:08-03
华为云“湖北·武汉动漫企业战疫驰援计划”正式启动
近日,华为云官方宣布“湖北·武汉动漫企业战疫驰援计划”正式启动。...
日期:02-26
雨雪天气打车难?百度地图一键呼叫多种车型让你更快乘车
“等了好久终于等到下雪天”,北京今天迎来了入冬后的第二场雪,人们一早拉开窗帘便喜提...
日期:12-16
华为云赋能游戏行业 为玩家带来极致体验
从红白机到PS4、从笨重的台式电脑到便携的VR设备……随着游戏终端设备的不断演进,游戏......
日期:11-13
荣耀 20/20 Pro系统更新:优化相机,默认开启中国电信VoLTE
7月27日消息 根据网友投稿,荣耀20系列手机迎来更新,主要优化了相机稳定性,默认开启中国电信VoLTE......
日期:07-27
和美团一起成长:赢的不仅是这个夏天,还有人生“战场”
对外卖行业来说,夏季是一年中必须高度重视的备战季。订单量激增、交易额高涨,趁着这股夏日“......
日期:09-22
海信电视质量怎么样?如何安装当贝市场?最新教程来了!
当去别人家里做客,看到别人家的电视,自己觉得很喜欢时,一般情况下都会问两个问题:这电视多大的?什么......
日期:08-10
华为云依托AI等新兴技术 携手园区保障安全复工
近日,全国各地有不少企业开始进入复工的阶段。为了避免园区内上下班人员聚集、人员未佩戴口罩等情况......
日期:02-18