您的位置:首页 > 电脑软件

百度智能云TechDay业界首发EasyDL OCR,定制化、自动化产品特性掀起效能风暴

发布时间:2020-11-02 00:00:00  来源:互联网     背景:

  OCR(文字识别)技术是最早应用于企业降本增效的 AI 方向之一,如今已逐渐下沉为企业智能化升级的一项重要基础设施能力。10月29日,百度智能云线上线下同期举办了TechDay OCR技术创新沙龙,深度分享OCR产品矩阵、功能、应用案例等最新进展,并重磅全新发布EasyDL OCR自训练平台。泰康保险集团、北京融汇金信等企业伙伴在现场分享了OCR在企业内的应用经验和心得。百度智能云OCR产品为企业打造了技术领先、类型丰富同时支持便捷自定制的解决方案,已广泛应用于金融服务、财税报销、快递物流、法律政务、交通出行、教育培训、内容审核等全行业领域,加快推动企业实现产业智能化升级。

  业界首发EasyDL OCR自训练平台,低成本满足OCR定制化需求

  近年来,OCR的识别能力不断突破,逐渐在更加复杂的数字化场景发挥作用,有效降低信息提取和录入的人力成本,帮助企业专注于上层业务应用。与此同时,企业对于OCR识别模型定制化的需求日益旺盛,包括OCR在特定场景下是否有高精度识别效果、能否高效响应自身业务需求、是否能在模型训练过程中保证数据安全,以上三点成为行业共性诉求。

  为满足企业快速定制OCR识别模型的诉求,EasyDL OCR自训练平台应运而生。据介绍,EasyDL OCR 自训练平台具有两大核心产品功能,即自动训练OCR和定制化训练OCR;同时具备三大产品特性,包括内置成熟OCR技术方案,预置经过真实业务检验的多种自动化机制,如智能标注、自动数据预处理、虚拟数据生成等,同时还开放了调参能力,满足多种场景OCR模型定制训练需求,保证高准确率;可视化模型训练,预置领先的OCR算法,可实现零门槛模型训练,高效响应业务需求;支持本地私有化部署,数据无需出厂,有效保障数据安全。

  会上,EasyDL OCR产品负责人还分别演示了自动化训练OCR和定制化训练OCR模型训练过程,并在最后总结了适合应用的不同场景和优势。

  具体而言,自动化训练OCR每个版式仅需1张训练图片,“智能标注”功能支持快速标注关键字段,显著提升标注效率,系统自动完成模板分类,可应用于版式多样、识别特定字段、图像质量统一的场景,同时模型重训功能支持新增版式的快速扩充。定制化训练OCR则具有数据自动生成能力,可模拟各类真实场景中复杂数据状况,如模糊、变形、缺角等,少量标注数据即可获得更高的识别准确率,可应用于版式固定、全字段识别、图片质量复杂的场景。

  百度OCR“技术+产品+应用”行业领先,助力企业智能化升级

  百度OCR是国内应用最广泛的文字识别服务,依托业界领先的深度学习技术和海量优质数据,提供多场景、多语种、高精度的文字检测与识别服务,并针对图片模糊、倾斜、翻转等情况进行深度优化,鲁棒性强,多项ICDAR指标居世界第一,通用、主流卡证识别准确率高达99%。

  而其背后正是由百度AI核心技术引擎——百度大脑支撑,如今升级到6.0的百度大脑已成为AI新型基础设施。从基础层的算力、数据、飞桨深度学习平台,到感知层的语音、视觉、AR/VR,再到认知层的语言与知识,以及平台层的AI平台与生态,百度大脑始终保持核心技术持续领先,不断夯实“软硬一体AI大生产平台”,并通过百度智能云整合输出产品服务,加速产业智能转型升级。截至目前,百度大脑已经开放了273项AI能力,凝聚超过230万开发者,培养了超过100万AI人才,在众多行业领域落地应用,推动了中国AI技术研发、实践应用与生态建设。

  产业智能化升级一个核心前提就是,信息数字化和结构化。OCR作为最早应用于企业效率提升的AI方向之一,显著提升了信息提取和录入的效率,实现了信息处理的“电子化”、“自动化”,为上层业务应用提供有力支撑。

  据现场介绍,百度OCR技术经过多年沉淀和实践打磨,在多项行业竞赛评比当中持续摘得桂冠。例如:2019年从90多支参赛队伍中脱颖而出,获得中国最高等级商业领域人工智能技术竞赛唯一A级别证书;在OCR领域最具影响力的ICDAR 19 MLT (多语种task)榜单当中获得文字检测领域世界冠军;。同时,百度OCR也在不断推进算法创新和突破,引领行业技术发展,例如:发布了业界最大的中文OCR数据集,首次提出端到端OCR-部分监督算法End2End-PSL,实现精标数据+弱标数据的混合训练,克服精标数据成本高问题,使得标注成本降低至1/90。

  依托百度大脑领先的深度学习技术,百度OCR已开放全系列50多款产品,不仅可以实现通用场景的文字识别,还可满足各类垂直场景的信息电子化、结构化识别需求,例如财务票据识别、医疗票据识别、教育场景的公式识别和试卷识别等等。

  打破封闭研发生态,积极赋能企业在具体场景落地

  作为保险医疗领域的代表,泰康保险集团科技研究院、图文分析实验室负责人刘兴旺在会上表示:“如何提高理赔效率,降低成本成为各大保险公司非常关注的一点。基于百度OCR识别提取各类医疗票据/单据字段信息的技术能力,我们共同首创的端到端关系识别模型,整个质检分类准确率可达到97%,实际复杂生产环境中的结构化识别准确率可达86%,大大节约了人力成本,同时显著提升了理赔业务效率。”

  北京融汇金信信息技术有限公司创始人罗彤从金融服务的角度发表了自己的看法,他讲到:“金融主要做的两件事其实就是,需要大量数据进行预测,以及大量文档、图片等信息进行客户服务。而百度OCR提供的解决方案,可以让我们把数据和知识打通,解决人工录入信息出错率高、效率低等行业痛点的同时,能够显著节约成本、得到更加精准的预测结果,同时提升整体业务效率。”据悉,在金融服务领域,百度OCR已在银行、保险、证券、信贷、支付等场景应用落地。

  除此之外,百度OCR还已广泛应用于财税报销、快递物流、法律政务、交通出行、教育培训、内容审核等众多领域,为企业降本增效,提升用户体验。例如:代账公司借助百度OCR,为中小企业提供智能报账服务,大幅提升业务流程效率;中国移动设计院使用百度OCR对内部报账系统进行智能化改造,20分钟的人工填报流程缩短至1分多钟;在快递物流领域,则可以综合应用OCR、NLP地址识别、语音识别等多项AI能力,提升分拣、配送效率及用户使用体验。

  目前,使用百度OCR的用户已超过70万。未来,百度OCR作为百度智能云服务的重要一环,在百度大脑领先技术的支持下,将持续快速迭代,不断优化产品服务,探索更多应用场景,同时赋能更多合作伙伴,助力企业开启智能化升级快速通道,创造更大价值。

特别提醒:本网内容转载自其他媒体,目的在于传递更多信息,并不代表本网赞同其观点。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,并请自行核实相关内容。本站不承担此类作品侵权行为的直接责任及连带责任。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。


返回网站首页

本文评论
苹果芯片供应商“台积电”遭遇勒索病毒,腾讯手机管家提醒防范勒索风险
每年9月是果粉们最为期待的日子,因为苹果公司会推出新产品。而正当大家翘首以盼新款iPhone X时,苹......
日期:08-10
Windows 10修复Bug:亮度切换正常了
现在,微软发出公告称,他们又修复了Windows 10中的一个烦人Bug,而这个Bug之前已经让不少用户非常......
日期:11-17
戴尔推出灵越3880台式机:i5-10400F+GT 730
5月24日消息 戴尔推出了灵越3880台式机,搭载了刚刚上架的十代酷睿i5处理器,显卡为入门级的GT 730......
日期:05-24
临近升级,BCH的开发者和爱好者们都在做什么?
开发者们推出了客户端的更新版本 临近BCH 5月份硬分叉升级,Bitcoin ABC开发组在本周......
日期:04-12
Windows 10升级将控制面板系统小程序
据外媒报道,虽然微软在Windows 8和Windows 10中首次发布设置界面已经超过8年时间,而Windows 10仍......
日期:07-06
中标麒麟操作系统完成飞腾认证,支持所有国产芯片
近期,中标软件有限公司(中标软件)与天津飞腾信息技术有限公司(飞腾)宣布:中标麒麟操作系统与飞腾......
日期:12-11
高考也发补助金?考生和家长切莫被骗入局
每年的高考都牵动着千万家庭,考生和家长都处在神经紧绷、时刻备战的状态,只为努力踢好临门一脚。......
日期:06-06
AMD RX6000 系列显卡再曝光:含双 “煤气灶”版本
9月16日消息 先前 AMD 官方放出了该系列显卡的渲染图,而知名 YouTuber @JayzTwoCents 昨日通过一段......
日期:09-16
英伟达与华硕推出最强移动工作站:搭载RTX 6000,24GB显存
9月4日消息 根据WCCFTECH的报道,英伟达和华硕在IFA2019上合作推出了一款最强移动工作站—&mda......
日期:09-05
Mozilla Firefox 82 现已发布:性能提升,新外观等
10月20日消息 Mozilla 今天发布 Firefox 82.0 更新,其中包含大量新的改进。Firefox 82 带来了更强......
日期:10-21
Chromium 版 Edge 浏览器窗口突然变黑,微软:杀死 GPU 进程可解决
据Softpedia的报道,最近Microsoft Edge中出现的一个问题会导致所有浏览器窗口突然变黑,从而无法继......
日期:03-06
华为视频带你围观,漫威BUG级英雄惊奇队长
一扫上映前的争议和质疑!《惊奇队长》票房已破亿! 她,不愧为对抗灭霸的新希望 官方认证的漫威宇宙最强英雄 她...
日期:03-10
企业用鱼塘多销SCRM转化客户,有6大优势
疫情时期,人们处于少“移动”不“联通”状态,在线办公的销售如何更快“......
日期:02-21
XSKY软件定义存储一体机 XE2000高效运维实践
为了保证关键业务的连续运行,存储系统需要全天候就绪。存储系统的日常易于维护和可视化管理变得十......
日期:08-06
游戏网络延迟优化,MediaTek G90T芯片助红米Note8 Pro实力圈粉
9月3日倍受关注的的红米Redmi Note 8 Pro正式上市,作为1399元价位里最耀眼的新机型, Redmi品牌总......
日期:09-04
AMD录屏软件被爆高危漏洞 腾讯电脑管家率先发布应对措施
继Intel因被爆出Meltdown、Spectre漏洞而焦头烂额之后,又一全球知名企业成了安全漏洞的受害者。近......
日期:04-20
虚实携手创龙智新,软硬件结合助力AR交互界面升级
AR 眼镜在AR领域就如同显示屏于电脑,根据不同需求进行调优,改善提升软件,优化升级硬件,并通过软硬件......
日期:08-30
迅雷X上线后,这个新功能被玩坏了!
迅雷X正式版上线蛮久了,期间看到了不少老用户的及时评测,给予了迅雷全新力作非常高的评价。但小编......
日期:12-27
Office 2019内容简介:或许是最后的永久许可证版本
经历数月的预览之后,在今天召开的Ignite 2018大会上微软宣布了Office 2019正式版。不过目前仅适用......
日期:09-25
Windows 10补丁KB4522355搞崩部分“开始”菜单,且安装易失败
11月4日消息 Windows 10的“开始”菜单问题最早在9月份浮出水面,并且安装10月份发布的补......
日期:11-04