您的位置:首页 > 互联网

信也科技再攀科研高峰:复杂网络研究成果登上国际顶级期刊IEEE TKDE

发布时间:2020-10-12 00:00:00  来源:互联网     背景:

  近日,金融科技公司信也科技(NYSE:FINV)与浙江大学合作撰写的论文“Robust Network Enhancement from Flawed Networks”被国际顶级期刊IEEE TKDE正式收录。

  IEEE TKDE(Transaction on Knowledge and Data Engineering)是数据挖掘与知识工程领域最具影响力的刊物,也是被中国计算机学会(CCF) 定位为数据库、数据挖掘和内容检索领域的A类国际期刊,属于值得我国学者去突破的顶级刊物。

  据悉,IEEE TKDE主要关注知识发现和数据挖掘、数据库和数据建模、并行分布式数据管理系统、数据密集型可扩展计算系统结构、搜索引擎以及数据工程应用等领域的最新研究进展和技术。该期刊审稿过程专业严谨,在数据挖掘领域享有很高的学术声誉。信也科技与浙大的这篇合作论文被收录,这既是信也科技与高校合作成效的直接体现,也是信也科技始终致力科研斩获的又一硕果。

  着眼复杂网络基础数据缺陷问题

  “网络”或者“图”作为一种重要的数据形态,在很多领域中扮演着越来越重要的角色,如社交网络网络分析、搜索与推荐、生物化学分子结构分析等。而在金融领域,将用户、设备、公司、账户等作为节点,构建网络数据,并在此基础上进行反欺诈的方式也已经带来了实际的商业和社会价值。信也科技作为金融科技领域的领军企业具备较高的科技能力,在业务中已实际利用复杂网络结构,结合机器学习技术,快速、精准识别并锁定不良中介和欺诈团伙,并将相关成果发表于2019年CIKM的oral论文“Understanding Default Behavior in Online Lending” 。

  然而,由于采样不完全、数据不可得、量化标准有误差等等原因,现实中收集到的数据一般带有偏差和噪声。而复杂网络数据由于关注节点之间的关联,更容易受到缺失和噪声的影响,从而波及下游任务,比如不良中介识别、欺诈团队识别等。

  此次由信也科技与浙江大学杨洋副教授团队合作完成的论文“Robust Network Enhancement from Flawed Networks”,便旨在解决上述在复杂网络领域中基础而重要的问题:大规模网络数据中的缺陷检测。这种网络的缺陷,可能是由带缺陷的节点或者带缺陷的边引起的,此次发表的论文专注于解决带缺陷的边引发的问题。期望给整个领域提供一种独特视角出发的有效缺陷边检测算法,提升复杂网络领域算法的噪声鲁棒性,即系统的健壮性。

  首次提出联合学习网络缺失边和噪声边

  据了解,上述带缺陷的边可分为噪声边和缺失边。噪声边,即为真实情况下并不存在的边,比如用通话网络来构建社交状况,可能因为误拨的电话或者一些推销、外卖电话而加上了一些不反映社交状况的边;缺失边,则是真实情况下存在,数据中却并没有观测到的边,比如以用户之间的转账来构建关系网络,一家银行往往只有用户在本行转账的数据,而观察不到本来存在的他行转账数据。

  许多学者已关注到,缺陷边的问题可能引发下游任务的误导性结论,并进行了大量的相关研究。而该篇论文的一个重要贡献是充分考虑了缺失边与噪声边的识别会相互影响(如图1(c)&(d)),提出了E-Net(Enhancement Network model),一个端到端的基于图神经网络的模型,来联合学习噪声边和缺失边。一方面,噪声边被识别出来并去除掉,会有利于缺失边的预测;另一方面,缺失边预测的目标函数可以为噪声边的识别提供间接的监督。由于在很多实际场景中都不容易获取一条边是否是噪声边的标签,这样的半监督学习框架使得模型对噪声具有很强的鲁棒性。

图1:在统一框架内识别缺失边和噪声边的示意图

  对于大规模网络,使用整个网络去推断节点之间的关系(比如缺失边、噪声边)会带来无法承受的计算量。另一方面,使用整个网络进行训练,还会导致模型很难外推到新加入的节点和边上,从而影响应用到实际场景。许多学者采用了子图提取来解决这个问题,即针对任意一对关注的节点,仅提取它们周围子图来推断该节点对之间的关系。

  论文的另一个重要贡献就是提出了一种RWR(Random Walk with Restart)子图提取方法(如图1(b))。相较于传统的子图提取方法(如图1(a)),RWR不再抽取固定的一跳或两跳邻居,从而可以(1)抽取的子图规模不随节点邻居数爆炸;(2)既包含局部又包含全局的图结构。

  信也科技AI团队负责人王春平表示:“此算法最强大的优势在于不需事先知道噪声标签,就能通过缺失边的预测来对噪声边进行半监督学习,从而大大提升算法对噪声的鲁棒性。” 论文中工作的有效性已在多个实验中得到了验证。相对于不去噪的模型,对缺失边的预测F1可以提升大约10%,相对于分步识别噪声边和预测缺失边的模型,F1可以提升2%左右。在进行了去噪和缺失填补两方面的网络增强以后,对下游节点分类问题也有很大帮助,F1大概提升4~5%。网络增强已经成为信也科技复杂网络算法挖掘的一个重要环节,并已逐步投入实际业务应用,大大提升了算法的鲁棒性。

  目前,信也科技完备的自研技术已实现了对业务流程的全覆盖,如人脸识别、多场景OCR、声纹识别等多模态核身、增信技术,语音识别、意图识别、对话管理、语音生成等全流程智能对话机器人技术,以及基于复杂网络的不良中介识别和团伙识别技术等。此外,还形成了智能投放、精准营销、核身、反欺诈、风控决策流、Automl模型平台和智能机器人等一系列AI产品。

  科技领域累累硕果的背后,是信也科技始终着眼于科技并致力于科研的信念,亦是信也科技来自海内外顶级高校与知名科技企业的相关研究人员以及加州理工大学、加州大学洛杉矶分校、浙江大学等高校的多名担任科学顾问的教授的辛劳与汗水。此前,信也科技已与浙江大学共建人工智能实验室,并同中国人民大学建立了战略伙伴关系,长期保持积极的合作。本次被IEEE TKDE收录的论文即为校企科研合作的阶段性成果之一。

  今后,信也科技将继续保持对科技研发的关注与投入,并进一步加深与高校的科研合作,力求在相关领域进行新尝试与新突破,努力实现“科技,让金融更美好”的使命。

  (先睹为快:论文将刊登在下一期TKDE,Early Access电子版 )

特别提醒:本网内容转载自其他媒体,目的在于传递更多信息,并不代表本网赞同其观点。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,并请自行核实相关内容。本站不承担此类作品侵权行为的直接责任及连带责任。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。


返回网站首页

本文评论
Vitu创始人薛昆: Vitu要做加密世界的开源交易大厅
4月28日,PlatON云图社区议事会-Vitu.AI专场活动开启。Vitu创始人薛昆与社区成员就数字资产研究与交......
日期:05-18
画质与性能双重加持,Unity超越游戏的“炫技”
从细致入微的纹理、虚实难辨的光影质感,再到两个完全由视觉特效创造的角色波士顿(Boston)和摩根(Mo......
日期:03-20
打造无限可能的数字时代!谈谈大数据在零售行业中的应用
随着大数据的发展,数据挖掘在零售领域中的运用正逐步显现,通过对大量的数据进行探索和分析,揭示......
日期:09-04
软件绿色联盟奖项揭晓 航班管家&高铁管家斩获“2019年度绿色应用”奖项
2019年11月19日,以“构生态·建未来”为主题的第二届软件绿色联盟开发者大会在北......
日期:11-19
伦敦交通服务支持Apple Pay“快捷交通”模式:无需刷脸
目前通过Apple Pay搭乘公共交通工具有两种方法,第一种方式是在iPhone或者Apple Watch上开通「交通......
日期:12-02
视界通告诉你为什么Twitter在自媒体人中如此受欢迎?
自媒体,作为近几年越来越火的行业,也在受到更多人的关注。 以前想成名太难了,现在如果你自媒体做的非常好,拥有超级多...
日期:07-22
鲁大师8月新发布手机流畅榜:小米 vs 三星,谁打赢了?
8月安卓新发布手机流畅榜数据来自鲁大师安卓APP 08.01日-08.31日的数据,榜单只筛选在这期间新发布......
日期:09-03
粉丝福利爆满直播间 京东国际黑五巅峰直播盛典诞生3位超级锦鲤
11月28日感恩节当晚,京东国际开启的“黑五巅峰直播盛典”热闹非凡。由张绍刚主持,脱口......
日期:11-29
“云课堂”助武汉中小学师生“停课不停学”,百度文库全面开放视频教育资源
虽然“新冠”肺炎疫情仍在继续,但人们纷纷借助互联网展开线上办公,已逐渐开始“云......
日期:02-03
vivo服务日来袭 全国六城上线“地摊”服务
6月27日,vivo服务日活动官方认证地摊手机美容中心亮相深圳、西安、长沙、南宁、安阳、齐齐哈尔全国......
日期:07-10
奇安信战“疫”复工勇担当 多措并举守护网络安全
“贯彻落实习近平总书记关于新冠肺炎疫情下有序复工复产的重要指示精神,以维护国家网络安全为......
日期:04-10
KOOV亮相第十四届全球教育产业博览会 助推青少年编程良性发展
2020年9月24-25日, 2020 TIME教育科技大会暨第十四届全球教育产业博览会在上海召开。该展会以&ldqu......
日期:09-28
广电总局:推动区块链技术在广电和网络视听创新应用
11月19日消息 据国家广播电视总局官网消息,昨日,广电总局党组召开会议,指出要推动区块链技术在广......
日期:11-19
孙燕姿空降西瓜视频直播间,谈新专辑和新计划
9月25日晚上8点,孙燕姿空降西瓜视频,开启个人专场直播首秀,整场直播持续20多分钟。...
日期:09-28
2亿用户送出道:金山文档获2020小程序百强前十,工具类第一
据eNet研究院、互联网周刊等7月联合发布的小程序排行榜显示,金山文档小程序登榜,并获得2020小程序......
日期:07-24
战略布局成果显现,科大讯飞2019年度营收或超百亿
2月2日晚间,科大讯飞股份有限公司(以下简称“科大讯飞”,002230)发布2019年度业绩预告......
日期:02-04
腾讯发布首份《未来交通白皮书》,46页报告开启未来交通新图景
当前,新一轮科技革命和产业变革加速兴起,交通行业的新技术、新要素和新业态竞相涌现,交通新基建......
日期:09-30
华为自主研发操作系统曝光 内部代号“Project Z”
5月22日消息,华为消费者业务CEO余承东透露,华为自主研发的操作系统最快会在今年秋天、最晚到明天......
日期:05-23
杜丫丫举办甘肃青海招商会,狂掀儿童英语启蒙智能化新浪潮
在政策规范与技术赋能的双重背景下,在线教育已经进入下半场。 这阶段破局的至关重要的一点或许将落在智能硬件上,其中的...
日期:07-19
用味蕾打开“宫里的世界”,《爆炒江湖》全新联动版本上线
10月10日,紫禁城即将迎来自己600周年华诞。早在数月之前,以中华美食为背景的放置经营手游《爆炒江......
日期:09-30