正在阅读:社交数据应用:能够很好补充征信系统数据

社交数据应用:能够很好补充征信系统数据

2016-03-25 13:45:03来源:51CTO 关键词:云计算大数据大数据应用阅读量:32761

导读:在WOT”互联网+”时代大数据技术峰会上,来自腾讯数据挖掘工程师刘黎春做了以《社交数据在征信领域的应用探索》为主题的演讲。
  【中国智能制造网   智造快讯】在WOT”互联网+”时代大数据技术峰会上,来自腾讯数据挖掘工程师刘黎春做了以《社交数据在征信领域的应用探索》为主题的演讲,主要内容由社交征信背景、腾讯社交网络数据、个体用户画像研究、社团圈子研究、模型建设及应用这五部分构成,下面我们就逐一为大家介绍各部分的内容。

 
  社交数据应用:能够很好补充征信系统数据

  社交征信背景
  
  刘黎春表示,征信并不是一个简单征信评分的模型,而是由数据公司、征信公司、征信使用方三部分组成。数据公司就是采集或做一些数据的初步挖掘,这类公司可能会有特殊的数据源,例如法院、公安等这些数据都是需要深入行业背景才能拿到。征信公司是有一个产权联系,另外它也会向第三方一些数据公司去购买一些数据回来,丰富它数据的维度,并且基于这些数据去做一些征信的事情,提供一些征信级的解决方案。征信使用方就是征信的解决方案后给到谁来用。一般来说我们的理解就是银行和P2P的贷款机构。这三部分综合起来,就形成了一个整体的征信行业的产业链。


  
传统征信相关机构

  
  美国征信公司

  
  国内征信发展历程

 
  综合以上的数据来看,如果社交数据可以用到征信中的话,是不是可以对央行的征信系统做一个很好的补充呢?刘黎春表示,这是腾讯在做社交征信项目时开始思考的问题。社交数据非常庞大,但并不一定都是有效数据,还要看具体应用的业务场景是不是和数据有相关性,这些数据是不是真的能够用到后的模型或者算法中去。这样问题就接踵而来,社交数据与信用评级有关系吗?交易数据天然具备金融属性,社交数据有吗?社交数据非结构化程度高,怎么挖掘并有效使用?


 
 
  


  腾讯社交网络数据
  
  在谈腾讯社交网络数据构成之前,刘黎春先介绍了传统征信的分析维度。其一是用户的基础信息,如年龄、性别、职业、收入、婚姻状况,工作年限,工作状况等基本上和每家银行或者每个做征信的机构获得的数据都差不多。其二是信贷情况,看用户申请几张信用卡,近一个月的征信报告被查询的次数,因为我们大家都知道征信报告被查询的次数可以直接代表近有没有比较频繁地做贷款的申请或者信用卡申请。如果近的次数特别多,那说明这个人近非常缺钱,可能就会影响信用,直接影响授信额度。


  
  上图是腾讯的数据现状,包含了很多维度的数据,覆盖的用户数相对来说更加全面一些。

 
  
  腾讯社交征信SWOT分析
  
  上图为腾讯社交征信SWOT分析,优势、劣势、机会、风险一目了然。有了这样详细的分析,做个人征信是必然的事情,但做征信之前要清楚的知道征信对象是什么样子,所以开始着手做个体用户画像的研究。
  
  个体用户画像研究
  
  刘黎春表示,做个体用户画像研究遇到的挑战主要有如下三方面:其一,如何充分利用腾讯各种丰富的数据资源及之间的联系?其二,如何使用户画像适应各种不同的应用场景?其三,如何的处理海量的用户数据(超过10亿的QQ用户,超过千亿级别的各类日志数据)?面对这些挑战,刘黎春给出来相应的解决方案如下:
  
  1.针对不同的底层数据类型设计特定的挖掘算法,挖掘用户的行为特征,形成底层标签。综合考虑不同数据来源的,形成更上层的抽象用户标签
  
  2.建立完善的用户画像标签体系结构,从不同维度、粒度对用户进行描述。
  
  3.搭建用户画像挖掘系统,基于大规模存储和机器学习计算平台,定期对全量用户数据进行计算和挖掘,并提供用户标签的使用和查询服务。

  
  用户画像系统架构



  
  用户画像文本挖掘系统



  用户画像行业挖掘
  


  用户画像挖掘结果
  
  个人用户画像研究的结果就是把结构化数据,文本分类,LBS数据,社交网络传播扩散这些挖掘之后形成一个比较完整的画像,比如说人口的一些基础属性如年龄、家乡、兴趣等。同时也会对用户婚姻状况来做一个判断。有了这些数据之后,就可以基于这些用户数据去做很多社交征信工作。
  
  社团圈子研究
  
  这里说到的社团圈子其实就是QQ圈子,刘黎春表示,在2012年有一个社交网络的成果非常有影响力,那就是把挖掘出来的结果作用到整个前端的QQ用户。具体案例就是如用户的某个同事,你们并不是直接的好友关系,但腾讯会知道这期间的潜在关系,或自动分到同事分组并同时加上备注。这个结果在当时引起了很大争议有人觉得对于他们找到一些潜在好友提供便利,但有些人觉得触碰了他们的隐私。
  
  QQ圈子除了它自己本身之外,也会把它作用到很多场其他景里去,比如说用它来挖掘学历的信息,基于QQ圈子好友的备注,如说很多人把这个用户备注成一个本科同学,那系统可能会判断我的学历是本科学历。这样的数据腾讯是拿一些真实的数据做过验证,数据覆盖率大概能覆盖74%,准确到90%以上。


  
  社交网络拓扑的应用
  
  社交网络拓扑的应用无外乎有两种,其一是是判断拓扑的类型,其二是研究这些类型在这个关系链里的影响力。比较有标志性的拓扑类型有三角形和心型两种结构。
  
  模型建设及应用
  
  那么要如何把个体用户画像和社团圈子的研究,用到模型中去呢?刘黎春表示,首先要做的事情就是先建立一个社交模型,但在建模之前要做一些基本假设,如两个QQ号码是属于同一个人的话有一些比较明显的特征,个他会经常在同一个设备里面登陆,或者在同样的IP里面登陆,或者它有其他特征的表现等等。后把这些特征用来建立模型,去判断说某几个QQ号码背后对应的到底是不是同样一个人,这个的准确率大概是85%,覆盖率是75%左右。


  
  变量衍生与模型结果


  
  模型整体效果


  
  微粒贷应用
  
  后刘黎春介绍征信模型运用到微粒贷中的具体应用流程,上图为产品截图。打开QQ如果能够看到微粒贷入口,说明是在腾讯筛选出的白名单里面。只要你点击了申请开通,它会马上给你算一个额度出来,如果你要借款,这个也是非常快,只要你绑定了你的银行卡,应该在两分钟之内会把你的借款打到你的账上。其实这个相对于去传统银行借款的话,它这个效率是有一个质的飞跃。但其前台产品表现得越简单,它背后的技术可能是越复杂的技术。征信模型作为微粒贷背后技术就是为了筛选具有良好信用的用户,为这些用户提供贷款服务。
我要评论
  • 2025世界计算大会专题展优秀技术、产品及应用成果火热征集中!

    2025世界计算大会同期将举办2025世界计算大会专题展,本次专题展以“智算驱动新质生产力”为主题,聚焦计算技术前沿、成果应用、产业赋能等领域,集中展示全球计算领域最新技术、产品及应用成果。
    世界计算大会量子计算云计算
    2025-10-13 11:40:29
  • 工信领域有哪些重要政策和大事要闻?一文速览→

    工业和信息化部等七部门近日联合印发《深入推动服务型制造创新发展实施方案(2025—2028年)》;近日,工业和信息化部与国家标准委联合印发《云计算综合标准化体系建设指南(2025版)》......
    服务型制造云计算
    2025-10-13 09:36:26
  • 两部门关于印发《云计算综合标准化体系建设指南(2025版)》的通知

    《云计算综合标准化体系建设指南(2025版)》提出,到2027年,新制定云计算国家标准和行业标准30项以上,不断健全云计算产业标准体系。开展标准宣贯和实施推广的企业超过1000家,以标准赋能企业数字化转型升级的成效更加凸显。加快云计算领域国际标准供给,促进产业全球化发展。
    云计算云平台软件
    2025-10-10 09:07:31
  • 2025云栖大会剧透来了!今年有这些AI新看点

    2025云栖大会以“云智一体·碳硅共生”为主题,为期三天,设三大主论坛和110余场聚合话题,预计将有来自50多个国家的2000余位嘉宾出席。
    云栖大会云计算人工智能
    2025-09-17 09:49:56
  • 人工智能+大数据:2025年它们如何塑造企业

    “2025 年商业中的人工智能与大数据”如今已成为竞争优势的代名词。人工智能 (AI) 与大数据的融合正在通过预测分析、个性化服务和自动化运营重塑全球经济的各个领域。
    人工智能大数据
    2025-09-16 10:29:40
  • 中国大数据规模未来5年增速世界第一 全球占比10%

    中国大数据市场表现格外亮眼,预计2029年中国大数据IT支出规模为730.2亿美元,全球占比约10%。
    大数据大数据技术
    2025-09-12 11:44:02
版权与免责声明:

凡本站注明“来源:智能制造网”的所有作品,均为浙江兴旺宝明通网络有限公司-智能制造网合法拥有版权或有权使用的作品,未经本站授权不得转载、摘编或利用其它方式使用上述作品。已经本网授权使用作品的,应在授权范围内使用,并注明“来源:智能制造网”。违反上述声明者,本站将追究其相关法律责任。

本站转载并注明自其它来源(非智能制造网)的作品,目的在于传递更多信息,并不代表本站赞同其观点或和对其真实性负责,不承担此类作品侵权行为的直接责任及连带责任。如其他媒体、平台或个人从本站转载时,必须保留本站注明的作品第一来源,并自负版权等法律责任。如擅自篡改为“稿件来源:智能制造网”,本站将依法追究责任。

鉴于本站稿件来源广泛、数量较多,如涉及作品内容、版权等问题,请与本站联系并提供相关证明材料:联系电话:0571-89719789;邮箱:1271141964@qq.com。

不想错过行业资讯?

订阅 智能制造网APP

一键筛选来订阅

信息更丰富

推荐产品/PRODUCT 更多
智造商城:

PLC工控机嵌入式系统工业以太网工业软件金属加工机械包装机械工程机械仓储物流环保设备化工设备分析仪器工业机器人3D打印设备生物识别传感器电机电线电缆输配电设备电子元器件更多

我要投稿
  • 投稿请发送邮件至:(邮件标题请备注“投稿”)1271141964.qq.com
  • 联系电话0571-89719789
工业4.0时代智能制造领域“互联网+”服务平台
智能制造网APP

功能丰富 实时交流

智能制造网小程序

订阅获取更多服务

微信公众号

关注我们

抖音

智能制造网

抖音号:gkzhan

打开抖音 搜索页扫一扫

视频号

智能制造网

公众号:智能制造网

打开微信扫码关注视频号

快手

智能制造网

快手ID:gkzhan2006

打开快手 扫一扫关注
意见反馈
我要投稿
我知道了