马云的马云芝麻信用用是怎么利用大数据评判用户信用的

芝麻信用评分_图文_百度文库
两大类热门资源免费畅读
续费一年阅读会员,立省24元!
芝麻信用评分
阅读已结束,下载文档到电脑
想免费下载本文?
定制HR最喜欢的简历
下载文档到电脑,方便使用
还剩26页未读,继续阅读
定制HR最喜欢的简历
你可能喜欢爱就投:关于互联网金融大数据征信风控的思考
近日,马云公开表示大数据以及大数据的信用体系和风控体系,是互联网金融企业成功的关键要素,并用了一个非常形象的比喻。
:11月19日,电商巨头阿里巴巴集团董事局马云,在国际金融峰会上指出,互联网金融有三个必备要素,一是大数据,二是要建立基于数据的强大信用体系,三是基于大数据的风控体系,并不是基于IT技术的风控。纵观2016年互联网金融行业的发展,征信体系缺失、风控之痛扼住了互联网金融咽喉,也阻碍着互联网非公开股权融资的健康发展。
互联网征信对比
Credit Karma是美国在2008年成立的专业的互联网征信机构,基于互联网向美国的消费者提供免费的信用评分、信用报告和信息监控服务,帮助其用户了解和提升自身信用状况,根据从传统征信机构获得的个人消费者的信用信息和金融信息,经过数据挖掘和计算分析,为用户定制个性化的金融产品。
Credit Karma只是美国成熟的个人信用体系中一个寻常环节,在美国每个公民都能在信用局查到自己的信用分数,无论是买车买房、申请信用卡还是签发个人支票,任何一项经济活动都会形成数据,进入征信系统。美国的征信体系就像一只看不见的眼,紧紧盯着美国公民的言行举止,时时刻刻都在监督着他们要诚信,否则寸步难行。
对互联网金融,美国直接启动征信体系、实施大数据风控,进行严格监管,因此美国的网贷平台,鲜少出现类似平台“跑路”事件,更鲜少听说过平台充当“资金池”现象。有数据显示,美国征信体系覆盖率为85%,中国人民银行征信系统中有征信记录的约为3.2亿人,约占总人数的23.7%,远低于美国征信体系覆盖率,这就导致中国的互联网金融,从诞生之初就缺乏完善的征信机制和信用体系作为支撑,目前的监管较多是事后“应对式”监管,缺乏事前主动积极防范,仅有的征信体系远远无法满足市场信用交易的多元化征信服务需求,互联网金融风控之难,每个从业者几乎都感同身受。
互联网征信流派
目前中国市场上目前所谓的大数据风控公司,基数太小,不超过千万之数,能够匹配使用的不超过10%,这对中国14亿人的庞大人口而言,根本就是杯水车薪。大多数互联网金融平台,并不愿意做到公开客户征信数据“资敌”。
而国内颇具规模的大数据征信,主要有四大流派:一类是侧重电商数据的芝麻信用,一类是侧重社交的腾讯信用,一类是运营商积累多年的大数据信用,还有一类是信用卡信用数据。相比阿里巴巴,腾讯的社交数据相对偏向生活化和边缘化,不能切实为个人用户的金融信用画像,与互联网金融相关的大数据征信体系是马云构建的芝麻信用。
芝麻信用的数据大多数来自淘宝、天猫、蚂蚁金服等电商和互联网金融数据,通过综合分析考量用户的信用历史、行为偏好、履约能力、身份特质、人脉关系五个维度信息,采集个人用户信息进行加工、整理、计算后得出信用评分。然而芝麻信用也存在一个致命缺陷,那就是芝麻信用是可以刷的,甚至有一些专门的QQ群,互相转款、虚假购买来积累交易数据,这也是马云极为头疼却难以根治的征信缺陷。
不过马云深知,要想推动中国大数据征信体系的构建,单凭阿里巴巴一家是很难做起来,开放和共享是解决这一社会难题的一个办法,他用了一个很形象的比喻,木秀于林,风必摧之。村里人就你家最有钱,大家一定会把地主剁了,如果大家都有钱,你稍微多一点,可能问题不是太大。对这些数据,马云公开表示自己想要将数据处理和风控能力,与其他公司一起共享的意愿。
大数据征信成为掣肘互联网金融平台发展,降低风险的绊脚石,也是中国面临的最大挑战之一。在此背景下,除了政府监管部门出台促进个人征信市场发展政策之外,互联网金融平台也需要创新征信体系和风控技术手段。除了将自身数据挖掘画像之外,也需要同更多的第三方征信机构进行合作,对创业者和投资人进行严苛的信用筛选,避免引发非系统性风险。
以爱就投为例,在今年六月,爱就投创始人徐文伟提出用大数据征信支撑互联网非公开股权融资平台的征信体系,并在大数据征信基础上,做了大胆创新。首先通过同国内知名的第三方支付易宝支付合作,以大数据征信为切入点,筛选甄别创业者的个人信用,并设定了“过往信誉不良”“离婚两次”“有赌博恶习”“对合作伙伴不忠诚”等信用负面清单,精准筛选创业者。
其次,爱就投作为一个平台,每天产生的大量数据,都是基于互联网金融投融资的行为选择,是最精准的互联网金融数据,其中包括各行各业的创业者和投资人。如何把这些投资人的资源和项目方甄别筛选,快速对接,不仅帮助创业者融资,还能通过大数据高效匹配创业者所需要的资源,帮助企业快速发展,降低创业失败率,是爱就投技术创新的重点。
爱就投即将上线的融测测2.0,基于大数据高效匹配、智能化筛选、区块链记账的智能技术系统,将平台数以万计的项目归纳分类画像,用大数据系统、五力模型智能评判项目的信用、长处和短板。届时,创业者每个环节、每个阶段都可能通过众筹来完成,系统智能匹配创业者需要的资源,同时帮助有闲置资本和资源的人群,用资本生财,将资源变现,打造一个大数据“众筹+众包”的平台。
最后,借用马云一句话,任何一次技术革命,前20年基本是技术公司的角逐,例如新技术的突破,包括计算技术、数据技术、风控技术,这是平台公司的思考。在这种背景下,平台公司的技术和金融创新一定会层出不穷,大数据征信也将迎来新的发展机遇!
责任编辑:
声明:本文由入驻搜狐号的作者撰写,除搜狐官方账号外,观点仅代表作者本人,不代表搜狐立场。
今日搜狐热点不知你有没有应用阿里巴巴推出的芝麻信用分呢?你了解这种基于大数据分析的征信评分背后的原理吗?...
编辑推荐自从听说阿里巴巴推出的芝麻信用评分可以帮助办理签证,小编就对这种评分产生了深厚的兴趣,何况它利用大数据分析的方法听上去也很酷,不知道你有没用过呢?今天,我们推送的文章就深度介绍了芝麻信用评分与经典的FICO评分之间的差异……
如果你身为高富帅或者白富美,同时又是个剁手族,那你的阿里巴巴芝麻信用分一定很高。这样,当其他人还在焦急地等待签证消息时,你就可以潇洒地从限量版的爱马仕包包里拿出iPhone6s,点击支付宝,轻触芝麻信用,哇,你的信用分数是760!随后你任性地把护照和iPhone6s扔在签证官面前,看着他/她在你护照上盖章,你微笑着说:Please charge Visa fee directly from my Ant Credit Account (蚂蚁花呗)!
除了签证办理之外,其他许多生活方面的应用也离不开芝麻信用。如果你想免押金租车、租房,在酒店先入住后付款,都需要一定的芝麻信用分数;更不用说金融方面的信用贷款了……FICO评分在中国的推广一直说不上热火朝天,可是在中国有芝麻信用分的人不说上亿,起码也有几千万吧。这么广泛的客户来源,再加上支付宝的强大覆盖力,FICO评分这样的传统信用评分还有多大价值呢?会不会在不远的将来,就被芝麻信用分、腾讯征信评分取代映衬得黯然失色呢?
其实也不能一概而论。让我们先看看传统的FICO评分和芝麻信用分是如何计算出来的吧:
FICO评分是Fair Isaac公司开发的信用评分系统,也是目前美国应用得最广泛的一种。FICO评分系统得出的信用分数范围在300~850分之间,分数越高,说明客户的信用风险越小,它采集客户的人口统计学信息、历史贷款还款信息、历史金融交易信息、人民银行征信信息等,通过逻辑回归模型计算客户的还款能力,预测客户在未来一年违约的概率:
1. 人口统计学信息:如客户年龄、家庭结构、住房情况、工作类别及时间等;
2. 历史贷款还款信息:即过去6个月或12个月的付款方式、逾期次数等;
3. 历史金融交易信息:即过去6个月或12个月的平均月交易笔数、金额等;
4. 银行征信信息:如过去12个月中新开的账户总数、所有账户的总额度、账户是否逾期等。
看,以上这些信息都是FICO评分模型的自变量,最终会通过逻辑回归模型输出最终分数。不同的是,阿里巴巴推出的芝麻信用分则是以大数据分析技术为基础,采集多元化数据,包括传统的金融类交易、还款数据,第三方的非金融行为数据,互联网、移动网络和社交网络数据等,帮助贷款方从多个方面考察个体的还款能力、还款意愿,做出合理、全面的信用评分。上图展现了基于大数据分析技术的机器集成学习法Ensemble。不同于传统的逻辑回归模型,它采集了上万个数据项、从不同的层面(还款能力、还款意愿、欺诈可能性、稳定性等)对个体进行建模打分;再把这些单个层面的评分、结合个体的综合信息,给个体一个最终的信用评分。
两种评分模型采用数据量的不同体现了其评分思路的区别。通常,FICO评分模型只有十几个评分项,每一个评分项对目标变量(即是否违约)的预测性和影响力都很高。但是,在机器集成学习法中,最终进入模型的评分项可能多达成千上万,而且每一个这样的评分项对目标变量的单独预测性可能都很小;Ensemble就是利用机器学习法,把这么多微小的预测性汇总成为最终对个体的违约可能性有很强预测性的评分。
那么,芝麻信用有哪些局限性呢?我们不妨参照已有的实例来进行横向对比分析。美国的互联网金融公司ZestFinance从2009年就开始研发基于大数据的信用评估模型:融合多源信息,采用机器学习的预测模型和集成学习策略,进行大数据挖掘。他们收集了上千种来源于第三方的数据,比如水、电、煤账单,电话账单,房屋租赁信息,和传统的金融借贷、还款信息等;通过机器学习的方法寻找数据间的关联性并对数据进行必要的转换;在关联性的基础上将数据重新整合成不同的测量指标;每一种指标反映个体的某一方面特征,比如诈骗概率、长期和短期的信用风险和偿还能力;最后,将所有指标按加权投票的原则,做成最终的信用评分。
但是ZestFinance的个体信用评分只适用于缺乏或没有信贷记录的人群,也就是说,这些人或者刚移民到美国,或者之前从来没有过贷款行为。所以ZestFinance 的大数据征信最终无法替换FICO评分,而只是用来补充FICO评分的不足。原因包括多个方面:
ZestFinance 的大数据征信的体量不大,到现在只为10万美国人提供服务,对模型的有效性、准确性还很难做出有效的评价。
ZestFinance 的大数据模型也给传统的风险管理带来挑战:传统的FICO评分需要处理的变量比较少,对模型结果可以给出合理的解释,方便金融机构不同部门之间、金融机构与客户之间的沟通。而ZestFinance 的基于大数据的数以千计的变量规模和多模型应用,使得数据的处理和模型的解释变得很复杂,在实际应用中会带来许多麻烦。
ZestFinance 在利用个体消费者的大数据进行信用评估时,很多数据会涉及个人隐私,比如个人社交网络数据(微信朋友圈)、电商交易数据、通话记录等,所以涉及个人隐私的保护和合规性。
阿里巴巴的芝麻信用和ZestFinance的大数据征信相似,也存在一定的问题,比如:芝麻信用覆盖的人群可能上亿,但是芝麻信用分的有效性和准确性还没有得到公认的评估;凭借高的芝麻信用分可以在支付宝开通蚂蚁花呗,类似信用卡的透支服务,但是芝麻信用在其他方面的应用还没有达到一定的规模。
当然,大数据信用评分终归是历史的趋势,目前FICO公司和国外三大征信机构都已经开始了利用大数据分析技术来完善传统信用评估体系的前瞻性研究。比如,益百利Experian已经投入研究团队关注社交网络数据对信用评分的影响;FICO公司也已经开始了在线评估的信息工具和基于互联网的信用评估系统的项目研究。我们相信,随着理论与方法的完善和实践的深入,基于大数据分析的信用评分终有一天将占据主流地位,不过,市场上会不会出现有力的新竞争者、最终赢家究竟是芝麻还是西瓜,仍需我们拭目以待。
我们是KPMG专业数据挖掘团队,在微信公众号中,我们会在每周六晚8点准时推送一篇原创文章。文章都是由项目经验丰富的博士以及资深顾问精心准备,内容也是结合实际业务的理论应用和心得体会等干货。欢迎大家关注我们的微信公众号,关注原创数据挖掘精品文章。如果想要联系我们,也可以在公众号中直接发送想说的话与我们联系交流。
长按二维码即可关注!也请随手推荐我们给你的小伙伴 ↓↓↓↓
手机浏览器扫一扫下载神器
安全&& 正版
微信扫一扫关注公众号
要回复文章请先或
微信扫一扫 进一步关注【好通过网】互联网征信等大数据应用很大一部分还是讲故事_好通过网吧_百度贴吧
&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&签到排名:今日本吧第个签到,本吧因你更精彩,明天继续来努力!
本吧签到人数:0可签7级以上的吧50个
本月漏签0次!成为超级会员,赠送8张补签卡连续签到:天&&累计签到:天超级会员单次开通12个月以上,赠送连续签到卡3张
关注:8贴子:
【好通过网】互联网征信等大数据应用很大一部分还是讲故事
南京数据分析师:互联网征信等大数据应用很大一部分还是讲故事,如果说马云构建的金融帝国是一个大家族,那么每一条业务线都可能成为“野孩子”。最近“摊上事”的则是刚刚起步几个月的征信业务。近日有媒体报道称,央行近日叫停了蚂蚁金服旗下芝麻信用多个营销活动,包括与首都机场快速安检通道合作。不过蚂蚁金服和芝麻信用等方面很快辟谣,称并未收到央行通知,该公司还表示,所谓转账等方式提高芝麻信用分更是无稽。否认被叫停今年1月份,央行首次批准8家企业准备个人征信工作。包括阿里、腾讯、拉卡拉等互联网公司,成为首批试点幸运儿。值得注意的是,相比其他几家,阿里在个人征信服务方面更是十分活跃,除了可视化的“芝麻信用分”产品外,还与神州租车、一嗨租车、阿里旅行、网易花田等一系列第三方尝试商业化合作,涉及租车、交友、网购、住宿等多个领域。尤其是与支付宝合作,更使得“芝麻信用”成为类余额宝网民话题。不过最近芝麻信用在机场、校园等场景一系列营销活动,也遭遇了部分媒体质疑。财新援引接近央行消息人士称,“芝麻信用机场快速安检通道被叫停”,此外,还有业内人士质疑,用户可以通过互相划款提高芝麻信用分。“我们没有收到任何监管叫停通知,”9月24日上午芝麻信用发布声明辟谣,称芝麻信用快速安检通道将面向信用分750以上用户继续开放。声明还提道,芝麻信用公测期间,“一直与监管保持良好沟通。”记者注意到,芝麻信用当天上午还推送了这一服务的消息通知。消息显示,芝麻分在750以上用户可以走首都机场CIP安检通道(国内快速安检通道),活动期限为9月15日至10月14日,具体时间为每天6:30至20:30。据了解,自1月份开始“准备工作”之后,蚂蚁金服先是向部分用户开放测试,随后在6月份开放全国范围公测。公测期间,芝麻信用启动了无人超市、大学生信用节、芝麻信用快速安检通道等活动,不过该公司并未透露目前参与芝麻信用用户规模。按照芝麻信用分可视化的结构,其构建目前呈现为“行为偏好”、“身份特质”、“人脉关系”、“履约能力”和“信用历史”等,对应了用户教育职业、消费行为、资产状况、社交关系等方面信息,但对于媒体报道乃至部分坊间观点认为,可以通过网购、互相转账等方式,来提高信用分的说法,芝麻信用也进行了澄清。“互相划款提高信用分是无稽之谈”,芝麻信用在回应声明中称,这种手法会被芝麻信用的大数据模型识别,不但无效还会给用户信用历史带来负面影响。按照该公司的解释,其征信系统参考数据关系多达数亿条,结合的底层指标超过上万个,数据来源包括电商数据、互联网金融数据、公安网、最高法、教育部、工商等公共机构数据,除此之外还有第三方合作伙伴以及用户自主递交生活、支付、购物、投资、公益等多个场景。蚂蚁金服内部人士告诉记者,某一维度数据丰富并不意味芝麻信用分高。该人士还表示,芝麻信用也不是所谓“会员”概念,因为平常的积分是只会增加不会减少,而芝麻信用因为多种数据,可能会有所下降。但对于这个构建在“大数据”概念下的信用维度架构和规则,芝麻信用方面却一直没有对外透露。“如果我们披露的话,就会有人去刷信用。”前述人士表示。网络征信试水“央行对于民企做征信,还是有顾虑的,既然是试点,就应该允许探索不同方法,尤其是企业行为,更应该坚持市场导向,有一些市场行为也无可厚非。”中央财经大学教授黄震表示。在黄震看来,BAT以及其他一些公司,都积累了很多数据,不管是交易、社交乃至交通旅行等方面数据,有一定数据基础和条件的数据公司,都应该鼓励尝试,“哪怕只是一孔之见。”他同时指出,国外早就有了用各种数据作为征信依据,包括航空公司、大型零售商与银行机构合作,基于一些评级、评价数据分析,推出相关产品服务。“央行征信中心难以覆盖到个人征信需求,存在瓶颈问题,”黄震告诉记者,国内多个机构、部门数据实际上都不怎么打通,形成了信息孤岛。互联网和大数据技术发展,带动起个人征信尝试,实际和借款、消费信贷等一样,都是将原有垄断打破。不过黄震认为,现在互联网征信还谈不上颠覆,更重要是数据价值挖掘、联网、开放。按照芝麻信用的说法,芝麻信用除了阿里系统数据外,还有很多第三方数据,互联网金融千人会秘书长易欢欢则认为,个人征信不管是外在形式如何,娱乐化或者营销模式怎么样,最重要还是要从内在看数据价值挖掘,能否构建起一个可以信赖、验证模型,这也将是一个长期的过程,既需要数据本身积累,与其他各方打通,同时也需要反复验证以提高准确率,“从目前看,阿里和腾讯都在做积极尝试。”实际上,包括“芝麻信用”以及其他第三方征信产品,最核心构建理念基本都是互联网与大数据,这也为互联网公司津津乐道。但迄今为止,成熟的商业产品依然有待验证,与此同时,央行也尚未发布真正的个人征信牌照,所以企业也都是“试牌照”。花果金融CEO认为,所谓“大数据”应用,有很大一部分还是出于互联网讲故事因素,“大数据应用于征信确实有一些成功案例,但大规模应用目前还不存在。此外,目前关于大数据很多时候也是出于互联网公司讲故事的需要。”
操作步骤,案例分享,培训资料......你想找的都在这里,海量信息免费查寻!
贴吧热议榜
使用签名档&&
保存至快速回贴

我要回帖

更多关于 马云力捧的芝麻信用 的文章

 

随机推荐