百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 运营笔记 > 正文

揭秘:芝麻信用是怎么做的

ann3311 2025-02-26 10:45 11 浏览 0 评论

编辑导语:在支付产品中,你或许看到过这样一个产品——芝麻信用,它是衡量我们的信用程度的一大指标。那么,为什么要做这样一款产品以及它是如何评估我们的信用的。本文对芝麻信用进行了详细的介绍,一起来看看芝麻信用是怎么做的吧。

上周五在电脑里翻到一个文档,是芝麻信用的产品介绍。我不知道是从哪来的,也无法轻易搜到同一份文档。但既然是产品介绍,就权当这是公开文件,作为一个外行,聊聊。

我显然没做过芝麻信用分,甚至我都没有调研过,但我是做过同类产品的。这样一款信用产品,与那些消金信贷公司的A卡B卡是有很多不同的。这个行业里多了很多懂数据懂算法的人,但没几个懂信用懂风控的人。因而,我觉得这份不同,还是值得小书一下。

主要是揭秘下芝麻信用分是怎么做的,说是揭秘,但因为我并不是幕后操盘手,更准确的说法是推测,也可能只是臆断。

另外,花呗接入央行征信系统,我们这些消费者在使用这类产品时要不要另作考虑,也会说一说。

关于芝麻分,官网有一段介绍如下:

芝麻分是由独立第三方信用评估机构-芝麻信用管理有限公司,在用户授权的情况下,依据用户在互联网上的各类消费及行为数据,结合互联网金融借贷信息,运用云计算及机器学习等技术,通过逻辑回归、决策树、随机森林等模型算法,对各维度数据进行综合处理和评估,在用户信用历史、行为偏好、履约能力、身份特质、人脉关系五个维度客观呈现个人信用状况的综合分值。芝麻分的分值范围为350至950,分值越高代表信用越好,相应违约率相对较低,较高的芝麻分可以帮助用户获得更高效、更优质的服务。

01

信用衡量的就是先享后付的能力,那就是要让该享受服务的人能享受到服务。一个该一个能。该的人不能,不该的人能,是要解决的关键问题。

想清楚两件事情,你就知道怎么做这样一款产品了。

一是,哪些信息能衡量一个人的信用?

两个维度,一是能力,二是意愿。能力取决于你的收支情况,以及保持收支平衡的稳定性的水平。所以,你的就业、你的收入、你的消费很重要,不仅在于当前是什么水平,还在于它是不是稳定的。如果你四海为家,如果你黄赌毒,都是稳定性上的负面。

意愿的衡量本质在于违约的成本,这一定程度上和收支相关,但并不相同,因为数字化时代法律约束变弱了,更靠的是道德约束。这时候,意愿的刻画就很困难,但意愿体现在你的信用历史中。

一个月入十万的人找你借一万块钱,和一个每次借钱下个月都及时还钱的人找你借钱,你更愿意借给谁呢?

不管你去搜集哪些数据,它们都是刻画这两个指标的工具。

二是,做信用产品的根本目的是什么?

显然,做产品的目的是希望它能被用的尽可能多,但用的尽可能多一定是效果尽可能好吗?

答案是否定的。

企业做信用评分,讨好的是用户,但付费的是需要查询评分的商户。讨好的是用户是说,你要关注几乎所有用户的几乎所有方面的需求,不能仅仅是大部分用户的大部分需求,否则客诉可能让你的产品活不下去。企业要考虑面向用户可解释,商户不需要。

付费的是商户意味着,企业需要的是商户调用的越来越多,不是当前足够多,是长期足够多,而商户需要的是效果好,效果好就更精准,长期反而不会更多。两者的利益是不完全对等的。

这意味着,构建这样的模型时要根据经验挑选覆盖各个维度的变量,并使其保持绝对的可解释性,而不光是选择区分度高的变量。前者是芝麻信用这种产品的视角,后者是A/B/C/F卡的视角。

你说企业内部也要用啊,不需要效果尽可能好才更好吗?

企业又不是只用这一个工具。

02

我们来重点聊一聊芝麻信用的数据变量。

这个数据变量服务总共包含 65 个变量,按照芝麻信用评分维度(一级分类)和 DAS 变量类别(二级分类)分类如下:

如前所述,相信你对这五大维度一点也不吃惊。身份特质、履约能力体现了“收”,行为特质体现了“支”,信用历史体现了意愿,人脉关系也体现了违约的成本项。

图中变量数量,基本就体现了这些类别的重要程度。信用历史往往是最重要的,其次是履约能力。

同样的一万块钱,借给一个每次借钱下个月都及时还钱的人,比借给一个月入十万的人靠谱的多。

这 65 个变量进一步拆分为 8 个核心变量和 57 个基础变量。

这些变量的分段逻辑,按文档的说法是,综合考虑 DAS 变量在全量芝麻用户上的数值分布对好坏用户的区分度将其进行分段,最多分十五段。分段序号 01-15 代表变量数值由小到大的排列顺序。

我们详细看一看这8个核心变量,57个基础变量汇总放在后面。

在身份特质项中,更核心的变量竟然是稳定性指标,而不是行职业信息。一方面是因为,行职业信息一般很难准确获取;另一方面,所在公司、所做职业是需要分类到大类上的,这类信息在住房按揭这种长期贷款中很重要,对短期借贷没有直接作用关系。不管是消费信贷,还是信用生活,还款能力的刻画完全不需要上升到行职业,反而稳定性指标更为重要。

第三方支付的核心在于深度和广度,支付业务要看广度,对应的当然要看用户使用第三方支付的广度。行为特质中,支付活跃场景数就很好的体现了这个广度。而支付金额和资产等维度在下面的履约能力中体现。

履约能力选取了一个资产一个支出一个消费层次。资产和支出不必说,消费层次意义在于,只消费生活必须品,和对精神物品有强烈需求的,代表了不同的层级。

信用历史中更为关注信用还款,而非逾期,我推测原因有二,一是还款类的信息丰富度会高很多,二是正面信息在面向用户可见的产品上更为友好,它既能一定程度上起到和负面信息类似的效果,在相对关系上负面降分和正面增分区别不大,还能激励用户更高频高额地借还。

剩余 47 个基础变量,我整理如下。

上述变量除了选取的指标值得学习外,时间窗口也很值得注意。另外,显而易见,这些变量很多都是相关的,它们都会被用在芝麻分里面吗?它们怎么综合得到一个芝麻信用分呢?

当然是通过权重进行组合。

权重如何得到?

“综合考虑 DAS 变量在全量芝麻用户上的数值分布对好坏用户的区分度将其进行分段”,既然变量的分组是参考了好坏用户的区分度的,专业名词就是WOE,那变量的组合当然是对好坏用户进行建模得到。

但是,这些变量,高度相关的变量,是会被评分卡筛选掉的。有效的模型不可能用到了其中所有的变量,即使有,我推测,很多变量也是人为地被赋予了无关痛痒的权重。

请注意,这是 DAS 变量数据服务文档,并未称作芝麻信用分产品介绍。我推测芝麻信用分的关键在那8个核心变量,我说的是关键,并不是说完全不用那57基础变量。

另外,芝麻分作为面向用户的产品,还兼有营销激励的功能,最终的芝麻分除模型计算外,应该还有其他环节的增减分设置。

03

花呗将全面接入央行征信系统,用户使用花呗需不需要担心哪些问题呢?

征信关乎个人信用,花呗是当代人超前消费的好助手,当它俩一拍即合,消费者应怎么考虑?

我不说责任和义务,也觉得有必要说几句。

现在大概央行收录的自然人11亿,其中有信贷数据的应该不到一半,我们消金业务发起申请查得率稍高一些,60%左右。也就是说,绝大多数人的征信数据信息是比较少的,就是那些简单的身份信息,没有金融信用数据。

传统的信用评估模型是根据一个人的借贷历史和还款表现,通过逻辑回归的方式来判断这个人的信用情况。现在越来越兴起大数据模型,它的数据源就十分广泛,包括电商、社交、搜索浏览等行为都产生了大量的数据。

所以,显然,花呗接入央行征信,对各大平台来说好处很大,因为用户的信用更好被评估了,那对用户来说呢,是不是就不好呢?

不是的,对用户来说其实影响不大,但要注意养成按时还款的习惯。

花呗对征信的补充,主要就影响了两点,借贷次数多了,逾期信息多了。

风控策略呢,也就是信用评估,借贷次数多了影响不大,次数再多也只算一个机构,一般不会认为这是坏行为,主要是逾期,逾期这种负面行为容易被风控拒绝,偶然性的逾期其实也不至于太坏。银行信审有个说法,称为“连3累6”,即连续出现三个月逾期,两年内共计六次逾期,这种属于严重的违约行为。但最好别逾期。

所以,可以照常用,养成按时还款的习惯基本就妥了。

我先是消费者,再是消金行业从业人员,我的立场始终是消费者。我说这话的一个依据是,对于《个人信息保护法》的出台,我第一感觉是这是好的,而不是这很糟糕。

04

还是要声明,上述说的很多事情,我并没有取证,甚至懒得找蚂蚁的朋友确认,我们有时候关注如何做一件事的原理和本质就够了,至于一个实例的所有detail,其实并没有太多价值去研究。就像,一个结构工程师盖房子,也实在没必要一定要知道建筑立面要做哪些装饰,这可能只是某些人的要求而已。

另外,我在
http://www.woshipm.com/data-analysis/5118872.html这篇文章中,提到过这几款信用评分,包括芝麻信用分、微信支付分和小白守约分。下面的说法来自那篇文章。

无论是天猫淘宝京东的消费还是花呗白条支付的海量交易数据,都可以用来评价个人的还款能力和意愿。结合着马斯洛需求理论,也就是生理、安全、情感、尊重、自我实现依次升级,越能体现高级需求的数据越可以给更高的权重。也就是说重要的不是单次购买行为,而是消费习惯。

而那些店铺商家,平台有他们所有的交易、资金、物流信息,都可以用来作为金融服务的依据。

你掌握了一个人的人际关系,就掌握了这个人。社交关系链,不仅可以用来评估信用,还能直接作为质押物,因为每个人都在乎它,而且很在乎。

我在知乎搜这个话题时,发现有不少问题在问如何提高芝麻分。也说一句。

如果你想要提升分数,就考虑下那些核心变量吧。另外值得注意的是,这些变量都是时间窗口的,并且是分段的,你的行为会被摊平到一段时间内,并且需要分段后跳档才能对结果产生影响。这给提升分数带来了难度,也是防止指标造假的科学手段。

本文由@雷帅 原创发布于人人都是产品经理。未经许可,禁止转载

题图来自Unsplash,基于CC0协议

相关推荐

如何把已经造成的店铺违规影响降到最低?

很多卖家经常来说,我的店铺违规降权了,怎么删除啊?店铺违规降权是没办法消除的,我们能做的就是尽量把影响降到最低。如果是确实违规,那就想办法降低影响。如果是误判,那就积极进行申诉。貉塘月色论坛首先我们先...

淘宝用户名怎么改(怎么改淘宝用户名字)

淘宝用户名怎么改?以下为具体操作步骤:品牌型号:iphone13系统版本:ios16.6.1软件版本:淘宝10.27.40方法/步骤1/3分步阅读手机淘宝在我的淘宝页面点击右上角“设置”。...

电商成长路之淘宝新手开店基本功(新手淘宝开店入门基础教程)

随着近两年淘宝的飞速崛起,越来越多的人开起了淘宝店。问题来了,店是开起了,怎么天天等着,旺旺总是只有广告信息呢,顾客去哪儿了?相信大部分的新手朋友还是迫切希望改善的,今天利用闲暇时间一起交流一下,给大...

一文读懂!成人用品网店开店流程大起底,资质办理全攻略

现在网上购物越来越方便,成人用品也跟着火了起来!网上买东西隐私性强,不用尴尬,所以很多人都想在网上开家成人用品店。但到底怎么开?需要办啥手续?今天就手把手教你!...

淘宝主图优化神器!AI智能指令改图,电商卖家都在用!

传统修图流程繁琐、耗时且成本高昂,让许多中小卖家望而却步。“图生生”推出「AI修图-指令改图」功能,只需上传图片+简单指令,即可实现专业级图片优化!...

这是一节高标准的搜索扫盲课,有点长耐心看。

大家想必都知道淘宝的搜索类目逻辑主要有前台类目树和后台类目树组成,前台类目面向买家展现查找,后台类目便于商家发布商品信息存储管理,从技术的角度来看的话,前台类目就是在后台类目的基础上建立了一个虚拟类目...

怎么做网站seo优化-做网站优化还有效果吗

现在大家都很熟悉淘宝SEO优化了,大家也经常会对自己的淘宝店铺进行优化,但是你知道网站SEO该如何优化吗?下面小编就给大家介绍一下,希望对大家有所帮助。如何优化网上商店SEO1.首先,内容为王作为网...

网店要如何做好SEO优化,有哪些技巧?

网购在方便人们生活的同时也促进了就业,开设网店成为了许多创业者的首选。然而,随着大量人才涌入,网店之间的竞争也愈发激烈。所以,不少网店经营者开始对自家网店进行SEO优化,以此吸引顾客,增加销量。那么,...

淘宝店铺搜索流量始终起不来?做好这四点优化,快速打造出爆款!

流量碎片化越来越明显,但是搜索流量仍然是重中之重,很多商家都在抢这块流量,无奈又怎么都做不起来,是哪里出了问题呢?我们做产品不管是卖什么,都会存在竞争,如果你所做的类目都是搜索流量,但是你却没有,那店...

搜索效果差,试试这几个办法(搜索搜索的)

搜索质量差,找不到所需内容时,可以尝试以下几种方法:换搜索工具;优化关键词;使用搜索指令;多看一些结果。1、换搜索工具搜索效果差,那就换个搜索工具,看看其它搜索引擎的结果。...

网店出售0.5元“怒骂苏家三父子”,一周300多人来撒气

#苏明成出来挨打#、#苏大强又作妖#、#苏家三个男人都是自私自利#……自从电视剧《都挺好》热播以来,热搜天天都被剧中的苏家三父子“花式霸屏”,下面则是网友一水地怒骂。演员郭京飞继带头“打倒”自己的角色...

广东某公司抢注“安耐晒”商标 敲诈淘宝卖家

近日,有淘宝代购卖家发微博反映,自己家卖的日本资深堂“安耐晒”产品,被举报,申诉均失败,照成店铺商品被下架删除。微博发出后,引来其他卖家的关注,也都反映自己卖的“安耐晒”被投诉下架删除。事情真相原来是...

恶意给差评敲诈淘宝店主,这位“买家”三顾茅庐终被抓

网上购物时,网友都会查看商品评论区,有没有差评成为众多网友网络购物的重要购买标准,影响着商品销量。然而,电商卖家对商铺口碑、信誉的重视也使得一些不法分子有机可乘。最近,深圳警方破获了一起利用恶意差评敲...

新手操作闲鱼如何日入300-500元?第五课操作中有问题如何处理

大家好,我是兔毛,今天继续给大家分享闲鱼的课程,前面几课我已经教会了大家如何去操作闲鱼,接下来就是讲解一下操作中会遇到哪些问题,需要怎么去处理,还有解答一些朋友的题的问题。有很朋友私信问我,要多少钱?...

电商被举报“偷逃税”? 专家教你反敲诈

作者:侯珍珍...

取消回复欢迎 发表评论: