分享到:
编者按:今年1月,中国人民银行印发《关于做好个人征信业务准备工作的通知》,要求八家机构做好个人征信业务的准备工作,准备时间为六个月。这被业界视为个人征信市场化将正式开闸的信号。
为了了解这八家企业的模式以及运营状况,网易科技推出了《大数据征信系列报道》;6月份我们详细介绍了征信行业新面孔华道征信的运转模式,7月份又推出了芝麻信用的专项报道。
今天,我们将要介绍的是考拉征信。
文/温泉
今年1月5日,中国人民银行官网发布消息称,人民银行已印发《关于做好个人征信业务准备工作的通知》,要求八家机构做好个人征信业务的准备工作。
进入首批名单的考拉征信,其大股东是拉卡拉集团。在中国的移动支付和收单市场上,拉卡拉的份额表现亮眼,特别是在线下拥有超过300万的个体工商户。
考拉征信的数据有什么样的特点,未来它将如何玩转大数据征信?
数据来源:股东最多
考拉征信有七个股东,在第一批名单中,是股东最多的一家。拉卡拉董事长兼总裁孙陶然表示,希望考拉征信形成一个公共、开放性的平台,而不是在自己一个圈子里来回绕。
与此相应,考拉征信的数据来源也有比较丰富的维度。
首先是大股东拉卡拉金服集团的数据。
拉卡拉成立于2005年,是联想控股公司,从线下刷卡业务起家,发展成为综合性的互联网金融集团,目前覆盖有支付、征信、信贷、理财等多项业务。
作为国内第一批取得支付牌照的线下第三方支付公司之一,近10年来,拉卡拉通过自己布在300多个城市中的便利店、社区小店,以及银行网点中的自助刷卡终端,向附近居民提供便民金融服务。如信用卡还款(跨行)、公共服务缴费等。
由此,考拉征信总裁李广雨向网易科技介绍,拉卡拉主要积累了两部分数据:一部分是累计超过1亿个人用户的交易数据,另一部分是300万小微个体工商户的数据。
李广雨告诉网易科技,在小商户装pos机的时候需要提交“三证一表”,少数行业甚至是“五证一表”。所谓“三证一表”,即营业执照、税务登记证、法人身份证和pos机的申请表,因为拉卡拉需要根据商户的经营范围来确定费率。这样,拉卡拉就可以了解商户经营的基本情况、日常经营流水和法人个人信息。考拉征信是将这些个体工商户的数据作为个人征信数据来看待的,因为个体工商户的信用和老板个人的信用是密切相关的。另外,拉卡拉平台上还沉淀了与个人相关的数据还包括信用卡还款、转账、水电煤缴费、火车票机票信息、理财、信贷等数据。
考拉征信的股东也各自在数据方面具有一定的优势,如蓝色光标、拓尔思、旋极信息、梅泰诺、51job等,在各个领域有着自己的特色。
开放性的股权结构,多家股东公司在各自领域的多年耕耘与积淀,为考拉征信的信息采集和数据合成以及大数据处理提供了先发优势。
数据处理:“拼的是理解”
这些数据如何处理?
考拉征信将这些数据划分为五个维度:履约能力、身份属性、信用记录、社交关系和交易行为。对比芝麻信用的五个维度:履约能力、身份特质、信用历史、人脉关系、行为偏好。二者维度基本一样。
“但是里面的内容却是大不相同的。”李广雨告诉网易科技,他解释说,“这就好比看一个人,基本的维度都是姓名、性别、身高、体重、学历、性格等等,维度是差不多的,但是不同的人来看,判断依据不同,结果也会有很大的差别。”
他举例解释,比如,芝麻信用主要是线上的数据,而考拉征信的数据在线下更有优势。再比如,腾讯来判断社交关系会应用许多聊天内容,但是考拉征信的人脉关系则更偏重于互相转账等金融方面的交集。
据考拉征信提供的资料显示,该公司目前的核心团队超过100人,其中数据分析团队有将近60人。在今年5月,考拉征信与中国科学院虚拟经济与数据研究中心联合成立了大数据征信实验室,主要致力于征信大数据建模与挖掘算法、大数据技术以及大数据应用等方向的探索与创新。而据李广雨透露,中科院的这个团队曾经参与央行征信中心的建模,比较有经验。
“整个数据团队有一整套分工流程,”李广雨告诉网易科技,“其中包括产品设计、建模、数据处理、研发、数据采集和数据合作,这其中的‘核心’是产品设计,并非大家所认为的数据建模。”
“大数据征信,拼的其实不是技术,而是对数据的理解和洞察。”李广雨总结,“有时一个变量的提取,就会使得整个评价结果截然不同。因此,将影响模型的关键的字段和变量提炼出来才是核心。产品设计相当于是写菜谱的人,其他人都是执行者。一个饭店的菜好不好吃,关键在这个写菜谱的人。”
“这要靠对相关业务的深入理解才可以做到。”李广雨进一步解释,考拉征信的产品设计都出身于行业资深人士。
他举了个例子,比如识别虚假商户。有的专门帮别人养信用卡的公司,为了掩盖自己的违法业务,在办理营业执照的时候会填报与自身业务并不相关的经营范围。要识别这样的商户,就要对他所填报的行业有一定的了解,知道这个行业的运行规律,用这个公司的相关数据和这个行业中其他公司的数据进行比对,看二者规律是否一致,从而识别真假。如果没有对相关行业的深入了解,是难以提取出这样的比对维度的。
“从海外归国的的数据建模人才,他们在理论方法上有一定的优势,但是目前这方面的差别并不是特别大,因为方法都是相通的。”李广雨介绍。
产品:市场各有差异
考拉征信的产品,既有企业征信的产品,也有个人征信的产品。李广雨告诉网易科技,企业征信方面考拉征信和传统的征信企业差别不大,是靠和其他机构合作获得数据,比较有特色的是个人征信,因为有其母公司拉卡拉集团的自有数据。
目前考拉征信推出的产品有考拉信用分、商户分、职业分等。考拉信用采用国际通行的信用分值表现用户信用水平高低,最低300分最高850分,分数越高代表信用程度越好,违约可能性越低。
李广雨透露,考拉诚信分已经在拉卡拉小贷和其他小贷机构中使试用,目前坏账率保持在2%以下,远远低于行业平均水平。考拉商户分的模型还要跑一段时间,才能看出比较稳定的结果,但是考拉征信对这个产品很有信心,因为拉卡拉积累的个体工商户的经营数据是比较多的。
李广雨介绍,考拉征信未来一段时间的市场,主要集中在个体工商户征信和职业征信。
个体工商户的数量非常庞大,也有旺盛的征信需求,而且他们的数据银行没有覆盖到,有较好的市场前景。
职业征信,李广雨认为也有很大的市场空间。因为用人单位要招聘员工,现在很多是靠行业内互相打听,有时主观的成分较多,而且未必全面,如果能够提供相对全面客观的个人履历,对用人单位是有价值的。
关于隐私保护,李广雨认为,征信公司不可能出卖个人信息。首先,征信公司受《征信业管理条例》的约束,征信业管理条例的核心内容之一就是强调对个人隐私的保护,征信公司如果侵犯了个人隐私,是会被吊销牌照的,这个后果非常严重。其次,征信公司本身并不拥有数据,征信公司所使用的数据在数据来源方。征信公司只有在得到个人授权之后才会去这些平台上调取个人信息进行分析。目前征信公司向数据来源查询信息都是要付费的,如果没有个人用户授权和买单,征信公司去购买很多数据,成本是巨大的,征信公司难以承担。
“因此,隐私保护的问题,其核心其实在于——数据的来源方应当如何保护个人隐私。”李广雨指出。