侵权投诉
订阅
纠错
加入自媒体

数据生意:全面解析阿里云技术

2014-10-14 01:08
苏子言岁月
关注

  作为互联网金融领域的先行者,成立于2009年底的阿里小贷发展初衷即是为淘宝和天猫上的卖家提供小额贷款业务,实现“让天下没有难做的生意”的目标。伴随产品形态的丰富,服务对象的扩展,小贷业务增长迅速,平均每年增长速度在四到五倍左右。经历了近5年的发展,已有超过36万人从阿里小贷借款,最小贷款额为1元。

  与传统银行不同的是,阿里小贷重塑了一套信用评价体系和信用概念,其小额贷款模式不需要抵押物,是纯信用贷款。信用从何而来?来源于贷款者线上经营信用数据、财务数据等等,阿里小贷对贷款者在互联网上积累的海量数据进行分析予以授信。数据成为阿里小贷业务模式的基础,也是核心所在。究其根本,这是一笔数据生意。

  这笔数据生意,从第一天起,就根植于阿里云计算飞天平台之上。

  数据驱动增长,掘金阿里数据

  “3分钟申请、1秒放款、0人工干预”,这是阿里小贷独有的一套高效工作模式,这样的高效有赖于其背后独特的业务模式,它将是否放贷、贷款额度和风险评估等传统银行最为看重的业务环节完全交给了大数据处理平台。阿里小贷数据仓库的总共数据量十多PB。每天处理上PB的数据量,包括店铺等级、收藏、评价等几百亿个信息项,运算上百个数据模型,甚至需要测评用户对假设情景的掩饰和撒谎程度。最终用户能否申请贷款、能贷到多少钱,完全依靠的是大数据平台为其计算出来的信用值。这些无疑对大数据处理平台的可靠性、安全性以及计算的准确性提出了极高要求,算错一笔可能就会造成比较大的资金损失。

  为了确保数据计算的准确性,阿里小贷要从各个层面去挖掘申请贷款的卖家或者消费者的信息,这个过程几乎会用到整个阿里集团包括淘宝、天猫、B2B和1688等多个业务部门的数据,以及集团外部的社会征信数据。这也使得阿里小贷聚集了多个项目的技术骨干。其中,负责阿里小贷数据仓库的基础模型和基础平台建设的架构师陈鹏宇和负责早期运维工作的资深经理张国保就是项目中重要的技术负责人。近日,他们深入分享了阿里小贷技术演进历程。

  据他们介绍,小贷业务目前每天从外部同步过来的数据量上百TB。数据同步过来之后要经过小贷数据仓库的三层加工,加工结果以指标(输出模型要用到的离线变量)的形式传递到阿里集团的通用决策系统AGDS。通用决策系统能够支持上万种数据仓库提供的离线变量,包括买家、卖家及店铺交易等所反映出的众多数据。此外,它还会从其他系统获取一些实时信息,如卖家当前的交易情况、具体的处罚情况等,并结合这些实时数据和数据仓库的离线变量动态计算卖家的风险程度和授信模型。因此,通用决策模型是小贷真正的业务引擎,其上大约有几千条规则,可以理解成一条有几千变量的公式,能算出卖家的最终授信模型。在放贷系统申请时,这个引擎就能告知它是否可以放贷、大约可以放多少钱等。这便是小贷依据数据计算做业务决策的整个过程,如图1所示。

  此外,阿里小贷的业务特点决定它对安全性和实时性也有很高要求。阿里小贷使用了多方数据,包括集团内部的数据以及其他合作伙伴提供的数据。这些数据都高度敏感,阿里小贷作为使用方有义务确保数据安全,因此对平台的安全性有较高要求。而且发放贷款之后,要做好贷后监控。小贷通常会根据贷款人的网上行为数据,对其信用风险进行评估。这种评估做得越及时,就越有可能在出现异常时提前发出预警、挽回损失。而准确性、安全性和实时性等阿里小贷的核心业务特性都得到飞天平台的有力支持。

1  2  3  下一页>  
声明: 本文由入驻维科号的作者撰写,观点仅代表作者本人,不代表OFweek立场。如有侵权或其他问题,请联系举报。

发表评论

0条评论,0人参与

请输入评论内容...

请输入评论/评论长度6~500个字

您提交的评论过于频繁,请输入验证码继续

暂无评论

暂无评论

文章纠错
x
*文字标题:
*纠错内容:
联系邮箱:
*验 证 码:

粤公网安备 44030502002758号