石家庄经济学院华信学院
结课
题目:对信用卡用户的数据分析
专 业 工商管理
学 号
学 生 姓 名
指 导 教 师
2014年12月2日
第一章 信用卡用户历史数据分析的目的及背景
1.1研究目的
通过对某银行信用卡用户的历史数据分析,了解信用卡用户逾期不还的行为特征,为将来新客户办卡的信用评级提供参考。
1.2背景介绍
随着信用卡市场的不断发展,发卡银行面临的风险也日益显现,如信用风险、流动风险、市场风险等。尤其是信用卡作为无担保的信用贷款金融产品,虽然贷款基于消费,且基本为小额,但客户群体众多,审核手续简单,在银行对客户信息收集、信息筛选中都面临各种问题,由于客户收入变化,或是恶意拖欠会造成较大的信用风险,即使存在有效的风险监控机制,事后逾期催收手段,同样面临较高的交易成本。据研究资料和实务数据统计分析,信用风险所造成的损失占商业银行信用卡业务风险损失的90%,因此信用风险是造成信用卡业务资产损失的主要原因,商业银行在开展信用卡业务时必须有效控制信用风险,从理论上、实践中对信用风险进行识别和控制。
因此为了进一步的保证对信用卡业务风险的控制,需要对客户的个人信息、用卡习惯等进行分析,找出能归纳定义持卡人信用风险的特征,并在审核和授信环节进行控制,最大限度地降低信用风险,减少因信用风险造成银行资金损失的概率。目前银行业界尚缺少对此系统的理论研究,在实务操作中也仍处于摸索阶段。因此研究信用卡用户个人信用评估这一论题对促进银行业务的创新,推进风险管理框架的构建,保持银行业持续、稳定和健康发展具有深刻的现实意义。
1.3信用评级的意义
信用评级(CreditRating),又称资信评级,是一种社会中介服务为社会提供资信信息,或为单位自身提供决策参考。信用评级最初产生于20世纪初期的美国。1902年,穆迪公司的创始人约翰·穆迪开始对当时发行的铁路债券进行评级。后来延伸到各种金融产品及各种评估对象。信用评级的目的是显示受评对象信贷违约风险的大小,一般由某些专门信用评估机构进行。 评估机构针对受评对象金融状况和有关历史的数据进行调查、分析,从而对受评对象的金融信用状况给出一个总体的评价。
信用卡公司和发卡银行面对的最大风险来自于违约风险。历年央行发布的《支付体系总体情况》显示,全国信用卡透支额度非常之高,信用卡坏账风险也随之加大,逾期半年未偿还的信贷总额高达几十亿上百亿甚至更多。造成这种局面的主要原因是银行和信用卡公司对信用较差的客户的积累且没有切实可行的
对其评价并寻求解决方法,从而使便利信用卡的门槛过低,吸引了各样的人但又没有可行的监管体系。这就使得银行及信用卡公司的办卡客户广泛,其中就包括例如大学生等缺乏还款能力的人群,而这也正是银行和信用卡公司的病痛所在。因此必须对信用卡用户进行评级,对用户数据进行分析,利用大数据对客户有一个明确的认识和了解,才能形成一个完善的评级监管体系,从而降低坏账率及逾期不还率,提高银行及信用卡公司的营收能力。
第二章 数据介绍与分析
2.1数据介绍
某年度随机抽取的8372 个信用卡用户,对8372个持卡用户进行调查。一下简要介绍一下数据的自变量和因变量。利用R中的head函数列出该数据集的六行数据,进而对数据有一个基本的认识。详见如下
--
性别
使用率
额度
房贷月供
逾期次数
开户数
预期状态
7390
男
0.08
10000
2680
0
0
0
6306
男
1.00
5000
0
1
0
0
807
男
0.00
2000
0
1
0
2
5154
女
0.95
5000
0
5
11
1
3616
女
0.36
3000
851
0
4
3
5140
男
1.01
5000
0
8
5
4
表2-1 信用卡用户使用情况
因变量是该用户最近的逾期状态,有8个不同取值,分别为0=没有逾期. 1= 逾期1-30天. 2= 逾期31-60天. 3= 逾期61-90天. 4= 逾期91-120天. 5= 逾期121-150天. 6= 逾期151-180天. 7= 逾期180天以上。如表2-2所示
Y
逾期状态
0
没有逾期
1
逾期1-30天
2
逾期31-60天
3
逾期61-90天
4
逾期91-120天
5
逾期121-150天
6
逾期151-180天
7
逾期180天以上
表2-2信用卡用户逾期状态表
解释变量有:信用卡使用率,该指标的具体定义没有给出,简单地说,该指标越高,
相应的信用卡使用的频率越高;信用卡额度;住房贷款月供(有可能是0);最近一次逾期之前的历史逾期赖账次数;同一个客户开户的次数。如表2-3所示
自变量
含义解释
性别
男和女
信用卡使用率
指标越高使用率越高
信用卡额度
信用卡可用额度
住房贷款月供
每月缴纳的房贷金额
历史逾期赖账次数
最近一次逾期前的历史逾期赖账次数
客户开户的次数
同一客户所拥有的信用卡数量
表2-3自变量解释表
2.2数据分析
该数据类型多样,有属性数据,也有技术数据,所以需要根据相应的数据采用不同的分析方法。首先考虑第一个自变量“X1=性别”。该因素是属性变量,具有两个不同的水平,可与因变量做一个分析表,如表2-4所示,该表的每个单元格列出了该单元格频数所对应的在总数据表中的比例、在本行中的比例以及在本列中的比例。将Y即因变量的8个不同取值( 0=没有逾期. 1= 逾期1-30天. 2= 逾期31-60天. 3= 逾期61-90天. 4= 逾期91-120天. 5= 逾期121-150天. 6= 逾期151-180天. 7= 逾期180天以上)与X1=性别进行全方面计算对比,从每行比例中可以看出,逾期状态与男性逾期率成正比,逾期状态逐渐上升,男性逾期率也随之变大,说明男性更容易逾期。而女性则表现得相对平稳,没有像男性那样的波动和随着逾期状态的上升而逾期率也变大,所以可以看出女性逾期情况较好。
Y
X1
频数
百分比
行百分比
列百分比
男性
女性
合计
0
2040
24.37
63.39
35.72
1178
14.07
36.60
44.27
3218
36.44
1
844
10.08
67.68
14.78
403
4.81
32.31
15.14
1247
14.90
2
1518
18.13
71.84
26.58
595
7.10
28.15
22.36
2113
25.24
3
850
10.15
72.77
14.89
318
3.80
27.23
11.95
1168
13.95
4
214
2.56
71.10
3.75
87
1.04
28.90
3.27
301
3.60
5
95
1.13
76.00
1.66
30
0.36
24.00
1.13
125
1.49
6
68
0.81
76.40
1.19
21
0.25
23.60
0.79
89
1.06
7
81
0.97
73.64
1.42
29
0.35
26.36
1.09
110
1.31
合计
5710
68.21
2661
31.79
8371
100.00
表2-4信用卡用户性别变量X1与逾期状态变量Y的列表分析
除去X1的其他变量,即X2- X6,X2(信用卡使用率)、X3(信用卡额度)、X4(房贷月供)、X5(历史逾越次数)、X6(用户开户数。这些变量都是取值为正的技术变量或者指标,这些变量均为随机变量。由此便可以做出分层次的解决方法,即探索X2- X6|Y=y的基本统计特征。这里采用的是均值和方差两个方法,对其进行研究分析,如表2-5和表2-6所示。
Y
X2
X3
X4
X5
X6
0
0.48
6142.62
1159.44
0.45
3.13
1
0.70
4971.93
616.66
1.50
3.76
2
0.61
4503.17
474.68
2.04
2.71
3
0.76
4451.31
433.47
2.95
4.03
4
0.81
4001.33
507.40
2.89
5.48
5
0.81
4463.20
686.00
1.84
5.38
6
0.70
4480.90
340.55
2.72
4.82
7
0.74
4279.46
392.24
2.33
5.29
表2-5 X2- X6样本均值计算结果
由上表2-5可得出,Y(逾期状态)与X2(信用卡使用率)、X6(用户开户数)这三个变量有较强的正相关性,而Y(逾期状态)与X3(信用卡额度)、X4(房贷月供)这两个解释变量之间的负相关性相对较强。
Y
X2
X3
X4
X5
X6
0
0.45
5772.24
8120.83
1.10
4.52
1
0.46
3735.67
2165.70
2.14
4.94
2
0.44
3653.73
2635.95
2.61
3.90
3
0.58
3703.34
1791.64
3.52
4.84
4
0.49
2532.73
2047.71
3.40
5.21
5
0.46
2654.87
3866.99
2.20
5.38
6
0.48
2337.05
1792.50
3.44
5.13
7
0.57
2884.32
1166.78
2.54
5.99
表2-6 X2- X6样本标准差计算结果
而从表2-6中则可以看出,每一列的标准差数量级是一致的,由此可以从稳定性角度说明由表2-5(X2- X6样本均值结果)得出的相关性是比较准确的。
第三章 总结及建议
本文通过对样本资料具体分析,可以看出个人信用体系还不健全,人们的信用意识比较淡漠,对于信用重视程度不高,这在一定程度上影响发卡机构对信用卡申请者的审核及对其信用额度的确定,因此会出现逾期率较高、坏账率较高的现象。而个人信用信息数据库存放的数据只是客户的历史信用数据,这只能杜绝已有违约记录或贷款过多的恶意贷款,对新发生的贷款和没有逾期记录的贷款不能实施有效的信用风险评估及管理,这种状况存在着不可避免的信用风险,同时会造成发卡机构的损失,大大增加了经营的成本。
针对以上问题,提出以下建议:
为促进信用卡分发机构的发展及
信用卡用户的行为,使信用卡分发机构更完善,使持卡者素质提高,应建立成熟的信用卡业务
, 建立科学的信用卡账户管理平台,完善信用卡业务技术上的缺点,完善信用卡业务技术上的缺点,加强监管力度,建立健全相关的法律规范,加快完善个人信用征信体系,优化信用卡业务的使用环境。进而创造一个创造一个优质、安全的信用卡业务使用环境。