1. 研究目的与意义
随着国民收入的提高和居民消费观念的转变,信用卡业务在我国得到了长足的发展,发卡数量、发卡银行和交易额都有了显著的提高。
然而,随着信用卡交易额提高的同时,其逾期未偿金额也在大幅度提高。
为了保持信用卡行业持续、稳定的发展,这不得不值得我国商业银行高度重视。
2. 研究内容和预期目标
研究内容:第一章,绪论部分,该部分主要介绍了本文的研究背景、内容、方法以及研究的意义所在。
第二章,机器学习模型简介,如随机森林、支持向量机。
第三章,介绍并描述信用卡数据集所包含的变量,确定研究路线。
3. 国内外研究现状
近年来,国内外学者对信用卡违约概率的研究很多,目前已有的研究特点主要集中体现在以下几个方面:(1)目前我国大多数学者均从用户的个体特征出发,研究教育水平、性别、年龄以及总信用额度、月份的消费及还贷情况等对信用违约与否有着明显的影响,大致有如下一些结论:有本地户的人比外地人的违约概率低;年龄在30岁以上的申请人的违约概率低;本科以上或者中级职称以上的人的违约概率低;机关事业单位、国有企业职工的违约概率低;月还款之和/家庭月收入、贷款本金之和/家庭年收入这两个比例越高,客户的违约概率也越大;存在信用不良记录的客户的违约概率越高;为他人提供担保的客户的违约概率较高;已有一套或一套以上住房的客户违约概率较低;有失业保险的客户违约率较低;有住房公积金的客户违约率较低;贷款逾期次数越少,违约率较低;首付比率越高,违约率越低。
(2)王颖、聂广礼等人(2012)主要运用logistics回归模型建模分析得出结论:1)现阶段,我国商业银行应结合自身特点,采用专家判断和信用评分模型相结合的方法计量信用风险,提高信贷风险控制的制度化和规范化水平。
与此同时,商业银行也要积极注意积累数据,积极创造条件逐步向运用内部模型度量信用风险过渡。
4. 计划与进度安排
第一阶段(准备阶段)2022.10.1-2022.1.15:
1、研究方向的确定、题目确定;2、收集数据、查阅文献、导师指导、完成开题报告、确定研究方法。
第二阶段(实施阶段)2022.1.16-2022.5.1:
5. 参考文献
[1] 聂雨. 基于数据挖掘的信用卡个人客户信用评价研究[D]: [硕士学位论文]. 西安: 西安科技大学, 2012.[2] 崔萌. 基于CPV 模型和压力测试的我国商业银行信用风险研究[D]: [硕士学位论文]. 长春: 吉林大学, 2013.[3] 高嘉晔. 信用卡违约风险影响因素实证研究[D]: [硕士学位论文]. 大连: 东北财经大学, 2014.[4] 朱醒亮, 王佳, 葛姣菊. 基于 Probit 模型对消费者信用卡还贷影响因素的实证分析[J]. 消费经济, 2013(4): 48-51.[5] 徐少锋, 王延臣. 个人信用评估中的Logistic 模型[J]. 天津科技大学学报, 2003(12): 46-49.[6] 石庆焱. 一个基于神经网络--Logistic 回归的混合两阶段个人信用评分模型研究[J]. 统计研究, 2005(5): 45-49.[7] 方匡南, 章贵军, 张惠颖. 基于Lasso-Logistic 模型的个人信用风险预警方法[J]. 数量经济技术经济研究,2014(2): 125-136.[8] 周丽峰. 基于非平衡数据分类的贷款违约预测研究[D]: [硕士学位论文]. 长沙: 中南大学, 2013.[9] 佚文. 机器学习中的算法(1)--决策树模型组合之随机森林与GBDT [DB/OL].http://www.cnblogs.com/LeftNotEasy/archive/2011/03/07/random-forest-and-gbdt.html, 2011.[10] 李伯韬. Spark 随机深林扩展--OOB 错误评估和变量权重[DB/OL].http://www.cnblogs.com/bourneli/p/4536778.html, 2015.[11] 佚文. 不平衡数据下的机器学习方法简介[DB/OL]. http://www.jianshu.com/p/3e8b9f2764c8, 2015.[12] Chawla, N.V., Bowyer, K.W., Hall, L.O. and Kegelmeyer, W.P. (2002) SMOTE: Synthetic Minority Over-SamplingTechnique. Journal of Artificial Intelligence Research, 16, 321-357.
以上是毕业论文开题报告,课题毕业论文、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。