机器学习中各类模型及其运用文献综述

 2022-09-02 20:50:03

机器学习中各类模型及其运用

摘要:机器学习是一个庞大的知识体系,它综合了多种学科的研究内容。在当下,机器学习的理论正日益趋于完善,所能应用到的领域也极其广泛。本文通过描述前人发现并得出的机器学习模型在金融行业,医学领域,人脸识别技术,彩票市场以及日常生活中决策方面的应用,极大地展现出机器学习模型强大的解决问题的能力。

关键词:金融大数据; 人脸识别; 神经网络; 决策树; ScoreNet模型

一.机器学习在金融大数据风险建模中的应用

当今社会,互联网金融和消费金融发展十分迅速,导致央行征信的劣势极为突出,央行个人征信中心目前收录到有8.6亿多人,然而只有3亿多人有信贷记录,完全没有达到数据的全面性和层次性,所以深度挖掘大数据信息,开发大数据风控模型,从而得以有效地评估和控制风险,已然成为21世纪的基本核心课题之一。

早在1941年,大卫杜兰特就用判别分析法评估了信用得分,从而得以预测出还贷者是否按时或按量还贷。1950年左右,比尔菲尔和Earl Isaac发明了逻辑回归模型和FICO信用评分体系,受到广大科学系的一致好评,因为其业务逻辑十分清晰,解释性也较强。然而之前所提到的方法都具有局限性:一方面,判别分析模型和逻辑回归模型都要求数据的完整性和有效性,另一方面,它们都只能研究线性问题,无法分析非线性的数据。

1943年,三人(M,W,WP)提出了神经网络模型,取得了突破性的进展。不久后,机器学习的概念被提出,支持向量机,这一在统计学中应用最广泛的的统计模型也被发现,之后提出的集成学习算法,使得算法的鲁棒性,稳定性和泛化性都有了明显的提高。目前机器学习在诸多领域有了实质性的进展,比如信息检索,语音和图像识别,推荐引擎,非结构化数控挖掘等等。在金融风控领域,虽然有一些推荐的算法比如随机森林模型能预测风险指标,但无论单一还是集成的学习算法,模型都十分复杂,对从业人员来说,是个不小的挑战。况且,由于模型过于复杂,解释性很多时候也会因此而丧失。

在传统的风控模型基础上,结合决策树模型和Logistic模型,建立起了T-L模型,再通过融合随机森林模型,能够建立起ScoreNet模型,此模型不仅保留了传统模型的稳定性和解释性,而且克服了传统模型对数据噪声敏感的缺陷。它具有广阔的应用空间,同时在金融风控领域,极大地提高了测评风险的能力,这种清晰的模型构架被受到了一致的好评。

在某一案例中,研究者利用ScoreNet技术,对用户违约风险进行了评估,主要涉及以下6个维度:身份信息,稳定性信息,金融申请信息,资产评估信息,商品消费信息和媒体阅览信息,其中子项大约1000个。结果显示,ScoreNet模型不仅维持了逻辑回归模型等传统模型的稳定性和解释性,其KS和AR的比值也被提升了0.05,ScoreNet的区分能力的强势,也能使得这种它能适应多种人群。

剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付

发小红书推广免费获取该资料资格。点击链接进入获取推广文案即可: Ai一键组稿 | 降AI率 | 降重复率 | 论文一键排版