论文部分内容阅读
中国金融行业的飞速发展和金融数据的爆炸式增长衍生出了对金融领域数据挖掘技术的探索需求。尤其在信用风险管理领域,传统的专家系统方法具有较高的主观性,一般性的判别方法难以应对日益复杂的高维数据,而各类数据挖掘技术展现出了客观性和准确性的优势。聚类分析是一种重要的无监督式数据挖掘技术,能够在没有训练样本的情况下,通过数据内部的联系识别横截面维度和时间维度上各类样本的特征,对信用风险评价问题和信用风险联动性分析问题具有较强的适用性。然而现有聚类算法在处理高维信用风险数据时存在聚类目标函数单一、算法鲁棒性较差、易陷入局部最优等不足。针对这些问题,提出了一种面向信用风险高维数据的聚类算法,并将其应用于截面数据和时间序列数据两种数据类型的信用风险管理问题的研究中。具体进行了如下工作:提出基于参考向量的多目标进化聚类算法(Reference Vector-based MultiObjective Clustering,RVMOC)。借鉴子空间聚类思想,建立针对信用风险高维数据聚类的多目标优化问题,并采用进化算法求解。在算法中设计了基于参考向量的局部搜索方法以提高算法准确性,提出了基于集成聚类的最终解选择方法以从最后一代解集中得到最终聚类结果。使用标杆数据集和其他对比算法对提出的RVMOC算法和其中的各环节进行了对比测试;信用风险应用研究一:面向截面数据的上市公司信用风险评价研究。构建上市公司信用风险指标评价体系和信用风险判别准则,使用提出的RVMOC算法对上市公司财务数据进行聚类,判断样本公司是否存在较高信用风险,并识别影响信用风险的关键因素;信用风险应用研究二:面向时间序列的证券公司信用风险联动性研究。利用CCA模型测度中国上市证券公司信用风险,得到时间序列结果数据,并使用提出的RVMOC算法对其进行完整时间序列聚类和子时间序列聚类,识别不同证券公司的信用风险特征,讨论了风险联动性与系统性信用风险之间的关系。实验结果验证了提出的RVMOC算法在处理高维数据聚类的问题上的准确性和鲁棒性。在信用风险管理的应用研究中,研究结论指出了在评价上市公司信用风险时,综合近两年的财务数据更能准确地得到评价结果。提前两年的盈利能力指标以及提前一年的盈利能力、偿债能力和成长能力指标具有重要参考意义;证券公司风险联动性的加强会导致系统性信用风险的积累,在风险事件的发酵下引发大规模风险爆发,而公司之间的风险联动性下降时,能提高证券公司体系面对风险的抵御能力,使风险逐渐回归正常水平。