摘要
银行对一个国家的经济发展有着直观重要的影响,银行的破产与倒闭对个人、企业乃至国家都会产生重大的冲击,因此银行效率的评估与破产成因的分析至关重要。通过数学建模和数据挖掘技术对波兰银行数据集的银行进行效率评估和破产成因分析、破产概率预测。对于银行效率评估,首先定性地筛选出了哪些指标是投入型指标,哪些指标是产出型指标。对于每大类指标,构造熵权模型并引进权重分别累计函数筛选出了9个投入型指标和6个产出型指标,并在此基础上构造了数据包络分析模型对银行效率进行评估。最终从效率的角度,得到破产银行与未破产银行的效率分界线为0.6013。对于银行破产概率的预测,首先提出了超距离和函数的概念进行银行的选取,并使用蒙特卡洛算法求解使得超距离和函数最大的银行组合。基于筛选出来的银行组合,建立了KNN模型对银行破产的概率进行预测。对于银行数据来源分析,首先使用余弦相似度和阈值判断哪些数据可能属于同一家银行,算法的时间复杂度在最坏的情况下为O(n2)。在正文的最后,对每个模型进行了分析和改进。