【摘 要】
:
针对信用评价中最为常见的不平衡小样本数据集问题,以及不同误分类造成的损失代价不同问题,在传统SVM模型基础上,提出采用过采样的SMOTE算法解决数据不平衡问题。在核SVM模型的
论文部分内容阅读
针对信用评价中最为常见的不平衡小样本数据集问题,以及不同误分类造成的损失代价不同问题,在传统SVM模型基础上,提出采用过采样的SMOTE算法解决数据不平衡问题。在核SVM模型的基础上运用交叉验证得出核最优参数,加入非对称误差成本(DEC),提高将高风险误分为低风险的成本,建立更适用于信用评价的模型。经数据验证,该算法有效弥补了传统SVM模型在不平衡数据集分类中的缺陷,避免了小样本数据集样本过少而使得模型泛化能力降低的问题。加入DEC之后的模型与未加入的相比,虽分类准确率略有降低,但将高风险误分为低风险的错
其他文献
巡检作业是各行业生产和运行过程中的一项重要工作,而巡检系统的应用则可以很好地对巡检工作进行规范化管理。巡检数据是巡检系统的核心,良好的巡检数据存储将直接提升巡检系统处理数据的能力和效率。首先分析了巡检数据的基本特征,提出了"多元巡检数据"的概念,以位图的方式解决了非量化数据处理问题;其次针对该类型数据的树形结构特征,设计了一套基于"XML树-表"结构的多元巡检数据存储的方法;最后就上述方法进行实验
针对传统路径规划算法在求解静态已知环境下的最优或次优路径时存在转折次数过多、路径复杂等问题,提出一种基于极值法的移动机器人静态路径规划算法。在对环境建模时,采用边界
研究图像帧的准确定位检索问题。由于图像的语义特征与一般像素特征不同,包含图像固有属性、图像对象和人为意识三个特征,上述三个特征之间具有较大的逻辑无关性,造成以这三个特征为基础建立的语义检索模型很难形成统一的检索特征标准,多个特征的检索确认模式造成图像检索精度较低。为了避免上述缺陷,提出一种图像共现语义特征的关键帧定位技术,对计算机视觉图像进行分类处理,从而提取出与目标具有较强相关性的视觉图像,将获
移动学习研究的重点是学习资源建设与内容推荐。介绍了移动学习特点及移动学习资源、学习主体等要素,在此基础上,以高校为研究对象,采用调研方式获取大学生用户需求信息,完善
针对图像去噪的问题,提出了一种自适应范数及正则化参数的图像重建方法。首先,考虑到退化图像不仅含有高斯噪声,而且含有拉普拉斯噪声,利用最大似然估计的思想估计高斯噪声和拉普拉斯噪声的标准差;其次,由于在图像重建过程中,噪声分布会发生变化,为此,构造基于统计量的高斯和拉普拉斯权重函数,整合L_1、L_2范数,设计一种自适应加权函数;最后,结合自适应正则化参数方法,设计了一种自适应L_1、L_2范数及正则
为了合理安排电力系统的中期运行计划,针对月负荷曲线的特点,提出一种基于小波变换、无偏灰色预测模型和RBF(径向基函数)神经网络的月度电力负荷混合预测方法。首先,基于小波变换将月负荷历史数据进行分解,表明月度负荷具有连续增长和周期性波动的特征分量。其次,针对各分量不同变化规律,分别采用不同的预测法进行预测:针对连续增长的分量,采用无偏灰色预测模型进行预测;针对周期性波动的分量,采用RBF神经网络法进
大数据时代,对大规模数据的分析和处理提出了更高要求。非负矩阵分解作为一种高效方法被广泛应用于数据降维和特征提取,有效减少了大规模数据的复杂运算,但存在计算过程繁琐的弊
传统数据库处理分析大量历史数据的性能有限,无法达到满意效果。针对该问题,通过对商立方体的研究,提出等价区间的概念,并利用区间之间的独立性,使商立方体能更好地适应分布
信息化的推进加快了慕课的发展,在慕课学习过程中积累了大量的学习者学习行为数据,合理利用这些行为数据可进一步提升学习者的学习效果。运用社会网络分析方法对《微课设计与
仿射传播聚类算法是一种比较新的基于质心的聚类算法,在图像分割领域得到了广泛应用。仿射传播聚类算法最终聚类数目会受到偏向参数P(Preference)的影响,得到的聚类数目往往偏多,影响分割质量。鉴于此,提出一种改进的仿射传播聚类的图像分割算法,该算法将仿射传播聚类算法与CURE层次聚类算法相结合,CURE算法能够对仿射传播聚类算法的分割结果进行优化。实验验证表明,改进后的算法图像分割效果更好。