文本分类中基于概念映射的二次特征降维方法

来源 :计算机工程与应用 | 被引量 : 0次 | 上传用户:epaiai009
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
对高维特征集的降维是文本分类的一个主要问题。在分析现有特征降维方法的基础上,借助《知网》提出一种新的二次降维方法:采用传统的特征选择方法提取一个候选特征集合;利用《知网》对候选集合中的特征项进行概念映射,把大量底层分散的原始特征项替换成少量的高层概念进行第二次特征降维。实验表明,这种方法可以在减少文本语义信息丢失的前提下,有效地降低特征空间维数,提升文本分类的准确度。
其他文献
生态空间在城市中的重构、正在建设的城市群、健康发展的城市群经济等,这些对体育产业的发展有着十分突出的影响,在新型城镇化的大背景下这些影响会更为突出。通过培养体育产
本文分析了数字化图书馆建设的重要因素,结合自身馆建条件加快数字化建设的步伐,紧 跟时代要求,满足读者需求.
Designing energy-efficient Medium Access Control (MAC) protocols has a significant influence on the energy performance of wireless sensor network (WSN). In this
在多机器人协同搬运过程中,针对传统的强化学习算法仅使用数值分析却忽略了推理环节的问题,将多机器人的独立强化学习与“信念-愿望-意向”(BDI)模型相结合,使得多机器人系统拥有
考虑物流网络需求的不确定性,运用区间分析理念以区间数度量不确定性变量与参数,建立区间需求模式下的物流网络设计的混合整数规划模型,定义风险系数与最大约束偏差,对模型进行目
为了进一步提高检索系统的整体效率,提出了一种分块组织技术的倒排索引方法。具体研究过程是在数据统计的基础上产生倒排索引的检索性能模型,分析倒排文件分块索引项的组织策
针对退化图像复原问题,提出了一种基于高维空间几何理论(HDSG)的PSO-BP神经网络图像复原方法。高维空间几何理论中的同胚映射和同源连续性原理,把图像映射为高维空间中的一个点,通过回归原模糊图像和由此图像衍生出的几幅更加模糊的图像对应在空间中几个点的分布曲线,得到清晰的复原图像。在该理论基础上,用PSO-BP神经网络来确定高维空间中各点的关系,通过对训练样本的学习训练,在三幅退化图像与原始清晰图