【摘 要】
:
结合网络舆情分析的应用需求背景,首先介绍了文本信息的处理,然后探讨了文本聚类中的K-means算法,针对其对初始聚类中心的依赖性的特点,对算法加以改进。基于文档标题能够代
【机 构】
:
中国科学院研究生院,中国科学院沈阳计算技术研究所
论文部分内容阅读
结合网络舆情分析的应用需求背景,首先介绍了文本信息的处理,然后探讨了文本聚类中的K-means算法,针对其对初始聚类中心的依赖性的特点,对算法加以改进。基于文档标题能够代表文档内容的思想,改进算法采用稀疏特征向量表示文本标题,计算标题间的稀疏相似度,确定初始聚类中心。最后实验证明改进的K-means算法提高了聚类的准确度;与基于最大最小距离原则的初始中心选择算法比较,提高了执行效率,同时保证了聚类准确度。
其他文献
在水准观测中误差是不可避免的,我们要通过采取相应的观测措施,消除或者减弱误差,从而提高观测精度。
分析了Wald序贯概率比检验用于故障诊断残差检测时备选假设必须唯一确定所带来的潜在局限性。在残差为正态分布的条件下,针对这种局限性提出了一种改进方法,在残差检测过程不断
带状疱疹在前驱期(又称无疹期)未出现皮损前,一些患者常以腹痛为主诉就诊.涉及诸多科室。临床医师在遇腹痛患者时,应注意详细了解病史。进行全面细致的体格检查,包括对皮肤的检查。
针对液压混合动力车辆制动过程能量回收率较低的问题,搭建液压混合动力装载机联合制动系统的Simulink仿真模型,并采用自适应神经模糊控制(ANFIS)建立联合制动系统的控制器,然
现在是信息化时代,越来越多的人都离不开移动互联网,移动互联网给我们的生活带来了很大的便利。近几年来,在中国就业压力大的形势下,更多人选择在家自由无约束地工作。基于此
目的分析本院5年的静脉滴注莫西沙星致不良反应的发生情况和影响因素。方法收集接受莫西沙星静脉滴注抗菌治疗的患者,分析其不良反应发生情况。对患者性别、年龄、不良反应累
正因飞鹏推出的锂电池自动灭火系统,能够瞬间捕捉火情、快速降温灭火,并形成保护膜,不复燃,使其获得了2016年度锂电池灭火系统科技安全创新大奖,并且赢得了市场的一致认可。
为了解决夜间会车滥用远光灯造成驾驶员晕光的问题,提出一种在IHS色彩空间下改进Curvelet变换融合可见光与红外图像的抗晕光方法。该方法通过改进Curvelet变换实现图像二维细
跃参1号区块位于顺托果勒低隆北部。由于前期叠前时间偏移剖面存在以下问题:缝洞体绕射波的收敛没有完全到位,部分“串珠”有拖尾现象,影响了井位部署的精度。因此在该区块首
通过文献研究法,对RE-AIM框架内容及其在身体活动干预领域中的应用情况进行梳理。RE-AIM框架在身体活动干预领域正得到越来越广泛的应用,为针对不同人群、适用于不同环境的身