基于K-means与FCA的网页文本聚类算法的研究

来源 :计算机时代 | 被引量 : 0次 | 上传用户:liuln6
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
搜索引擎针对某个查询条件返回给用户的查询结果可能数量非常巨大,要从这么多的返回信息中找到所需要的信息是很困难的.研究聚类算法是为了帮助用户更好地查询到自己所需要的和感兴趣的信息.提出采用基于K-means与FCA的网页文本聚类算法,并分析了两种算法各自的优势与缺点,为研究更优的网页文本聚类算法提供依据.
其他文献
分析了目前我国山区道路交通事故的路况影响因素及其与山区道路交通事故之间的关系。结合地区的交通发展状况利用全概率公式测算出各因素可能导致交通事故的概率及相应的危险系数;在实时勘测各因素的基础上,结合样本库中的数据,判断出车辆是否处于安全状态,对于处于非安全状态的车辆进行车牌定位。
摘 要: 探讨了高等学校创新计算机基础课程教学思路。结合社会对计算机应用人才的需求和高校计算机人才培养模式,联系高校的实际情况,对高校计算机基础教学的创新改革思路进行了详细的阐述。指出计算机基础教育多元化、专业化、创新化趋势和构建计算机教学的新理念、新视野、新方法的必要性和必然性。  关键词: 创新; 计算机基础课程; 教学改革; 人才培养  中图分类号:G642 文献标志码:A 文章编号:100
预计2018年智能手机将成为AI应用破局点。AI有助于打破智能手机的创新瓶颈,是智能手机差异化的发展方向。谁抢占了AI,谁就抢占了智能手机发展的制高点。过去的2017年可以说是
从我国村民自治政策实施效果来看,社会自主性的发育与发展离不开以下四个基础性条件:(1)经济发展;(2)利益分化;(3)公民素质;(4)政府控制和主导社会力量的程度。而后者更具决定性作用。
为有效推进高校信息化建设进度并保障建设成效,研究专业人才队伍的建设和管理至关重要。在剖析高校信息化专业人才内涵的基础上,深入分析了目前高校信息化专业人才的管理模式,总
目前,运营商话音业务进一步萎缩,数据业务又面临剪刀差挑战,如何寻找新的机会点,实现有质量的可持续增长,是运营商与产业企业共同关注的话题。2017年已经逝去,通信业迎来充满
近日,中国铁塔召开2018年工作会议。会议数据显示,中同铁塔经济效益和社会效益十分显著,铁塔共享率由成立前14.3%增至43%,新建铁塔共享率更是迅速提升至70.4%,累计相当于少建铁塔60.3万
坚持最严格的耕地保护制度和实行最严格的节约用地制度,是十七届三中全会提出的我国农村土地管理的主要目标,为我国建设节约集约型社会、推动农村土地改革指明了方向。耕地保护
针对目前部分高等院校网络工程专业办学特色不够鲜明的问题,提出在网络工程专业中开设与信息安全相结合的网络安全与管理方向。进一步讨论了网络安全与管理方向教学的知识结构
介绍了μC/FS嵌入式文件系统的主要功能,着重说明了μC/FS的移植步骤,实现了μC/FS在SD上的移植。测试结果表明,基于SD卡的μC/FS文件系统移植在采集系统中的应用满足了设计