基于网页聚类的搜索结果优化算法研究

来源 :计算机应用 | 被引量 : 6次 | 上传用户:yangzhibo0508
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对目前搜索引擎搜索结果中普遍存在大量重复网页的现象,提出了一种基于聚类算法DBSCAN的搜索结果优化算法。该算法选取源搜索结果中排名靠前的部分网页,对这部分网页根据网页相似度进行DBSCAN聚类,最大限度剔除冗余网页,实现搜索结果的优化。实验结果表明本算法可以提高搜索结果的全面性和准确性,提升用户使用搜索引擎的满意度。
其他文献
大多数图像编码前所采用的预处理方法都会造成一定程度的信息损失。以提高图像的熵编码效率为目的,提出一种自适应可逆图像预处理方法——基于相邻像素相似性的可逆图像变换,它包括8像素和4像素处理下的多种模式。在对图像做位平面分解后进行基于相邻像素相似性的可逆图像变换,并选择多种变换方式下具有最小熵的变换图像作为预处理输出,其直方图呈现出U型分布。实验结果表明,该预处理方法改变了图像的统计特性,从而提高了图
现有的多数人脸识别系统都专注于如何提高人脸识别算法的性能,但缺乏一种对数据源(人脸样本)进行分析和评估的机制。针对此问题,提出了一种建立在数据源分析基础上对典型人脸识别算法进行后处理的方法。为了揭示现有典型识别算法的识别性能在无约束环境下的鲁棒性,通过建立Lambertian反射模型和3D人脸模型,对特征脸算法的识别性能随数据源的变化(人脸姿态和光照改变)而变化的情况进行了分析评估。针对"数据源灾
根据《广东省2017年毕业生就业白皮书》的数据建立创新创业教育效率评价指标体系,运用非导向的SBM模型对广东省52家公办高职院校进行实证研究,并将评价结果与传统的DEA评价方
背景:自噬、氧化应激及炎症反应在非酒精性脂肪肝病中扮演重要角色,姜黄素具有调节自噬、氧化应激及炎症反应等生物活性。目的:探讨姜黄素对非酒精性脂肪肝病大鼠模型保护作
当前,电气工程的投资占整个建筑物建设投资的比重越来越大。电气工程的监理工作也随之贯穿于整个建设工程的始末,是建筑工程监理中的重要组成部分。坚持超前主动监理的思想,
介绍了三维视频编码的核心技术。首先比较了纯视频格式和深度增强格式三维视频编码技术的发展方向及面临的挑战,其中重点分析了深度估计技术和视点合成技术的研究思路;然后概括了国际3DV/FTV标准的制定现状;最后对三维视频编码技术进行了总结和展望。