论文部分内容阅读
针对目前通用搜索引擎对林业主题信息覆盖率和查准率较低的不足,提出了一种基于Shark—Search算法的林业主题爬虫设计方案。详细讨论了该主题爬虫的爬行策略、算法描述及实现,并通过实践构建了林业主题搜索引擎“搜林”。实验结果表明,相对于通用搜索引擎,“搜林”减少了搜索结果的信息量,提高了林业主题信息搜索的准确率。