论文部分内容阅读
通过计算数据集与样本集在主题特征向量上的相似度对数据集进行信息筛选与分类处理,以便有效地组织和分析交通管理领域内的数据资源,使查询结果分布在最相关的数据集中。利用Hadoop分布式应用程序框架使各工作节点协同完成索引的构建。根据用户查询的类别,只在最相关主题索引库中进行查找,以提高检索效率。