一种大容量文本集的智能检索方法

来源 :计算机工程与应用 | 被引量 : 0次 | 上传用户:xiaoyeziagan
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
分析了潜在语义模型,研究了潜在语义空间中文本的表示方法,提出了一种大容量文本集的检索策略。检索过程由粗粒度非相关剔除和相关文本的精确检索两个步骤组成。使用潜在语义空间模型对文本集进行初步的筛选,剔除非相关文本;使用大规模文本检索方法对相关文本在段落一级进行精确检索,其中为了提高检索的执行效率,在检索算法中引入了遗传算法;输出这些候选的段落序号。实验结果证明了这种方法的有效性和高效性。
其他文献
目的研究四制香附丸机械制丸的工艺参数,确定最佳工艺参数,并进行工艺验证。方法首先制得四制香附丸粉,然后以丸药圆整度、重量差异为评价指标,优选四制香附丸的制丸工艺参数
红磷在燃烧时不可能将装置内氧气完全耗尽,利用手持技术测定红磷燃烧后装置内的氧含量为8.85%。经进一步研究表明,运用压强传感器测定白磷燃烧前后的压强变化,可以测定出空气
减量构造Voronoi划分(DCVT)是利用已有的Voronoi划分,局部重构删除节点后的Voronoi划分。详细分析删除一个节点对其他节点的Voronoi区域的影响,将DCVT的主要工作简化为求解一个
国际上对于跨境贸易的增值税,普遍遵循消费地征税原则,实行进口国征税、出口国按照零税率退税的制度,以消除国际间的增值税重复征税。目前,国际上对于什么是跨境服务消费地及
对粒群优化算法进行了改进,提出了一种微粒群优化和视觉感应相结合的图像增强方法,通过微粒群算法优化灰度图像的平均明暗信息熵差值,自适应地选择图像灰度转换函数,用以实现图像的增强。该方法不仅参数个数少,优化速度快,在搜索能力上优于粒群优化算法,而且能够保证算法的全局收敛性。仿真实例证明了该方法在图像增强上的有效性和优越性。