【摘 要】
:
随着关键词查询技术的飞速发展和互联网数据的迅猛增长,高效、准确的数据源选择变得十分有意义。提出了一种基于倒排列表的数据源选择方式,通过这种方式,能够在短时间内选择
【基金项目】
:
The National Natural Science Foundation of China under Grant No. 60873065(国家自然科学基金), the National High-Teeh Research and Development Plan of China under Grant No. 2009AA011906 (国家高技术研究发展计划(863)), Rese
论文部分内容阅读
随着关键词查询技术的飞速发展和互联网数据的迅猛增长,高效、准确的数据源选择变得十分有意义。提出了一种基于倒排列表的数据源选择方式,通过这种方式,能够在短时间内选择出相关度高的数据源,在这些数据源中执行检索,从而减少查询时间,给用户带来了更好的查询体验。从实验结果可以看出,这种方法在实际系统(例如机票查询系统)中可以得到很好的效果。为了在大规模的数据集上高效地实现相关算法,将min-hash算法应用到相似度估计中来,减少了查询空间和时间的消耗。与传统算法的比较结果表明:min-hash算法能够得到较高的精确
其他文献
LS一Ⅲ型自调宽温低浓度镀铬添加剂适用于在宽温范围(16℃~50℃)、低铬酐浓度(140g/l~180g/l)、低电流密度条件下镀铬.与目前传统镀铬工艺相比,镀铬分散能力提高50%,深镀能力提
家用电器的广泛使用而产生的电子污染--静电的危害,已开始引起人们的关注.首先静电可以吸附周围的灰尘积聚在屏幕上,影响显示器清晰度及人们的视觉效果.其次由于机壳本身的静
分析了面向先进硬件平台上的数据库优化技术,提出了基于内存存储模型的多表连接查询处理优化技术,采用内存存储模型存储维表并对维表主键进行顺序化,从而使维表的主键与内存维表
在多重中断C程序中,中断嵌套可能会导致一些非期望的交叠执行,从而造成错误的程序执行结果。典型的问题是共享变量引起的数据竞争破坏了程序的原子性。针对此类问题,对多重中断c
嵌入式软件复杂度的提高加剧了软件风险。研究了嵌入式软件的特点和发展趋势,提出了基于Trustie环境的嵌入式软件生产线的构建方法,阐述了调度分析、代码自动生成和多余度调试
随着普适计算技术、定位技术、移动通讯技术的进步,移动对象数据管理技术在诸多领域中得到广泛应用。在移动对象数据管理领域中,隐私保护是一个不可忽视的问题。用户不仅期望