基于Hadoop的物联网(WoT)搜索引擎设计与实现

来源 :北京邮电大学 | 被引量 : 1次 | 上传用户:C1335639
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
感知设备的搜索是物联网发展道路上的关键一环,是物联网应用的前提,目前尚未有成熟的解决方案,而面向互联网的传统搜索引擎技术却已相当成熟,重用这些技术,对发展物联网搜索无疑是一种助力。另外,开源分布式计算平台Hadoop凭借易扩展、海量数据存储和超强计算能力被产业界和学术界视为大数据处理最重要的工具,除此之外,Hadoop可以被广泛地部署于廉价PC之上,能够降低生产成本。在此背景之下,本课题设计并实现了一个“基于Hadoop的物联网(WoT)搜索引擎”,它含有查询扩展模块和分布式倒排索引系统两个核心组成部分。本课题研究工作的主要内容如下:为了克服传统搜索引擎技术基于关键词进行机械式地符号匹配所带来的查全率低下的问题,查询扩展模块中引用一个已有的物联网领域本体,并对其进行基于规则的语义推理,获取本体中的隐含信息,完成对本体的扩充,依据推理之后的本体进行查询扩展。着重研究了本体相关理论、基于规则的本体推理以及Jena推理机,构建了用于本体推理的规则库,给出了一种基于本体的查询扩展算法。分布式倒排索引系统采用的是按文档划分的局部倒排索引组织策略。着重研究了面向互联网的传统搜索引擎的工作原理、HDFS、MapReduce、开源核心搜索库Lucene以及分布式倒排索引的两种组织策略。为了体现物联网搜索应该具有的空间特性,课题增加了一个基于距离的搜索结果排序模块。基于本体的查询扩展模块、分布式倒排索引系统、基于距离的搜索结果排序模块以及用户查询接口共同构成了完整的WoT搜索引擎。最后,通过测试证明了课题方案的可行性及有效性。
其他文献
在信息技术的支撑下,教育信息化已成为高校教育发展的必经之路,特别是教师信息化能力的发展已影响到高校教育信息化的发展速度。因此有必要从高校管理模式、教师发展服务、数
文章阐述了当前军队医院财务管理系统现状,对存在的问题进行分析并提出改进办法,探讨了大数据背景下的军队医院财务管理系统的建设路径。重构现有财务管理系统的顶层设计,完
近年来,城市化进程加快,生活水平提高,污水污泥产量日益增加。污水污泥处理形势严峻,人类社会急需探寻一套绿色环保、安全可靠和效益最优的处理处置技术方案。因此,在系统阐
近两年 ,中央政府所推出的一系列扩大内需的政策 ,有的已见成效 ,多半收效甚微 ,内需不足依然。因此 ,必须进一步探索扩大内需的途径和调整有关政策。其重点应该放在调整供给
满族文学是中华民族丰富多彩、源远流长的文学宝库中独具特色的篇章。充分地发掘、深入地研究它,还有赖于学术工作者做艰巨的努力。本文对有清一代满族诗人的诗歌创作中进步
在实践中人们普遍认为,用毛竹一年生实生苗造林成活率低效益慢。然而临桂县两江镇二圳村委一李姓农户96年用一年生实生毛竹造林却获得了成功。当年他在县林业局得到这10丛免费
本文以产业大融合的趋势为出发点,结合英国电信、Vodafone、法国电信、软银等国际先进运营商成功经验,深入分析3G时代运营商为适应来自产业内外的竞争压力,如何实施攻守结合的全业务竞争策略。
《神农本草经》是我国现存最早的一部药学典籍。到了现代,该书中部分中药的名称、入药部位及临床性效已经发生了改变。为了探究《神农本草经》中部分中药的古今变化,笔者详细