【摘 要】
:
针对通用搜索引擎的信息量大、查询不准确、深度不够等问题,本文采用垂直搜索引擎技术和电子商务服务相结合的新的服务模式,设计了一个电子商务垂直搜索引擎系统。论文重点研
【出 处】
:
华北电力大学(北京) 华北电力大学
论文部分内容阅读
针对通用搜索引擎的信息量大、查询不准确、深度不够等问题,本文采用垂直搜索引擎技术和电子商务服务相结合的新的服务模式,设计了一个电子商务垂直搜索引擎系统。论文重点研究了系统的数据分析模块中对页面数据信息抽取方式和数据索引的关键技术和实现算法;设计实现了数据展示模块的用户查询接口,同时对检索结果做了相关性分析。在对各类信息抽取技术进行分析和比较后,设计了本系统的信息抽取方案;针对该方案本文设计了独有的索引结构,在数据索引过程中应用了基于词库的最大匹配分词算法,采用顺排和倒排索引相结合的文件索引方式建立索引。经过试验证明,本文设计和实现的电子商务搜索引擎能够满足用户结构化查询需求,该系统具有较好的实用价值和应用前景。
其他文献
随着信息技术和Web应用的快速发展,Web服务组合技术逐渐成为企业信息集成的主流技术。从面向过程的角度看,服务组合就是根据业务需求来设计业务流程,为业务流程选择一系列符
低密度校验码是一种能逼近Shannon容量限的渐进好码,其译码采用了仅具有线性时间复杂度的置信传播迭代译码算法,并且可以检测几乎所有错误。由于低密度校验码具有诸多优点,它
电力网络是当代社会发展必需的最基础设施之一,建立可靠稳定的电网控制系统,保证电网的安全经济运行,是十分重要的问题。随着区域电网的互联与发展,国内电网采用分级管理、分层控制和区域独立处理的体制,使得各区域调度中心的数据资源广域分布在各个行政区域,对电力系统一体化仿真计算造成很大困难。由于电力经济市场的发展,在这种分层分区的管理模式下,不可能直接获取各个电力公司相对保密的电网数据,这就进一步加大了一体
增强现实技术是将计算机生成的虚拟物体、场景或系统提示信息叠加到真实世界场景中,增强用户对现实世界的感知。增强现实技术的关键技术有跟踪注册技术、光照技术、显示技术等
Internet的快速发展,使得流量一直处于爆炸性的增长之中。加上通信技术的进步,网络设备正承受着越来越多的流量压力。最近的研究表明,目前的网络设备的处理速度能力在10Gb/s
嵌入式系统有限的资源(如处理能力、存储空间等)及特殊的运行环境使其安全性设计和实现不同于其他通用计算机系统。在有限的资源下,系统不仅要完成预期的功能,还要支持加密算
随着电力工业的蓬勃发展,用电设备的快速增加以及大量非线性电力设备的使用,给电网带来的谐波污染越来越严重,对电力系统的安全运行造成了极大的影响。针对高精度谐波检测的具体
电脑横机是针织行业中技术含量较高的自动化机械,它融合了计算机数字控制、电子驱动、机械设计、电机驱动、针织工艺及软件工程等技术为一体,可以编织复杂的手摇横机无法完成的
说话人识别是指通过说话人语音信号的分析和特征提取,从而确定说话人是否在所记录的说话人集合中,进而确定说话人是谁的过程。它在许多领域内有良好的应用前景。 目前在说话
移动机器人平台上基于视觉的目标跟踪系统能够较好地应用于室内外环境,而无需建立额外的辅助设施。传统的基于视觉的目标的跟踪系统使用的镜头通常视角较小,当观测大角度范围