论文部分内容阅读
随着广东省专业镇经济的崛起与快速发展,各产业聚集区域制造能力与规模都有较大增长,但还处于初级发展阶段,所占国际市场的份额小,其主要原因是企业产业链不断延长造成了产业链上下游的衔接程度不高;人才配备不足,信息与知识资源不足,技术和产品创新能力不足,产品科技含量不高,缺乏产品开发与创新能力;产品单一,设备落后,利用率低;这种种技术上和资源上的劣势使企业难以有突破性发展。
目前,随着互联网技术的发展,数据挖掘技术也得到了迅猛发展,针对某一学科或主题的查询工具--主题搜索引擎也应运而生。本文在研究了Web搜索引擎的基本原理、核心技术和处理流程的基础上,针对灯饰企业的上述问题,特研究和开发了为企业提供如标准、专利、知识产权等查询的搜索引擎。
本文首先论述了系统开发的背景和国内搜索引擎的发展现状,以及深入研究了针对特定行业的主题搜索引擎的搜索策略,和主题词库的设计;在系统技术分析阶段,详细的研究了主题搜索引擎相关技术:
网络蜘蛛Spider技术和运用Lucene构建主题搜索引擎系统平台技术,在此基础上详细论述了用JAVA代码构建Spider抓取应用程序和对Lucene进行插件解析、中文分词等二次开发的详细过程和原理;
在系统详细设计阶段,提出了系统设计的功能和目标,并对设计过程中的设计思想、设计策略、设计难点做了分析,同时还对系统总体框架的各个模块所涉及到的知识和技术进行了详细的分析和设计;
最后在系统的实现阶段,从系统的运行流程角度对系统各个模块的实现进行了详细的论证,给出了相应的实现代码和运行实例。