论文部分内容阅读
当今社会信息技术的日新月异,互联网络发展一日千里,如何在这样大规模的网络信息中快速和准确地找到人们所需要的信息成为人们使用互联网时所面临的一个问题。这种背景下产生了搜索引擎。本文从企业级应用出发,设计一种适用于企业办公的网络资源搜索系统。该系统能够根据企业需求,获取指定的网址及其内部超链接中的内容,并建立索引库,将信息保存在本地的磁盘上。文章的主要内容如下:(1)分析了目前主流的搜索引擎的执行过程,包括建立索引库的过程和从索引库中查询的过程。(2)设计并实现了基本的系统管理功能。作为一个软件核心基础模块,系统管理实现了对系统中用户的管理、登录和权限认证的功能。(3)设计并实现了网络资源搜索系统中的网页获取功能。该模块可以根据入口地址、搜索深度和各种过滤条件从互联网上获取网络资源,并持久化进索引库。(4)设计并实现了网络资源搜索系统中的信息分析功能。该模块负责处理搜索的信息,将通过这些信息提取出的结论保存进数据库中,并可以使用图表直观的显示结论。(5)设计并实现了网络资源搜索系统中的本地查询功能。该模块与目前主流搜索引擎类似,在本地索引库中搜索和关键字匹配的记录。(6)使用Spring技术将Struts2框架、Hibernate(JPA)框架、Compass框架、整合起来,实现了事务的声明式管理和层与层之间的依赖注入。使得整个系统在具有很好的架构的同时,减少了重复代码,降低了模块之间的耦合的,便于系统的维护与更新。(7)使用Junit4技术,对所有持久层的代码进行了单元测试,在此基础上,编写前端业务逻辑,并使用功能测试验证程序的可行性。通过软件测试确保了系统的可靠性和合理性。本文实现的系统,可以部署在Web服务器上运行。该系统提供了搜索引擎的基本功能,能够满足企业的实际需求。