论文部分内容阅读
随着信息技术的快速发展,越来越多的纸质资源转为数字化存储,古籍文献资源的管理方式也逐步由人工管理转向基于数据库的信息化管理。数字化的存储和管理不仅能提升文献资源的保护性和共享性,更能提高相关专业人员对文献资源的查找效率。本文构建中国近代农业团体专题数据库系统,并研究和实现电子文献资源的推荐方法。项目依托课题组的研究成果开发。将相应文献资料、资料长编以及编年成果,进行科学分类整理和数字化处理,建立立体化检索体系,构建首个中国近代农业团体资料及研究的大型专题数据库系统。为方便用户检索,提出基于文本嵌入和用户画像的推荐算法,主要工作如下:1)依据课题国家社科基金项目投标书,分析研究者、用户和文献资源之间的交互方式,完成项目的需求设计,技术架构选型、数据库设计和关键功能模块设计。主要功能包括:前台内容展示、后台内容管理、立体化检索、个性化推荐。2)基于Spring、Hibernate、FreeMarker等技术构建中国近代农业团体专题数据库系统。系统提供便捷的检索查询体系,方便高校及研究机构的研究者、政府部门相关人员及普通用户使用。3)提出基于文本嵌入和用户画像的推荐算法,提高为用户推荐文献资源的针对性,提升服务质量。采用TF-IDF方法将文本嵌入到向量空间,利用Cookie机制识别匿名用户,根据用户浏览历史生成用户画像,以欧氏距离作为相似度度量方式,在向量空间中取距离该用户画像最近的前N个未浏览过的内容为用户推荐。算法保证了被推荐的文献资源在内容上关联用户兴趣,提高了用户的使用感受。