论文部分内容阅读
随着互联网的迅猛发展和广泛普及,全媒体线索新闻与素材展现出了信息海量、格式多样、处理时效性和准确性要求高的特点,单纯由人工采集、分析和处理的难度极大,导致工作效率低下,无法满足全媒体新闻生产的需求。新闻聚合平台采用了数据爬取、自然语言处理、搜索引擎、概率统计和机器学习等相关领域的技术,利用这些技术可以实现新闻采集和统计分析的自动化以及检索的快速化,为媒体从业人员提供线索新闻与素材,提高查找、过滤、分析的效率。新闻聚合平台为媒体从业人员提供服务。本文从开发新闻聚合平台出发,以新闻检索、新闻详情和定时任务调度三个模块作为切入点展开深入的分析与设计。新闻检索是平台的基础业务模块,满足用户对线索新闻、热点新闻、事件新闻和网络新闻的检索。新闻详情模块是平台的核心业务模块,在新闻原始信息的基础上,提供基于新闻内容的摘要、实体词、关键词、情感正负面、评论区域、评论量以及媒体报道量的统计分析结果,并依据新闻类别分为线索新闻详情、热点新闻详情、事件详情和历史上今天新闻详情。定时任务调度是软件的关键技术模块,基于Quartz Scheduler框架,实现新闻统计分析任务的自动化。本人参与了开发新闻聚合平台的需求分析和设计与实现阶段。在需求分析阶段,本人独立完成了所负责开发模块的业务分析工作、产品原型设计和前端页面的交互设计工作。在设计与实现阶段,本人参与完成了新闻检索模块中线索新闻检索子模块、热点新闻检索子模块、事件检索子模块和网络新闻检索子模块的设计与实现;独立完成了新闻详情模块中的线索新闻详情子模块、热点新闻详情子模块和事件详情子模块的设计与实现;独立完成了定时任务调度模块中线索新闻定时任务子模块、热点新闻定时任务子模块和事件新闻定时任务子模块的设计与实现,并参与完成了数据库表结构的设计与实现。目前,该新闻聚合平台处于用户试用阶段,部署于国内某企业云的新闻聚合平台运行良好;本人负责完成的模块运行稳定、达到了预期的目标。