论文部分内容阅读
在三网融合的大背景下,交互电视越来越得到普及,在观看交互电视时,对节目相关信息的需求越来越受到人们关注。节目相关信息是那些跟频道和节目内容密切相关且人们想获取的信息,而目前国内很少有此类研究来满足观众的这一迫切需求,这也正是本文研究的背景和选题的动力。节目相关信息的一大来源是互联网,然而互联网上的网页往往包含了导航栏、广告、无关链接等等这一类主题无关的信息,我们称之为网页噪声。论文为了能快速获取互联网中的节目相关信息和提取主题内容,将网页去噪作为研究的目标和任务。节目相关信息应用于交互电视涉及节目相关信息的描述与存储、呈现与同步,论文其他部分将以它们为重点展开。论文首先研究了当前存在的多种媒体内容描述标准,并根据节目相关信息的特点分析了它们不适合的原因,并提出了基于HTML+XML+数据库的节目相关信息描述方案。HTML来提供表现,XML和数据库提供数据,实现表现和数据的分离。在查阅了国内外大量文献资料和深入研究当前存在的网页去噪算法基础上,提出了一种基于LCS的特征树最大相似性匹配网页去噪算法,该算法可以利用同一站点网页的相关性有效去除噪声块,算法通过对目标网页进行预处理,寻找与目标网页相似的网页,生成目标网页和相似网页的特征树,并利用LCS能得到全局最大相似性解的特点找出两个特征树的不同之处,再通过网页块聚集和评分筛选找出中心内容块,实验证明该算法能达到良好的去噪效果。最后论文实现了一个示例系统,采用视频超链接机制,该系统将网页去噪技术应用到交互电视中,以网站为载体搭建了从服务器到客户端的整个模型系统。首先研究了节目相关信息呈现技术,以Ajax技术为基础,研究从节目相关信息的动态加载,到本地解析、动态显示的一系列技术;对节目相关信息与视频的同步、多终端的兼容性问题做了探讨并提出了相应的解决方案;然后给出了示例系统各模块的实现方法。