论文部分内容阅读
网络的发展极大地影响了我们的生活方式,它让我们在更容易获取信息的同时,也彻头彻尾地将我们陷入无边无际的信息海洋之中。每时每刻我们都要自觉或不自觉,被动或主动地面对数十亿页面的网络信息,想找回自己所需要的信息简直是“大海捞针”。搜索引擎的出现,让我们有了探索信息海洋的指南针。搜索引擎被业界公认为继广告、网络游戏、无线增值之后互联网的第四桶金。万维网(World Wide Web)是Internet上增长领域最快、最灵活、最通用的一个多种信息集成的多媒体信息发布、浏览与检索系统。Web的巨大魅力是为以多媒体方式发布信息提供了一条快车道。因此,有人用这样的公式解释“Web=Internet+多媒体”。随着信息技术的不断发展和推广应用,基于内容的多媒体信息索引与检索已经成为多媒体研究中的热点课题之一。多媒体信息主要包括文本、图像、图形、声音、视频、动画等形式, Flash动画作为互联网催生的新兴视觉媒介,从诞生至今十年的时间,已经发展成为网络上最流行的多媒体表现形式。本文以发布格式为SWF的Flash动画为研究对象,以SWF动画文件结构和Flash制作过程为依据,对Flash动画进行了内容特征分析和内容特征标引,按照一定的数据结构创建了基于Flash动画内容分析的索引数据库,并采用动态网页技术和数据库技术建立了一个基于内容的Flash检索系统。基于内容的Flash检索系统是一个专业的垂直搜索引擎系统,以快速索引和检索网页Flash动画为最终目的。首先,我们通过网络蜘蛛程序按照指定的URL从互联网上采集包含Flash文件的网页链接,然后从这些网页文件上提取Flash文件路径,并下载Flash文件;然后,对下载到的Flash文件进行内容分析,进而通过分析程序对Flash文件进行结构化标注,在此基础上,建立基于Flash内容分析的索引数据库,并运用动态网页技术设计适当的查询接口和友好的查询界面,按照一定的算法模型对数据库进行条件检索,最终,将包含动画摘要和动画链接等信息的页面返回给用户。本文首先讨论了目前国内外基于内容的Flash检索领域的研究现状和发展趋势;然后对基于内容的Flash检索的关键技术和方法进行了研究,并着重研究了一种基于改进的布尔检索算法;接着论述了基于内容的Flash检索系统的实现方法,并对Flash检索的界面设计和数据结构进行了研究,建立了一个基于内容的Flash检索原型系统;最后,我们讨论了关于海量数据库的编码和压缩问题,对系统数据库进行了一定的改进和优化,并对检索结果进行了分析和统计,实验结果表明,该系统检索Flash准确率较高,相对于传统搜索引擎来说,该系统对采用的算法对提高Flash的查全率与查准率具有积极意义。Flash资源以其形象、生动、直观的优点,在建构主义学习环境中起着非常重要的作用,将合适的Flash资源应用到教育领域,对于建构主义学习环境的创建,提高教育教学效果具有重要意义,基于内容的Flash检索系统在一定程度上能够更准确有效地帮助学生查找到自己所需要的Flash动画资源。