基于XML文档语义结构内容重组的研究

来源 :北京印刷学院 | 被引量 : 1次 | 上传用户:yushui223
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着电子信息技术的发展,人们获取信息的方式也逐渐呈现多样化的态势,在此背景下,传统出版业为了谋求更广阔的发展,将数字技术与出版流程进行融合,提出了数字出版这一理念。数字出版相对与传统的出版业,将计算机技术运用于整个出版流程之中,实现了出版技术和交付产品的创新,已成为了当今研究的热点问题。数字出版中内容重组技术可以有效地提高了出版物内容的重复利用率,提高了编辑效率,减少了资源的浪费,有极高的研究意义。本文着重于对内容重组领域关键技术的研究,主要包括了对XML文档基于关键字检索的优化,对XML文档查询返回结果的优化排序,并提出了基于XML语言的多样式重组模型。XML文档基于关键字检索的研究中,最常使用的语义为最小最低公共祖先(SLCA)语义。本文在对SLCA语义进行研究的基础上,提出了SLCA语义对单关键字查询效果不好以及SLCA语义返回结果粒度不精确这两项不足。针对SLCA语义的不足,本文在对XML文档的语义结构进行研究的基础上,提出了有意义节点的概念,并根据此概念提出了对于SLCA语义改进的算法,加入了对SLCA语义节点的筛选与处理。在本文的实验部分对SLCA语义和改进后的语义进行了结果准确率的比较,验证了改进后的算法返回的结果粒度更合理,更符合用户的需求。在研究XML文档基于关键字查询结果排序的问题上,本文首先分析了现有的查询结果排序模型和方法,分析了其不足之处,并对XML查询结果进行了语义特征分析,在此基础上提出了XML文档基于关键字查询结果语义结构的排序方法,该方法综合考虑了返回结果中节点的属性,相关程度和节点的属性,来对返回结果与关键字的相关程度进行评价。通过实验证明,该排序方法在查准率方面优于SLCA语义,提高了与关键字贴切返回结果的排序位置,使用户得到更准确,更符合需求的返回结果。在XML文档多样式重组模型中,通过分析XML文档内容片段的结构生成交付文档的语义结构映射表,再渲染该映射表生成最终的交付出版物。生成语义结构映射表的过程中,可确定最终交付文档的层级结构。在通过映射表进行渲染生成最终的交付出版物时,通过预处理将XML文档片段转化为具有固定格式的XML文档,根据需要选择生成交付出版物的样式,通过XSLT转换生成最终的交付出版物。
其他文献
目的探讨以患者需求为导向的临床护理路径应用于肺癌放疗患者中对其负性情绪、生命质量和并发症的影响。方法选取2014年11月—2016年11月收治的肺癌放疗患者84例,按入院先后
在中职语文教学大纲中,对于学生进行口语交际能力的培养是一项最基本要求,也是为顺应社会发展做出的重要举措,既要满足日常生活的需要,也要满足职业岗位的需要。而要让学生明
广西作为我国陆地和海上连接东盟各国的“桥头堡”,深入推进地方国有金融资产管理研究和管理为广西深入推进中国——东盟自由贸易区建设,创建区域性的国际金融中心创造了一个
本文介绍了目前世界各植入式神经刺激器厂家最新产品现状及植入式神经刺激器技术的发展趋势。
海报是一种对视觉感染力和号召力要求极高的艺术形式。作为时代的镜像,它敏感地捕捉着意识形态的风云变幻,因此,也较早地成为"去中心化"设计形态语言的"试验田"。"去中心化"
<正>新时代、新目标、新征程!2018年已经开启。过去的一年,在广大国内外专家、学者和读者的关心与支持下,《企业经济》杂志不断迈上新台阶,学术水平日益提升,有力地推动了理
彩色硬拷贝输出技术不断成熟,输出设备和材料种类繁多。由于设备、承印载体以及使用等因素的不同,使硬拷贝彩色影像的输出控制因素繁多,色彩表现各有不同。因而,常常是输出过
青花瓷的出现是中国瓷器生产传统的重大转变,白地蓝花和釉下彩装饰技术与中国瓷器传统的单色调及刻画装饰差别很大。虽然元青花瓷已经能够批量生产,但明代才将青花瓷确定为宫
尚贤是墨子思想的一个重要论题,包括什么是贤、如何育贤、为什么要尚贤以及怎样尚贤等一系列问题。墨子的尚贤思想不仅在当时令人耳目一新,时至今日仍不失有现实意义,值得大
<正>郑州大学西亚斯国际学院是由美国西亚斯集团公司投资,郑州大学、美国堪萨斯州州立大学(Fort Hays)合作的一所荟萃中西文化、具有国际化特色的新型高等学府,是河南省首家