基于主题语义扩展的混合类型数字资源分类研究

来源 :情报理论与实践 | 被引量 : 0次 | 上传用户:wfzhousd
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
为满足数字图书馆各种类型数字化资源统一分类组织的需要,文章着重对数字图书馆中多种类型文献混合分类的可行性进行探索与分析。引入语义主题模型构建方法,结合外部知识库Wikipedia进行语义扩展,构建一种基于主题语义扩展的混合类型文献自动分类方法。研究发现:在多类型文献混合分类中,网页与非学术性期刊文献、图书与学术性期刊文献之间具有较高的亲和力,可互相作为分类材料中的训练集并达到较高分类性能;不同分类算法针对多种类型文献混合分类具有不同的可学习能力和适应性,贝叶斯算法、最大熵模型比支持向量机更能适应多种类型文
其他文献
目的研究聚乙烯磷酸(PVPA)对牙本质中由酸蚀激活的基质金属蛋白酶(MMPs)的作用。方法收集50颗口腔颌面外科拔除的人正常第三磨牙,制备成牙本质粉并随机平均分成8组,对照组仅37%磷酸
<正> 重工业和轻工业是常用的一种工业分类。但由于缺乏严密、科学的划分标志,人们运用这种分类时,对它的解释往往不完全一致。近两年討論农轻重和社会生产两大部类关系的論