基于社会标注质量的文本分类模型框架

来源 :计算机应用 | 被引量 : 9次 | 上传用户:jy02191348
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
社会标注是一种用户对网络资源的大众分类,蕴含了丰富的语义信息,因此将社会标注应用到信息检索技术中有助于提高信息检索的质量。研究了一种基于社会标注的文本分类改进算法以提高网页分类的效果。由于社会标注属于大众分类,标注的产生具有很大的随意性,标注的质量差别很大,因此首先利用文档间的语义相似度以及标注间的语义相似度来对标注的质量进行量化评估。在此基础上对标注进行质量过滤,利用质量相对较好的标注对文档向量空间模型进行扩展,将文档表示成由文档单词以及文档标注信息组成的扩展向量。同时采用支持向量机分类算法进行分
其他文献
桩侧负摩阻力对桩基产生下拽力,对桩基的承载力和沉降均不利,对受负摩阻力桩基进行设计时,需要正确估计桩基负摩阻力的大小及中性点的位置。开发颗粒流程序来模拟单桩负摩阻力的
以西南地区一座曲线高墩连续刚构特大桥为计算实例,介绍该桥的设计信息,并基于空间有限元分析,介绍该桥0号块产生扭转应力组合情况、各工况下结构最大扭矩值及最不利工况下0号块
期刊
一、乡镇财政增收困难因素分析 当前乡镇财政增收难,主要有以下几个制约因素: 1.财政体制。从枣阳市的情况看,该市对乡镇的财政体制曾作了三次调整,最终确定为“划分税种、核
期刊
为给评价者提供一种定量的评价需求文档质量的方法,给出了需求文档的重要质量属性,提出了将模糊评价方法运用于需求文档质量评价,从而降低结论的主观性,提高结论的可信度和说服力
我国在加入WTO之前,发布了《企业会计制度》(以下简称新会计制度)。新会计制度针对许多企业长期以来粉饰会计报表、虚报利润、虚计资产等会计信息严重失真、影响市场健康发展的
期刊
根据《保险法》等法律法规,结合保险中介机构的业务特点和服务流程,我会制定了《保险专业代理机构基本服务标准》《保险经纪机构基本服务标准》《保险公估机构基本服务标准》,现
马鞍山长江大桥南锚碇采用沉井基础,沉井入土深度超过50m,其施工采用“3次接高,3次下沉”的工艺:第1次下沉采用降排水措施,第2次下沉采用半排水措施,第3次下沉采用不排水措施。在沉
选用语音信号特征参数LPCC、Mel谱、Bark谱以及时域点对点欧氏距离四组参数,通过比较原始信号与经过编码解码后的信号之间的欧氏距离,反映了两组信号的相似程度,对ITU-T Rec.G.722.1、G.722.2和Speex Codec三种语音编码方案作出了客观评价,同时对三种方案的编解码计算量进行了评估,为语音编码研究领域研究者提供参考和借鉴。
结合重庆东水门长江大桥和千厮门嘉陵江大桥渝中区连接隧道小净距段施工,采用Hoek-Brown 强度准则估算出节理岩体的力学参数,建立基于Hoek-Brown 强度准则的有限元分析模型,对隧