主题搜索引擎中的高效网页分类器构建方法

来源 :科技通报 | 被引量 : 0次 | 上传用户:lsylianyangdeyu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
提出了一种基于领域本体的相似度计算与基于网页结构的特征向量抽取相结合的分类器构建方案,改进后的WF-TF/IDF模型根据网页各部分对于主题相关的重要程度进行权重分配,同时引用领域本体知识库,将网页与主题的相关程度评价转化为本体中两个概念的相似度计算,扩大了爬虫的抓取范围。实验证明,该方案用于指导主题爬虫的抓取具有很高的灵活性和精确性。
其他文献
目的通过观察不同潮气量机械通气对大鼠肺组织激活蛋白-1(AP-1)和1-谷氨酰半胱氨酸合成酶(γ—GCS)表达的影响,探讨氧化-抗氧化系统失衡在呼吸机所致肺损伤(VILI)发生中的作用。方法
目的探讨高原慢性阻塞性肺疾病急性加重期(AECOPD)合并慢性肺心病(CCP)患者抗氧化治疗措施。方法将126例高原(海拔2260~3500m)AECOPD合并CCP患者随机分为红景天治疗组(A组)、氨溴索治
目的探讨核转录因子.5(NFAT5)在海水淹溺性肺水肿中表达的变化及作用。方法40只180~200gSD大鼠随机分为五组:对照组(NG),海水灌注1h,2h,3h,4h组,每组8只大鼠。灌注组经气管插管灌注4ml/kg
神经网络算法是一种非常经典的分类算法,然而神经网络的一个不足之处就是容易陷入过拟合。针对这种不足,正则化神经网路算法与提前终止迭代算法被提了出来。为了进一步研究这