基于网站特征分析的信源发现技术研究

来源 :沈阳航空航天大学 | 被引量 : 1次 | 上传用户:liuhu8207
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网信息内容的爆炸式增长,如何从海量信息中动态获取个人感兴趣的信息已成为当前研究热点之一。目前人们主要通过搜索引擎进行相关信息的检索。搜索引擎返回的信息往往是基于关键词的相关网页列表,而网页的来源错综复杂,如何基于网页发现与主题紧密相关的专业网站或专栏(本文简称“信源”)是本课题研究的重点。与网页检索相比,网站或专栏往往具有专题性强、信息质量高、动态更新等特点,更符合科技人员的研究需要。本文提出了一种基于网站特征分析的信源发现技术研究。即通过网页检索、内容清洗、相关性分析、网页来源分析、来源网站或栏目特征提取、评价推荐等环节实现用户需求网站或栏目的自主发现和检索排序。在本研究中,将网站或栏目作为情报研究的主要信源。网站特征的选取与相关度计算算法是本文研究的重点。本文提出了一种基于网站结构特征和内容特征相结合的网站特征抽取算法,并结合BM25(Okapi Best Match25)算法和余弦距离实现相关度的计算,同时综合考虑网站的特征数量和更新频度等评价网站的重要度。最终将高得分新网站或栏目信息每天反馈给用户,从而实现信源自动发现的目的。实验表明,该方法能充分利用不同网站的结构特征和内容语义特征有效地实现网站信源的检索发现。为了不断提高信源发现的精准性,系统结合用户浏览相关网站的隐性反馈行为,可以动态地优化排序结果;为了提升信源发现的效率,在实现环节采用了分布式文件系统和分布式计算架构。
其他文献
沿海航标是重要性、基础性和战略性的航海保障资源,对维护海上交通安全,在提升航标服务质量,保护海洋环境等方面发挥着重要作用。当前,“一带一路”、“京津冀协同发展”等国家战略深入推进,为秦皇岛辖区的区域海洋经济的发展带来了前所未有的机遇与挑战,海上交通环境和交通流密度日益复杂和紧张,各类海上活动及航海用户对航海保障服务的多样化、差异性需求日益迫切,公众对航标导助航服务提出了更多更高的要求。为了监督航标
本文采用归纳法和调查问卷法等研究方法,以杜威“从做中学”理论、行为主义语言习得理论和教育心理学理论为研究基石,结合笔者自身的教学实践经验,对汉语国际教育视域下的语
双目视觉能够获取目标工件的空间位置信息,有利于提高工件识别的正确率和工件定位的准确率。本文旨在建立一种基于双目视觉的工件识别方法框架,通过相机标定、图像去噪、图像匹配等,获取目标工件的空间位置信息,实现工件的识别和定位。本文主要研究该过程中的图像去噪、匹配与识别定位关键技术。首先,针对经典小波阈值去噪时,硬阈值去噪造成图像断层,软阈值存在恒定偏差等问题,本文建立一种新的渐进半软阈值函数,通过连续性
陕北白绒山羊是一种优良的绒肉兼用型山羊品种,但其繁殖性能亟待提高,故利用分子标记辅助选择(MAS)方法对其繁殖性状的遗传改良具有重要意义。作为山羊繁殖相关候选基因,精子鞭毛多发形态异常(MMAF)相关基因包括DNAH1、QRICH2、CFAP43、CFAP44、CFAP69、CCDC39和AKAP4。本研究首先利用现代分子遗传学和分子生物学技术挖掘MMAF相关个基因INDEL位点,并将其与陕北白绒
黑龙江省是我国重要的粮食生产基地,保证黑龙江省的粮食增产稳产,对于保障黑龙江省乃至国家粮食安全都具有重要意义。水氮作为影响玉米生长的两个重要因素,影响着玉米产量和品质的提高。在黑龙江省开展喷灌模式下的水氮耦合试验,对于提高作物产量和水氮利用效率、缓解当地农业用水压力都具有十分重要的意义。本试验于2018年4-10月,在位于黑龙江省西部地区的肇州县水利科学试验站进行。田间灌水采用喷灌灌水方式,设置灌
目的:探讨经自然腔道取标本技术在结直肠癌根治术中的可行性和安全性。与传统腹腔镜结直肠癌根治术相比,比较两种手术方式的临床疗效,评估经自然腔道取标本技术是否具有优势。为经自然腔道取标本技术在结直肠癌手术中的应用提供一定的理论依据。方法:回顾性分析2016-07至2019-02苏北人民医院胃肠中心行结直肠癌根治术的所有患者资料,根据严格的纳入标准和排除标准,最终选取48例患者纳入研究分组,并且根据取标
双齿围沙蚕是我国沿海地区一种重要的出口水产品,本研究利用磁珠富集的方法筛选出了用于群体分析的双齿围沙蚕微卫星引物,并综合了线粒体COⅠ序列标记、微卫星标记的方法,系统的
异议股东股权回购请求权是一项保护中小股东权利的重要制度,但在司法实践中对异议股东股权回购请求权行使主体资格的认定问题一直存在着争议。其争议主要集中在,行使主体资格
分数阶微积分理论是一个研究任意阶次微分、积分算子特性及其应用的数学理论,其发展历史至今已经有300多年。有关分数阶微分方程边值问题的理论研究已经引起了国内外许多数学
纯电动汽车因为其零排放、无污染和无需依赖传统能源的特性成为新型现代汽车的发展趋势。然而由于纯电动汽车在续驶里程方面存在缺陷,导致在推广纯电动汽车的过程中受到了影响。而通过使用再生制动技术可以延长纯电动汽车的续驶里程。综合考虑到实际行驶过程中路面附着条件情况下,研究考虑路面附着条件影响的再生制动控制策略具有一定的现实意义。本论文以电动汽车制动的安全性和稳定性为前提,通过研究电动汽车在行驶过程对当前行