基于t-SNE和模糊聚类的科技论文推荐方法研究

来源 :河北大学 | 被引量 : 0次 | 上传用户:ultizen
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近些年互联网飞速发展,其低廉的存储成本以及方便快捷的查询能力使得其成为科技论文的重要载体。目前科技论文查阅平台基本上依托于文本检索技术,科研用户希望在包含众多科技论文的查阅平台上快速准确的获取到自己需要的科技论文的愿望还难以实现。为此许多科研工作者将目光投到个性化科技论文推荐领域。互联网上的科技论文绝大部分以文本形式存在,判别两篇文本是否相似最具说服力的因素莫过于文本内容。针对传统的科技论文推荐领域忽视这一重要因素的问题以及对数据库中的科技论文进行两两对比造成的时间浪费和空间浪费的问题,从科技论文文本内容入手,提出基于t-SNE和模糊聚类的科技论文推荐方法。利用t-分布邻域嵌入(t-distributed Stochastic Neighbor Embedding,t-SNE)算法在处理高维数据方面的优势,对建模后的科技论文集矩阵进行维数约简,使用模糊聚类算法对t-SNE处理后的数据进行聚类,实现基于t-SNE和模糊聚类的科技论文个性化推荐。首先,利用空间向量模型对科技论文建模,其次为了解决向量空间模型带来的模型维数过大问题,提出采用t-SNE算法对科技论文模型进行维数约简。然后考虑到科技论文学科之间的交叉性,提出使用模糊C均值(fuzzy c-means,FCM)算法来对科技论文进行聚类,既避免了硬聚类带来的硬性划分问题以保留学科间交叉的特性,又减少了科技论文之间判断相似性时进行的不必要的比对。同时针对FCM需要人为指定聚类个数带来的聚类结果好坏不确定性问题,提出一种简单的自动确定其聚类个数的算法。最后,采用基于内容的推荐方法为科研用户进行科技论文的个性化推荐。实验表明,本文的方法在时间和空间复杂度上优于传统的科技论文推荐算法,同时推荐的准确性也较传统科技论文推荐有所提升。
其他文献
水力冲射开沟机械是使用最早、最普遍的海底施工机械。作者评述了海底水力冲射开沟机械的主要类型特征和技术水平之后,分别对海底施工环境条件及开沟设备自身影响水力开沟作
2019年7月1日下午,记者从连云港港口控股集团了解到,面对港际竞争日益激烈,环保督查持续高压,口岸监管全面从严的实际情况,连云港港强化生产组织保障,加大货源争盯力度,1-6月
我科食管贲门癌切除术中食管胃吻合480例,采用机械缝合和医用OB胶(广州白云医用胶总公司生产,规格1ml/支)联合应用预防胃食管吻合口相关并发症,收到满意效果,现报告如下。
研究生群体作为大学校园的一个重要主体,处于国民教育的最高端,是社会组织的特殊群体,其世界观、人生观和价值观都处于基本成型阶段.正确把握该群体的入党动机具有非常重要的
目的:研究配备坐姿矫正系统对脑瘫患儿坐姿功能异常康复的效果。方法:坐姿功能异常的脑瘫患儿62例,年龄8-36个月(20.0±9.2个月),随机分为研究组32例,对照组30例,两组均采用常规
羽毛球运动中发生的眼损伤虽然比较少见,但有可能造成严重的视力障碍,影响运动员的生活和训练。以下报告一例,并综合近年国内外报告的病例,加以讨论。病例介绍患者男性,55岁
<正>"注意是心灵的天窗"。只有打开注意力的这扇窗户,智慧的阳光才能撒满心田。注意力是学生学习和生活的基本能力,注意力直接影响学生的长远发展。因此,在小学数学课堂教学
为分析S仪化(600871)股票2011年的大致走向,必须要对其在2010年的表现情况进行分析。据此,从基本层面上对S仪化在2010年下半年的股票走势进行了大致分析。
根据目前水利工程勘测设计招标工作中存在问题,拟提出可研设计一体化招标模式,并针对可研设计一体化招标模式解决勘测设计招标模式现实问题的有效程度进行了实证调研。最后,
目的探讨急诊床边血液灌流抢救急性重度有机磷农药中毒的临床疗效。方法选取2013年1月~2017年2月我院收治的70例急性重度有机磷农药中毒患者作为研究对象,按照随机数字表法分