学术社交网络长文本关键词提取和推荐模型研究

来源 :华南师范大学 | 被引量 : 0次 | 上传用户:mygd520
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
学术社交网络(Academic Social Networks)是学者用户在线学术交流的网络平台,学者可以方便的在该平台上和其他学者建立好友关系,发布学术动态,分享和评论其他学者的学术动态信息。近年来,随着移动互联网技术迅速发展,各种智能移动终端更加快捷方便地接入互联网,越来越多的学者加入到学术社交网络的平台中。借助于社交网络强大的信息发布和信息分享功能,学术社交平台上积累了海量的学术动态信息。  面对海量的学术动态信息,如何帮助学者用户方便快捷的获取自身感兴趣的文本信息,是学术社交平台面临的挑战。首先,平台上的长文本信息具有多样性和专业性,不同专业用户需要不同领域的长文本,能否为每篇长文本自动生成关键词列表,方便学者参考阅读。其次,学术研究一般具有团队性,在社交网络上也有复杂的好友关系和互动网络,怎样有效的利用这些关系为学者推荐其需要的信息。  本文从学者在社交网络上发布的长文本入手,在长文本关键词提取问题上,首先分析了学术社交网络长文本的特点,并提出其形式化的定义。进一步的,提出了长文本关键词的提取算法,该算法从长文本的词汇词频、语义关联、词汇关系的角度出发,借助图论的方法计算长文本关键词。在长文本的个性化推荐问题上,首先充分的利用了学者的个人简介、学者发布的长文本来描述学者的兴趣点,利用学者好友关系网络、学者之间的互动网络来计算学者之间的信任度程度。进一步的,借助协同过滤推荐算法的思想,筛选和学者兴趣点较吻合以及信任程度较高的用户作为近邻用户集,将其长文本列表推荐给当前学者。最后,本文建立了算法的原形系统,实验表明,学术长文本关键词提取算法和推荐算法具有较高的准确性。
其他文献
电子政务的兴起给社会发展带来了深刻的影响,办公自动化、网络化、无纸化成为提升行政效能的有效方式。在信息化办公的日常管理过程中,各种项目申报、资料审批汇总都涉及大量的
学术社交网络中关键人物挖掘算法是一种通过分析学术社交网络信息找出网络中具有代表性关键人物的算法。这类算法可以分析学术社交网络中原本容易被忽略的信息,通过挖掘其深层
随着现代烟草农业生产技术对信息技术的依赖程度越来越高,如何将信息技术应用于烟草生产过程成为了目前烟草信息化建设的研究热点和难点。众所周知,烟草病虫害的防治是保证烟草
视频监控系统作为安全防范系统的重要组成部分,在保障工业生产安全、人民生活稳定与提高社会治安方面具有重要作用。近些年来,随着计算机网络技术、多媒体技术和通信技术的飞速
学位
在科学数据处理中,数据采集是很重要,但却不被人重视的一环。IT行业的数据大多由软件系统自身产生,数据采集不是问题。但是在非IT行业的科学研究中,科学家们经常需要从社会生活或
高性能计算是国家高科技发展战略的关键组成部分,研制具有中国自主知识产权的高性能计算机对提升我国综合国力具有重要意义。高性能计算机中CC-NUIVlA系统结点内部可以实现资
学位
随着社会网络、移动应用以及传感器技术的发展和普及,数据收集的效率、规模和种类得到了很大的提高,催生了对非结构化数据的管理。由于开放环境下的非结构化数据具有海量、异构
随着计算机科学技术的迅速发展,人脸识别技术已经取得了许多重大的研究成果和突破性的技术,但是人脸识别依然是一项比较艰难的课题。人脸图像在采集过程中容易受到复杂环境的影