论文部分内容阅读
学术社交网络(Academic Social Networks)是学者用户在线学术交流的网络平台,学者可以方便的在该平台上和其他学者建立好友关系,发布学术动态,分享和评论其他学者的学术动态信息。近年来,随着移动互联网技术迅速发展,各种智能移动终端更加快捷方便地接入互联网,越来越多的学者加入到学术社交网络的平台中。借助于社交网络强大的信息发布和信息分享功能,学术社交平台上积累了海量的学术动态信息。 面对海量的学术动态信息,如何帮助学者用户方便快捷的获取自身感兴趣的文本信息,是学术社交平台面临的挑战。首先,平台上的长文本信息具有多样性和专业性,不同专业用户需要不同领域的长文本,能否为每篇长文本自动生成关键词列表,方便学者参考阅读。其次,学术研究一般具有团队性,在社交网络上也有复杂的好友关系和互动网络,怎样有效的利用这些关系为学者推荐其需要的信息。 本文从学者在社交网络上发布的长文本入手,在长文本关键词提取问题上,首先分析了学术社交网络长文本的特点,并提出其形式化的定义。进一步的,提出了长文本关键词的提取算法,该算法从长文本的词汇词频、语义关联、词汇关系的角度出发,借助图论的方法计算长文本关键词。在长文本的个性化推荐问题上,首先充分的利用了学者的个人简介、学者发布的长文本来描述学者的兴趣点,利用学者好友关系网络、学者之间的互动网络来计算学者之间的信任度程度。进一步的,借助协同过滤推荐算法的思想,筛选和学者兴趣点较吻合以及信任程度较高的用户作为近邻用户集,将其长文本列表推荐给当前学者。最后,本文建立了算法的原形系统,实验表明,学术长文本关键词提取算法和推荐算法具有较高的准确性。