文本作者身份识别研究综述

来源 :图书情报工作 | 被引量 : 0次 | 上传用户:jewelryt40b
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
[目的/意义]鉴于传统的作者身份识别方法不适用于当前大量涌现的网络文本。综述近年文本作者身份识别的典型方法和关键问题,并进行客观分析和评价,以期为进一步研究提供新的思路。[方法 /过程]分别从应用领域、文体特征选取、作者身份建模和性能评价指标等方面对国内外作者身份识别相关研究现状进行客观分析,梳理相关领域研究发展脉络和趋势。[结果/结论]作者身份识别需要适应短文本、不规范文本、海量、高维和多语种环境,需更具表现和刻画能力的多层面特征和相应的作者身份建模方法,并借助信息检索、机器学习和自然语言处理领域的最新研究成果提高效率和准确率。 [Purpose / Significance] In view of the traditional method of author identification does not apply to the current mass network text. This paper summarizes the typical methods and key problems of text author identification in recent years, and carries out objective analysis and evaluation with a view to providing new ideas for further research. [Methods / Processes] Objectively analyze the status quo of the research on identification of authors both at home and abroad from the aspects of application field, selection of stylistic features, author identity modeling and performance evaluation index, combing the development context and trend of related fields. [Result / Conclusion] Authorship identification needs multi-level features that need to be more expressive and descriptive, as well as appropriate author identity modeling methods that adapt to short texts, nonstandard texts, massively, highdimensional and multilingual environments, Recent research in machine learning and natural language processing improves efficiency and accuracy.
其他文献
李泳禧,1929年出生于韩国平安北道云山郡(现朝鲜境内),2010年在首尔去世.他是韩国现代史上里程碑式的人物,也是一名颇具争议的人物.他一生著述颇丰,其中最具影响力的是《转换
本文通过对荣华二采区10
期刊
[目的/意义]化解军队院校联合参考咨询工作中学科专家的激励调动难题,实现深度的军事学科服务。[方法/过程]选用波特-劳勒激励模型为分析框架,从模型变量出发,抽象凝练出八大
档案职业作为社会职业构成中的组成部分,是在社会劳动分工基础上,以满足一定个体和社会需要为目的而形成的、具有特定技能要求的社会劳动形态之一。重视和研究我国档案职业的
摘要本文主要阐述了素质教育对培养新型人才的重要性,同时也说明了体育教学在学生成长乃至对以后生活的重要性,然后进一步说明了实行素质教育后,我在平时的体育教学中的一些体会与实践。  关键词素质教育;体育教学  所谓“素质教育”按《决定》表述:“就是全面贯彻党的教育方针。以提高国民素质为根本宗旨,以培养有理想、有文化、有道德、有纪律的,德、智、体、美等全面发展的社会主义事业建设者和接班人”。从这段文字可
[目的/意义]学科体系内部的知识发展以及信息技术的突破与应用,使得科学计量学的数据对象日益充盈丰富。在科学计量学呈现出迅猛发展态势的情况下,辨析科学计量学的数据对象,
[目的/意义]通过对潜在“睡美人”论文的引用分布分析,提炼其特征,以期为“睡美人”论文的预判研究提供思路。[方法 /过程]采用引用曲线这一更为直观的反映论文引用分布的方
本文通过对荣华二采区10
[目的/意义]随着语义网与关联数据的兴起与发展,采用SKOS语言对叙词表进行语义化描述成为主流,这为叙词表在网络上的发布、共享以及在网络环境下的应用提供新的契机。[方法 /
[目的/意义]构建国史知识检索平台,提高用户获取国史知识的效率,促进国史宣传和教育。[方法/过程]提出基于本体的国史知识检索平台构建思路与总体框架,在构建国史本体知识库