论文部分内容阅读
文本情感倾向性研究属于计算语言学、人工智能、数据挖掘等不同学科的交叉领域,但是这几年的研究主要偏重技术路线,比如:主观性句子的识别技术,利用词汇和语义判别观点句子情感极性的技术,而从语言学本体的角度进行文本情感倾向分析的文献较少。文本情感倾向分析不但涉及情感信息的挖掘,而且还关系到情感表达的语言知识发现,比如情感表达是否有明确的语言学标记,情感表达是否有较为偏爱的句类、句式或者词类、语气,情感表达的语言学现象能否用已有的语言学理论来阐释等等,简而言之就是,文本情感倾向分析能否找到情感表达的语言学方程式。本研究以网络评论文本(针对手机的评论)为语料,对其蕴含明确情感倾向的句子进行词类、句型、特定结构、语义、语用等角度的深入分析,以语言的主观性和主观化研究成果为基础,从语义标注、语用分析等角度归纳出正、负情感倾向的语言学标识。本文共分五部分。第一章绪论,介绍了本研究的选题背景、研究目的、方法、内容和研究现状,并对语料来源做了简要说明。第二章理论基础,从文本的主观性、主观化、语气、情态等角度探讨了文本倾向性分析的可能性。第三章、第四章分别从词语层面和句子层面对文本的情感倾向性做了分析,重点探讨了语气副词、否定副词、程度副词、疑问代词、指示代词以及部分特殊句式在文本情感倾向性分析中的作用和价值,总结出127个包含上述成分的情感表达式,并用实际语料中的例句进行说明。第五章结论,总结了全文的工作,讨论了从语言学角度进行文本倾向性分析的意义和可能的成果,并对下一步的工作进行展望。通过对语料的考察,我们发现表达负面情感的主要手段是使用否定结构,否定结构和语气副词、程度副词、指示代词、疑问代词的连用加强或削弱了否定的效果,从而表达出不同强度的负面情感。表达正面情感的主要手段是使用褒义词或贬义词的否定形式,词的褒贬性很多时候是受具体语境影响的,正面情感的表达式需要比负面情感的表达式有更多的上下文知识来说明。本文通过建立手机评论语料的情感词表,力求达到对词语或句式情感倾向性的细致描写。