基于语料库的网络新闻标题词频研究——以人民网、新华网和新浪网、网易网为例

来源 :曲阜师范大学 | 被引量 : 0次 | 上传用户:xchjzl
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目前网络新闻标题的研究主要是运用语言学的某一个理论或从某一个角度出发,讨论网络新闻标题语言特色及表达效果。而用语料库的研究方法去定量研究的很少,运用对比分析对不同的新闻标题进行定性的研究也不多。  本研究立足于语言学的角度对网络新闻标题进行研究,运用研制小型语料库的研究方法,制作成85.4709万的生语料库,并对语料库进行自动分词和词性标注的深加工,得到了“网络新闻标题语料库”。在此基础上,本研究又对人民网、新华网、新浪网、网易网这四个网站的词汇进行了词频统计,研制成这几个网站的网络新闻标题词汇频度表,并制成《网络新闻标题词汇表》。将四个网站的前300个词与通用词表进行比较,得到它们的特殊词汇,并进行对比,探讨它们的用词特色。在它们特殊词汇中的共有词汇里,言语词中主要包括地名和国家政治人物。语言词主要包括官职称谓语、新闻报道热点事件的常用词汇。还有对四个网站的高频词、次高频词和中频词进行对比分析,发现在言语词和语言词运用上的异同。在高频词中,单音节词占优势,是新闻语言常用词汇。在高频词和次高频词中,基本范畴词是基础。相比而言,人民网、新华网的上位范畴词比新浪网、网易网的词汇多。同一范畴中,新浪网、网易网的下位范畴词比较多。在中频词中,新浪网、网易网暴力类、色情类词汇比较多。  本研究以量化为依据,运用定量、定性结合的研究方法,研制成“网络新闻标题语料库”,并完成《网络新闻标题基本词汇表》。它在新闻标题的制作及词典的编撰上具有参考价值。
其他文献
《少年》是陀思妥耶夫斯基(以下简称“陀氏”)晚年的一部重要小说。它以主人公阿尔卡其的精神成长为主线,描写了一个涉世未深的少年在十九世纪六、七十年代“思想”的转变,反映出
自古以来,人们对知觉的研究是以人自身的五种外部感官为对象,通过人体的五种感官:听觉、视觉、嗅觉、味觉、触觉收集外部世界信息的,它们分别来自人自身的耳、目、口、自、身(人身
本文对明末清初着名学者傅山古体诗用韵情况进行系统整理、研究。全文分五部分:一、傅山研究综述,分别从生平交游、书法、绘画、学术思想、文学五个方面介绍。二、傅山古体诗
本文通过对荣华二采区10
期刊