【摘 要】
:
交集型歧义是中文分词的一大难题,构建大规模高频最大交集型歧义字段(MOAS)的数据库,对于掌握其分布状况和自动消歧都具有重要意义。本文首先通过实验指出,与FBMM相比,全切分才能检
【基金项目】
:
南京师范大学211资助项目(1240702504)
论文部分内容阅读
交集型歧义是中文分词的一大难题,构建大规模高频最大交集型歧义字段(MOAS)的数据库,对于掌握其分布状况和自动消歧都具有重要意义。本文首先通过实验指出,与FBMM相比,全切分才能检测出数量完整、严格定义的MOAS,检测出的MOAS在数量上也与词典规模基本成正比。然后,在4亿字人民日报语料中采集出高频MOAS14906条,并随机抽取了1354270条带有上下文信息的实例进行人工判定。数据分析表明,约70%的真歧义MOAS存在着强势切分现象,并给出了相应的消歧策略。
其他文献
学生学习兴趣的高低,将对学习质量的高低带来直接的影响。所以作为新课改下的初中物理教师,必须在初中物理课堂教学中注重学生学习兴趣的提升,在多方的帮助下,不断的成长,才
摘 要:游戏式教学作为一种现代化的教学手段,已经在小学英语中得到了广泛的应用。这种教学模式充分培养了学生的客观主动性,激发起学生的英语学习兴趣,对提升小学英语课堂教学质量有很大的帮助。为了让游戏式教学模式更好地应用小学英语课堂,教师在实践教学活动中加强游戏教学模式的分析,正确使用游戏式教学模式。 关键词:游戏;小学英语;英语教学;应用研究 小学阶段的英语课程并不是要让学生全面接触英语,而是要让
句子的韵律短语识别是语音合成的重要研究内容。本文提出了应用统计语言模型生成的二叉树,结合最大熵方法识别待合成汉语句子的语音停顿点。文中给出了二叉树相关的模型训练和生成算法;二叉树与语音停顿点之间的关系;在最大熵方法中应用二叉树剪枝识别句子的韵律短语。实验结果表明,在搜索算法中,利用二叉树进行剪枝,可以很大程度上提高语音停顿预测的正确率和召回率,基于试验数据的f-Score提高了近35%。
研究了加法半格簇Sl和双矩形带簇BR中的乘法带半环;从Green-D的关系出发,给出了R-D的Mal'cev分解式,得到了R-D的等价刻画。
课标指出“人人学有价值的数学,人人都能获得必要的数学,不同的人在数学上得到不同的发展。”其实是对课堂教学做出的要求,也就是关注个体差异、照顾到每一位学生。不同学生,
新课标教学中提出学科素养概念,体育作为高中教学中重要组成部分,将成为学生培养核心素养的一种途径,体育学科自身特点鲜明,应当将课程优势充分发挥出来,在体育课程的日常教
一、问题小强是刚进入高一的学生,在初中时,他在班上学习拔尖、是班里的主要干部,而进入高中后,突然发现周围高手如云,自己并不出众,为此感到伤心和懊恼,甚至有些厌学。开学
汉语自动分词中组合歧义是难点问题,难在两点:组合歧义字段的发现和歧义的消解。本文研究了组合歧义字段在切开与不切时的词性变化规律,提出了一种新的组合歧义字段自动采集方法
地理核心素养包含区域认知、地理实践能力、综合思维、人地关系等四个方面。全国各地的高考试题都以“立德树人”为宗旨,将地理核心素养的考察渗透在试题中。下面以2017年海
本文依据《现代汉语语法信息词典》中对词语多义的属性特征描述,对《人民日报》语料中155个词语共4996个同形实例进行了粗粒度词义自动消歧实验,同时用贝叶斯算法进行了比较测