论文部分内容阅读
汉语和日语中存在大量通用词汇,由于其意义、用法存在着微妙差别,经常成为中国学生学习日语和日本学生学习汉语的陷阱,因此汉日通用词汇一直是学界研究的热点。本文提出了以同源字形为依据对汉日语料进行归一化处理抽取通用词汇的方法,可以大规模高精度地进行汉日语通用词汇的抽取。抽取结果可用于日语教学、对外汉语教学领域汉日语通用词汇意义、用法的对比研究。