基于领域术语的中文问题自动生成技术

来源 :中国科学院大学(中国科学院计算机科学与技术学院) | 被引量 : 1次 | 上传用户:tianhaiyandml
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
面向领域的中文问题生成对于企业和学校进行教育培训与知识考核具有重要意义。通过领域专家进行手工出题的传统方法已经不能满足日益增长的教学培训需求。随着自然语言处理技术的发展,问题自动生成技术已经成为了研究热点,能极大地有助于教育培训的发展。同时,为了让生成的问题更具有领域针对性和领域重点,本论文提出了基于领域术语的中文问题自动生成技术,通过构建领域术语库来提高问题生成的质量。为了构建领域术语库,本文提出了两种领域术语抽取算法,基于依存句法分析的无监督方法和基于栅格长短期记忆网络(Lattice LSTM)的深度学习模型。前一种方法通过利用依存句法结构和领域术语的语法特点进行初步抽取,再经过语言规则和自定义的多因素评估模块进行过滤筛选来获得最终的术语列表,抽取效果较传统的无监督方法得到了提高。基于Lattice LSTM的深度学习模型能更好地抓住文本中字词的语义信息,并通过增加标签注意力层(Label Attention Network,LAN)使网络结构更关注领域术语的特征。实验验证了这一方法在领域术语抽取任务中比已有深度学习方法呈现出更好的效果。为了更好地提取领域文本中重要的句子,使之后生成的问题题干更具有代表性和重要性,本文提出了一种基于依存句法信息的卷积神经网络的关键句提取方法。先改进了Text Rank算法,进行初步的句子筛选,再通过训练好的利用依存信息的卷积神经网络建立句子的重要程度分类模型。实验结果表明该模型在关键句抽取任务中具有较好的性能。基于上述算法提供的领域术语库和文本句子,本文研究了基于领域术语的多类型问题生成方法。针对不同题型设计了不同的出题策略,尤其是选择题的生成,提出了多种干扰项的生成方式,从而提高问题质量并增加问题的多样性。人工评估表明,本文提出的问题生成方法所生成的大部分问题在语法语义的准确性上达到了要求,同时具有较高质量和多样性。最后,为了更好地实现自动出题功能,本文设计并开发了集领域中文自动出题与自动组卷功能于一体的软件,该软件可以充分满足用户的使用需求。
其他文献
目前我国的大部分苹果采摘作业仍以人工采摘为主,工作效率低,劳动强度大。但是改革开放以来,我国农村劳动力不断外流,常常出现人手不足的现象。实现苹果的自动化采摘,对于提
常规反应精馏塔(Conventional Reactive Distillation Column,CRDC)在处理相对挥发度排序为αC>αA>αD>αB的反应混合物时,相对挥发度最小的反应物B不断的在塔的底部积聚并
工业过程的各生产环节环环相扣、紧密相关,此时系统出现故障危害程度随之增加,造成重大的经济损失,甚至人员伤亡,因此,采用适宜、高效的故障检测方法至关重要。随着工业技术
《乌夜啼》是体现李煜后期"词淡而情浓"词风的代表词作,如何由浅入深地进行解读,笔者尝试了"以诗解诗"的比较阅读法,收到了极好的效果。
近年来,随着中国城市化进程的加速以及汽车工业的蓬勃发展,机动车的数量大大增加,城市道路车辆通行能力与城市交通中不断增长的车辆通行需求的矛盾日趋显现出来。因此利用智
我国土壤的重金属点位超标率较高,不仅对粮食安全生产和生态系统健康构成威胁,而且还通过食物链的生物放大作用影响人体健康,使得土壤重金属污染问题成为了当前的研究热点。微生物诱导的矿化修复是一种可边生产边修复的绿色可持续技术,近年来逐渐受到人们的重视。因此本文试图从重金属污染土壤中分离获得可以进行磷酸盐矿化的土著细菌,并且进一步研究其对Cu的吸附和生物矿化作用,为基于微生物矿作用的重金属污染土壤修复提供
针对传统打印设备体积过大、打印幅面有限、不便于随身携带等问题,本文设计了一种可在纸面上自由移动的两轮差速式驱动的爬虫打印机器人,大幅缩减了打印机体积,打印幅面不再
在日常生活中有许多户外视频系统,比如车辆违规监控系统、车辆自动驾驶系统等。在雾霾天气条件下,视频的可视性会降低,这些系统中使用的模式识别等图像处理算法的性能会下降,导致这些户外视频系统的可用性受到严重损害。为了克服雾霾对于户外视频系统的不利影响,本文设计了一套完整的、鲁棒的视频实时自适应去雾解决方案,并且在三个方面完成了创新性的工作。本文设计了基于暗通道先验和Haze-Line先验的实时图像去雾算
随着中国道路、桥梁大规模的建设,混凝土结构越来越多,针对混凝土结构的裂纹损伤检测是一个急需解决的问题。传统混凝土结构裂纹的检测有人工检测、机器视觉等,这类检测方法
传统的攻击模型假设攻击者只对密码算法的输入、输出有一定的访问权限。然而,在实际中,有一些攻击者利用算法执行过程中侧面反映出来的如功耗、时间等信息来进行密钥恢复,这类攻击被称为侧信道攻击。侧信道攻击反映了理论上对于传统攻击模型的假设已经不够充分的事实,因此,白盒密码应运而生。白盒攻击环境假设攻击者对密码算法的实现和动态访问有完全的控制权,使得攻击者可以随意地观察并修改算法执行的中间值。显然,传统模型