面向领域的问答系统和自然口语任务理解系统研究

来源 :中国科学技术大学 | 被引量 : 0次 | 上传用户:lxqandhd
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着科技的发展,人们对于互联网和科技产品的依赖越来越严重,用户的使用需求也正在不断的提高,用户以最自然的表达方式与机器进行交互成为一种趋势。这对人机交互来说是一个新的挑战,IBM公司的问答系统Watson和苹果公司的智能语音助手Siri的出现,将人机交互的研究推向了一个新的起点:用户自然状态下语言的理解。相比于英文,中文在人机交互方面的研究起步较晚,基础薄弱,本文分别从领域常问问题集的问答系统和口语理解两个层面对中文的人机交互进行了一些研究。   搜索引擎是互联网用户最常使用的工具,但是搜索引擎只对关键词进行搜索,并未涉及到用户输入的语义意图,所以搜索引擎常常会返回一些与用户意图无关的网页,需要用户进行过滤,并且需要用户从相关的文本网页中查找答案。20世纪中期,欧美科学家们就开始对问答系统进行研究,本文对中文的领域常问问题集的问答系统进行了研究。传统的做法是基于问句相似度的方法,将问答对库中与用户输入相似度最大的问题的答案作为返回答案,但此方法仍只涉及词语层面。本文研究如何理解问句意图以及如何从知识库中提取答案,首先我们对问句进行浅层句法分析和模板匹配将得到语义意图向量,将意图向量转换成本体查询语句在领域的知识本体库中查询推理答案。在实验中我们将常问问题集中问题分成五大类,获得的问句语义向量的准确率和召回率分别为94.66%和72.62%。由于本体的标注需要大量的人力,我们只标注了一个实验领域本体,在答案抽取模块我们对每一类的问句进行了实验演示,实验验证了本文答案抽取方法的可行性。   随着移动互联时代的到来和语音识别技术的日益成熟,通过语音的交互方式来使用移动终端成为一种趋势。如何理解用户自然状态下的口语输入,传统的做法是手写上下文无关的文法规则,但是文法规则的书写需耗费大量的人力和物力,并且很难维护和更新。本文提出了一种采用支持向量机和条件随机场串行结合的方法,把口语任务理解分解为任务发现和信息抽取两个过程,并最终将任务表达成语义向量的形式。最终对“讯飞语点”语音助手用户返回的八个不同的任务种类的数据进行了测试,在一比一的噪声中识别任务语义表达的准确率和召回率分别达到了90.29%和88.87%。
其他文献
  人工神经网络从诞生至今经过了六十多年的演变,相对于传统神经网络,第三代人工网络脉冲神经网络(Spiking Neural Network,SNN)更好地模仿了生物神经元的工作原理。SNN中
本文研究同态加密体制的构造及应用。在构造方面,首先对现有的类同态加密方案和全同态加密方案进行了较全面的介绍,重点介绍了全同态加密方案构造中采用的Gentry蓝图和BV11b方
随着计算机及网络技术的飞速发展,我们已经进入了一个全新的信息化社会。这些技术的应用对我国的考试体系的改革产生了巨大的影响。网上报考、网络考试、网络评卷等一系列新
代谢是生物必不可少的生理功能,负责维持细胞的生命。因此,代谢过程对基础生物学、生物技术和医学的研究者都是一个重要而有趣的研究课题。代谢通常被定义为一系列生化反应的集
存储系统(尤其是现在的大型合并存储系统,例如云存储系统、大型数据库系统等)的管理有两个重要的内容:一个是数据部署问题;另一个是存储系统的自动化配置问题,当前存储系统的管理
无线传感网络(Wireless Sensor Network)是由许多小型或微型的无线传感器结点所组成的无线自组织网络,它在军事和民用中都有广泛的应用,如监测敌人的动态、监测水环境的污染状
随着工业的发展和技术的进步,与人类生产生活密切相关的交通运输、电力输送、医疗服务、集成制造等系统日趋庞大。这类复杂系统的行为描述常需同时涉及宏观状态的确定性及其演
2009年,飞思卡尔半导体公司在中国市场上推出了应用于工业控制、汽车电子及消费电子的嵌入式实时操作系统MQX。MQX最早是Precise Software Technologies公司1989年开发,2009
随着计算机的快速普及和互联网的迅猛发展,网络已经成为人们日常生活中的一个重要组成部分。各种网络应用也快速覆盖到人类生活领域的各个方面,持续增长的需求和不断降低的开发
由于网球比赛视频拥有巨大的商业价值和广阔的应用前景,如何自动分析和检索成为当前学者的研究热点。本文主要研究如何标注网球视频盘局。第一,对网球视频中的广告进行了定位。