基于结构数据的多模式智能问答消歧系统

来源 :山东大学 | 被引量 : 0次 | 上传用户:zhchbetty
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近些年,人们满足自身信息需求的方式发生了深刻变化。例如,移动设备如今无处不在。据报道,人们在移动端的搜索量已经超过了 PC端的搜索量。我们在本文中主要研究多种交互模式(多模)下的问题解答技术;利用这种技术,人们既可以提供自然语言的问句,又可提供图片。本文通过整数线性规划函数及定义多模约束来实现上述目的。实验结果表明,即使面对难度很大的模糊实体搜索,本文方法也可提供准确答案。当前智能问答技术的工作一般都基于文本展开。其中一类方法是将用户的自然语言问句,提取出能够表达主要含义的的一个或多个关键字,然后通过网页或文本的搜索引擎进行查找,如2001年Kwok和Etzioni等的Scaling question answering to the web工作。尽管基于关键字的方法现在被普遍使用,但学术界和工业界一直在寻求更准确、更高效的查询方式。此类工作最先进水平的智能问答系统,是通过模板将自然语言的问句过滤为符合模板的问句。另一类方法是试图通过知识库(Knowledge Bases)或知识图谱(Knowledge Graph)方式来解答问题。早期基于知识库的智能问答系统,如BASEBALL、SHRDLU和LUNAR,只能解决某特定领域内的问题。随着知识库的发展,智能问答技术逐渐从特定领域问答扩展到多领域,如早期的依托手动创建的知识库的Unix Consultant和LILOG系统。近年来,智能问答系统更多的依赖于关联数据网络(web of linked data),如 DBpedia、Freebase 和 Yago 等。IBM 的 Watson 项目将自然语言问句进行文本处理后,通过DBpedia和Yago进行逻辑推理得到答案。2012年,Watson机器人在著名智力竞赛节目"Jeopardy"战胜了人类。本文提出了使用自然语言处理和图像检索两种方式对用户提供的问句进行分析,在基于文本的智能问答技术上进行拓展,建立多模式问答系统。在用户提出自然语言问句的同时,我们还允许用户提供照片、手绘图等方式,表达其所想得到的答案的图像。然后,我们对文本和图像处理进行并行处理,处理的结果在Yago知识库上进行逻辑推理,通过线性优化的方式得到最优解。实验表明,使用文本和图像两种方式,能够使得用户表达的信息更为明确,更好的使机器理解用户的问句含义,对消除用户问句中实体的歧义,非常有效果。随着用户通过移动设备获取图像越来越便捷,我们扩展智能问答技术的输入也成为可能,用户使用移动设备可以很便捷的同时提供文本和图像进行查询,综合考虑自然语言和图像检索时可提升问题回答的准确率。另外,本文研究也有助于推广利用多种交互模式条件下的多媒体知识库。随着在线多媒体内容的爆发式增长和移动设备的高度普及,将来对多种交互模式(音频和视频)下的多媒体搜索领域的研究需求会不断增长。
其他文献
目前,在这个信息化迅速发展的时代,随着计算机的广泛应用和互联网技术的普及,人们互相交流思想获取信息变得更加快速和便捷,抄袭现象也越来越普遍,手段也越来越隐蔽。在各个高校中
随着信息技术的发展,数据挖掘技术作为目前计算机研究的热门领域,在社会各方面得到广泛使用,它旨在从大量数据中挖掘出有价值的信息。   本文重点研究数据挖掘中的分类方法和
在分布式网络快速发展的推动下,数字视频内容日益丰富,数量急剧增长。数字视频储存、复制和再分发的便利性,一方面极大地满足了人们学习和娱乐的需求;另一方面又带来了越来越多的
由于无线信道的广播特性,无线传感器网络中任一节点发送的无线信号都可能被其通信范围内的其他节点接收。因此,当位于同一地理区域范围内的节点同时传输信号时,会形成相互干
在航天领域,飞行控制计算机作为航天飞行器控制系统的核心功能部分,其可靠性要求不容置疑是很高的。本文主要以某型号航天飞行器的飞行控制计算机研制项目为背景,结合飞行控制任
随着高性能计算的发展,计算能力得到大幅度的提升,然而受限于投资和复杂度,I/O性能则相对发展缓慢。基于此,I/O性能已经成为众多HPC应用程序的性能瓶颈,提升应用程序的I/O性
随着信息数量及用户数量的迅速增长,网络经常由于数据包产生速率超过了整个网络的通信能力而产生了拥塞现象。而网络的拥塞控制与路由策略关系密切,该领域的研究受到了学者的广
随着信息技术的进步,Java语言越来越广泛的应用于编程当中,一方面改善了设计质量,提高了编程的效率;另一方面使得软件越来越复杂,发现程序的漏洞特别是并发、多线程程序的漏洞异常
随着对嵌入式应用要求的不断提高,单核处理器在复杂功能实现上出现了不足与局限性,多核技术的发展也越来越受到人们的关注。SOPC通常是指在单个芯片上通过编程实现的数字计算
由于Web服务遍布世界各地,因此Web攻击数量在迅速增加。近年来,各种Web攻击事件,比如SQL注入攻击、网站扫描攻击等频繁出现,Web安全问题引起了大家的广泛关注和讨论。Web访问