面向综合集成研讨环境的主动信息获取技术研究

来源 :中国科学院研究生院 中国科学院大学 | 被引量 : 0次 | 上传用户:yp7611
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
20世纪90年代初期,我国科学家钱学森院士等人提出了用于处理“开放的复杂巨系统”及相关问题的方法论一综合集成法。综合集成法的构思是将人集成于系统之中,采取人一机结合的技术路线,充分发挥人和计算机各自在信息处理方面的优势,解决那些单靠人或计算机都难以解决的问题。1992年,综合集成法被进一步发展为综合集成研讨厅体系,其要点是借助专家研讨和智能化信息处理工具,把综合集成法中的个体智慧明确上升为群体智慧。   在综合集成研讨厅的应用过程中,已经发现:来自互联网的权威信息可被视为一个“特殊专家”的重要观点,对于启发、激活专家思维具有重要意义。然而在存在时间压力的情况下,频繁的信息检索以及随之而来的信息过载将极大加重用户(专家)的工作负担,导致传统的信息获取方式在综合集成研讨环境中难以使用。因此,我们需要一种主动化的信息获取方法,在研讨进行过程中主动感知当前话题,自动根据话题选择合适的检索词进行检索,并主动将检索结果推送给相应的用户。这一过程涉及到结构化领域词典的构建、研讨话题的实时提取及研讨用户兴趣建模等关键问题,本文针对这些问题开展了研究,具体研究内容和成果包括:   1.提出了一个主动信息获取技术框架。该框架主要包括结构化领域词典构建模块、研讨文本分析模块、用户兴趣模型构建模块及个性化信息检索与过滤模块。该框架的工作流程为,在研讨开始前,根据研讨所在领域搜集相关背景资料,生成研讨所需结构化多领域词典,并对参与本次研讨的用户,根据其历史发言记录建立兴趣模型;在研讨进行过程中,定时读取研讨发言,生成反映研讨主题及所在领域的话题,判断并跟踪话题的变化;当话题发生变化时,生成检索词送入搜索引擎进行检索,将检索结果依据研讨文本内容进行过滤,将得到的与研讨相关的信息根据用户兴趣模型进行筛选,得到个性化的信息推荐给相应用户。该框架的设计符合研讨厅本身研讨内容领域性强、信息快速流动变化、用户作为一个整体协同开展工作等特点,有助于指导主动信息获取中相应研究工作的开展,其应用与实施也是对现有研讨厅环境的重要补充。   2.提出了一种结构化领域词典生成方法。该方法主要包含两个步骤:1)采用潜在话题模型建立领域与词汇之间的关系,从多领域语料中挖掘各个领域的领域术语;2)在每个领域的语料上,采用词问关联范式(word associationnorm)度量领域术语之间的相关性,学习该领域术语之间的层次关系。本文分别在中英文语料上二进行了实验,并采用人工与自动结合的方法对算法进行了评价。实验结果表明,方法挖掘出的词条能够很好的表示相关领域的内容,学习到的层次关系能够有效的反映所在领域的结构特点,同时比现有技术具有一定的优势。   3.提出了一种新的基于标签的发言段落话题表示方法。首先,针对研讨环境中发言文本短小、领域性强等问题,选取已标注过的文本作为背景语料,分别采用语言模型、潜在狄利克雷模型(LDA)、概率作者话题模型及语言模型与LDA模型的组合,建立标签与组成文本的特征词之间的关系模型,再将该模型用于研讨文本话题表示中,提取标签形式的话题。该方法相比传统的关键词话题表示方法,所提取的话题主题性强、意义更加明确。   4.提出了一种基于子讨论结构的研讨文本建模方法。该方法将研讨发言依据其内容,按照时间顺序聚成不同的类,每个类别为一个子讨论。再将各个子讨论根据其在研讨中的重要程度进行组合得到整个研讨的模型,并将模型用于外部相关信息识别及历史研讨检索任务中。实验结果表明,本文提出的方法相比其他传统方法能够有效的发现讨论的子主题,在相关应用任务中取得了更好的效果。   5.提出了一种面向研讨层次结构用户个性化兴趣建模方法。该方法利用研讨过程中用户的发言、用户之间的回复关系及研讨所在的领域,分别对用户在各个领域及领域内部的兴趣进行形式化的表示。本文将得到的用户兴趣模型用于新研讨推荐、外部新闻信息推荐及研讨用户检索等任务中。实验结果表明,该模型能够反映用户的兴趣及用户之间的关系,是向用户推荐高质量、个性化信息的重要依据。   6.设计了一个面向综合集成研讨环境的主动信息获取系统。综合应用上述研究成果,本文给出了综合集成研讨环境中的主动信息获取系统的概要设计,叫确了各个模块的功能和实现方法,为系统开发奠定了基础。
其他文献
生产调度在计算机集成制造系统中是连接管理层与监控层的枢纽,它通过传递决策层的经营管理决策,向监督控制层下达指令,以保证企业生产有条不紊的进行,是流程工业中能否成功实施CIMS的关键。调度问题与企业的利益最大化是紧密相关的,对于我国现代化生产制造过程的发展起着至关重要的作用,其中Flow Shop调度问题是一个非常典型的生产调度问题。本文通过引入异步进化策略设计与改进现存的智能优化算法用于解决Flo
冷凝器管道内的污垢检测数据是维护冷凝器高效运行的重要数据之一,直接关系到机组的运行过程中的经济性和安全性,因此必须对管道内污垢形成的关键参数进行有效、实时测量。本文
随着现代科学技术的发展,精确制导武器在现代战争中的地位越来越不可忽视。研究精确制导武器的制导控制系统设计具有重要的意义。本文研究的空间拦截器的姿态控制方法为精确制
随着大规模集成电路技术、微电子技术、计算机网络和电力电子技术的发展,运动控制系统已经从以单片机、微处理器为核心和以专用集成芯片(ASIC)为核心的运动控制系统,发展到了
随着机械臂在工业、特种机器人、医疗、服务型机器人中越来越广泛的应用,同时对机械臂控制器功能多样化复杂化的需求也日益增加。机械臂控制系统的研究成为当今机器人领域的一
随着全球经济的快速发展以及社会需求的不断提高,工业生产过程正朝着智能化、集群化和复杂化的方向发展。与此同时,工业系统的故障也随之变得更加的难以检测,如何对复杂工业生产
写作作为语言学习的一个组成部分,一直以来就占有举足轻重的地位。随着全球化的不断深入,第二语言学习的流行越发成为促进文化交流的一种趋势。在这种趋势之下,语言学习中传
随着社会老龄化问题的日益突出,提高老年人和残障者的生活自理能力是整个社会不得不认真面对并努力解决的一个重要问题。日常生活中普遍存在的楼梯是目前的普通轮椅和电动轮
近年来随着电力电子技术和控制技术的迅速发展,无刷直流电机以其体积小、效率高、运行可靠、维护方便等一系列优点,在工业控制的各个领域得到了广泛应用。现代工业的发展对无刷直流电机控制系统的性能要求也不断提高。因此,研究具有响应速度快、调节能力强、控制精度高的无刷直流电机控制系统具有十分重要的意义。本文介绍了基于DSP的无刷直流电机控制系统的硬件与软件设计。系统采用TI公司专门为电机的数字化控制而设计的D
本文通过研究离散小波变换(DWT)与传统数据校正理论相结合以处理动态系统的数据校正问题。在动态数据校正问题处理中考虑通过两种方式来进行。首先第一种方式为先将动态系统