面向Web的农业轻量级本体学习研究

来源 :合肥工业大学 | 被引量 : 0次 | 上传用户:chimaomao
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
我们正处在一个知识爆炸的时代。然而不同领域、不同性质、不同目的的知识以及不同的知识表示方法和推理机制,使得知识之间难以进行共享和互操作,人们仍然只能望洋兴叹。因此,人们越来越意识到,需要对知识在概念级上利用本体进行建模。经过几十年的发展,本体已涉及语义Web、智能信息检索、信息集成、数字图书馆等许多领域,并出现了一大批通用以及领域本体库和本体开发工具。   然而,单纯依靠手工构建本体,特别是大规模本体的构建,需要大量的领域专家,投入大量人力物力,开发周期长,成本很高,远远不能满足人们对本体的巨大需求,因此研究如何快速、自动构建大规模本体成为研究的热点。然而目前的本体学习方法在对领域概念的覆盖程度、时效性以及有效性方面存在不足。   有鉴于此,本文以农业领域作为应用背景,围绕着快速、高效、自动构建大规模轻量级农业本体展开研究。   本文的主要工作和创新点如下:   1. 实现了一种面向Web的自适应农业领域词汇挖掘算法,将领域词汇的自动获取问题转化为网页分类问题,同时采用近似最优策略,选取分类标签进行迭代提交,从而解决大规模农业领域词汇术语的高效获取问题,实验证明其收益率大幅提高,目前用这种方法已经获取了超过20万的农业领域术语。   2. 基于词汇专属度以及相似度,自上而下的构建农业领域词汇概念层次树,从而解决大规模农业轻量级本体构建的核心问题。用这种方法目前已构建超过5000多个术语的农业轻量级本体,涉及的领域包括种植业、农资市场、东海鱼类等。   3.本文将获得的农业轻量级本体应用于农业领域网页分类的任务中,通过对比实验,证明基于农业本体的概念空间模型较大程度提高了农业细分领域网页/文本的自动分类性能。同时,研发了农业网页自动分类系统。   最后,本文进行了总结,并展望了下一步的工作。  
其他文献
当大规模流感或传染性疾病爆发时,在学校校园这种人群居住比较密集的环境下,一旦出现一例传染源,将容易导致发生大规模传染性疾病。在监控流行性传染病的指标中最直接的指标
针对LTE系统中小区间干扰比较严重,已有的干扰协调技术不能很好的解决边缘用户频谱效率低的问题,在LTE-Advanced系统中引入了协同多点传输和接收(CoMP)技术。该技术通过各个小
TD-SCDMA(时分-同步码分多址)是由CWTS(中国无线通信标准化组织)提出的、拥有我国自主知识产权的第三代移动通信标准(简称3G)。该标准将智能天线、联合检测、同步CDMA和SDR(
随着计算机的普及以及计算机科学技术的迅猛发展,人类对计算机的依赖性不断增强,一场信息革命正在酝酿,新型的人机交互技术正逐渐成为研究热点。语言本身作为人类特有的功能,
本文主要阐述了基于FPGA的10G EPON物理层的设计与实现。首先介绍了以太网技术、接入技术的发展历程以及10G EPON系统的工作原理和相关理论知识,随后介绍了ESL建模在整个系统
随着通信技术的不断发展,现代通信系统对通信的有效性和可靠性提出了更高的要求,如何有效提高这两项相互矛盾又相互制约的性能指标,一直都是通信领域的研究热点,并且通信系统的安
移动互联网的快速发展极大地刺激了人们对无线通信高数据速率和多业务服务的需求。然而无线频谱资源非常稀缺,因此提高其利用率是无线通信研究的重要内容之一。正交频分复用(Or
音乐是人们日常生活的重要组成部分,可谓是人类精神生活的润滑剂,从古至今音乐的熏陶与鼓舞从未间断。分析音乐信号对研究音乐有积极的促进作用,而音乐信号音符识别在自动音