基于语义的互联网信息分析技术研究

来源 :南京航空航天大学 | 被引量 : 0次 | 上传用户:yilongzhanyuye1
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
互联网中海量的非结构化信息包含丰富的语义内容,对其进行语义分析具有重要的意义。语义分析的对象主要有文字、图像和图像中的文字。微博是当前流行的社交网络,其中包含大量的文字和图像。本文对微博中文字信息的语义分析技术做了研究,并将图像作为单独研究对象,分别在图像文字提取和图像语义分类技术上进行了研究。本文的主要工作如下:(1)为了分析用户对微博事件的推动价值,研究了用户的事件影响度和事件潜力值等评价指标,设计了相应的算法,并通过实验进行了验证。(2)提出一种基于形态学和色彩分层的图像文字提取方法。该方法首先提取边缘图像,然后根据形态学方法和文字特点提取长方形区域和非长方形区域,最后分别处理这两类区域。处理非长方形区域时使用了色彩分层法。方法中还研究了大字修复算法,使得方法能同时适用于小字体和大字体的文字图像。实验结果表明方法具有较高的准确率。(3)提出一种基于HSV分层的局部特征和SVM的图像语义分类方法。方法对图像的底层视觉特征进行提取,包括提出的基于HSV分层的局部特征,并用SVM对图像进行语义映射。该方法融合了局部特征和全局特征,提高了语义分类效果。实验结果证明了方法的有效性。(4)实现了一个基于语义和图像文字提取的图像检索系统。系统对输入的文字图像进行文字提取和识别,并对所有图像进行语义分类,因而可以同时检索文字图像和普通图像。
其他文献
人体运动捕获是计算机视觉研究领域的重要课题之一,也是近年来备受研究者关注的前沿方向。本文集中研究基于数据库的运动技术进行人体三维重建,包括对动作的检索和查询和动作数
基于物理的流体模拟一直是计算机图形学中的热门研究领域之一。其中,烟雾模拟因其重要的应用价值,更是成为了人们研究的重点。它广泛应用在游戏引擎、影视特效、灾难场景的模拟
在信息时代,数据是企业重要的资产,防范数据资产泄漏是意义重大的课题。本文立足于数据防泄漏保护的研究,旨在构建一个检查文件安全性的有力工具,阻止敏感数据的泄漏。为此,
本文探讨了应用基于种群交叉策略遗传算法对无线传感器网络布局进行优化。无线传感器网络(Wireless Sensor Network WSN)是由一组低成本,低功耗,多功能和小规模的传感器节点组
数据链路通信是对物理层的通信传输进行原始比特流功能的加强,将物理层提供的可能出错的物理连接改造成为逻辑上无差错的数据链路。本文的选题主要是在数据链路通信的基础上进
无线Mesh网是一种多跳、高速率、大容量的新型无线网络结构。它融合了无线局域网和移动Ad hoc网络的特征,是“最后一公里”宽带理想的接入方案。作为下一代无线通信网络宽带理
特征提取是模式识别所研究的关键问题之一,其基本任务是寻求对分类尽可能有效的特征。在监督的特征提取方法中,线性判别分析(LDA)具有代表性,并已在人脸识别、文本分类、信息检索
基于三维人体运动数据的情感识别是一个崭新的人体运动学与模式识别的交叉课题,该技术的研究目前尚处于起步阶段。本文对该技术进行了深入的探索与研究,包括人体运动建模、Peri
数字化、高清晰度、可连接网络、自带操作系统的智能电视成为了下一代电视的发展趋势。虽然智能电视与传统电视有许许多多的不同,但智能电视在提供新功能的同时也需要支持传统
随着电子政务信息化进程的推进,电子政务的优势凸显,对比传统政务方式,工作效率有了极大的提高,但是因为初期建设时缺乏统一规划,各个业务系统间不能相互沟通交流,形成了一个个的“