特征权重相关论文
朴素贝叶斯算法在给定输出类别的情况下,需假设属性之间相互独立,然而现实中这个假设一般不成立,导致在属性个数较多或者属性之间相关......
针对协同过滤算法在为用户商品相关性建模时未考虑用户/商品对特征属性的不同关注度及不可解释性问题,提出基于特征权重与情感偏好......
由于互联网和自媒体的快速崛起,人人都可以是内容生产者,各种信息文件呈爆炸式增长。我们不缺乏信息的来源,但找到需要的信息却愈......
如何对多视图无标签数据进行特征选择已经成为数据挖掘领域中的一个重要问题。现有的多视图无监督特征选择方法大多存在以下问题:样......
期刊
针对机器视觉场景图像中由于雨线影响导致背景信息模糊、损失的问题,提出一种基于倍频卷积和注意力机制的图像去雨方法。首先,建立基......
随着经济全球化进程的推进和国内外经营环境的越来越复杂多变,企业的生存也面临更多的挑战,而准确高效的管理决策能为企业持续经营......
随着科学技术的迅速发展,尤其是计算机、人工智能等技术的进步,离散装备制造业正在进行新一轮的产业变革,将智能化、信息化和工业......
液压系统作为自动化生产设备的重要组成部分,一旦出现故障将会严重影响系统安全可靠运行。利用系统状态数据挖掘深层特征信息进行......
随着通信技术的飞速发展,5G通讯的普及,电子邮件数据呈现爆发式增长。垃圾邮件日益泛滥,对垃圾邮件的分类和过滤变得越来越迫切。......
微表情是一种不受控制的面部肌肉运动,其通常出现在人类试图隐瞒或者压抑真实情绪的时刻。而与普通的面部表情有所区别的是,微表情......
随着互联网时代的来临,每一刻都会产生海量数据,其中文本数据以传输效率高、便捷性高、普及范围广的优势存在于各个领域中,而如何......
随着科学技术的快速发展,各个行业每天都会产生海量的数据。并且,数据维度的迅速扩张,造成了数据中噪声、冗余以及不相关特征越来......
分类问题是数据挖掘的主要任务之一。分类算法是指通过训练得到一个分类模型并对未知类别的样本进行预测,它在数据分析中的应用极......
气候分区是根据某些气象要素对特定区域进行划分,在农业生产和建筑节能领域都有着重要的应用价值。现有的气候分类方法大多只考虑......
为挖掘数据的非独立同分布关系并解决传统KNN算法中存在的分类结果不准确的问题,提出一种非独立同分布下数值型数据的KNN改进算法......
文本是互联网上的主要信息载体,文本自动分类技术能够有效地将文本信息组织管理起来,帮助人们准确高效的定位文本信息,为用户获取所需......
智能算法是一种受自然界中自然现象或生物体的机理启发而开发的仿生算法。随着人工智能的迅猛发展,各种智能算法不断涌现,其应用领域......
范例推理是人工智能领域中较新崛起的一种重要的基于知识的问题求解和学习的方法,它是根据过去的成功或失败的事例来推导出新问题的......
随着Web2.0的出现和发展,越来越多的人开始在网上表达他们对一些产品和服务的意见。用户的意见通常包括对该产品的整体评分以及一......
传统的聚类算法,如k-means算法、EM算法等,都是建立在凸形分布的样本空间上,若样本空间不为凸,算法将会陷入局部最优,因此不能对任......
随着Web资源的迅速增长,互联网中的信息越来越丰富。Web信息资源分类的质量将直接关系着现有信息资源能否高效的服务于信息需求者,......
随着互联网的发展,网络上的数据呈现了指数级地增长,互联网的用户也不断增加。如何从各种数据中快速准确的找到人们需要的信息,并......
互联网信息资源日渐激增,如何高效地从中取出有用信息成为学术界的一个重要研究方向。信息抽取是从半结构化或非结构化的数据中抽取......
伴随着信息技术的快速发展,网络成为了人们的一种社交平台,人们的生活、工作及学习也变得越来越网络化,电子邮件作为常用的网络交流工......
聚类是数据挖掘的重要研究方向。由于大部分聚类算法都没有考虑到用户分类习惯以及主要类别与离散类间的关系,聚类结果往往不易被......
伴随着现代旅游行业的飞速发展,网上酒店预订已然成为人们出行住宿选择的主要方式,日常生活中人们更倾向于在互联网中得到大量的出......
多光谱对地观测激光雷达是一种新型植被监测手段,其应用越来越广泛。现有多光谱对地观测激光雷达系统大多采用光栅分光、多通道光......
21世纪是信息时代,万维网上出现了海量的文本资源。对于互联网用户来说面对如此海量的文本信息,出现了拥有海量信息但知识相对贫乏的......
Leader算法是一种基于粗糙集的层次聚类算法,其聚类过程中各维特征贡献作用均等,这样的处理方法降低了主要特征在聚类中的贡献作用......
粮虫的识别属于参数多、混合度大的分类问题,特征客观权重的自动确定是粮虫可拓分类中的重要环节。提出了用聚类数评价函数自适应......
针对传统分词算法、传统提取关键词算法对现代营销活动中以客户为中心,分析客户评论,提取重要客户的需求具有局限性等问题,提出融......
重点讨论了基于案例推理中特征权重的自动学习方法.通过认真分析现有的一种利用粗糙集理论进行权重自动学习的算法,指出了该算法中......
用户属性在个性化服务中具有重要的作用,利用手机数据进行用户属性预测逐渐成为新方向.利用手机应用类别均使用时长和应用类别个数......
从可信计算角度,提出一种可靠信任推荐文本分类特征权重算法,分析了特征在文档中的特性,基于Beta分布函数研究了特征与文档类之间......
文本分类是研究文本数据挖掘、信息检索的重要手段,文本特征项权重值的计算是文本分类算法的关键。针对经典的特征权重计算方法 TF......
面对海量数据的管理和分析,文本自动分类技术必不可少。特征权重计算作为文本分类过程的基础,起到了至关重要的作用。为了提升文本......
传统基于概率的特征权重算法,往往只对词频、逆文档频和逆类频等进行统计,忽略了类别之间的相互关系。而对于多分类问题,类别之间......
特征项权重计算是文本挖掘中关键词提取的核心,其计算方法的好坏对文本挖掘的结果有着重要的影响。本文在对关键词提取特征项权重......
提出一种融合类无标度网的禁忌粒子群(ST-PSO)算法,并用其优化改进后的图像检索相关反馈过程.该方法通过融合类无标度网的禁忌粒子......
针对不同类别文档可能被表示为相同向量的问题,在研究常用文档特征权重计算方法的基础上,分析文档中特征项之间的相对位置关系,引......
分析传统基于多特征的图像检索算法,针对于传统算法核心仅放在如何更多的提取图像的底层特征,却忽视了如何组织这些特征,提出一种......
将神经网络算法应用于舰船目标识别,提出了一种基于神经网络的特征增强算法——AugNet。该算法在网络学习过程中自动分配通道特征......
短文本具有特征维度高且稀疏等特点,导致将传统的分类方法应用于短文本分类时效果较差。针对此问题,提出基于频繁项特征扩展的短文......
讨论基于案例推理中特征权重的自动学习方法.通过分析现有的一种利用粗糙集理论进行权重自动学习的算法,指出了该算法中存在的一些......