基于频繁模式挖掘的中文关键词提取算法

来源 :太赫兹科学与电子信息学报 | 被引量 : 0次 | 上传用户:zhaojian1990
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对现有关键词提取算法存在计算复杂、语义信息挖掘较浅等问题,提出一种基于频繁模式挖掘的中文关键词提取算法.该算法采用改进的FP-增长算法挖掘词共现信息,排除噪音词汇;利用语义相似度算法消除同义词;精简候选词特征,在保证较高准确率和召回率的条件下减少了存储空间和计算量.实验结果表明,该算法所获得的平均F值为59.7%,高于若干经典算法;支持度计数是最重要的影响因素.
其他文献
针对标准粒子群算法易陷入局部最优、收敛过早的缺陷,提出了一种模糊自修正粒子群算法。通过利用模糊推理机制建立了粒子适应度值隶属度函数,在每次寻优过程中,使得各粒子根据自
为克服无人机天线之间的相互干扰,采用遗传算法对天线进行优化布局,以减少天线间的耦合。通过采用一种新的目标函数,结合一致性几何绕射理论对圆柱体上的单极子天线和无人机表面
对肉苁蓉生品及不同炮制品中麦角甾苷的含量进行比较研究。采用高效液相色谱法测定麦角甾苷含量,使用YWG-C18色谱柱,甲醇-10ml/L乙酸为流动相,UV检测波长为332nm,麦角甾苷在0.1-0.8μg范围内与峰面积呈良好的线
超宽带雷达不受雨、雪、声、风等自然环境的干扰,可用于无线传感器网络并全天候工作;在通信领域,超宽带雷达可避免多径干扰问题,解决无线传感器网络在复杂多径环境中的应用局
结合深圳多端柔性直流配电示范工程,研究了柔性直流配电网的保护配置和直流线路故障定位方法。首先根据实际工程的电路拓扑结构,明确了柔性直流配电网保护区域的划分方法。其
当目标相对雷达存在二维转动时,即使采用单频雷达也可获得目标的二维图像。特别是在目标围绕2根垂直于雷达视线的正交转轴旋转时,成像投影平面垂直于雷达视线,获得视角类似于
仁者爱人认识徐大成先生有很长一段时间了,知道他研制的"艾氪新"能康复肿瘤,但是总认为与自己的生活无关。在年初一次例行的体检中,我被查出患了子宫颈中度糜烂。其实不算什么
北京中科福康生物科技有限公司是集科研、生产、销售及健康管理为一体的高科技企业,作为清华紫光药业的科研合作伙伴.公司一直致力于生物工程高新科技的研发和推广工作。在清华
通道幅相差的存在会导致直接定位算法(DPD )精确度下降.分析了通道幅相差对多阵列直接定位算法的影响,并在通道幅相差存在的情况下提出了一种改进算法.该算法利用各阵列通道幅
提出一种利用低漏抗变压器和并联型低压有源电力滤波器实现对高电压等级补偿的新方法。针对现场工况情况,考虑到变压器的移相特性,采用一种新型数字锁相环技术对原有控制策略