【摘 要】
:
在特定信息域内的网络文档中,主题及其特征词的抽取工作是近年人工语言处理研究的重点,其研究结果具有显著的管理决策意义。本研究提出一种新的数据挖掘方法用于从海量UGC中分
【机 构】
:
电子科技大学经济与管理学院,四川旅游学院信息与工程学院,中国民用航空总局第二研究所
【基金项目】
:
国家自然科学基金资助项目(71271044、U1233118、71102055、71572029、71490723)
论文部分内容阅读
在特定信息域内的网络文档中,主题及其特征词的抽取工作是近年人工语言处理研究的重点,其研究结果具有显著的管理决策意义。本研究提出一种新的数据挖掘方法用于从海量UGC中分析出其“热点话题词”和“局部特征词”之间的关联关系。首先,利用网页抓取工具从网上获得某个域相关的文档,并对文档内容实施分词操作。然后,基于分词结果,抽取网页文档中存在的域内信息词并组成新的数据集。最后,我们提出一种基于热点话题词和语义分隔符号的数据集切分方法来获得每个热点话题词相关的本地特征词数据集。并且在该数据集上,可以分析出特征词对于热点
其他文献
腐植酸对化学肥料有明显的调控和增效作用,主要表现为对氮、钾缓释,对磷活化,从而提高了化肥的利用率。作者从理论上阐述了腐植酸增氮解磷促钾的调控机理,也通过一些实例证明
<正>【报告提要】1腐植酸应用盐碱地改良的历史自1978年吉林农业大学土壤教研室用硝基腐植酸,在盐碱地上种植玉米取得成功以来,经过大量实验证实,腐植酸在改良园林盐碱地中作
目的:优选黄芩汤的提取工艺。方法:以方中黄芩苷含量、芍药苷含量和干膏率为指标,采用L9(34)正交试验法,优化黄芩汤的提取工艺。结果:黄芩汤最佳提取工艺为加水量为其处方量
随着“互联网+”计划的提出和实施,“互联网+农业”的潜力也逐渐被激发出来。农业作为基础产业,亟需使用现代化技术提升生产效率。通过云计算、大数据、移动互联网、物联网等新技术,对土壤、肥力、气候等进行分析,据此提供种植、灌溉等方面的解决方案,从而实现精细化操作,在提升生产效率的同时又节约了资源。由于农田无线电环境较为复杂,农业物联网系统往往在无线侧存在着资源开销大、可靠性较差、耗电高等问题。本文设计了
目的:了解结核病患者家属生活质量及其影响因素,为提高结核病患者家属生活质量提供参考依据。方法:采用世界卫生组织生存质量测定量表简表(WHOQOL-BREF)对长沙市4所结核病医
三氧化二砷冶炼过程中产生大量含砷废渣,此类废渣对环境的危害极大,目前国内外常规的稳定化技术、固化技术难以从根本上解决其对环境的危害,通过大量的试验和实践,证明此类废
对水中氰化物测定中的不确定度进行分析,根据建立的数学模型,找出影响不确定度的因素,运用测定不确定度评定与表示的理论,建立了有效的数学式。根据数学式,通过实验测定标准
<正> 当今居住在美国、以色列、原苏联等地的犹太人仅有12806400人,虽然是一个比较小的民族,却在世界民族之林中占有非同小可的地位。它有着不同寻常的传奇经历、十分旺盛的
论述了BFe30 1-1冷凝管生产工艺的优点及主要问题,对现行生产工艺提出了改进方案。