企业社会媒体主题信息提取算法研究

来源 :煤 | 被引量 : 0次 | 上传用户：chywei

【摘要】

：

鉴于已有信息提取方法的可改进之处，结合对HTML网页性质的统计和分析，针对社会媒体中的用户生成数据，提出一种网页主题信息提取算法。算法依据DOM的树型结构特点，充分考虑节点中

【作者】

：

孙宝华

【机构】

：

潞安矿业集团公司租赁站

【出处】

：

煤

【发表日期】

：

2014年1期

【关键词】

：

社会媒体网页主题信息 DOM树

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

鉴于已有信息提取方法的可改进之处，结合对HTML网页性质的统计和分析，针对社会媒体中的用户生成数据，提出一种网页主题信息提取算法。算法依据DOM的树型结构特点，充分考虑节点中非链接文字总数和超链接总数这些语义信息，对其进行基于HTML标签的过滤和基于语义的剪枝，能够准确地提取出网页HTML文档的主题信息。实验证明，提取到的主题信息具有较高的准确性和完整性。

其他文献

千米深井采区设计优化

根据15孜东矿首采区在施工中遇到的难题，对接替采区（1213采区）的布置进行合理优化：合理选择好的岩层层位来布置巷道、调整巷道间距减少工程扰动、采用新型支护方式等，以取得最佳的

期刊

千米深井采区设计锚架注

深部采区软岩巷道联合支护方案的设计与应用

随着告成煤矿开采深度的不断增加，矿压也随之增大，软岩巷道单一的锚网喷支护或U型钢＋喷浆的支护强度已经不能满足矿井的支护要求。为了有效防止25内、外环水仓以及泵房变电所掘

期刊

深部采区软岩巷道联合支护deep mining area soft rock roadway combined support

佳瑞煤矿主通风机监控系统设计与实现

构建煤矿主通风机监控系统,对煤矿安全、节能提效具有重要意义。文章论述了佳瑞煤矿主通风机监控系统的详细设计与实现过程,包括变频系统、主通风机PLC测控系统和上位机冗余

期刊

在线监测变频控制PLC组态冗余

湿法烟气脱硫过程中石灰石离解模型及应用

石灰石-石膏法烟气脱硫工艺已在我国得到了广泛的应用，其中石灰石的活性是湿法脱硫工艺中的一个重要指标。为了深入认识石灰石湿法脱硫体系中石灰石的溶解特性，以单个石灰石颗

期刊

烟气脱硫石灰石离解速率掩蔽效应数学模型flue gas desulfurization limestone dissolution rate

深部采区软岩大断面硐室联合支护技术研究

随着矿井采深不断加大,巷道逐渐向深部延伸,而地应力也越来越大,深部软岩大断面硐室变形破坏问题日趋严重,传统的巷道硐室支护技术已不适应。在石桥煤矿四采区-680 m水平配电

期刊

深部软岩大断面硐室联合支护deep soft rock greater chamber combined support

3V5Mn5Ce／TiO2催化剂SCR脱硝反应动力学研究

采用微波干燥法制备了3V5Mn5Ce／TiO2催化剂，考察了催化剂的脱硝活性及内外扩散对脱硝反应的影响，通过计算得出反应速率常数和反应活化能。结果表明：催化剂粒径小于0．38lnm，空速不大

期刊

催化剂SCR脱硝动力学3V5Mn5Ce/TiO2catalyst SCR denitration kinetics 3 V5 M n5 Ce/

综放工作面回撤期间自然发火事故分析

分析总结了宝积山煤矿701综放面、红会一矿1703综放面回撤期间两起自然发火事故,查找事故原因,对充分认识综放面末采回撤阶段防灭火工作的复杂性,全面、有效采取防治措施,避

期刊

综放工作面回撤自然发火事故

环境与健康工作存在哪些问题？

（1）重视不够，底数不清。我国环境与健康问题具有多样性和复杂性特点，因环境污染或污染事故导致的急性人体健康损害事件不断发生，相关部门对这些事件调查的范围、深度和广度远远不

期刊

环境污染健康工作健康问题健康损害污染事故复杂性多样性事件

企业社会媒体主题信息提取算法研究

其他学术论文