半结构化文档数据流的快速频繁模式挖掘

来源 :东南大学学报:自然科学版 | 被引量 : 0次 | 上传用户:dbscy001
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
为了提高半结构化文档数据流的挖掘效率,对原有挖掘算法StreamT进行了改进,提出了一种半结构化文档数据流的快速频繁模式挖掘算法——FstreamT.该算法针对利用集合存储候选频繁模式效率较低的缺点,采用枚举树存储候选频繁模式,可以有效地提高对候选频繁模式集合进行查找和更新的效率,同时利用频繁模式的单调性和枚举树的特点减小了维护负边界的搜索空间,从而提高了整个算法的效率.理论分析和实验结果表明,算法FStreamT与算法StreamT相比具有较高的效率,是有效可行的.
其他文献
党的十五届四中全会是深入贯彻十五大精神的一次重要会议,集中研究了国有企业的改革和发展问题,提出了搞好国有企业改革与发展的一系列政策措施,充分柏示厂党中央对搞好国有企业
在直接蒸发冷却和间接蒸发冷却(IEC)优化组合的基础上构建了溶液除湿蒸发冷却系统(LDCS),该系统通过IEC对排风进行全热回收,并能够提供高质量的空调送风.研究表明:用LDCS进行空气调节
远离故土灌南600多公里的杭州乃“人间天堂”,处处洋溢着现代大都市气息。在杭州,在许多来自灌南的农民“淘金者”,他们从迈入杭州的那一刻起,就用自己的辛勤、自己的朴实,自己的
为了正则化扩散张量磁共振成像所产生的扩散张量场,提出了一种非线性张量值加权方向-距离滤波方法.首先通过张量间的二次点积定义了张量值图像的方向滤波,然后结合张量中值滤波
工业化、现代化目标的最终实现,离不开一支高素质产业大军的支撑,而产业大军的培养和缔造,又与职业教育发展水平息息相关。近年来,在高校连续扩招引起的“普高热”和经济结构调整
张怀西,江苏无锡人。做过教师,担任过副县长、副市长、江苏省副省长,现任全国人大常委、全国人大教科文卫委员会副主任、民进中央副主席。今年年初来郑视察民进河南省委工作期间
目前,乡镇企业正进入一个全面创新的发展阶段,处在一个极为重要的转型时期:买方市场的竞争环境不断加剧,民资,外资企业等各种经济成份迅猛发展,原有的政策优势在弱化,自身的机制优势
编者按:省委组织部、统战部、省宗教局《进一步贯彻落实〈关于在农村基层组织建设中认真妥善处理好宗教活动问题的通知〉的意见》下发后,各地认真贯彻落实,取得了较好的效果。商