基于改进后缀树算法中英文聚类引擎的实现

来源 :吉林大学学报:理学版 | 被引量 : 0次 | 上传用户:xjj
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
提出一种基于改进后缀树与交互聚类思想相结合的算法——ISTC算法,通过改造传统后缀树结构实现了对文档标题和摘要的层次化聚类,同时用交互聚类的方式替代了传统的递归算法.ISTC算法具有语言无关性,不仅适用于基于单词的西方文字,而且可以在不引入词典分词技术的情况下有效地处理基于单字的中文字符.在此算法基础上,设计并实现了基于改进后缀树算法的交互聚类引擎,在不同的网络环境下对其进行了系统测试,并与其他元搜索引擎进行了对比.实验结果表明,使用改进后缀树算法进行实时交互式聚类是可行的.
其他文献
对氢化非晶硅(a—Si:H)进行了脱氢和不同能量密度的准分子激光晶化多晶硅的实验,对所得样品用X射线衍射表征.针对多晶硅(111)面特征峰的强度、晶面间距和宽化信息,分析了激光功率