论文部分内容阅读
由于不同的维吾尔文网站采用了不同的字符编码或不同的字库体系,使得单一的搜索引擎很难兼顾不同的维吾尔文网页信息。针对维吾尔文网页内容检索特点,提出了利用元搜索引擎完成网页信息采集,通过信息过滤技术从动态的信息流中抽取出符合用户个性化需求的信息条目,经去重后栽入采集数据库,通过与敏感信息库进行比对,发掘出发布特定信息的网页。