论文部分内容阅读
维医药搜索平台对维医药信息的搜索进行了实践,同时也支持汉语的搜索,重点在底层环节的支持,包括搜索架构的选择,维文分词的处理算法等。核心架构采用Apache的爬虫和索引器,它们爬取特定站点的信息,并将原始数据结构化。还提供了B/S型的用户搜索界面,对返回的结果做了个性化的聚类处理,将结果加以分类并且以图形化的样式直观的显示出来。