TextTiling算法相关论文
文本分割是信息检索的一个重要问题。文本分割是指在一个书面文档或语音序列中自动识别具有独立意义的单元(片段)之间的边界,其分割对......
如何正确有效地确定文档的子主题边界对于自动文摘、问答系统等自然语言处理应用是非常重要的。然而多数文档中子主题之间没有明确......
个性化信息检索可以根据用户的检索兴趣返回个性化的检索结果。提出了用户新兴趣发现子任务,根据用户检索对象的变化识别包含新检索......
讨论了一种运用于搜索引擎中的多文档自动摘要技术。传统搜索引擎返回结果繁杂,常用的解决方案是使用聚类技术将内容相似的网页集合......
主题分类是数据挖掘中文本分类的一种应用。介于流行病新闻的特点以及数据挖掘的特殊性,文中提出了一种专门用于中文流行病新闻主......
文本结构分析在信息检索、自动文摘、信息抽取等领域扮演着重要的角色。文本结构分析是将含有多个子主题结构的文本按语义划分成多......