面向概括性小文本的文本分割算法

来源 :计算机工程 | 被引量 : 0次 | 上传用户:g56410029uoyuhao1995
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
文本分割是自然语言文本处理的一项重要研究内容。该文针对现有模型无法有效分割概括性小文本的不足,提出基于隐马尔可夫模型的统计算法。该算法利用小文本中各结构块的长度及词汇信息,对概括性小文本进行同一主题不同论述侧面的分割。对发射概率设计了基于句群和基于分割点2种不同的计算方法。以Medline摘要为样本进行的实验表明,该算法对概括性小文本分割是有效的,明显好于经典的TextTiling算法。
其他文献
目的评价磁共振弥散加权成像(diffusiion wieghted imaging,DWI),在脑脓肿与坏死囊变性脑肿瘤鉴别诊断中的价值.方法12例经手术病理(10例)或临床随访(2例)证实的脑脓肿和50例
开放型金属有机骨架配位聚合物(Metal-Organic Open Frameworks, MOFs)因其有机配体可供修饰而成为制备功能化材料的最佳候选。对热稳定性良好的MOF实施后功能化修饰日渐普遍
Hir/hira(histonc regulation)基因是组蛋白基因表达的负调节因子,其产物包含一组保守的蛋白家族,广泛存在于从酵母、果蝇、鱼、爪蟾、鸡以及到哺乳动物小鼠和人类等多种生物
目前,高校岗位津贴的实行虽然取得了一定的成效,但是仍然存在许多问题:岗位津贴制本身存在重约束。轻创造,重分配、轻效率,重视身份,忽视绩效;未能真正实现绩效与公平的统一;考核评价
热处理作为影响高温合金显微组织的重要手段,在高温合金的研究中占有重要的地位。了解合金显微组织演变有助于优化合金成分、显微组织和加工工艺,进而为研发并设计新一代高性能高温合金提供理论指导。本文利用JMatPro热力学模拟计算软件对不同硼含量合金的平衡相图、凝固路径等特性进行了计算,结合差示扫描量热法确定了合金的相变温度点,依据合金的凝1固特征温度制定了六种热处理工艺,对合金进行了不同工艺的热处理,并
在面向服务构架的应用流程中,服务使用者较难绑定高性能服务。该文结合Web服务质量评价模型和负载分摊策略提出一种Web服务动态绑定(DWSB)算法。DWSB算法优先选择质量等级较高
针对随机早期检测(RED)算法稳定性差的问题,根据排队论知识,在分析了决定其性能要素的分布规律之后,得出结论:路由器缓冲区的队列长度是非线性分布的,路由器尾丢弃率随队列平均长度
基于NetFlow流技术通过提取园区网边界数据流的地址、端口、协议和流量等特征属性在三维空间中建立流的几何可视化模型,简化了网络流量的显示,设计了基于地址段A的可变坐标几何