基于“固结词串”实例的中文分词研究

来源 :中文信息学报 | 被引量 : 0次 | 上传用户:lijie041132
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近几年的中文分词研究中,基于条件随机场(CRF)模型的中文分词方法得到了广泛的关注。但是这种分词方法在处理歧义切分方面存在一定的问题。CRF虽然可以消除大部分原有的分词歧义,却会带来更多新的错误切分。该文尝试找到一种简单的、基于"固结词串"实例的机器学习方法解决分词歧义问题。实验结果表明,该方法可以简单有效的解决原有的分词歧义问题,并且不会产生更多新的歧义切分。
其他文献
本文以2.2.15细胞株为模型,以HBsAg,HBeAg,HBV DNA,细胞存活率为观察指标,综合评价了喹酮类药物吡哌酸,氟哌酸,环丙氟哌酸,氟嗪酸体外抗HBV效果。结果表明:吡哌酸,吡哌酸、氟哌酸,环丙氟哌酸,氟嗪酸对HBsAg、HBeAg50%抑制浓度分
痘苗病毒感染HeLa细胞后形态学上出现了较典型的细胞凋亡特征,电泳分析显示出DNA阶梯,用DNA新裂原位检测技术发现其染色质断裂主要存在于核周,与染色质凝聚位置相似。
党的十八届三中全会指出,全面深化改革的总目标是完善和发展中国特色社会主义制度,推进国家治理体系和治理能力现代化。这一表述,反映了新形势下我们党对治国理政理念和方式规律
本文采用抗原捕捉ELISA方法检测了HCV感染者血清中抗-HCVIgG抗体轻链Κ和λ的比值,发现所检测的抗HCV-NS4、抗HCV-CP1和抗HCV-CP2抗体轻链的表达呈现明显的偏斜,65例抗HCV阳性者中63例(占96.9%),至少一种抗HCV抗体К/λ偏离了正常1∶1的比
评价对象是情感分析中情感信息的一个重要组成部分。该文基于条件随机场模型,研究多种特征在评价对象抽取任务中的表现,并将特征归纳为词法、依存关系、相对位置、语义四大类
为了加快推进政府职能转变,国务院常务会议要求积极推进政府购买社会组织、机构和企业的公共服务,以及落实引导民间投资措施。按照国务院的要求,各地,诸如北京、广东、江苏南京,正
以AcMNPV的多角体蛋白基因为探针,定位了中国棉铃虫单粒包埋核刑有体病毒的多角体蛋白基因。序列测定表明,HaSNPV的多角体蛋白基因编码区为738个核苷酸,编码256个氨基酸,预计蛋白质分子量为29kDa。同源性
国有林场和垦区棚户区改造是保障性安居工程建设的重要组成部分。各地越来越重视林区、垦区的棚户区改造,并在推进机制和管理制度方面进行了一系列探索。近期,我们对江西省国有
利用经典技术,着重分析了脊髓灰质炎病毒穿越细胞膜的对结构变化,探讨了脊灰病毒的结构变化与其进入细胞的关系,并研究了脊达病毒壳蛋白VP4在病毒穿膜过程中的作用功能,提出了关于脊
本文报道了97例疟疾患者丙型肝炎病毒(HCV)感染的原因。发现疟疾患者抗-HCV阳性率为71.13%,其中有单采血浆还输血细胞(下称单采浆)献血史者为89.71%,有受血史者为64.29%,既无单采浆史又无受血史者无一例抗-HCV阳性。