基于CRFs的专利文献领域术语抽取方法

来源 :计算机工程与设计 | 被引量 : 0次 | 上传用户:ddudi5460
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
通过对新能源汽车领域中文专利文献中术语特点的分析,提出利用条件随机场模型,分别基于三词位、四词位和六词位的字序列标注进行术语抽取的方法。以字为切分粒度,避免在术语抽取过程中因分词原因导致术语识别错误问题,并探讨不同词位标注集对术语抽取性能的影响。实验结果表明,基于六词位字标注的条件随机场模型术语抽取的性能最好,准确率、召回率和F值优于对比方法中基于词、词性、词长等信息作为特征的抽取方法,验证了所提方法的有效性。
其他文献
本文首先对改进Sobel算子进行描述,然后提出了基于Sobel算子图像预处理的目标检测算法.该算法使用Sobel算子对图像进行预处理,通过阈值设定,检测运动目标,针对目标位置、速度建立图像ROI区域,对连续目标建立帧间关联,并确立置信度,最终实现目标检测目的。对该算法进行试验测试,试验表明,该算法能较好的检测运动目标,具有较好的鲁棒性。
本文主要针对柔性自动化技术中传感器的应用情况进行分析,目的是将柔性自动化测试技术的优势得到更加全面的体现,进一步推动我国电气自动化行业的发展,促使我国工业领域不断变革。
新闻视频由于其真实准确、内容丰富、信息量大等特点,成为人们获得信息的重要媒体类型。对于情报人员而言,新闻视频是一种公开的情报源,其时效快,且反映各国政治、经济、军事
北京玻璃仪器厂与世界知名的玻璃产品制造商美国肯堡成立合资公司,双方不久前举行了项目合作签约仪式。据悉,该项目建成并投产后,将可实现年销售收入1.7亿元人民币,实现利润超过30
本文首先系统介绍了三支决策的概念、数据缺失概念及产生的原因、数据缺失机制、缺失数据处理方法 ;对数据缺失常见的方法引入三支决策思想进行综述。并简单介绍了根据不同数据集的不同特点选择更适用的方法 ,只有这样才能更接近良好的处理效果。并表示随着缺失数据处理方法的增多,考虑三支决策思想,将对数据缺失处理领域带来良性的效果。
目的探讨临床路径式护理教学在急诊外科临床护理教学中的建立与应用。方法选取急诊外科2013年1月~2014年12月大专护理实习生60名为对照组,选取急诊外科2015年1月~2016年12月
【正】 为了响应党的号召,向科学进军,图书馆应更好地为科学研究工作者服务。图书馆对科技图书的处理,应有更好的方法。一般图书分类法都把科技图书分为两大类——自然科学、
由于K均值算法易受噪声干扰且对初始粒子的选取较为敏感,在进行PHD状态提取时,难以获得稳定可靠的状态估计结果。对此,提出基于谱聚类的自适应新生目标强度状态提取方法,运用
针对教学优化算法(TLBO)在解决复杂实际问题时易陷入局部最优的缺陷,提出一种改进教学优化算法(MTLBO)。在教师阶段引进自适应基准消除“原点偏好”,在学生阶段引进分科学习
为解决现有高速公路逃费预测方法的准确率和稳定性低等问题,依据车辆收费数据提出一种基于IGA-IBP算法的预测模型。优化遗传算法中的变异算子和BP神经网络的隐含层和输出层之