基于缝隙裁剪的满文单词分割和提取方法研究

来源 :中文信息学报 | 被引量 : 2次 | 上传用户:dgjjtjn
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
从大篇幅的满文文档图像中分割和提取满文单词,是满文文档分析的关键步骤。该文提出了一种基于缝隙剪裁的满文文档图像单词分割和提取方法。首先,通过投影轮廓匹配策略初步涂抹并确定文本列数目;然后,在相邻文本列间自底向上地进行动态规划,寻找最小能量线,并通过中线区域约束得到不损坏满文文字部件的最佳分割线;最后,依据分割线提取独立满文文本列进而提取满文单词。结果表明,该方法在满文文档图像数据库上取得了较好的分割和提取效果。
其他文献
机器阅读理解是自然语言处理(NLP)领域的一个研究热点,目前大部分的研究是针对答案简短的问题,而具有长答案的问题,如描述类问题是现实世界无法避免的,因此有必要对该类问题
张燕虽然在其他行业有着3年的管理经验,但刚接手的这家美容院管理不到两个月,却陷入了危机之中。除了业绩上不去,下属的几名美容师表面上看起来对她毕恭毕敬,但对她的要求却
“若不是长时间被冷落,就民众自身而言,他们更希望成为新型城镇化建设的主角而不是一名看客。”  作为第一届中国民生发展论坛协办单位的掌门人,广州市容大生物技术有限公司(以下简称容大生物)董事长韩敏在论述“新城市化下的企业机遇与社会责任”议题时,所持观点被点评为“直抒胸臆、亲民一派”。  在论坛上,韩敏认为,在以政府为主导的新型城镇化建设过程中,政策的制定者以及城市的管理者决不能脱离民众,相反要去影响