英文科技文档识别中数学公式定位新方法

来源 :大连理工大学学报 | 被引量 : 8次 | 上传用户:buzi899
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
提出了一种自底向上和自顶向下相结合的定位英文科技文档图像中数学表达式的新方法.首先,利用整幅图像的统计数据计算出用于分类的基准参数,然后利用局部极大成分的水平投影数据进行初步行分割,再利用每行的竖直投影数据将每行的符号分成数个子区域.对每一个子区域依据其性质利用基准参数进行分类,通过对特定类别子区域的适当合并,最终得到文档图像中公式的位置.新方法可以用于处理图文混排的文档图像,能够降低文档中的图片、表格等元素对于公式定位结果的影响.
其他文献
把样本分布信息融于特征提取过程将有助于提高特征的分类能力.利用模糊隶属度概念,提出一种基于模糊标号典型相关分析的特征提取新方法.构造模糊标号刻画样本的分布情况,并将其与典型相关分析结合,能提取综合灰度信息和分布信息的有效判别特征.此外,针对样本不足导致的小特征值包含较多干扰信息的问题,基于矩阵理论及双空间分析思想,进一步提出双空间模糊标号典型相关分析算法,缓解了过小特征值对算法性能的影响.在ORL
银行监管是指一国政府的金融主管机关或金融监管执行机关根据金融法规对银行实施的行为监督和业务规范,通过银行监管可以促进银行的稳健经营和公平竞争,保护存款人和投资人的
1典型病例马某,男,11岁。无发热、外伤等既往病史,无癫痫家族遗传病史.出现左侧肩胛部阵发性不规则异常抽动20d,可闻及“咯噔咯噔”抽动声,伴局部酸困不适,入睡后抽动可消失,精神、饮
目的:观察氧气驱动布地奈德和沙丁胺醇吸入治疗毛细支气管炎的临床疗效。方法:60例病例随机分为两组,每组30例。两组病例均采用抗感染、静脉滴注二羟丙茶碱、吸痰、吸氧等综合治
根据运动员训练自我监控行为表现特征和前人的研究结果建立了运动员训练自我监控的训练前、训练中、训练后3个一级因素和计划性、准备性、执行性、意识性、方法性、反馈性、
目的:观察碱性成纤维细胞生长因子(bFGF)对大鼠肺气肿病变的治疗作用,并探讨其可能机制。方法:24只Wistar大鼠随机分为bFGF组、模型组和健康对照组3组,每组8只。bFGF组、模型组用烟
针对以往夹层板理论大多忽略芯板的垂向应变这一不足,构造了一种考虑芯板垂向可压缩变形的夹层板位移模式,并推导了相应的有限元单元及控制方程,求解了夹层板动力响应,进而利
区域水资源复合系统的可持续利用演变呈不同S形增长模式.基于线性假设的Logistic模型不能够反映演变模式的多样性,所以引入更有弹性的Richards模型来描述区域水资源复合系统