论文部分内容阅读
针对电商图片背景复杂、水印重叠等问题,论文实现了一种基于特征融合的文本检测模型。该算法先通过50层的残差网络提取输入图像的特征,然后将残差网络得到的每一层不同尺寸的特征图进行特征融合,对特征融合后的特征图进行回归和分类的操作,去除候选区域的提取、过滤和融合等步骤,提高模型的效率。利用改进后的NMS将预测的文本框合并,得到最终的检测结果。为解决非平衡数据的问题以及加快模型的收敛,模型引入了DiceLoss和实例间平衡的交叉熵损失相结合的损失函数。