一种联合文本和图像信息的行人检测方法

来源 :电子学报 | 被引量 : 17次 | 上传用户:MARRYMAS
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对纯视觉行人检测方法存在的误检、漏检率高,遮挡目标以及小尺度目标检测精度低等问题,提出一种联合文本和图像信息的行人检测方法.该方法首先利用图像分析的方法初步获取图像目标的候选框,其次通过文本分析的方法获取文本中有关图像目标的实体表达,并提出一种基于马尔科夫随机场的模型用于推断图像候选框与文本实体表达之间的共指关系(Coreference Relation),以此达到联合图像和文本信息以辅助机器视觉提高交通场景下行人检测精度的目的.在增加了图像文本描述的加州理工大学行人检测数据集上进行的测评结果表明
其他文献
基于泊松方程和边界条件,推导了对称三材料双栅应变硅金属氧化物半导体场效应晶体管(MOSFET:metal oxide semiconductor field effect transistor)的表面势解析解.利用扩散-
针对自适应人机界面对用户行为意图预测的需求,提出一种基于眼动特征的人机交互行为分类及意图预测方法.通过建立简化的界面模型,将用户的行为意图分为5类,设计视觉交互实验收集相关行为意图状态下的眼动特征数据,利用SVM(Support Vector Machine)算法建立分类预测模型,结合差异性分析方法选取眼动特征分量,最终确定连续3个采样注视点的位置X坐标、Y坐标、注视时间、眼跳幅度以及瞳孔直径共1
摘 要:在公办、民营、公建民营等机构养老模式尚无法充分满足中国农村老年人养老需求的社会背景下,“慈善+扶贫+产业”的新型养老模式在农村地区应运而生。“慈善+扶贫+产业”的农村新型养老模式通过慈善奠基、扶贫保障、产业支撑、机构承接、需求导向等特质,链接、整合了社会、政府、市场、机构、个人等多个层面的资源,最大限度地发挥了社会和民间资本的力量。“慈善+扶贫+产业”的新型养老模式具有显著的成本和价格优势