论文部分内容阅读
在计算机视觉领域,图像理解是十分重要的一个分支,而要对图像进行准确的理解,对光源信息的确定是不可忽略的一个重要部分。当三维物体确定之后,只要再加上适当的光照,就能恢复出源图像中的信息,使系统能够更好的理解图像。为此,本文提出了一种基于渲染的光源定位系统,通过从图像中理解出的三维立体模型,再在渲染软件中建模,从而对不同的光源位置进行渲染,最终得到对输入图像的光源位置的估计。由于在图像理解过程中,是从已知图像中得到所有的图像信息,相当于一个反向求解的过程。而引入图像渲染以后,通过三维物体和光源信息就能确定出一幅图像,从而使得光源位置参数变为一个正向试根的过程,通过对光源位置进行指向性遍历,然后得到一个与源图像最近的图像所对应的光源位置,即为本文对光源位置参数的最佳估计的方法,使得光源定位方法变得更加容易理解,从而具有更高的可靠性。本文分析了光源定位在图像理解过程中的必要性和可行性,并且通过分析光源定位算法的历史发展和研究现状,并在基于渲染的图像理解的算法框架下,分析了算法的可行性。然后本文着重介绍了基于渲染的光源定位系统的算法流程,和相关的图像渲染以及灰度评价的理论,并且针对实验所遇到的局限性。并对在实验过程中遇到的问题进行了深入细致的分析,优化了评价函数。比较了基于渲染的光源定位算法相对于传统算的优势,分别从在单光源下的精度比较和单光源下的物体多样性两个角度与传统算法进行了单光源定位的比较。然后对光源分类算法进行了仿真实验,并对实验结果进行了分析;在分类以后,利用两种精确定位方法对光源在分类区间内进行精确定位,并分别对两种方法进行了仿真实验,最后,对两种实验的结果进行比较,发现指向性搜索方式得到精确定位结果,不仅有很高的准确性,而且大大提高了精确定位的效率。