论文部分内容阅读
光学关键尺寸测量(OCD)在10多年前开始就广泛应用在半导体生产设备中,用于在生产过程中对蚀刻的过程进行检测和控制,还有对光刻胶的修整。与其他的CD测量方法(CD-SEM、AFM等)相比,OCD可以对非常复杂的结构或者介质填充等复杂的样品进行无损测试,可以取得很高的测量精度,而且成本相对其他的方法要小很多,体积也要小于其他的测量设备。OCD测量平台的软件是最重要的构成部分,软件部分的性能决定了测量的精度和效率,软件部分主要由优化器和模拟器构成,优化器建模样本结构模型,然后模拟器计算其光学响应,通常取0阶衍射率,然后与真实的测量数据进行比对,然后修改模型,再进行计算,这样不断重复,直到与测量数据吻合,这时候的模型就是真实结构的关键参数。模拟器根据精确的衍射理论,通过一定的算法求解,得到光学响应。模拟器的性能决定了整个平台的性能。算法的好坏则决定了模拟器的性能,最常用的算法是严格耦合波分析法(RCWA),它是对麦克斯韦方程进行求解,但是通常情况下RCWA都要计算比较大的矩阵运算,尤其是其中的特征值求解非常耗费时间,制约了模拟器的效率。在尝试过GPU和多进程运算以后,得知GPU加速RCWA的瓶颈在于特征值运算,所以本文在其基础上尝试采用DSP对模拟平台进行加速,同时由于层吸收(SAM)方法避免了特征值运算,可以实现比较好的并行计算特性,也用来解决模拟平台的效率问题,本文也尝试使用DSP对SAM方法进行加速。DSP本身并不是应用于通用计算的,但是随着DSP性能的提升,DSP在乘法性能、存储器访问性能上得到了很大的提升,而矩阵运算本身对这两者的依赖非常大,这是本文进行这个工作的原因,同样的这个也是进行软件设计里最重要的,所以本文也重点对这2方面进行了详细的介绍和优化。而且更为关键的是DSP扩展非常的容易,可以在1个PCIE插槽上放置8片DSP;而CPU要进行扩展是需要对整个系统进行扩展,比如多路服务器;而对于GPU,每个PCIE插槽只能放置一到2个核心,而且高端GPU的功耗非常高。这使得可以在比较小的成本和功耗增加下大大提升平台的性能。