【摘 要】
:
本文采用机器学习方法研究统计物理模型的相变,其中主要使用主成分分析Principal Component Analysis算法及其变种核主成分分析Kernel Principal Component Analysis和扩散映射Diifusion-Map三种算法等降维算法和聚类指标Calinski-Harabaz指标来寻找物理模型的相变点。首先使用降维算法对有着庞大维度的物理模型数据进行降维,之后使
论文部分内容阅读
本文采用机器学习方法研究统计物理模型的相变,其中主要使用主成分分析Principal Component Analysis算法及其变种核主成分分析Kernel Principal Component Analysis和扩散映射Diifusion-Map三种算法等降维算法和聚类指标Calinski-Harabaz指标来寻找物理模型的相变点。首先使用降维算法对有着庞大维度的物理模型数据进行降维,之后使用K-Means聚类算法与聚类评估指标Calinski-Harabaz进行分类和评估聚类情况,通过评估结果找出不同相之间的相变边界。近些年来,机器学习方法被应用于预测物质相变的各个状态以及它们之间的转换,但在拓扑相变(例如在经典XY模型)中,其相变点很难通过使用无监督学习(例如PCA)来获得。2019年,哈佛大学的研究者发表在《Nature Physics》上的文章使用了降维算法中的扩散映射算法来预测拓扑相变,并能够确定经典XY模型的Berezinski-Kosterlitz-Thouless相变,方法是通过不同簇平均距离和簇内离散距离的交点。但由于拓扑约束,如果或没有太大变化,就不容易找到交点。本文我们使用的Calinski-Harabaz指标来确定临界点,这种指标与/的比值相似,但是Calinski-Harabaz指标会在相变点位置达到峰值,从而帮我们确定相变点。我们在几个统计物理模型中检验了Calinski-Harabaz指标,包括那些包含Berezinski-Kosterlitz-Thouless相变的模型。对于伊辛模型,Calinski-Harabaz指标或其分量的极值与比热极值位置一致。对于正方形和六角晶格上的经典XY模型,Calinski-Harabaz指标结果显示了在超参数/0的范围内峰值的收敛。我们还研究了q=2和q=8的广义XY模型,并分别用1/2涡旋或1/8涡旋研究了相变,可以获得全局相图。本文主要研究内容为:第一章,介绍了机器学习研究物理相变的背景、意义以及本文的研究动机,所使用物理模型数据和拓扑相变,以及具体的研究内容。第二章,阐述了文中使用到的降维算法,分别是主成分分析算法、核主成分分析和扩散映射,以及扩散映射超参数的确定方式、三种降维算法的应用范围。第三章,引进了聚类指标中的Calinski-Harabaz指标,运用提到的三种降维对数据进行降维,配合Calinski-Harabaz指标预测相变点。实验分别给出了不同聚类指标下哈佛大学的文章和我们方法的对比结果。第四章,通过实验验证Calinski-Harabaz指标寻找相变点的准确性,数据使用了伊辛模型、正方形晶格和六角形晶格的经典XY模型、q=2和q=8的广义XY模型。第五章,总结与展望。附录,介绍了文章中XY模型的拓扑结构、核函数、常用聚类指标的计算公式和利用伊辛模型数据时扩散映射与核主成分分析的结果对比。
其他文献
皮带输送机是煤矿井下开采所需的十分重要的工具,其在安全生产中肩负着十分重大的责任。在生产过程中,由于恶劣的工作环境、经常出现混有棱角的矸石、细杆状物等尖锐物体等问题,皮带通常会伴随有划痕,划伤的出现,甚至会发生撕裂这样的严重破损,这些问题可能会威胁井下人身安全,还可能使煤矿造成一定的财产损失。为此,寻求准确并且实时的皮带破损检测的方法,是现在一个很有意义的课题。但是现存的检测方法,对于皮带破损图像
传统计算机经过几十年的发展演变,已经非常成熟,在很多领域已经表现出卓越的性能,被认为是人脑的拓展。然而传统计算机在很多领域中还远远达不到人脑的智力水平。人工神经网络以一种类似于人脑的方式处理信息,有望突破传统计算机遇到的困境,在很多领域表现出极大的潜力。人工神经网络主要包括前馈神经网络和递归神经网络,由于递归神经网络具有记忆衰落特性,擅长处理时间相关任务,因更贴近实际问题而被广泛研究。然而传统递归
在日常生活中,到处都充斥着背景噪声与混响,使得纯净的语音信号受到干扰,往往导致语音质量和可懂度的显著下降,特别是对于听障人士来说,听觉感知会受到极大的影响。近年来,随着深度神经网络(Deep Neural Network,DNN)在语音去混响领域的广泛应用,增强语音的客观指标有了显著的改善,然而基于人类听力测试的主观评价得分并没有获得同样程度的提高,并且由于真实环境下混响的多样性,传统的DNN很难
幼小衔接是指学生从幼儿园到小学这一时期的整体衔接,幼儿开始接受正规小学教育的时期。教师在这一时期进行书写入门指导时,要尊重学生的年龄特点和发展规律,适时适量,应考虑学生的心理需求和发展需要,让学生学会初步欣赏书画作品,从兴趣入手,开展多元评价,提升他们的学习自信心,为学生从幼儿园平稳过渡到小学创造良好的氛围与条件,促进这一阶段学生的整体和谐发展。
随机数被广泛应用于科学计算、模拟仿真、身份认证、信息安全等诸多领域。特别是信息安全领域,加密系统的安全主要依赖随机数的随机性与不可预测性,故随机数的安全性评估至关重要。目前,针对随机数安全性评估主要基于概率统计方法。该方法依据概率统计规律检测随机序列是否存在明显的统计缺陷。然而,受限于模式识别与数据挖掘能力,基于概率统计的测试标准在随机数安全性评估中表现出了不足。例如,一些伪随机序列存在微弱且固有
近几年选煤厂的智能化改造正在如火如荼的进行着,重介质分选过程作为煤炭洗选加工过程中极为重要的一个环节,由自动分流、自动补水、自动加介、桶位平衡、密度智能设定等各个环节自动化的实现,使得重介质分选自动控制得到较大发展。在实际生产过程中由于原煤煤质的改变和波动以及在线灰分仪本身存在的测量误差,使得灰分闭环控制环节(密度智能设定)的调节速度以及调节准确性仍需提高。根据选煤厂实际生产情况的调研和分析,重介
糖尿病视网膜病变是糖尿病最为常见的一种并发症,也是目前造成人类失明的主要病症之一。由于这是一种不可逆的眼部疾病,患者需要及时地、定期地进行视网膜检查,避免病情恶化最终导致失明。然而随着糖尿病视网膜病变患者数量的不断增加,目前所采用的完全依靠眼科医生手工分割患者眼底生物标志物再以此进行病变分级的诊断模式已经变得无法应对,特别是在医疗资源紧缺、医疗水平不足以及医患比例严重失衡的地区。因此本文设计并实现
脑胶质瘤是来源于神经系统胶质细胞和神经元细胞肿瘤的统称,是由于大脑和脊髓胶质细胞癌变所产生的、最常见的原发性颅脑肿瘤,占颅内肿瘤的35.26%~60.96%。脑胶质瘤难以治疗且容易复发,患者死亡率也较高。利用多模态的核磁共振影像可以有效的发现胶质瘤病灶区域,但是这同时会生成大量的MRI序列图像,使得人工分割脑胶质瘤区域的效率非常低。基于MRI的脑胶质瘤分割有助于医生对医学图像进行定量的分析。同时,
精神分裂症是一种常见的脑部疾病,发病率高,给患者和社会带来极大的影响。目前功能磁共振成像技术已经越来越多的应用到精神分裂症的诊断治疗上,研究人员通过分析大脑活动的异常情况,发现大脑在功能上出现一些改变的情况。另一方面,对于精神分裂症实际诊断和治疗来说,需要进行诊断的患者为数众多,导致相关的临床医生有着极大的工作量,这样有可能导致诊断的效率不足甚至出现漏诊误诊的情况。因此,不管是对精神分裂症患者进行
我国的能源结构主要是以多煤少气为主。山西省晋城无烟煤储量丰富但其渗透性较差,严重制约了煤层气的开发利用。渗透率的好坏主要取决于煤岩的孔裂隙结构。由于煤岩在开采过程中,受地质特征、埋深、多场耦合等因素影响,煤层结构发生了变化,致使煤岩内部微细观孔裂隙结构改变;其中微孔隙主要用于煤层气的储藏,而大孔隙、微裂隙、裂隙是煤层气运移通道。研究煤层结构的空间发育、连通性及分布特性,提高渗透性是煤层气高效开采的