基于深度神经网络的说话人识别研究

来源 :南昌大学 | 被引量 : 0次 | 上传用户:junlintianxiap
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
说话人识别,又称为声纹识别,是一种依据语音来判别说话人身份的技术。近些年随着互联网的快速发展和智能移动设备的普及,人脸识别、指纹识别和说话人识别等身份验证技术有了广阔的应用市场。说话人识别的核心是从语音中提取出能表征说话人身份的信息,深度神经网络因为具有强大的信息提取与建模能力,已经在计算机视觉、自然语言处理等领域得到广泛应用,将深度神经网络引入说话人识别领域是目前的研究热点。本文主要工作如下:首先,研究了基于深度神经网络的说话人识别系统,以梅尔频率倒谱系数作为语音的特征参数,搭建了基于深度长短期记忆网络(LSTM)的说话人识别系统作为基线系统。其次,研究了神经网络的复杂性对系统性能的影响,由于隐层层数和节点数目的改变会影响系统的识别效果,所以对不同层数和节点数的网络结构进行了识别率对比,进而选定网络结构,优化了识别系统。最后,与传统的说话人识别系统GMM-UBM进行了两方面的对比实验分析,验证了无论是在语音长度改变还是在说话者个数增加的情况下,基于LSTM模型的说话人识别系统的识别效果均优于传统模型。
其他文献
目的研究环氧化酶-2(COX-2)在人肾透明细胞癌组织中的表达,分析其表达水平与肿瘤分期的关系。方法应用免疫组织化学技术检测48例人肾透明细胞癌组织和28例正常人肾组织标本中CO
采取踏查和定点观察法,对农牧交错区保护性耕作玉米田进行杂草普查。并在此基础上进行了化学除草(播后苗前、生长季)、机械除草(播前、苗期)、人工除草、农业轮作等综合除草技术研
当前建筑业广泛应用的项目法施工需要一种全新的设备管理模式,实施机械设备租赁经营管理的具体做法,在理论和实践上都证明了这种变革是可行的.
随着国内社会经济的快速发展与居民生活水平的不断提高,购物中心在房地产领域成为一个新的增长点。然而,由于宏观经济形势的转变和居民消费观念的变化,已投入运营的购物中心
目的观察骺板细胞在无血清培养液中的生长情况,并通过ELISA方法检测骺板细胞分泌TGF-β1。方法提取3周龄新西兰兔骺板组织,获得良好生物活性的骺板细胞。采用CCK-8生长曲线检
固体氧化物燃料电池(Solid oxide fuel cells,SOFCs)是一种新型的能源转换装置。SOFCs可以将存储在燃料中的化学能转换为电能,被公认是能量转换效率高和环境友好型的发电装置
三元硼化物基金属陶瓷同时具有金属与陶瓷的性能优点,且制备工艺简单,成本低,粘结性高,广泛适用于耐磨、耐腐蚀、耐氧化领域,在硬质材料生产、航空航天、涂层等领域有良好的发展前景和重要的研究价值。其中,Mo_2NiB_2基金属陶瓷具有良好的力学性能以及优良的耐磨性、耐腐蚀性、耐高温性、抗氧化性、导电性、导热性,在功能材料研究方面具有巨大的发展潜力。但由于其烧结活性和韧性较差,影响其综合性能的提升,制约了
应用灰色关联度分析法,对2005年河南省展示的7个春性小麦品种的11个主要性状进行了综合评定。结果表明:濮麦9号、温麦18、郑麦9023的加权关联度值较高,综合性状表现好。