基于卷积神经网络的声学场景分类算法研究

来源 :中国传媒大学学报(自然科学版) | 被引量 : 0次 | 上传用户:jerryby001
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
声学场景中包含着很多长时特征和短时特征。本文提取环境声的能量信息,批量生成声音场景的三维语谱图,作为卷积神经网络的输入。神经网络采用卷积层和下采样层重复交叠,整体网络采用六层网络结构,最终经过softmax方法进行多分类。实验采用DCASE2017竞赛数据集作为素材,对15类6300段音频进行训练测试,结果表明,语谱图特征与卷积神经网络相结合的算法能够很好的提取长时特征和短时特征,使得最终分类准确率较高,优于网站基线系统的分类结果。
其他文献
跨国公司是国际经济关系中一股强大的势力,为了谋求全球性的利润最大化,其财务战略在国际化经营中具有举足轻重的地位。本文试图对跨国公司制订财务战略时所涉及的问题进行
"深度伪造"是利用深度学习技术中的"对抗生成网络"模型形成的智能视频处理技术。"换脸视频"是该技术最为典型的应用。与原有技术相比,该技术具有高度真实性、泛在普适性和快
随着中职语文综合实践活动的深入开展,综合实践活动的实施策略越来越受到重视。在教学实践中,探索构建了“任务驱动式职业情境化”的综合实践活动教学模式,以江苏省职业学校文化
在肉鸡饲养过程中由于有些养殖场不具备先进养殖技术和生产条件,导致肉鸡腹泻病时常发生。这不但会严重影响肉鸡的生长,而且还会污染环境,诱发其他疾病的产生。因此,准确诊断
糖尿病肾脏病(diabetic kidney disease,DKD)是糖尿病最严重的慢性并发症之一,是终末期肾脏病的重要原因。随着全球糖尿病患者不断增加,DKD的发病率也随之升高。DKD的发病机制至今
目前大部分虚拟实验平台缺乏对异构组件的支持。为此,提出一种基于异构Web服务的虚拟实验平台,该平台采用Web服务技术,以其语言独立性、平台无关性等特点,将异构组件进行Web
<正>目前,包括工伤保险在内的各项社会保险费缴费基数不实状况仍比较普遍。在缴费基数低于法定标准时,工伤职工及其遗属的工伤保险待遇差额,应由工伤保险基金承担还是用人单
近日,国家社会保险公共服务平台正式上线。参保人员可以通过"刷脸"完成社会保险待遇资格认证,也能在平台中估算未来能领到多少养老金。那么,关于养老金,有哪些是你应该了解的
地层划分与对比直接影响单砂体识别的准确性和预测油藏及油气的分布规律,所以地层划分与对比对勘探开发及岩性油藏探区具有重要的意义。随着油田开发进入到了中后期,开发节点的
新二元社会理论指出,大学生就业难的客观原因在于当前我国的新二元社会特征使就业市场因用人单位所有制不同而产生了分割。以两所大学的毕业生为样本进行调研后发现,毕业生的