基于深度学习的自动作曲编曲研究

来源 :中国科学技术大学 | 被引量 : 0次 | 上传用户:tujiangbo110
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
音乐是人类历史上最伟大的发明之一,对人类生活产生重要影响。创作音乐需要专业的领域知识和乐器技能,如何自动创作音乐已成为近年来一个热门研究方向。许多公司和研究机构在这方向做了很多有趣的工作,如Google的Magenta项目,对现有的大量的钢琴曲进行学习,研究如何让机器自动创作钢琴曲。随着深度学习的崛起,深度神经网络应用于音乐生成中,避免了传统机器学习方法中需要大量手工特征的耗费。以往的模型在进行音乐生成时还有许多不足之处,很多影响音乐生成质量的因素都没有很好地考虑进来,诸如和弦进行和节奏型。和弦进行广泛存在于流行音乐中,它可以指导旋律的走向,将其作为输入将有益于音乐生成。同时流行歌曲有着固定的节奏型,但现有的研究采用基于音符级别的生成方式,未考虑到音乐的结构性。此外,流行歌曲通常有着多个音轨和乐器来为旋律进行伴奏,不同的轨道和乐器应该相互协调,而以往的工作并没有考虑到音轨间的和谐性。最后,音乐有着多种风格,如古典,爵士和流行音乐,如何生成特定风格的音乐是值得探索和研究的问题。针对以上问题,本文基于深度学习的技术,对音乐生成中相关问题进行了研究,主要研究内容和贡献有:1.针对流行音乐的生成,本文提出了一个从旋律到编曲的端到端的生成框架(Melody and Arrangement Generation Framework,MAFG),该框架包括两个部分,分别是旋律生成部分和编曲生成部分。在旋律生成部分中,提出基于和弦的节奏和旋律交叉生成的模型(Chord based Rhythm and Melody Cross-Generation Model,CRMCG)来提升音乐音程关系,学习乐段的结构性。在编曲生成部分中,提出基于多任务学习的多乐器联合编曲模型(Multi-Instrument Co-Arrangement Generation Model,MICA),实现多音轨多乐器间的和谐配合。2.针对音乐风格的控制,提出了一个多风格多乐器联合编曲模型(Multi-Style Multi-Instrument Co-Arrangement Generation Model,MSMICA)。该模型包含了编曲生成器和多个判别器,通过生成器和判别器对抗训练生成特定风格的音乐,且保证音乐的和谐性。3.针对以上两个工作,在真实音乐数据集上进行了大量实验,实验结果验证了CRMCG,MICA和MSMICA模型的有效性。
其他文献
本文浅析城市线性边沿空间定义、空间类型、空间构成和线性空间研究意义。通过对线性边沿空间研究进而物化出一种城市可持续发展低碳模式。
杨绛作为中国20世纪典型的知识分子,其小说、散文、戏剧以及论文、译作,整个作品观照世界与言说世界的角度、方式、姿态,都呈现出知识分子所具有的诗性写作特征。第一,杨绛延续了
当前,农产品流通不畅,交易方式效率低,交易过程中环节多、损耗高、成本高等问题已经成为制约农产品加工、运输、交易企业和农民增收的重要因素。随着信息技术的发展,农产品交
<正>风险导向审计的应用,要求注册会计师通过了解测试,形成对被审计单位环境风险、经营风险、管理风险、财务风险的整体评价,在此基础上,决定审计的风险所在(李爽,2003),其中
<正> 龙是中国民间舞蹈采用最为广泛且最具信仰意义的母题。龙是中华民族发祥和文化肇端的象征。与中国民间舞蹈的其它事物作为信仰母题不同,龙不存干自然,它是一种神灵幻化
该文通过大量调查研究,论述了国内外安全评价的发展现状以及进行安全评价的目的和意义,提出了对化工储罐区进行安全评价时评价方法选取的原则;并依照这些原则及储罐区的特点运用
<正>韩国科学技术研究院清洁能源研究中心研究团队开发出可将二氧化碳转换成乙烯的耐久性催化剂,提出了可将温室气体变成资源的可行性方案。该研究成果发表在JACS杂志上(J Am
网络德育管理是指公共管理者在网络环境下,为维护社会的正常运转,运用各种有效手段,配置、整合和利用各种资源,对社会公民(特别是青少年)的道德、理想、信念教育活动进行决策、组
本论文是结合某山地城市新区给水管网规划的实际工程而完成的。众所周知,山地城市给水管网与平原城市管网有很大的区别:首先,山地城市管网及其水源地面标高相差悬殊,致使管网
维吾尔语词汇构成途径的研究是一项基础研究,它对词汇学、形态学、句法学、语义学、粘着语属性及其他相关专业的研究都具有重要意义。已有成果中虽然有关于此问题的论著,但缺少