基于电话音频大数据的通话语音分类系统的设计与实现

来源 :北京邮电大学 | 被引量 : 0次 | 上传用户:longxue1211
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网在全球的普及和5G网络在中国大范围的建设,更全面的网络覆盖使得网络活动更便捷的同时也带来更大信息泄露的风险。投机分子会利用获取到的用户联系方式,通过全球各地的运营商电话网络系统、VoIP电话服务器等通信服务,从非中国大陆地区向大陆民众实施电信诈骗等非法行为。因此,针对这部分电话音频大数据的分类管理、电话音频呼叫人的行为模式分析,对于干预投机分子的不正当行为有较大帮助。本文提出可支持电话音频大数据场景的系统总体架构方案。针对当前电话音频采集系统日增千万的数据量级、音频借助通话描述记录表达等特点,设计一套完整、可支持业务的系统架构方案。借助无共享架构方法和虚拟化技术,使得使用本架构方案实现的语音分类系统在当前场景下,既满足需求,又能呈现高可用、易运维的特征。本文基于Go语言线程调度GPM模型实现思路提出了通话音频分类任务调度模型。通过参考GPM模型,设计分类任务调度全局队列、本地队列等抽象组件模型,减少并发任务调度时锁操作;结合生产-消费者设计模式,提升任务调度并发能力以减少总体任务执行时间;设计任务多级分发、任务窃取等抽象方法,提升并行的调度器运行时负载均衡度。最终,根据上述构建语音分类任务调度模型并在调度层实现,使得语音分类任务异步、并发、高效地被调度和执行。本文提出了基于语音分类结果的通话人行为模式挖掘分析方法。根据通话描述记录多用于描述语音在通话时间、通话地理位置等元信息的特点,通过分析语音分类系统所获取音频通话描述记录数据,将数据在时间和空间层面进行聚合分析,获得通话人行为模式时间和空间上的分布特征。然后,通过将语音分类系统所获得分类结果与通话音频的通话描述记录数据项对比,获得通话人呼叫地区迁移模式特征。使用上述行为模式挖掘分析方法,本文共提出四种通话人行为模式,在语音分类系统平台侧展示通话描述记录数据背后呈现的数据规律。基于上述方案和模型的设计,本文实现了基于电话音频大数据的通话语音分类系统并进行测试。通过使用分类任务调度模型构建任务调度模块,异步执行通话语音分类任务。同时,为用户提供管理、控制平台,包含音频数据分类结果筛查、通话人行为模式分析结果查看等功能。最后,针对本文所实现的语音分类系统进行功能和性能的测试方案设计和实施。
其他文献
党的十九大以来,“共同富裕”的重要性再度被提上日程,并且被赋予了新的时代内涵.在这样的时代背景下,三次分配成为了近年来国家顶层设计中事关共同富裕的重要战略部署,而文化产业与三次分配有着重要的关联.具体而言,三次分配为我国文化产业的发展提供两个机遇:一是推动文化产业内部资源分配结构实现积极有效的调整;二是打通社会其他领域与文化产业领域内资金循环再分配渠道.而且,三次分配有助于推动我国文化产业转型:一是通过支持非公有制文化企业深入参与国家重大战略,从而构建新型的文化产业与国家关系;二是合理配置协调文化产业与公
人才引领发展是中国共产党带领中国人民统筹实现中华民族伟大复兴战略全局和应对世界百年未有之大变局的重大战略谋划,对在新的历史条件下建设社会主义现代化强国和彰显中国式现代化新道路的世界意义至关重要.百年党史的奋斗历程、国内新发展阶段的客观现实、国际人才资源的激烈竞争都迫切需要实施人才强国战略的统筹谋划.基于马克思主义人学的主体理论来廓清新时代人才观的科学内涵和中国特色,坚持历史唯物主义的群众史观来明确人才创新创造活动的人民性根基,在兼顾事实经验与价值规范协调统一的基础上来制定科学合理有效的人才评价标准,才能尊
随着数字技术的不断发展,虚拟文化空间已经成为了用户生活中区别于物理文化空间的第二存在场域,用户的文化消费场所正在逐步从物理文化空间转移到虚拟文化空间,其空间获得感也得到极大提升.从用户视角看,其参与虚拟文化空间存在信息需求、情感需求、交际需求三大内在需求,并通过对虚拟文化空间的空间实景、空间知识、空间情感、空间经历的感知来满足内在需求.在用户参与的具体方式层面,结合“和平精英”知乎话题中问答文本数据,利用模糊集定性比较分析方法,探索出用户参与虚拟文化空间存在着情感分享型参与方式、知识交流型参与方式、虚拟型
中国共产党人学习观是中国共产党人对于学习本质及其规律的总的观点和根本看法,是马克思主义实践观、历史观、群众观、矛盾观、发展观等在中国共产党人学习理念和学习过程中的具体体现.百年党史是一部创造性学习的历史,是中国共产党人通过学习实现自我革命和社会革命的历史,也是中国共产党人学习观在革命、建设和改革实践中不断发展和深化的历史.置于党的发展历史坐标中,中国共产党人学习观依据不同历史时期所面临的社会主要矛盾的变化,呈现出阶段性演进的特质,这既反映了建党以来党的学习目标和任务所具有的时代内涵与实践特征,也反映了中国
以金融业和房地产业为代表的虚拟经济是一个“快变量”,而实体经济的创新能力提升相对来讲是一个“慢变量”,两者之间的时间背离可能会导致经济“脱实向虚”下的创新能力抑制.基于2003~2018年我国283个城市的面板数据,探究虚拟经济冲击、创新驱动和经济发展动力之间的关系,研究结果显示:经济“脱实向虚”并不会直接弱化实体经济发展,但会通过弱化企业创新能力进而抑制实体经济发展,并且这种效应十分显著.机制分析表明,经济“脱实向虚”会通过挤出创新部门的创新性劳动投入和引发工资等要素成本上升等方式抑制企业创新能力.由此
防范企业信用风险是维护地方金融秩序、建设现代化经济体系的重要前提.数字经济作为一种全新的经济运行模式,为防范化解企业信用风险提供了新思路.以2012~2018年中国沪深A股上市企业为样本,探讨数字经济影响企业信用风险的内在机理及作用路径,结果发现:数字经济的发展显著降低了企业的信用风险.路径分析表明,数字经济通过两个维度降低企业信用风险:一方面通过提高企业全要素生产率来增强企业的还款能力,另一方面通过降低信息不对称程度来增强管理者的还款意愿;地区信用环境在数字经济影响企业信用风险的过程中发挥调节作用.拓展
节日在传承文化意义、寄托民族文化记忆、建构社会成员文化身份认同等方面发挥着重要作用,但在资本逻辑的操纵下当前节日呈现出异化发展的趋势,人们对物的崇拜超过了节日本身的文化意义,各类资本拜物教盛行于节日消费领域.节日的资本化和资本的节日化成为一种趋势,一方面节日被纳入到资本循环的流程中,成为资本实现增殖的时间节点和空间场域,出现了节日仪式、节日礼物和节日象征的资本化现象;另一方面,资本栖居于节日之上,以节日的生产和再生产来促进资本的循环和实现资本的逐利,表现为传统节日的资本赋值、国外节日的复制与资本捆绑、“资
伴随中国教育竞争的加剧,城市家庭中的母职实践已逐渐跨越私领域传统角色,女性呈现焦虑母职现象,母亲以教育规划师身份整合学校内外教育资源,协助子女在教育竞争中获取优势.与此同时,父亲也被期待承担更多家庭抚育工作.基于对深圳市10组中产家庭父母配对样本的深度访谈发现,城市中产家庭的焦虑母职呈现多面向图景,主要体现在选拔焦虑、教育焦虑、分层焦虑等3个维度.相对单一的人才选拔制度及优质教育资源稀缺使得子女通往成功的道路变得狭窄,催生出选拔焦虑;减负政策未能落到实处,影子教育如影随形,强化了教育焦虑;教育分流对子女未
全民普法和守法是依法治国的长期基础性工作.对于普法和守法的现有研究一般从道德和法律约束以及守法成本与收益等角度展开,相关的制度设计也大多基于同样的理念,其中经济人假设的应用尤为普遍.基于经济人假设的守法促进模式具有合理性与必要性,但由于对人的心理机制考虑不足,也表现出明显的局限性.半个多世纪以来,从众心理、损失厌恶、框架效应等认知偏差的发现及其进化原因和神经基础的相关研究成果揭示了人类认知与决策的真实情形,为相关主体从行为经济学角度出发破解促进守法难题提供了可能.与传统的守法促进举措相比,利用行为经济学的
自人造地球卫星被应用到远距离通信以来,卫星通信技术一直都是实现跨区域远距离通信传输的重要方式,也是各国发展国防通信力量的重要手段之一。此外,近年来5G技术发展态势十分喜人,卫星通信与5G相融合的技术逐渐成熟,因此,如何应对涨势凶猛的通信业务并有步骤成体系地对卫星网络的弹性能力进行巩固强化成了新的挑战。从物理层拓扑控制的角度来看,目前针对应用于WSN网络的拓扑控制策略的研究众多,因此可以将其优势与卫