【摘 要】
:
在高维数据分析过程中,变量选择是一道关键的步骤:若剔除掉关键的变量将会导致得不到理想的分析结果;若保留了过多的无关变量则不仅会拖慢回归效率,也会增大模型的回归误差。SSVS(Spike-and-Slab variable selection)理论的发展使得解决高维的问题中使用贝叶斯的方法也能得到既准确又高效的结果。相对于常用的变量选择方法,贝叶斯变量选择对剔除变量施加较大惩罚的同时对选入变量也施加
论文部分内容阅读
在高维数据分析过程中,变量选择是一道关键的步骤:若剔除掉关键的变量将会导致得不到理想的分析结果;若保留了过多的无关变量则不仅会拖慢回归效率,也会增大模型的回归误差。SSVS(Spike-and-Slab variable selection)理论的发展使得解决高维的问题中使用贝叶斯的方法也能得到既准确又高效的结果。相对于常用的变量选择方法,贝叶斯变量选择对剔除变量施加较大惩罚的同时对选入变量也施加了较小惩罚。但是,贝叶斯变量选择的研究似乎更多地体现在线性回归以及二分类逻辑回归上,多分类相对于二分类更为复杂,还需要深入进行讨论。本文将SSLasso GLMs(Spike-and-Slab Lasso GLMs)理论应用在MNL模型和MOL模型中,构建出基于Spike-and-Slab先验分布的贝叶斯变量选择框架,通过EM算法和坐标下降法实现了SSLasso-MNL模型和SSLasso-MOL模型的参数估计,将贝叶斯变量选择推广到了高维无序和高维有序的多分类模型中。并通过仿真数据和实证数据对模型进行检验。通过仿真数据回归结果得知,SSLasso-MNL模型的变量选择结果要优于Lasso。将该模型对癌症患者的基因数据进行分析,十折交叉预测的准确率为92.8%;再对职业选择的主要影响因素进行分析,十折交叉预测的准确率为75.0%。再借助仿真数据考察SSLasso-MOL模型,该模型的变量选择结果同样也优于Lasso。并且能够在分析时筛除解释变量中不符合比例优势假设的部分。将该模型运用到老年痴呆疾病严重程度主要影响基因研究,留一法预测准确率为54.8%;再进行CFPS问卷的生活满意度分析,十折交叉预测的准确率为61.0%。SSLasso-MNL模型能够得到很高的预测准确率,并且模型设定简单,易于执行;SSLasso-MOL模型回归过程虽然繁琐,但是若能得到较好的结果,其系数也会具有较强的解释力度,在实证分析时更为有意义。本文最后综合了两个模型的优缺点并进行分析,为后续的研究提出了合理的建议。
其他文献
探索性创新是企业持续改进和创新的源泉。创新的关键是核心知识,而人是知识的载体。与此同时,人才流动网络伴随着组织间普遍的人才流动而形成。那么,人才流动网络如何影响企业探索性创新?知识网络密度在这一路径中起到怎样的作用?在网络内容人才以往绩效和企业自身吸收能力的不同的情况下,人才流动网络对知识网络密度的影响会发生什么样的变化?为了更加准确的揭示人才流动网络对企业探索性创新的影响机理,本文以社会网络理论
当今社会,伴随着社会化媒介的高速发展,虚拟品牌社区日渐成熟并为品牌与顾客之间建立起了沟通的纽带。与此同时,部分对品牌具有高度好感与忠诚度的顾客也越来越有与品牌方、其他同好者交流与互动的意愿。一方面,品牌方通过虚拟品牌社区可实现对顾客关系的维系,提高顾客的品牌好感度与忠诚度;另一方面,顾客可通过参与虚拟品牌社区的互动,完成自我情感的释放、形成品牌粉丝与用户的集体认同。在本文中,笔者选择了具有代表性的
亚文化始终与社会前进的步伐紧密联系在一起,而其中尤以二次元文化的发展最具代表性,其在塑造年轻受众的价值观方面颇具影响力。近年来,“洛天依”等虚拟歌姬逐渐走入大众视野,引发社会热议,而当下我国对虚拟偶像文化的研究却远远不够。在强调“文化自信”的今天,对于虚拟歌姬古风音乐及其受众的研究或将进入新的历史阶段。本研究以扎根理论为指导方法,以虚拟歌姬古风音乐受众为研究对象,界定B站“拜年纪曲”为案例音乐,深
移动社交已经成为人们生活中交流和沟通中必不可少的一部分,熟人社交无法满足年轻人的社交需要,认识新的朋友成为当前的社交痛点。随着一批陌生人社交产品相继涌现,其拓宽了受众人际交往的范围,在一定程度上满足了受众的交友需求。如今,女性生活状态发生了重大的变化,思想与经济的独立使得女性的地位日益增高。女性网民数量也在日渐增多,女性已经逐渐成为网络社交的主流群体。陌生人社交产品的兴起,不但为女性提供了一个自由
如今已步入web3.0时代,受众自由的消费与出入于各种媒介文本之中,融合文化趋势显现并不断地走向成熟。“跨媒介叙事”理论作为融合文化趋势下的特有产物,其强调以故事核为核心打造高度包容的“故事世界”冲破不同受众群体之间的文化隔阂,与跨文化传播的要义不谋而合。目前,已在西方出现了如美国的“漫威宇宙”、英国的“哈利·波特魔法世界”等案例,其以本土的传统文化特色与价值观内嵌而在全球围内获得粉丝的追捧,不仅
近年来,伴随着互联网技术的深入发展,影视作品的呈现形式也有了较大的进步,2018年,Netflix在交互式游戏电影的启发下发布了《黑镜》(Black Mirror)系列的特别版—《黑镜:潘达斯奈基》(Black Mirror:Bandersnatch),这部电影采用了多线性叙事的形式,通过“人机交互”赋予了观众以选择的权力,完全颠覆了以往的视频观看模式。《黑镜:潘达斯奈基》发布后,国内各大视频平台
阿甘本对生命政治的思考集中在《神圣人》系列的著作中,他在全方位地审查西方政治对生命的分隔与捕获后,给出了生命救赎的方案,这个方案,不指向任何一个特定的阶级与斗争,它是无组织、无目的、只指向纯粹潜能性的生命自身,此即“生命-形式”(form-of-life)。“生命-形式”是阿甘本反思生命政治的逻辑起点,也是他破解其运行的哲学目标。与西方政治将生命作为对象的“死亡政治”不同,阿甘本的“生命-形式”概
开发区是我国重要的区域性产业政策,同时也是企业创新的载体,在改革开放的进程中首次发挥了重要作用。随着“大众创业、万众创新”的倡议提出,加快建设创新型国家战略已是势在必行,开发区再次成为学界所关注的焦点。对此,本研究考察国家级开发区设立给企业创新带来何种影响,以及通过何种方式给企业带来影响,进一步做异质性分析探究不同类型、不同地理区位的开发区设立对企业创新产生的影响。本文采用1996-2019年的上
奥金(Susan Moller Okin)是当代著名的女性主义政治哲学家,其主要研究领域为家庭正义。在她看来,传统家庭无疑是不正义的,而主流的正义理论家却对此从无异议,因为他们理所当然地认为家庭领域不需要正义。奥金对此进行了全面的考察,她认为,仅仅因为某一社会成员生为女性,就决定了其一生的前景,而且这个前景与男性相较,地位又差、负担又多,劳动所得又少,那么社会就没有给予女性以正义的对待,忽略女性的
反贫困,是对贫困状态的不满与反抗,是正当性获得财富的渠道,是对美好生活的期待并付诸实践的目标,是黑格尔与马克思两位巨人在经济问题上的相遇之处。关于市民社会贫困问题,黑格尔与马克思相继提出了解决观点:黑格尔认为具有特殊性的市民社会是造成贫困的根源,因此在反贫困问题上求助于具有普遍性的国家和绝对精神,以资产阶级为其主体;虽然马克思于《1844年经济学哲学手稿》中明确表达了“需要”一词在富有与贫困中的地