【摘 要】
:
压缩模糊K-近邻(CFKNN)算法仅适用于中小数据环境,且其样例选择采用静态机制,导致算法不能对阈值进行动态调整从而选出最优样例。为此,对CFKNN算法进行改进,将其扩展到大规模
【机 构】
:
河北大学数学与信息科学学院,河北大学河北省机器学习与计算智能重点实验室
【基金项目】
:
国家自然科学基金(71371063),河北省自然科学基金(F2017201026),河北省科技计划重点研发基金(19210310D),河北大学研究生创新项目基金(hbu2019ss077)
论文部分内容阅读
压缩模糊K-近邻(CFKNN)算法仅适用于中小数据环境,且其样例选择采用静态机制,导致算法不能对阈值进行动态调整从而选出最优样例。为此,对CFKNN算法进行改进,将其扩展到大规模数据环境,提出分别基于MapReduce和Spark的2种大规模压缩模糊K-近邻算法。在样例选择阈值设置方面,引入动态机制,使得所选样例更具代表性。在具有7个数据节点的大数据平台上进行实验,结果表明,与CFKNN算法相比,所提2种算法具有更高的分类精度和加速比。2个平台相比,MapReduce产生的中间文件数目多于Spark,而S
其他文献
目的:对经腹部联合经阴道超声技术在卵巢囊肿蒂扭转诊断中的临床价值进行评价分析。方法:选择在我院接受治疗后证实为卵巢囊肿蒂扭转的患者120例,根据在治疗前所接受的超声检
报道了一种电压调制型电化学发光分析技术,通过在施加恒定电压的基础上叠加一个小脉冲电压,可将鲁米诺-过氧化氢体系的电化学发光强度提升近2倍.电化学发光强度与过氧化氢浓
对宁夏农产品质量安全体系的科学构建,实现农产品从源头到餐桌的全程监控和实时决策,为全区农产品质量安全管理系统化、科学化和规范化提出了建设性意见。
通过对新疆某老年公寓进行调查访问,了解到社会工作者的具体工作状况。从老年人的生理、心理和日常生活三个方面讨论社会工作者在老年服务机构中的作用,并从中发现老年社会工
目的:观察扶正抗癌方联合FOLFOX6化疗方案治疗晚期胃癌患者的临床疗效。方法:将80例晚期胃癌患者按照随机数字表法分为治疗组与对照组,每组40例。对照组采用FOLFOX6化疗方案,
采用琼脂扩散沉淀试验、玻片和试管凝集试验以及血清吸收凝集试验,对6株鸭疫里默氏菌分离株进行了抗原性分析.这6株分离株被鉴定为血清10型,但它们与10型内已知的4个亚型菌株
以聚醚多元醇、蓖麻油、多苯基多亚甲基多异氰酸酯(PAPI)、针状硅灰石、偶联剂等为原料,全水发泡制得了两种密度的硅灰石/蓖麻油型中高密度聚氨酯硬泡。研究了蓖麻油含量、针
随着大数据时代的到来,审计数据量几何级数增长和数据类型的日趋复杂对高校内部审计工作带来了巨大挑战,传统的抽样审计和基于查询的审计方法已不能适应"审计全覆盖"的要求,