某医药流通企业销售数据的统计特征提取K-means聚类的实证研究

来源 :华南理工大学 | 被引量 : 0次 | 上传用户:shihongxin
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
某医药流通公司(简称A公司)是一家集科研、生产、销售为一体的大型医药流通企业,每年所经营商品有六千多种,企业内部缺乏统一、科学管理,采购数量主要是靠经验、凭感觉,近年库存积压严重。A公司数据库中拥有大量经营数据,但目前数据利用率非常低,“数据丰富、信息匮乏”,A公司所经营商品种类繁多,异常销量高,增加了销售预测和统一管理的难度。本文以A公司2012年所有在营商品每周销量为研究对象,首先从A公司6837种商品的销售数据的集中程度、波动情况、分布状况、销售曲线形状、盈利能力、季节性等维度对A公司所有在营商品的统计特征进行一次探索性分析,发现A公司商品平均销量差异大、大异常值比例高、小异常值比例低、销量为0的周数比例高,商品生命周期难以界定,盈利能力各不相同、部分商品销量存在很强的季节性。基于A公司商品销售数据的集中程度、分布情况、异常情况、缺失情况、季节因素、盈利能力等方面,选取和构建统计指标,并建立了一个销售数据的特征指标体系,该体系可帮助企业经营者快速掌握商品的销售特性。进一步,基于时间序列聚类的思想对特征指标体系中的部分统计指标进行K-means聚类及分析。结果表明,所选统计指标能较好地解释聚类结果,各聚类所反映的商品销售特征可为A公司商品经营提供一定的参考依据和数据支撑,为商品分类管理提供一个研究方向。本文基于箱线图和变异系数,引入箱线系数。箱线系数可以消除商品间箱线图的尺寸和量纲的影响,均值结合箱线系数,可以掌握商品间的销售水平及分别情况。本文K-means算法中,k值的选取是首先将k值限定在n,n为样本数。然后通过计算不同k值对应的类间平方和总量与生成类的总体距离平方和的比值,将比值最大时对应的k值作为聚类数目,该方法可以达到类内紧凑、类间分离的效果。
其他文献
目的分析冠心病(CHD)患者行经皮冠状动脉介入治疗(PCI)术后再狭窄(ISR)发生的因素,并提出相应的对策。方法共选择我院收治的CHD行PCI患者308例,随机分为ISR组和非ISR组,比较两组患
大型科学仪器设备装备水平是一个国家科技创新能力的体现,大型科学仪器设备是培养人才重要的物质保障。近年来,随着科技的进步和经济突飞猛进的发展,我国大型科学仪器设备数
当今世界,随着经济的发展,在企业经营的过程中不可避免地会遭遇内部和外部的风险,不断对企业的内部控制提出要求。而在安然、世通事件之后,美国更是颁布了《萨班斯法案》对于
论证了100MW机组的高效化合理改造方式,阐明了在山西省100MW机组的改造实践中所采用的技术,以及所取得的经验和效果。
竖琴是一种历史悠久的乐器,也是交响乐队中不可或缺的乐器组成部分,其音域宽广、音色独特,具有丰富的艺术表现力。本文对其演奏要点进行了分析和总结,旨在使其特有的作用和价
<正> 《傅青主女科》载有用"宣郁通经汤"治疗妇人"经水未来腹先疼"的病症,笔者用该方治疗男子急性睾丸炎,效果满意,兹举验案报导如下;陶××,男,40岁,县委干部,1980年11月7日
随着社会经济的发展和居民生活水平的提高,电力、热力消费需求与日俱增,由此带来的CO2排放的问题也日益严重。因此,为实现热电行业(电力、热力的生产和供应业)的低碳发展,需
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield
目的:探讨妇科手术后并发下肢静脉血栓栓塞症的病因、防治措施。方法:回顾性分析2016年3月至2016年9月本院妇科手术后26例下肢静脉血栓栓塞症患者的临床资料。对其病因及予以
目的观察腰硬联合麻醉及硬膜外麻醉运用到分娩镇痛中的功效对比。方法回顾性分析本院2017年9月至2018年6月收治的46例产妇的资料,将其中接受硬膜外麻醉的23例作为A组,另外接