关于图书情报中大数据与小数据的对比分析

来源 :青年生活 | 被引量 : 0次 | 上传用户:tjhaixin2
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  摘要:大数据时代给很多行业带来新的可能性,传统的小数据研究慢慢不受重视。虽然大数据有诸多优势,但也无法取代抽样调查和实验研究等小数据研究在行业里所占据的地位。因此,本文通过对大数据、小数据概念和特点的分析,而后分析大数据与传统意义上的小数据的异同。
  关键词:大数据;小数据;基本概念;异同比较;特点
  1. 引言
  大数据是用来指数据集太大或太复杂,而不是传统的数据处理应用软件充分处理有许多情况(行)的数据提供了更多的统计功率,而具有较高复杂性(更多属性或列)的数据可能会导致更高的错误发现率.大数据挑战包括捕获数据,数据存储,数据分析搜索,共享,转移,可视化,查询,更新,信息隐私和数据源。小数据是“小”到足以让人理解的数据。这是一个卷和格式的数据,使它可以访问,信息和行动。
  2. 特点分析
  (1)同质性与异质性
  “小数据”的哲学基础是同质性,实践方法是“还原论”,试图通过发掘事物内在统一性而达成共识。在事物同质性假设的基础上,“小数据”对事物进行抽象化提取,通過层层假设剥离事物的个性,并最终通过数学建模完成对事物的科学化认知。同质性是我们认知世界的一个重要方式,“小数据”只是为人类提供了认识同质性的工具,却没有提供洞察异质性的工具;“大数据”既能洞察事物的同质性,又能洞察事物的异质性。
  (2)结构化与非结构化
  “小数据”是以“人力为主,机器为辅”的运行模式,在数据的采集、存储、传输和处理中大量地依赖人力资源;“大数据”恰好相反,计算机等各类数据设备成为数据采集、存储、传输和处理的主体,人力只在模型设计、参数设置、编辑矫正等环节发挥作用。“大数据”能够处理的数据来源更加广泛,不仅包括结构化数据,而且包括只有机器方能处理的非结构化数据。
  (3)局部与整体
  “小数据”建立的基础是抽样调查技术,通过选择具有“代表性”的局部样本来洞察整体样本。抽样样本的“代表性”的科学化问题是“小数据”的关键所在。围绕着“代表性”的科学化问题,统计学不断完善其抽样技术,推出了一系列数据抽样和处理技术。“大数据”建立的基础是全样本调查技术,不再用局部去“代表”整体,让整体中的每个成员“代表”自己。“大数据”克服了统计学的拘囿,不再纠结于局部样本的“代表性”。在小数据时代,需要对参与人员进行严格的标准化处理,避免参与人员的主观性影响调查结果,但是大数据的全样本调查技术,摆脱了参与人员的主观性对抽样所带来的负面影响。
  (4)静态与动态
  “小数据”是静态性数据,只是抽取了“时间轴”上的某个片段,再加上从数据采集、存储、传输到处理上的周期性,这使得“小数据”具有典型的延时性特征,不能实时反映事物发展的动态性。“小数据”为了克服静态性的不足,采取了跟踪调查、事前调查、事中调查、事后调查等补偿性手段,但这些手段的周期性,使其依然难以反映实时性动态。“大数据”是动态性数据,通过移动互联网技术、物联网技术及人性交互技术等数据技术可以对调查对象全程追踪,主动抓取实时数据。“大数据”能够即时洞察事物发展的延续性和断裂性,这克服了小数据“事后诸葛亮”的尴尬。
  (5)描述性与预测性
  “小数据”具有局部性、静态性、单维性、非场景化和规模性等特征,在数据采集、存储、传输和处理过程中,损耗了大量的细节数据,只是对各类事物的高度抽象性概括,因此,“小数据”难以从全局把握事物的变动性,在使用方式上多被用来进行描述性研究,而解释性和预测性却相对不足。“大数据”具有整体性、动态性、多维性、场景化和长尾性等特征,能够对事物及其周边环境进行空间性和历时性洞察,“见微知著”,因此,“大数据”不仅在描述性上更优于“小数据”,而且能够在解释性和预测性方面更准确。
  3. 对比分析
  首先,从数据的规模或量来看,大数据体量巨大,规模已经超出了在常规方法和时间内搜集、利用、管理和处理数据的能力,体量是PB量级的。小数据相对来说小得多,传统社会下生产的统计数据可以看作是小数据。
  其次,从数据形态来看,传统的数据通常是结构化数据,结构化数据(行数据)是指存储在数据库里的,大数据则是混合形态的数据。在大数据中,多数是非结构化的数据。
  第三,小数据是目标导向数据,价值密度较高。小数据有非常明确的目的,有非常明确的价值。大数据则是记录导向的,价值密度低,仅仅是为记录数据,并不是首先就有为了得到或解释某个特定事件的具体目的。
  第四,大数据即时产生,随时可用。小数据生产的时间长,从测量到可用,需要相当长的时间;而大数据是即时产生的,大数据的获取省略了抽样设计环节,基本不介入调查对象的行为,始终以观察者的角色出现,直接对整体进行分析。
  第五,从数据占有情况来看,在传统社会里的小数据拥有的主体是政府(包括政府统计部门和各专业部门)、企业、民间调查机构、科研机构等。而大数据则主要掌握在互联网公司手中,目前我国国内互联网三巨头BAT(百度、阿里、腾讯),数据私有化将成为一种趋势。而对大数据的开发利用,也只有具有技术能力的网络公司才能做到,通过网络爬虫在网络上抓取数据,然后经过数据清洗,进行数据挖掘分析。不具备大数据挖掘利用能力的一般个人或者企业、机构,通过向这些公司付费后购买数据和服务,这就是我们日益熟悉的云计算、云平台、云服务;未来的地方政府或许将不得不向私营部门购买数据。
  4. 结语
  本文通过对大数据和小数据的概念分析和特点分析,发现大数据和小数据在不同的领域发挥着各自的优势,而后对两者进行对比分析,发现大数据和小数据在数据规模、数据形态、目标导向、产生时间和占有数据情况上都有各自的特别。
  参考文献
  [1]秦萧,甄峰.大数据与小数据结合:信息时代城市研究方法探讨[J].地理科学,2017, 37(03):321-330.
  [2]唐文方.大数据与小数据:社会科学研究方法的探讨[J].中山大学学报(社会科学版),2015, 55(06):141-146.
  [3]徐立军.数据时代的未来  大数据与小数据融合的价值与路径[J].新闻与写作,2015 (11):11-15.
  [4]王浩. 大数据时代下的思维方式变革[D].东华大学,2015.
  [5]郭新平,黄贻俊.浅析大数据时代的小数据[J].现代经济信息,2014(20):149.
  [6]黄欣荣.大数据技术对科学方法论的革命[J].江南大学学报(人文社会科学版),2014,13 (02):28-33.
  [7]王成文.数据力:“大数据”PK“小数据”[J].中国传媒科技,2013(19):68-70.
其他文献
摘要:在新时期乡村振兴发展背景下,我国乡村旅游业也取得了不错的成功,但是在乡村旅游人才方面还较为匮乏,如何做好“互联网+”背景下中职乡村旅游人才培养,是当前各中职院校亟待思考的一个问题。  关键词:互联网;中职教育;乡村旅游;旅游人才  引言  我国的地域辽阔、物产丰富,为旅游产业的发展提供了巨大的发展潜力。现阶段,我国的旅游产业已经进入到快速发展时期,但是在旅游新业态下,却存在旅游人才培养不合理
期刊
摘要:随着中国改革开放的深入发展,越来越多的中国知名品牌进入海外市场。然而,尽管许多品牌在中国享有一定的地位和名誉却无法在海外市场占据一席之地。这还要归因于一些知名品牌的广告宣传,在中文翻译成英文的过程中,无法充分的展现其销售理念和产品内涵。一些企业对于中文翻译成英文在广告方面的应用水平还有待加强。因此,中文广告的英译方式值得探索。  关键词:纽马克交际翻译理论,广告翻译,广告学  引言:  本篇
期刊
摘要:本文分析员工离职后申请专利的权利归属问题,从《专利法》和《专利法实施细则》的相关规定,并结合实际案例,分析专利的申请权归属于原单位、员工,还是新单位。  关键词:职务发明创造 员工 离职 权利归属  随着社会的发展,员工离职已经是一种常见现象,而员工的离职后,往往会将在原单位掌握的技术应用在新单位。如果员工在离职后,提出专利申请,这个专利的申请权是否应该归属于原单位、还是应该归属于员工或其任
期刊
摘要:农村区域经济协调发展是提升农村经济整体发展质量的关键,对这一问题进行优化策略的制定,可以为社会主义新农村建设提供有利支持。本文首先对农村区域经济协调发展存在的不足进行了研究,并结合社会主义新农村建设的实际需要,制定了优化农村区域经济发展质量的策略,对提升农村区域经济的总体发展水平,具有十分重要的意义。  关键词:农村区域经济;协调发展;社会主义新农村  社会主义新农村的建设是当前农村居民的迫
期刊
摘要:随着信息技术的快速发展,每个行业都开始实行信息化管理。不过 在档案管理方面,信息化管理方式没有取得很好的效果,主要的原因是因为相 关管理人员没有熟练掌握信息技术,而且行业中缺少专业的管理人员,这也就 导致信息化档案管理出现了很多的问题。因此,本篇文章根据档案管理的安全 保密及信息化档案管理的问题进行分析,并且制定出合理的信息化管理策略。  关键词:档案管理;安全保密;信息化档案管理;策略  
期刊
摘要:在当前高校教学改革的背景下,对教师职业素养提出了更高的要求和标准。高校教师需要根据自身的实际情况,抓住机遇,迎接挑战,促进自己职业生涯的发展。但是从当前高校教师教学来看,存在不同程度的职业倦怠。因此,本文首先分析高校教师出现职业倦怠的原因,然后提出相应的解决策略。  关键词:高校教师;职业倦怠;成因;应对策略  前言  就目前而言,在高校教育改革的大背景下,教师作为特色的职业群体,出现了不同
期刊
摘要:为了防止对马克思主义的割裂、歪曲与只注重分门别类研究的弊端,学界倡导进行马克思主义整体性研究,从整体上把握马克思主义。在此基础上,学者们提出了进行马克思主义整体性研究一大视角即文献学研究,从马克思主义经典著作的文本中探讨马克思主义的整体性。而《反杜林论》一书一直以来被认为是将马克思主义划分为哲学、政治经济学以及科学社会主义三大组成部分的文本根据,也是马克思主义进行分门别类研究的支撑。本文旨在
期刊
摘要:新一轮科技革命时代背景下,人工智能技术的应用已从传统领域逐渐延展到法律领域,成为一项重要的国家战略。人工智能的介入,改变了传统的司法模式,为我国进一步落实司法体制改革,推动智慧法院的建设提供了坚实的动力。但同时,随着司法人工智能应用的不断深入,逐渐显现出人工智能在当前存在的诸如算法隐秘、数据结构不合理一些现实问题。司法人工智能的发展仍需实践探索,保持审慎的态度和正确的认识是解决实践中难题,推
期刊
摘要:和谐油田建设离不开政工工作的大力支撑,特别是在当前油田深化改革促发展的新常态下,加强政工工作对于促进和谐油田建设更是发挥着至关重要的作用,基于此,本文立足当前油田职工队伍思想现状,通过突出针对性、主动性和实效性等思想政治工作的具体措施研究,对加强政工工作服务和谐油田建设进行了简要探究。  关键词:政工工作;思想教育;和谐油田  1 油田职工思想现状  广大油田职工及家属是开展政工工作的主要服
期刊
摘要:随着网络信息技术的迅速发展,网络购物逐渐盛行起来, 其以物美价廉、操作简单快捷的优势, 受到很多消费者的追捧。一时间各种网络购物平台层出不穷,但是消费者在享受网络购物带来的便利时,也会遇到到各种各样的糟心的问题,本文针对网络购物中消费者维权的问题进行分析以及建议。  关键词:消费者维权;网络购物  一、网络购物的现状  经济的提高和人民消费意识的增强,为网络购物的发展提供了良好的环境。网络购
期刊