【摘 要】
:
随着信息科技的高速发展,大数据技术不断突破,计算能力和存储能力得到大幅度提升。大数据涉及面广、数据量大,使得数据管理的难度大、耗费时间长。为解决这些问题,我国政府部门颁布了一系列相关的利好政策,如“大数据发展行动纲要”等,其中涉及到农业大数据的政策有,“农业农村大数据发展”、“乡村振兴”等。目前,针对农业大数据的管理,不同的平台使用不同的存储规则,手动处理数据的方式仍然存在,导致数据汇集难度大,管
论文部分内容阅读
随着信息科技的高速发展,大数据技术不断突破,计算能力和存储能力得到大幅度提升。大数据涉及面广、数据量大,使得数据管理的难度大、耗费时间长。为解决这些问题,我国政府部门颁布了一系列相关的利好政策,如“大数据发展行动纲要”等,其中涉及到农业大数据的政策有,“农业农村大数据发展”、“乡村振兴”等。目前,针对农业大数据的管理,不同的平台使用不同的存储规则,手动处理数据的方式仍然存在,导致数据汇集难度大,管理效率低下。农业大数据不仅具有大数据规模性、高速性、多样性、价值性、真实性等特点,还面临数据采集难度大、跨越周期长等问题,这使得农业大数据的管理难度更大、消耗时间更多。因此,如何提高农业大数据的管理效率成为亟待解决的问题。本论文的研究是在农业大数据的基础之上,使用分布式存储架构和面向数据的体系结构DOA(Data-Oriented Architecture)中数据注册中心的思想建立数据注册中间库,并设计数据注册系统客户端。针对农业大数据特点,对非结构化数据制定“统一注册规则”,采用TF-IDF(Term Frequency–Inverse Document Frequency)算法、朴素贝叶斯算法和K最近邻算法对文本类数据分类;对结构化数据制定“数据注册原则,一库一标准”,采用TF-IDF算法代替手动注册方法,对众多数据属性字段进行自动筛选,选出TOP-N作为数据注册字段,提高数据注册效率,实现农业大数据的高效管理。本论文的主要创新点如下:(1)提出了一种关于农业大数据的非结构化、结构化注册规则。农业大数据的非结构化数据注册规则是“统一注册规则”,注册表结构模板分为4大模块,分别是原始数据内容、映射关系、注册信息、权限管理模块;结构化数据注册规则是“统一注册原则,一库一标准”,其中‘统一注册原则’共有八大原则,‘一库一标准’根据结构化数据注册表结构模板和实际的数据库表结构得出。(2)提出了一种运用算法注册非结构化、结构化农业大数据的方法。对非结构化数据注册,以文本数据为例。首先对文本内容进行预处理,使用Jieba库分词,去除无用词,建立词典库,使用one-hot进行编码,运用TF-IDF算法计算TF和IDF,通过word2vec将每个词映射成一个向量,使用朴素贝叶斯和K最近邻算法对文本进行分类,得出分类结果,注册非结构化数据;对结构化数据运用TF-IDF算法计算TF和IDF值,选取TOP-N字段作为机动字段,结合固定字段,注册结构化数据,提高数据信息的注册效率。通过农业大数据注册系统的测试验证,使用算法注册数据能极大提高注册效率。在注册非结构化数据测试中,结果表明:不使用算法的注册时间是使用朴素贝叶斯算法的720倍以上,是K最近邻算法的750倍以上。K最近邻算法的分类精准度比朴素贝叶斯算法高,能更好地实现数据库主题分类目标。注册结构化数据时,不使用算法的注册时间是使用TF-IDF算法的30倍以上。
其他文献
由于美国资本市场对企业上市要求较为宽松,并且资金流通相对自由,因此早期很多中国企业选择赴美上市。但从2018年开始,随着中美两国关系恶化,美国资本市场也受到重大影响,2020年美国政府通过了与中国现行法律相悖的《外国公司问责法案》,使得未来在美上市的中概股存在整体被强制退市的风险。与此同时,随着我国资本市场改革的不断推进,对中概股的吸引力愈发强烈,当前中概股掀起了新一轮的回归潮。本文首先对中概股回
2014年“43号文”及新《预算法》的颁布是投融资平台开启转型的政策起点,政府融资内核被正式剥离。随后一系列法规政策相继出台,地方政府投融资平台的隐性担保、融资举债及经营运作都受到约束,平台面临债务肃清和监管政策趋紧的挑战,进行科学转型,增强平台市场化、规范化经营能力迫在眉睫。大量平台通过并购控股上市公司的模式向综合城市服务平台、金融控股平台或国有资本运营平台这三大主要转型阵营靠拢,积累了丰富的平
土茯苓是双子叶植物菝葜的干燥根茎,《中国药典》(2020年版第一部)已将其收载。现代药理研究表明,土茯苓具有免疫调节、抗炎、抗氧化、抑菌、镇痛、利尿等活性,临床上常用于治疗湿热淋浊、筋骨疼痛、头痛、痛风等症状。同时,土茯苓也属于原卫生部规定的可用于保健食品的物品,具有除湿解毒,健脾胃等功效。本文以土茯苓为原料,对其乙醇提取工艺进行优化;探究了醇提物及落新妇苷的抑菌活性、抗氧化性,以及对胰脂肪酶和α
经过多年的发展,我国普惠金融业务在理论和实践层面都取得了巨大进展,理论成果颇丰,实践效果良好。然而在原有的普惠金融业务模式中,小微群体获取贷款的难度较大,风险程度也高,普惠金融业务的拓展仍面临多重困局。随着大数据、云计算、区块链等数字技术的出现与大量应用,传统金融机构纷纷进行普惠金融的数字化转型,但互联网银行具有传统银行不可比拟的技术和客源优势,与小微群体形成息息相关的金融生态圈,其普惠金融业务极
长期以来,传统金融机构热衷于“高净值客户”,遵循着二八定律,鉴于经营模式转换成本高、信息不对称等原因,较难将服务重点转向长尾客户群。传统金融机构的普惠金融模式将重点放在补贴利率、提高授信额度等方面,具有很强的政策性倾向。但对于一般性小微企业和三农用户等来说,贷款准入门槛高、审批周期长等问题阻止了其向传统金融机构获得金融服务。如何促进普惠金融发展,让金融服务于这些弱势群体,是如今社会各界关注的焦点。
受新冠疫情影响,国内外经济状况普遍下滑。中国虽然保持经济正增长,但依然面临很大的经济下行压力。未来经济工作要把保稳定放在重要位置,推动实体经济高质量发展。目前家电行业增长乏力,消费者对产品的要求向智能化和成套化转型,家电企业面临技术创新和转型升级两大难题。在此背景下,产融结合也要创新发展,助力产业转型升级,推动实体经济高质量发展,同时注意防范风险。海尔集团是较早进行产融结合的企业,经过多年的发展已
城市商业银行不断改革发展后,现已成为我国银行业中最有发展潜力的机构之一,也是我国商业银行中不可或缺的一部分。城市商业银行的健康发展,能够有效拉动当地经济的发展。目前,宏观经济增速放缓,城市商业银行不良资产规模持续增长,如何有效处置不良资产,成为城市商业银行急需解决的事情。因此,本文以城市商业银行为研究对象,对其不良资产处置进行分析。H城市商业银行资金规模不断扩大,在城市商业银行中位于行业前列,但是
随着经济发展和社会消费结构的转型升级,我国零售业的业态不断创新,零售业的竞争也越来越激烈。零售企业供应链上多为中小企业,竞争压力的增大,使得上下游中小企业的生存也更加困难,面临着融资难的问题。供应链融资的出现,给中小企业融资提供了新的思路,能有效拓宽中小企业融资渠道,缓解其资金压力。随着供应链融资业务的发展,业务参与主体和模式也逐渐增多,加大了供应链融资风险控制的难度。目前对于供应链融资风险的研究
Pickering乳液因其独特的稳定机制而区别于传统乳液,其拥有更好的稳定性和环境友好性,在食品、化妆品和制药等行业中广泛使用。食品级颗粒的开发与制备是拓展Pickering乳液在食品工业中应用的基础。明胶是一种胶原蛋白水解而成的天然聚合物,广泛应用于制药、食品和组织工程领域。明胶中的功能性氨基酸基团、末端氨基酸以及羧基基团的存在使其具有两亲性行为,也有利于以其为原料形成纳米颗粒。当前,以明胶纳米
随着中国资本市场不断发展和完善,市场上的投资主体从个人投资者占主导地位逐渐过渡到机构投资者占主要力量,而且市场上的投资者在进行理财时相较于以前直接投资于股票市场上来说目前更愿意投资到基金这类较为稳健的理财工具。在这种情况下,有必要对机构投资者的市场交易行为进行研究和分析,所以本文从行为金融学中处置效应这一角度来分析机构投资者在进行市场交易时是否会出现处置效应这类不理性的行为。处置效应简单来说就是指