基于新浪微博的爬虫程序设计与实现

来源 :无线互联科技 | 被引量 : 0次 | 上传用户:myloft1d
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
为了快速地获取到微博中人际关系信息,根据网址的特点,文章提出了一种基于新浪微博的爬虫程序设计方法。本方法通过模拟登录新浪微博,实现抓取微博中由指定用户出发的关注对象的名称等信息;该程序利用解析关键路径,广度遍历等技术,匹配符合规定条件的人物名称,并抓取相关内容;最后对该程序又进一步地优化与改进。实验结果表明:本程序具有针对性强,数据采集速度合理,易推广开发,稳定性强等优点,为寻求人际关系的研究者提供了寻求微博用户关注者的方法,有利于对微博的后续数据挖掘研究。
其他文献
基于当前机器学习方法在中文微博文本情感分析处理过程中的复杂性、低准确率等问题,文中提出在统计情感词的基础上,结合情感影响因子和语义规则,并加入表情特征这一重要元素,
王官屯油田官三断块经过近30年开发,区块产能逐步下降,层系内一类油层储备越来越少。随着开发技术的进步,层系内可动用低产油层、油水同层等之间成为后期接替层系。通过研究王官
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield
会议
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield
向课堂40分钟要质量一直是高效课堂的终极目标。小学语文课堂教学要实现学生听说读写等基本语文能力的提升和态度、情感、价值观三位一体的建构,高效课堂就成为必然选择。高
本文根据新型工业化要求,从江苏目前的实际出发确定了选择江苏主导产业的选择模式、指标体系;用数据包络分析、层次分析法对现有主导产业进行了对比排序,并得出相关结论.
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield
目的:观察井穴刺络放血对中风大鼠缺血后脑水肿的影响。方法:将SD大鼠随机分为正常组、假手术组、模型组、井穴刺络放血组和井穴不放血组。参照Zea Longa法建立大脑中动脉栓