基于微博数据的POI现势状态变化检测方法

来源 :武汉大学 | 被引量 : 0次 | 上传用户:johnnyxp
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
兴趣点(Point of Interest,POI)作为位置服务的重要数据底座,在动态实时的服务需求下,使用者对其数据的质量和现势性提出了更高要求。但由于类型复杂多样、状态变化快、数据更新成本高等问题,POI数据现势性与动态实时位置服务需求之间的矛盾日益突出。因此,本文基于微博数据研究POI现势状态变化检测方法,尝试从海量、时效性强、语义信息丰富的社交媒体数据中捕捉POI现势状态变化,提高其数据现势性,让POI更加鲜活,具有重要研究意义与应用价值。该方法结合微博数据中获取的POI名称、位置及现势状态描述完成现势状态变化检测工作,主要工作概括总结如下:(1)针对现有地理命名实体识别算法中存在的对构词复杂和高动态变化的POI类型识别能力有限等问题,提出了一种条件随机场(Conditional Random Field,CRF)和规则约束结合的POI名称识别方法。该方法从POI构词特征、微博语言表达方式与地域特色三方面综合选取5个特征因子并建立词典约束,设计相应的CRF特征模板用于特征融合,从而提高POI名称识别的准确性。通过实例验证,该方法对复杂的商业类POI名称能取得较好的识别效果。(2)针对微博签到位置与POI实际位置存在偏差的问题,提出了一种联合文本地址和签到坐标的POI位置推算方法。该方法构建地名地址库提取微博文本中的非结构化地址信息,并从文本关系、地址层级和距离计算三方面综合设计优选规则确定文本地址,在坐标和地址一致性约束条件下联合签到坐标推算POI位置,提高从微博数据中获取POI位置坐标的可靠性。(3)针对现有研究对POI现势状态变化检测不足的问题,构建了一种支持多类型POI现势状态变化检测方法。该方法回溯识别出POI的微博文本,通过建立的三级现势状态词库进一步提取现实状态描述并优选,而后将状态描述映射到相应的变化类型上从而完成对该POI的现势状态变化检测工作,提高数据现势性。经过案例分析,对变化检测结果的精度进行定量评价与分析,验证了本文提出方法的有效性。
其他文献
火干扰是广泛存在于森林的干扰之一。大兴安岭是我国最大原始林区,火灾常年多发于此,而针对此地区关于火烧对树木径向生长及其气候响应的研究鲜见报道。本文从树轮角度,研究不同强度火干扰对兴安落叶松(Larix gmelinii(Rupr.)Kuzen)径向生长及其气候响应的影响,旨在揭示火干扰对森林生态系统的生态作用机制,并为预测树木受火烧后恢复情况提供科学依据。采集漠河地区轻度火烧、中度火烧、重度火烧和
德国的宝马集团是一家驰名世界的高档汽车制造企业,也被国际媒体认为在世界上是高档汽车技术生产业的引领者和先导。80年来,它由最初的德国一家高性能飞机引擎和越野车生产厂逐步发展成为今天以德国高级轿车生产业为主导,并且开发和生产一系列享誉于全球的高性能飞机引擎、越野车和高性能摩托车的国际化企业技术集团。德国宝马集团历来以高度重视汽车技术革新而举世闻名,不断为生产高性能高档自动化的汽车产品设定新标准。尽管
一直以来有一个重要的经济现象被经济学文献所忽视:大城市居民的储蓄率低于中小城市居民的储蓄率。我国作为教育文化大国,“再苦不能苦教育,再穷不能穷孩子”是家长一直奉行的信条,家庭教育支出一直在家庭消费支出中占据较高比重。因此本文提出了家庭教育支出是不同城市规模间居民的储蓄率差异背后的影响机制这一理论假说。基于此,本文整理了居民储蓄率以及家庭教育支出相关理论,作为本文的理论支撑,并对相关国内外文献进行了
小说因其故事情节完整、人物特点鲜明、环境描写典型、主旨含义丰富及构思设计巧妙成为中学语文教材的重要组成部分,所以小说教学也是中学语文阅读教学的重要组成部分,也一直被语文教育界所重视。基于文本解读理论的发展和语文教学的客观需求,中学语文阅读教学强调以文本为中心,细读文本的细微之处,深入分析文本,从而揭示出文本的审美价值。在当前的中学语文小说教学过程中,越来越多的语文教师重视对小说进行微观分析,微观分
改革开放初期,资源型城市随我国经济发展而崛起,这类型城市为我国建立健全工业体系、推动经济高速发展作出了巨大的功劳。然而,由于资源被无节制开采,该类型城市呈现出资源逐渐枯竭、产业结构失调、失业人员激增等诸多矛盾。同时随着国内经济发展不平衡、世界能源消耗格局转变以及能源价格波动下降,资源型城市在推动当地经济健康高效运行时面临不小的压力。2020年7月,习近平总书记在山西进行调研时,提出“在转型发展上率
杨树作为北方地区生态修复的常见树种,其促进降雨蓄渗、水源涵养的生态服务功能对于生态水文循环有重要的意义。因此,该研究以欧美杨(Populus×euramericana)人工林生态系统为研究对象,对冠层水文过程、大气环境因子和土壤水分等因子开展实地长期观测,采用聚类分析对降雨进行雨型分析,建立GASH模型量化分析冠层降雨再分配过程,利用Hydrus-1D多孔溶质运移模型模拟了同期土壤水分运移过程,并
自动驾驶是汽车行业发展的趋势之一,近年来,该领域不断有所突破,甚至部分厂商已经有成品出现。毫米波雷达在汽车中主要用于高级驾驶辅助系统(ADAS,Advanced Driving Assistance Syatem),和激光雷达、摄像头等其他传感器一起为汽车提供周围环境信息。毫米波雷达与其他传感器相比具有全天时、全天候、低成本等优点。由于传统雷达精度与其他传感器相比较低,因此车载雷达其主要功能仍是实
随着发展绿色经济理念的兴起,能源消费端逐步在由被动的消费者向主动的产消者变化,屋顶光伏、小型风电、电动汽车、可调负荷等可调资源在用户侧蓬勃出现。但绿色资源不确定性供电和电动汽车无序充放电的增加,导致用电侧波动性和随机性迅速上升。因此,如何对低压配电网内大批量、小体量的分布式单元进行管理,并对其碎片化可调能力加以利用,是亟待研究的问题。本课题正是针对电力系统分布式发电(Distributed Gen
当今世界正处于大调整、大变局、大发展的关键时期,政治、经济、社会、公共安全等非传统安全风险相互叠加,各种类型、各个利益群体间的矛盾接连出现,冲突日益加剧。此次新冠肺炎疫情俨然成为世界格局调整的导火索,政治运作、经济制裁、社会冲突与这一特大公共卫生事件相互交织,使得此次新冠肺炎疫情成为史无前例的社会参与度最高、矛盾冲突最为激烈、处置过程最为复杂、动员规模最大的突发公共卫生事件。事实再次表明:非传统安
新中国成立70周年以来,我国一直积极倡导减贫事业,有力推动扶贫开发工作,先后制定和实施了一系列助力脱贫攻坚的具体计划、规划、方法、建议。特别是党的十八大以来,我国明确了到2020年我国现行标准下农村贫困人口实现脱贫、贫困县全部摘帽、解决区域性整体贫困的目标任务。截止2019年,贫困群众人均年收入水平实现大幅度提高,贫困地区基本的生产生活条件已得到明显改善,贫困治理能力也明显得到了提升,但是制约贫困