本章介绍了VGI大数据的数据主要来源、数据特点及优势以及VGI大数据关键技术以及其在城市功能、城市居民活动判定、城市交通布局等方面的应用。
VGI大数据主要具有易获取、数据量大、覆盖面广、更新速度快、大众化等的特点。
VGI大数据主要形式为VGI信息收集平台数据、带有地理位置的社交媒体数据。
VGI大数据中带有地理位置的社交媒体数据在细粒度理解城市社会经济特征、构建细粒度居民活动模式等方面有广泛的应用。
基于VGI信息收集平台所得数据(如:OSM)为城市规划、评估城市交通布局状况等提供决策支持。

资料下载

课件下载

VGI大数据简介

VGI大数据概念

自发式地理信息 (Volunteered Geographic Information, 简称VGI):
• 随着地球信息科学在新地理信息时代中发展出现的新概念,由M.F. Goodchild 于2007年提出;
• 指任何人都可以通过移动互联设备自发地贡献地理空间信息;
• 认为地理信息的创建、维护、应用可由大众完成,反映了互联网时代地理信息新的获取与应用方式

VGI大数据来源

VGI信息收集平台: OpenStreetMap、Wikimapia、Google Map Maker、微信、美团…
带有地理坐标的社交媒体数据也被认为是VGI数据

VGI大数据示例—OSM路网

Snipaste_2021-08-19_17-34-08

VGI大数据优势

VGI数据在城市科学中有什么优势?
• 缩短了地理信息创建和传播的时间,降低了普通大众获取、分享和处理
地理信息的门槛,数据量大,易获取;
• 补充地理框架数据的不足,为更好的描述现实世界提供丰富的细节和人
类感知;
• 具有随时编辑性,能尽可能的保证现势性。

VGI大数据关键技术

VGI大数据关键技术—自然语言处理

自然语言处理( Natural Language Processing, NLP):
• 是计算机科学领域与人工智能领域中的一个重要方向;
• 研究能实现人与计算机之间用自然语言进行有效通信的各种理论和方法;
• 应用于机器翻译、舆情监测、自动摘要、观点提取、文本分类、问题回答、文本语义对比、语音识别、中文OCR等方面。

自然语言处理—主题模型

主题模型
• 主题模型是用来在大量文档中发现潜在主题的一种统计模型。
• 主题模型能够自动分析文档(document),不计顺序地统计文档内的单词(word),根据统计的信息判断该文档包含的主题(topic)以及各个主题所占比例。

自然语言处理—Word2Vec

Word2Vec
• 将词转化为「可计算」「结构化」的向量的过程

自然语言处理—知识图谱

知识图谱:
• 一种基于图的数据结构,由节点(Point)和边(Edge)组成;
• 每个节点表示一个“实体”,每条边为实体与实体之间的“关系”;
• 知识图谱本质上是语义网络。

VGI在城市科学领域的应用

POI向量化—POI2Vec

Snipaste_2021-08-19_17-46-33

轨迹向量化—Traj2Vec

Snipaste_2021-08-19_17-47-37

基于知识图谱的城市居民活动推断

人们正在做什么?下一步要做什么?

基于OSM的中国城市交通布局评价

Snipaste_2021-08-19_17-49-28

Q.E.D.