1.数据集介绍

中文版(当前)English version

数据标注过程与结果

该数据集的研究区域包括中国81个主要城市 (Zhang et al. 2022) ,研究区域总面积为983,215平方千米。由于这些城市具有不同的空间形态、格局和景观,因此数据集可以较好的描述中国城市的遥感景观,具有代表性。

在标注任务准备阶段,为了适配地块(社区)尺度,我们集成了阿里内部的iTAG智能标注平台、宜搭平台和DataStudio平台,开发了AliLBS-CUG多源时空数据人机协作标注平台(点击查看过往文章详情)。

在数据标注阶段,我们基于Data Centric思想提出了一种人机协作的数据集构建框架。在该框架中,数据标注过程由人类专家和机器共同完成,目标是通过迭代来提升数据集的质量和模型的表现。这一框架的详细内容将会在我们即将发表的论文中进行全面阐述,敬请期待。

在数据验证阶段,我们采用了交叉检验方法,将不同志愿者之间的25%的数据用于验证,保证准确率范围在90%至95%之间。最终,我们得到了116,121条数据,其中包括居住用地44,588条、公共服务8,184条、商业服务9,065条、工业用地27,529条和农业与自然用地26,755条。

合作方

本研究的合作单位是阿里巴巴控股集团1,为本研究的工作做出了重要贡献。包括但不限于以下内容:

  • 强大的云计算支持:阿里云2作为阿里巴巴控股集团旗下的云计算平台,为处理大规模数据集和复杂算法提供了强大的计算能力,提供了高性能计算支持。
  • 高精度测绘地图信息支持:阿里巴巴控股集团旗下的高德集团3是全球领先的数字地图服务提供商之一。他们提供了高精度的测绘地图信息,为数据集标注提供了准确的地理位置和地理特征信息。
  • 数据中台与行业前沿算法支持:阿里巴巴控股集团的数据中台4(现经过业务拆解,被划分为爱橙科技等部门)是一个集数据管理、数据应用和数据服务于一体的平台,集成丰富的数据资源和数据服务。为本研究提供合作的的LBS团队在人工智能和机器学习领域拥有丰富的经验和技术实力,包括图像识别、自然语言处理等方面,为研究工作提供了有力支持。

此外,我们还要格外感谢岐伟所带领的LBS团队的每一位成员,他们的专业知识、耐心指导和帮助对我们的研究工作起到了至关重要的作用,我们对他们的支持深表感激!

测试集说明与下载地址

为了使大家更好地了解数据集的特点和适用性,我们决定开放一部分测试数据供大家使用。我们从每个类别中选择了部分数据作为测试数据集,并将其命名为CN-MSLU-DEMO-1K。

说明书

数据集下载

点击此处下载CN-MSLU-DEMO-1K

现在CN-MSLU-DEMO-1K完全开放供各位老师和同学使用!

此外,我们还制作并分享了CN-MSLU-DEMO-10K数据集,点击此处下载CN-MSLU-DEMO-10K。该数据集的解压密码请本微信公众号(UrbanComp位置智能和城市感知)发送“MSLU-10K密码”获取。

此外,团队内部同学还可以通过NAS进行下载CN-MSLU-DEMO-10K。(点击此处下载)

现在CN-MSLU-DEMO-100K也已开放供各位老师和同学使用!(点击此处下载)

反馈与交流

我们欢迎您对研究的建议和交流!

若需要完整版数据进行研究,请联系项目负责人姚尧老师( yaoy@cug.edu.cn )。

有关项目的其他咨询,可以联系相关负责同学

2.基于DCAI思想的标注平台

AliLBS-CUG多源时空数据人机协作标注平台是UrbanComp团队联合阿里LBS团队,在阿里巴巴创新研究计划(Air)项目合作中开发的地理语义标注平台。该平台基于Data Centric AI (DCAI)思想,目的是辅助在全国、全球大尺度土地利用、城市功能、社会经济识别和监测中,对多源时空大数据进行动态展示,支撑微观尺度人机协作标注和多尺度样本集快速建立。该平台耦合多种阿里内部高性能存储、计算平台,打通了不同平台间联动困难的壁垒。本平台经过多次版本迭代,实现了符合相关需求的操作简便、响应快速的人机协作智能标注。(点击查看过往文章详情

AliLBS-CUG标注平台只是一个开始,未来的研究会对基于DCAI的平台进行进一步的研究,敬请期待!

3.感谢名单

我们从中国地质大学(武汉)的地理信息等相关专业召集了56名志愿者同学参与标注工作。在此,我们衷心感谢每一位志愿者同学的辛勤付出!

以下是志愿者名单,按照拼音字母顺序横向排列,不分先后:

曾城泷戴良洋董安宁樊明
范云鹏冯羽彤高荣徽郭延铎
郭子豪郭紫锦韩佳澎韩葳奇
胡志辉胡子敬黄坤姜家政
江瑛李贵程李昊然李建锋
李锦鲜李思宇梁琳刘航甫
刘佳耀刘宇骁马跃恒裘嘉楠
冉耘博任斐然尚青欣汪玉笳
王斌王慧纹王芊卓王兆歆
尉锐武浩夏迎兵肖诗宇
熊凯路徐苏琪徐争薛晨阳
杨明斯喻承龙张凯楠张翔
赵传成赵业博周文海周宇航
朱坤坤朱恰祝翰林卓星语

4.参考文献

以下参考文献为本研究打下了充分的理论基础

DCAI-CLUD Model:

  • Wu, H., Jiang, Z., Dong, A., Gao, R., Yan, X., Hu, Z., … Yao, Y. (2024). DCAI-CLUD: a data-centric framework for the construction of land-use datasets. International Journal of Geographical Information Science, 1–24.(站内链接

POI-embedding 的方法:

  • Yao, Y., Zhu, Q., Guo, Z., Huang, W., Zhang, Y., Yan, X., ... & Guan, Q. (2023). Unsupervised land-use change detection using multi-temporal POI embedding. International Journal of Geographical Information Science, 1-24. (站内链接
  • Huang W, Cui L, Chen M, et al. Estimating urban functional distributions with semantics preserved POI embedding[J]. International Journal of Geographical Information Science, 2022, 36(10): 1905-1930. (站内链接
  • Yao Y, Li X, Liu X, et al. Sensing spatial distribution of urban land use by integrating points-of-interest and Google Word2Vec model[J]. International Journal of Geographical Information Science, 2017, 31(4): 825-848.(站内链接

多源数据融合的方法:

  • Yao Y, Zhang J, Qian C, et al. Delineating urban job-housing patterns at a parcel scale with street view imagery[J]. International Journal of Geographical Information Science, 2021, 35(10): 1927-1950.(站内链接
  • Yao Y, Yan X, Luo P, et al. Classifying land-use patterns by integrating time-series electricity data and high-spatial resolution remote sensing imagery[J]. International Journal of Applied Earth Observation and Geoinformation, 2022, 106: 102664.(站内链接
  • He J, Zhang J, Yao Y, et al. Extracting human perceptions from street view images for better assessing urban renewal potential[J]. Cities, 2023, 134: 104189.(站内链接
  • Guan Q, Cheng S, Pan Y, et al. Sensing mixed urban land-use patterns using municipal water consumption time series[J]. Annals of the American Association of Geographers, 2021, 111(1): 68-86.(Annals of the American Association of Geographers

轨迹-embedding的融合方法:

  • Zhang J, Li X, Yao Y, et al. The Traj2Vec model to quantify residents’ spatial trajectories and estimate the proportions of urban land-use types[J]. International Journal of Geographical Information Science, 2021, 35(1): 193-211.(International Journal of Geographical Information Science

人机对抗(协作)模式:

  • Yao Y, Liang Z, Yuan Z, et al. A human-machine adversarial scoring framework for urban perception assessment using street-view images[J]. International Journal of Geographical Information Science, 2019, 33(12): 2363-2384.(站内链接

推荐系统:

  • Yao Y, Liu P, Hong Y, et al. Fine‐scale intra‐and inter‐city commercial store site recommendations using knowledge transfer[J]. Transactions in GIS, 2019, 23(5): 1029-1047.(Transactions in GIS)

其他相关研究:

  • Liu X, He J, Yao Y, et al. Classifying urban land use by integrating remote sensing and social media data[J]. International Journal of Geographical Information Science, 2017, 31(8): 1675-1696.(站内链接)
  • Yao Y, Liu X, Li X, et al. Mapping fine-scale population distributions at the building level by integrating multisource geospatial big data[J]. International Journal of Geographical Information Science, 2017, 31(6): 1220-1244.(站内链接)
  • 姚尧, 任书良, 王君毅, 等. 卷积神经网络和随机森林的城市房价微观尺度制图方法[J]. 地球信息科学学报, 2019, 21(2): 168-177.(站内链接)

Q.E.D.