1235 字
6 分钟
EarthNets:一个用于评估深度学习模型的地球观测数据平台

地球观测旨在利用遥感数据监测地球状况,对于改善我们的日常生活和环境至关重要。随着在轨卫星数量的不断增加,越来越多不同传感器和研究领域的数据集被公布出来,为遥感界的研究提供了便利。EarthNets收集了400多个公开发布的数据集,包括土地利用/覆盖、灾害监测、场景理解、农业、气候变化和天气预报等场景,可用于对深度学习方法和模型进行一致性评估。https://earthnets.nicepage.io/

本文挑选部分数据集进行介绍。

  • SEN12MS: 一个用于深度学习和数据融合的地理配准后的哨兵-1/2 影像数据集,由 180,662 个双波长合成孔径雷达 (SAR) 图像分块、多光谱 Sentinel-2 图像分块和 MODIS 土地覆被图组成。由于所有斑块都以 10 米的地面采样距离进行了地理配准,并覆盖了所有气象季节的所有有人居住的大陆,该数据集能为社区开发基于深度学习的复杂方法提供支持,以完成场景分类或土地覆被制图的语义分割等常见任务。

    数据集下载地址:

    https://mediatum.ub.tum.de/1474000

    数据处理和分析工具:    https://github.com/schmitt-muc/SEN12MS

    Paper:

    https://arxiv.org/abs/1906.07789v1

  • Landslide4Sense: 用于滑坡探测的参考基准数据和深度学习模型,分为训练/验证/测试三个部分,分别由 3799、245 和 800 个图像片段组成。图像来源于哨兵-2和ALOS PALSAR的14个波段,所有波段的分辨率均调整为每像素约 10 米。图像片段的大小为 128 x 128 像素,并按像素标注。

    数据与软件地址: 

https://github.com/iarai/Landslide4Sense-2022

    Paper: https://arxiv.org/abs/2206.00515

  • AID: 航空场景分类性能评估基准数据集,由以下 30 种航空场景类型组成:机场、裸地、棒球场、海滩、桥梁、中心、教堂、商业、密集居住区、沙漠、农田、森林、工业、草地、中等居住区、山地、公园、停车场、游乐场、池塘、港口、火车站、度假村、河流、学校、稀疏居住区、广场、体育场、储罐和高架桥。所有图像都由遥感图像解译领域的专家进行了标注,共有 30 个类别的 10000 幅图像。

数据集下载地址:

https://captain-whu.github.io/AID/

  • DOTA: 是一个用于航空图像中物体检测的大型数据集。它可用于开发和评估航空图像中的物体检测器。这些图像来自不同的传感器和平台,来自谷歌地球、中国资源卫星数据与应用中心提供的 GF-2 和 JL-1 卫星以及 CycloMedia B.V. 提供的航空图像,包括 RGB 图像和灰度图像,RGB 图像来自 Google Earth 和 CycloMedia,灰度图像来自 GF-2 和 JL-1 卫星图像的全色波段。所有图像均以 “png “格式存储。每幅图像的大小在 800 × 800 到 20,000 × 20,000 像素之间,包含各种尺度、方向和形状的物体。DOTA 图像中的实例由航空图像判读专家通过任意四边形进行标注。

 https://captain-whu.github.io/DOTA/dataset.html

  • BigEarthNet: 由柏林工业大学(TU Berlin)的遥感图像分析(RSiM)小组和数据库系统与信息管理(DIMA)小组构建。BigEarthNet 是一个基准档案库,由590326组哨兵1号和哨兵2号图像片段组成。BigEarthNet 的第一个版本(v1.0-beta)仅包含哨兵 2 号图像。BigEarthNet 通过 Sentinel-1 图像进行了充实,创建了一个多模式 BigEarthNet 基准档案(也称为 BigEarthNet-MM)。

    代码:https://github.com/avulaankith/BigEarthNet

    数据集地址:https://bigearth.net/

    Paper:https://arxiv.org/abs/1902.06148

  • SSL4EO-S12 数据集是用于地球观测无监督/自监督预训练的大规模多模态数据集。该数据集由来自全球 251079 个地点的无标注分块三元组(哨兵-1 双波谱合成孔径雷达、哨兵-2 大气层顶多光谱、哨兵-2 地表反射率多光谱)组成,每个分块覆盖 2640 米 x 2640 米,包括四个季节时间戳。

    数据集地址:https://github.com/zhu-xlab/SSL4EO-S12

    Paper:https://arxiv.org/abs/2211.07044

  • SatlasPretrain :用于理解卫星图像任务的大规模预训练数据集。通过 “哨兵-2 “和 “NAIP “等来源,地球上大部分地区的定期更新卫星数据均可公开获取,这些数据可为从处理非法砍伐森林到监测海洋基础设施等众多应用提供信息。然而,开发自动计算机视觉系统来解析这些图像需要大量的人工标注训练数据。通过将超过 30 TB 的卫星图像与 137 个标签类别相结合,构建了一个有效的预训练数据集,大大减少了为下游卫星图像应用开发可靠模型所需的工作量。

数据集地址:https://satlas-pretrain.allen.ai/

EarthNets:一个用于评估深度学习模型的地球观测数据平台
https://blog.scidatalab.net/posts/earthnets-一个用于评估深度学习模型的地球观测数据平台/
作者
Echo
发布于
2024-01-11
许可协议
CC BY-NC-SA 4.0