3625 字
18 分钟
打通地球观测数据的“最后一公里”

Radiant Earth是一家总部位于美国华盛顿的非营利技术组织,致力于通过社区驱动的方式让地球科学数据更易获取、更易使用。本文将全面介绍其创立背景、核心项目、技术栈、生态系统及全球影响力。


一、使命背景#

卫星数量从2017年的约1,400颗激增至2021年的4,852 颗,地球观测数据正以前所未有的速度增长。然而,数据的开放不等于数据的可用,“Open data is not good enough”是Radiant Earth成立的初衷。

数据必须同时满足三个条件才能真正发挥价值:

  • • 可发现(Discoverable):能被搜索引擎和目录系统索引
  • • 可访问(Accessible):通过标准化 API 和云原生格式获取
  • • 可使用(Usable):附带充分的元数据和文档

Radiant Earth的使命正是围绕这三点展开:通过构建开放的数据基础设施,让全球的研究者、开发者和决策者都能高效利用地球观测数据。Radiant Earth要做的是”让任何人都能像使用互联网上的网页一样,发现、访问和使用关于地球的数据”。

Radiant Earth 使命:可发现、可访问、可使用


二、核心项目#

Radiant Earth 三大核心项目:STAC、Source Cooperative、CNG Forum

Radiant Earth目前运营三个核心项目,构成了完整的地理空间数据生态系统。

2.1 STAC — 时空资产目录规范#

STAC(SpatioTemporal Asset Catalog)是 Radiant Earth 最具影响力的开源贡献。它定义了一套标准化的 JSON 规范,用于描述任何与地球某个时间和地点相关的数据文件。

STAC 三层架构:Catalog → Collection → Item

核心设计理念:最小核心 + 灵活扩展

STAC 由三层对象构成:

层级对象作用
顶层Catalog目录入口,包含子目录和集合的链接
中层Collection数据集集合,定义时空范围、许可证等元信息
底层Item单个时空资产,包含实际数据文件的链接和属性

为什么 STAC 如此重要?

  • • 通用性:最初面向卫星影像,现已扩展支持 SAR、LiDAR、高光谱、DEM、矢量、ML 标签等几乎所有地理空间数据类型
  • • 云原生:与 Cloud Optimized GeoTIFF(COG)、GeoParquet 等云原生格式无缝协作
  • • 静态部署:可以作为一组超链接的静态 JSON 文件部署,不需要数据库或后端服务
  • • 行业标准:已被 NASA Earthdata、Microsoft Planetary Computer、USGS 等主流平台采用,并成为 OGC 正式标准

STAC 的诞生与发展:2017年,Radiant Earth 资助了第一次 STAC 编程冲刺(Coding Sprint),由此启动了规范的开发。Planet公司不仅支持了核心开发者Chris Holmes,还参与了每一次冲刺、主办了第 4 次冲刺。Development Seed、Element 84 等 13 家组织从第一次冲刺起就参与其中。社区于 2021 年 5 月发布了 1.0.0 正式版

STAC 软件生态系统

工具语言用途
PySTACPythonSTAC 对象的创建、读取和操作
pystac-clientPythonSTAC API 客户端,搜索和过滤数据
stac-geoparquetPython/Rust将 STAC Items 批量存储为 GeoParquet 格式,提升查询性能
STAC BrowserJavaScript基于浏览器的 STAC 目录浏览器
stac-serverNode.jsSTAC API 服务端实现
rustacRust使用 DuckDB 对 GeoParquet 格式的 STAC 数据进行高速查询

STAC规范由Radiant Earth在GitHub上维护(radiantearth/stac-spec)。

2.2 Source Cooperative — 数据发布平台#

Source Cooperative 是 Radiant Earth 的数据发布基础设施,也是此前 Radiant MLHub(2019-2023)的升级继任者。其定位是面向 Web 的数据发布公用事业(Data Publishing Utility for the Web),允许受信任的组织和个人使用标准 HTTP 方法共享任意规模的数据产品。

Source Cooperative 关键数据仪表盘

关键数据(截至 2025 年 6 月)

指标数值
托管数据量超过 1 PB(2024 年 10 月为 450TB,半年翻倍)
月数据传输量约 500 TB
月请求数约 1.26 亿次
数据产品数300+
GitHub 代码引用464 个代码仓库(同比增长 149%)

技术架构

  • • 存储后端:AWS S3 + Azure 云存储,支持多区域镜像
  • • 数据格式:支持 Cloud-Optimized GeoTIFF、GeoParquet、FlatGeobuf、PMTiles、Zarr 等云原生格式
  • • 访问方式:HTTP 数据代理(重新设计并改进文档) + 直接云存储访问
  • • 元数据:集成 ORCID/ROR 标识符、DOI、使用量统计
  • • 认证:基于角色的访问控制,支持个人和组织账户
  • • 开发合作伙伴:Development Seed
  • • 新版前端:s2.source.coop(2025 年夏季上线)

代表性数据集

  • • dynamical.org 的云优化全球天气预报数据
  • • Earth Genome 的卫星影像嵌入向量
  • • [C]Worthy 的海洋碳去除图集(Ocean Carbon Dioxide Removal Atlas)
  • • LandCoverNet 全球土地覆盖分类数据
  • • Fields of the World (FTW) 全球农田边界基准数据集
  • • WaterNet 水体数据集(Bridges to Prosperity)
  • • 欧洲地面运动(EGMS)云原生数据
  • • 建筑足迹、农田边界、湿地清单等

三、重点计划与数据集#

3.1 LandCoverNet — 全球土地覆盖分类数据#

LandCoverNet 是 Radiant Earth 发布的首个全球多卫星土地覆盖分类训练数据集,使用 Sentinel-2 卫星的多光谱高分辨率影像。

属性详情
覆盖范围非洲、亚洲、澳洲、欧洲、北美、南美
图像瓦片8,941 张(256×256 像素)
标注像素约 5.86 亿
类别数7 类

七种土地覆盖类型:

    1. 水体
    1. 自然裸地
    1. 人工裸地
    1. 木本植被
    1. 栽培植被
    1. (半)自然植被
    1. 永久冰雪

LandCoverNet非洲版于2020年首先发布,全球版于2022年7月发布。

3.2 fiboa 与 Fields of the World — 农田边界数据生态#

fiboa(Field Boundaries for Agriculture)是Radiant Earth与Taylor Geospatial Engine合作开发的农田边界数据通用规范,旨在让此前孤立的农田边界数据集实现互操作。

Fields of the World (FTW) 是基于 fiboa 规范构建的最大、最多样化的全球农田边界基准数据集

属性详情
样本数超过 76,000 个
地块边界160 万个
覆盖国家27 个国家,4 大洲(欧洲、非洲、亚洲、南美)
输入数据Sentinel-2 光学影像(红、绿、蓝、近红外 4 个波段)
标注类型实例分割和语义分割掩膜

这一合作吸引了Bayer、Microsoft、Planet、亚利桑那州立大学、华盛顿大学圣路易斯分校、世界资源研究所等众多机构参与。其目标是支撑供应链追溯、再生农业实践和小农保险等应用。

3.3 数据挑战赛#

Radiant Earth 组织了多项数据挑战赛,推动 ML 在地球观测领域的应用:

挑战赛时间详情
ICLR CV4A Crop Detection2020在 Zindi 平台举办,440 名数据科学家参与,识别西肯尼亚 7 种作物类型(玉米、木薯、菜豆及 3 种间作组合),涉及 4,000+ 农田
Spot the Crop Challenge2021南非作物类型检测,奖金 $8,800

3.4 “Great Data Products” 播客#

Radiant Earth 推出了 Great Data Products 播客,这是”一档关于数据人体工程学与手艺的播客”(A podcast about the ergonomics and craft of data)。

核心理念:一个”好的数据产品”应该具备文档、明确的许可证、一致的格式、用户支持,最重要的是:它明天还会存在

3.5 Leading Women in Earth Science#

Radiant Earth 每年在国际妇女节期间评选 10 位”地球科学杰出女性”(Leading Women in Earth Science),表彰她们在利用云原生地理空间技术方面的领导力和创新。该项目自 2021 年起持续举办。2024 年获奖者包括气候数据科学家兼海洋学家 Paige Martin、Development Seed 数据工程师 Aimee Barciauskas 等。


四、技术栈全景#

Radiant Earth 的技术生态围绕”云原生地理空间”(Cloud-Native Geospatial)理念构建。

云原生数据格式#

格式用途特点
Cloud-Optimized GeoTIFF (COG)栅格影像HTTP Range Request 支持,无需完整下载。2015 年 Planet 首先将 Landsat 档案转换为 COG 格式
GeoParquet矢量数据列式存储,高效查询大规模矢量数据集
FlatGeobuf矢量数据支持流式传输和空间索引
PMTiles地图瓦片单文件归档,无需瓦片服务器
GeoZarr多维数组为 Zarr 添加地理空间能力,适合时序遥感数据
STAC GeoParquet元数据索引将 STAC Items 批量存储为 GeoParquet,避免逐条 HTTP 请求

核心标准#

  • • STAC:元数据发现和索引的通用标准
  • • OGC API:RESTful 的地理空间数据服务标准
  • • fiboa:农田边界数据互操作规范
  • • Cloud Object Storage:以 S3 兼容的对象存储为数据基础设施

STAC 生态系统与平台集成#

STAC 已被以下主流平台原生支持:

平台维护者说明
NASA Earthdata SearchNASA地球科学数据搜索门户
Microsoft Planetary ComputerMicrosoft地理空间数据分析平台,使用 STAC 框架
Earth SearchElement 84AWS 开放数据的免费 STAC API 索引
USGS LandsatUSGS最新 Landsat 数据通过 STAC API 发布
Google Earth EngineGoogle部分支持 STAC 目录
CBERSINPE(巴西)首批更新至 STAC 1.0.0 的目录之一

云原生地理空间数据格式概览


五、合作伙伴与生态系统#

Radiant Earth 与众多机构建立了深度合作关系:

政府与科研机构#

  • • NASA:通过 ACCESS 计划资助 MLHub 扩展(3 年合作协议);NASA Earthdata 原生支持 STAC
  • • 欧洲航天局(ESA):地球观测数据合作
  • • USGS:Landsat 数据 STAC 化
  • • NOAA:前 CEO Miglarese 曾任商业遥感联邦咨询委员会成员
  • • 地球观测组织(GEO):全球地球观测数据共享

商业与技术公司#

  • • Planet:深度参与 STAC 开发,提供高分辨率卫星影像
  • • Microsoft AI for Earth:Chesapeake Bay 土地覆盖等数据集发布在 MLHub
  • • AWS:为 Source Cooperative 提供实物支持(云存储),Earth Search 由 Element 84 在 AWS 上运营
  • • Development Seed:Source Cooperative 开发合作伙伴,STAC 早期贡献者
  • • Element 84:Earth Search 开发维护,STAC 冲刺创始参与者

数据合作伙伴#

  • • SpaceNet:高质量标注卫星影像(道路和建筑)通过 MLHub 发布(STAC 兼容)
  • • Taylor Geospatial Engine:fiboa / Fields of the World 合作开发
  • • 全球可持续发展数据伙伴关系(Global Partnership for Sustainable Development Data)

社区影响#

在Source Cooperative的beta阶段即服务了超过100个组织,包括世界银行和天主教救济服务等。一位 2017年博茨瓦纳的 Mandela Fellow 使用该平台帮助低收入农民通过无人机分析作物,帮助他们了解何时何地种植作物,最终增加收入并减少粮食不安全。


六、发展历程#

Radiant Earth 发展时间线 2016-2026

时间事件
2016Anne Hale Miglarese 创立 Radiant.Earth(法律名称 Open Imagery Network Inc.)
2017正式启动运营;资助 STAC 首次编程冲刺,启动规范开发;聚焦地球观测数据的开放获取
2018发布首个开放地球影像平台;Miglarese 获评地理空间女性冠军奖;被任命为 NOAA 联邦咨询委员会成员
2019发布 Radiant MLHub,全球首个地球观测 ML 训练数据云端平台;NASA ACCESS 3 年合作协议;SpaceNet 和微软 AI for Earth 数据入驻
2020发布 LandCoverNet 非洲土地覆盖数据集;举办 ICLR CV4A Crop Detection 挑战赛(440 名数据科学家参与)
2021STAC 1.0.0 正式发布(5 月);Cloud-Native Geospatial Foundation 成立;首届 Leading Women in Earth Science 评选
2022Jed Sundwall 接任执行董事;发布 LandCoverNet 全球版(8,941 图像,7 类别,6 大洲)
2023品牌简化为 Radiant Earth;推出 Source Cooperative,MLHub 内容全部迁移;发布 Planet RapidAI4EO 大规模训练数据集;提出 fiboa 规范
2024Source Cooperative 获 Navigation Fund 开放科学计划资助;与 Taylor Geospatial Engine 启动 Innovation Bridge 合作;发布 Fields of the World (FTW) 基准数据集(76,000+ 样本,27 国)
2025Source Cooperative 突破 1 PB 数据(半年翻倍);新版前端 s2.source.coop 上线;Source Cooperative 咨询委员会成立;CNG Conference 2025 召开(NASA、Planet、AWS、NYT 参与);推出 Great Data Products 播客
2026CNG Forum 2026 开放注册(10 月 6-9 日,犹他州 Snowbird)

七、对开发者的意义#

如果你在地球科学、遥感、气候或环境领域工作,Radiant Earth 的工具生态可以直接为你所用:

数据消费者

  • • 通过 Source Cooperative 发现和下载 300+ 开放地理空间数据集
  • • 使用 STAC API(pystac-client)编程搜索和过滤数据
  • • 利用云原生格式(COG、GeoParquet)实现按需读取,无需下载完整文件
  • • 使用 odc-stac 将 STAC Items 直接转为 Xarray 对象

数据发布者

  • • 在 Source Cooperative 上免费发布地理空间数据
  • • 使用 STAC 规范为数据添加标准化元数据
  • • 使用 fiboa 规范发布可互操作的农田边界数据
  • • 获得 DOI 和使用量统计,提升数据的学术影响力
  • • 收听 Great Data Products 播客获取最佳实践

ML/AI 研究者

  • • 获取高质量的地球观测训练数据(作物、建筑、洪水、云、海洋垃圾等)
  • • 使用标准化的数据格式减少预处理工作
  • • 利用 Fields of the World 等基准数据集进行模型评估
  • • 参与数据挑战赛和社区合作

总结#

维度要点
定位非营利地理空间数据基础设施(“瞪羚”模式)
创始人Anne Hale Miglarese(2016),现任 ED Jed Sundwall(2022)
核心贡献STAC 规范 — 地理空间数据的”通用语言”(OGC 标准)
数据平台Source Cooperative — 1PB+ 开放数据,300+ 数据集,1.26 亿月请求
重点数据集LandCoverNet(全球土地覆盖)、Fields of the World(农田边界)、ML 训练数据
社区CNG Forum — 云原生地理空间从业者社区(NASA、Planet、AWS 等参与)
合作伙伴NASA、ESA、Microsoft、Planet、AWS、USGS、GEO 等
技术理念云原生、开放标准、可互操作
影响领域粮食安全、灾害响应、环境监测、全球南方发展
思想引领”互联网权力”、“行星级数据机构”、“Great Data Products”

Radiant Earth正在做的,本质上是为地球科学数据构建一套开放的、云原生的基础设施层,让任何人都能像使用互联网上的网页一样,发现、访问和使用关于地球的数据。


References#

  • • radiant.earth — 官方网站
  • • source.coop — Source Cooperative
  • • stacspec.org — STAC 规范
  • • cloudnativegeo.org — CNG Forum
  • • fieldsofthe.world — Fields of the World
  • • github.com/radiantearth/stac-spec — STAC 源码
  • • medium.com/radiant-earth-insights — Medium 博客
  • • @OurRadiantEarth — X/Twitter
  • • GlobeNewsWire 新闻稿 — 历次官方公告
  • • Element 84 STAC Retrospective — STAC 发展回顾
  • • Taylor Geospatial Engine — fiboa 合作
  • • Radiant Earth Foundation Wikipedia
打通地球观测数据的“最后一公里”
https://blog.scidatalab.net/posts/打通地球观测数据的-最后一公里/
作者
Echo
发布于
2026-03-04
许可协议
CC BY-NC-SA 4.0