Google DeepMind发布多模态地理空间基础模型及其衍生数据集

地球是一个动态且复杂的系统。从热带雨林的消长，到城市边界的扩张，再到农作物的生长周期，这些变化无时无刻不在发生。然而，要精准、全面地捕捉这些变化，传统方法一直面临着巨大的挑战。7月30日，Google DeepMind与Google Earth合作，发布了一个能够融合光学、雷达等多源卫星数据，并为地球表面生成统一语义“指纹”（即嵌入向量）的地理空间基础模型AlphaEarth，及其衍生的一个AI-ready和开放的卫星嵌入数据集（Satellite Embedding Dataset）。目前，该数据集已经可以通过Google Earth Engine平台的数据目录免费获取使用。

1. 传统地球观测的挑战#

几十年来，人类依赖卫星星座从太空观测地球。这些手段为我们提供了宝贵的视角，但其局限性主要体现在：

• 数据孤岛：不同的卫星搭载不同的传感器（光学、雷达、热红外等），在不同的时间、以不同的光谱波段捕捉地球的影像。这些异构的数据源就像一块块拼图，难以无缝地融合成一幅完整、一致的画卷。
• 时空遮挡：云层、阴影甚至卫星自身的轨道限制，都导致我们获取的地球数据存在大量的时空空白。想象一下，当一片关键的农田连续几周被云层覆盖时，我们就无法准确评估作物的健康状况。
• 高昂的分析门槛：科学家们常常需要针对特定问题（如评估某地的毁林速率或水体变化）来定制和处理数据。这个过程不仅涉及海量的原始数据下载，还需要进行复杂的大气校正、云层掩膜等预处理步骤，不仅耗时耗力，而且极大地限制了研究的广度和深度。

2. AlphaEarth：统一时空与多模态的基础模型#

AlphaEarth是一个真正意义上的多模态地理空间基础模型。

• 多模态数据输入：该模型的核心能力在于其能够消化和理解极其多样化的地理空间数据源。它并不仅仅处理光学卫星影像，而是融合了：
光学与热红外：来自哨兵-2（Sentinel-2）和陆地卫星（Landsat 8 & 9）的高频次观测数据。
雷达数据：来自哨兵-1（Sentinel-1）的C波段合成孔径雷达（SAR）和ALOS PALSAR-2的扫描雷达数据，这些数据能穿透云层，提供全天候的观测能力。
高程数据：包括GEDI的光栅冠层高度数据和GLO-30的全球数字高程模型。
气候与重力场：整合了ERA5-Land的月度再分析气候数据和GRACE的月度重力场网格数据。
• 自监督学习范式：AlphaEarth采用了自监督学习的方法进行训练，在全球超过500万个地点，利用了超过30亿个独立的图像帧进行学习。它将一个地点随时间变化的卫星图像序列视为一部“视频”，从而学习跨越空间、时间和不同测量模式的深层规律。

模型通过从视频序列中提取非均匀采样的图像帧，来实现对时间轴上任意位置的索引

3. 卫星嵌入数据集：AI驱动的“分析就绪型”知识库#

如果说AlphaEarth是强大的引擎，那么由其衍生的卫星嵌入数据集，就是将这一引擎的动力直接交到了全球研究者手中。这个数据集是AlphaEarth模型推理计算的直接成果，是一个“分析就绪型”（analysis-ready）的知识库。

• 维度与表征：数据集的核心是64维的嵌入向量。这64个“波段”（从 A00 到 A63）可以被理解为一个点在64维超球面上的坐标，是对一个10米分辨率像素点的高度浓缩的语义描述。
• 时空信息的封装：每个10米像素的嵌入向量，都打包了一整年的多源卫星数据。它不仅捕捉了该像素点本身的光谱、纹理等属性，还包含了其周边区域的空间上下文信息以及关键的季节性信号（如植被的物候变化）。
• 覆盖范围与分辨率：该数据集提供了自2017年以来，每年一个版本的全球陆地表面10米分辨率的嵌入数据。

模型生成的卫星嵌入数据集三维可视化

对于研究人员而言，这个卫星嵌入数据集的发布堪称一个颠覆性的变革，其核心作用在于将AI的强大分析能力直接注入每一个像素，从而极大地提升了研究效率和深度。具体来说：

• 研究人员可以直接跳过传统卫星遥感中最为耗时和繁琐的数据预处理步骤，如大气校正和云层剔除，数据集提供的嵌入向量已经捕捉了地球每个像素点一整年的动态信息。
• 模型自动学习和提取的64维嵌入向量，本身就是为机器学习“量身定做”的、信息密度极高的特征，这意味着研究人员可以用更少的标注样本训练出更精准、泛化能力更强的分类或回归模型。
• 模型解锁了全新的分析范式：研究人员不仅可以进行更精准鲁棒的变化检测，还能在全球范围内执行内容相似性搜索（例如，找到所有与某个特定生态环境相似的区域），通过比对不同时期的嵌入向量，高效地追踪环境变迁。利用自动聚类等机器学习技术，在数据中发现隐藏的地理空间模式。用更少的标注数据就能在Earth Engine的机器学习分类器上训练出高精度的土地覆盖分类模型。

从影像到嵌入向量：将视频序列转化为信息丰富的特征向量，覆盖每一个 10米 x 10米的像素

4. 如何访问和使用数据集#

这个强大的数据集已经通过Google Earth Engine (GEE) 平台向公众开放。研究人员和开发者可以直接在GEE中调用它，极大地简化了传统的工作流程。数据集链接地址：https://developers.google.com/earth-engine/datasets/catalog/GOOGLE\_SATELLITE\_EMBEDDING\_V1\_ANNUAL?hl=zh-cn

• 加载数据集：该数据集在Earth Engine中的ID为 GOOGLE/SATELLITE_EMBEDDING/V1/ANNUAL。你可以像加载任何其他影像集合一样加载它。
• 筛选数据：这是一个年度数据集，因此你需要根据你的研究需求，筛选出特定年份的影像。
• 直接用作特征：这64个波段的嵌入影像可以直接作为机器学习模型的输入特征，无需任何额外的归一化或特征工程（其向量已经是单位长度，非常适合分类和聚类算法）。

代码示例：土地覆盖分类

假设要对某个区域进行土地覆盖分类，传统方法需要你收集、筛选、去云、并计算多种光谱指数（如NDVI, EVI等）。而使用卫星嵌入数据集，流程被大大简化。

以下是一个在Earth Engine代码编辑器中（JavaScript API）进行分类的示例代码：

1
// 1. 定义你的研究区域和年份
2
var year = '2022';
3
var region = ee.Geometry.Polygon([[...]]); // 在此定义你的多边形区域
4
var trainingPoints = ee.FeatureCollection([...]); // 加载你带有土地覆盖标签（如'landcover'属性）的训练样本点
5

6
// 2. 加载卫星嵌入数据集并筛选出指定年份的影像
7
var embeddingsCollection = ee.ImageCollection('GOOGLE/SATELLITE_EMBEDDING/V1/ANNUAL');
8
var embeddingsImage = embeddingsCollection.filterDate(year + '-01-01', year + '-12-31').first();
9

10
// 3. 准备训练数据：直接从嵌入影像中为训练样本点提取特征
11
// GEE会自动使用影像的所有64个波段作为特征
12
var trainingData = embeddingsImage.sampleRegions({
13
collection: trainingPoints,
14
properties: ['landcover'], // 'landcover'是你标签的属性名
15
scale: 10
16
});
17

18
// 4. 训练一个分类器
19
// 例如，使用一个随机森林分类器
20
var classifier = ee.Classifier.smileRandomForest(50).train({
21
features: trainingData,
22
classProperty: 'landcover', // 指定哪个属性是分类标签
23
inputProperties: embeddingsImage.bandNames() // 使用全部64个波段
24
});
25

26
// 5. 对整个区域进行分类
27
var classifiedImage = embeddingsImage.classify(classifier);
28

29
// 6. 可视化你的分类结果
30
Map.centerObject(region, 10);
31
Map.addLayer(classifiedImage, {min: 1, max: 5, palette: ['blue', 'green', 'yellow', 'red', 'gray']}, 'Land Cover Classification');

通过这个流程，可以看到，从加载数据到获得最终分类图，整个过程变得异常流畅和高效。

AlphaEarth模型及其开放数据集代表了地球科学研究范式的一次重要转变。它通过先进的AI技术，将海量的、零散的地球观测数据，转化为了统一、连贯且易于处理的知识。这不仅极大地降低了前沿地理空间分析的技术门槛，更重要的是，它为我们提供了一个更深刻、更全面的视角来理解我们这颗星球的复杂动态，为共同应对气候变化、粮食安全、可持续发展等全球性挑战注入了强大的新动能。

数据集链接：
https://developers.google.com/earth-engine/datasets/catalog/GOOGLE\_SATELLITE\_EMBEDDING\_V1\_ANNUAL?hl=zh-cn