据美国国家航空航天局(NASA)估计,仅在 2024 年,其地球科学任务就将产生约 25 万 TB 的数据。为了让气候科学家和研究界高效地挖掘这些成堆的原始卫星数据,IBM、HuggingFace 和 NASA 合作建立了一个开源地理空间基础模型,该模型将作为新型气候和地球科学人工智能的基础,可以跟踪森林砍伐、预测作物产量和记录温室气体排放。
在这个项目中,IBM 利用其最近发布的 Watsonx.ai 作为基础模型,使用了美国国家航空航天局(NASA)一年的统一大地遥感卫星哨兵-2 号卫星数据(HLS)。该数据由欧空局的一对哨兵-2 卫星收集,用于获取陆地和沿海地区 13 个光谱波段的高分辨率光学图像。
HuggingFace 则在其开源人工智能平台上托管该模型。据 IBM 称,通过在"洪水和烧伤疤痕绘图的标记数据"上对模型进行微调,该团队能够在使用一半数据的情况下,将模型的性能比目前的技术水平提高 15%。
IBM人工智能研究院副总裁斯里拉姆-拉加万(Sriram Raghavan)在一份新闻稿中说:"开源技术在加速气候变化等关键领域的发现方面发挥着至关重要的作用,这一点从未如此清晰。通过将 IBM 旨在创建灵活、可重复使用的人工智能系统的基础模型工作与 NASA 的地球卫星数据存储库相结合,并将其提供给领先的开源人工智能平台 Hugging Face,我们可以利用协作的力量来实施更快、更有影响力的解决方案,从而改善我们的地球。"