Apresentando Prithvi WxC, um novo modelo de IA de uso geral para clima e tempo.
Em colaboração com a NASA, a IBM está lançando um modelo de base de código aberto que pode ser personalizado para uma variedade de aplicações relacionadas ao clima e ao clima — e executado em um computador desktop.
O futuro da previsão do tempo alimentada por IA parece promissor. Alguns modelos de aprendizado profundo treinados em dados meteorológicos históricos já podem igualar o desempenho de modelos meteorológicos convencionais que simulam processos físicos em supercomputadores massivos aos quais poucas pessoas tradicionalmente têm acesso.
Em colaboração com a NASA , a IBM queria construir mais do que apenas outro modelo de previsão de IA. Em vez disso, o objetivo era levar as coisas adiante com um modelo de IA de propósito geral que pudesse ser personalizado para uma variedade de aplicações práticas de clima e tempo, em escalas espaciais variadas. Hoje, com contribuições do Oak Ridge National Laboratory, eles estão disponibilizando o resultado desse esforço no Hugging Face, menos de um ano após se prepararem para projetar um modelo de base completo para clima e tempo .
Foram necessárias várias semanas e dezenas de GPUs para treinar o modelo em 40 anos de dados meteorológicos históricos doMERRA-2 é o conjunto de dados harmonizado da NASA de dados de satélite e outros dados históricos de observação da Terra.Reanálise MERRA-2 da NASA. Mas o modelo agora pode ser rapidamente ajustado para diferentes casos de uso e servido de um computador desktop em segundos. Aplicações potenciais incluem a criação de previsões direcionadas a partir de dados meteorológicos locais, prevendo eventos climáticos extremos, melhorando a resolução espacial de simulações climáticas globais e melhorando a representação de processos físicos em modelos convencionais de clima e tempo.
“Nós projetamos nosso modelo de base para que todo o trabalho duro e as horas de GPU investidas inicialmente valessem a pena, permitindo que as pessoas rapidamente criassem e executassem novos aplicativos”, disse Campbell Watson, pesquisador climático da IBM que ajudou a desenvolver o modelo.
Em um experimento, o modelo pegou uma pequena amostra localizada de dados meteorológicos e reconstruiu com precisão as temperaturas da superfície global preenchendo 95% dos valores ausentes. “A capacidade de generalizar de uma pequena amostra de dados históricos de alta qualidade para todo o planeta é útil para uma ampla gama de tarefas de projeção de clima e tempo”, disse Juan Bernabé-Moreno, diretor da IBM Research Europe e líder da IBM para clima e sustentabilidade.
Redução de escala, previsão de furacões e captura das ondas gravitacionais elusivas da Terra.
O novo modelo de fundação de clima e tempo é descrito em um novo artigo publicado no arXiv . No artigo, os pesquisadores descreveram como construíram o modelo e o ajustaram em dados especializados para criar três aplicativos com relevância imediata para meteorologistas.
O primeiro aplicativo é projetado para dar zoom em dados de baixa resolução para mais detalhes, um método conhecido como downscaling. Ao localizar projeções de clima e tempo, o downscaling pode fornecer um aviso antecipado de que um evento extremo de inundação ou ventos com força de furacão estão a caminho.
A IBM lançou um modelo de downscaling como parte da família IBM Granite . Ele pega dados de resoluções e tipos variados, como temperatura e quantidade de chuva, e os amplia em até 12 vezes. Por meio do downscaling, chuvas intensas que levam a uma enchente repentina teriam sido vistas anteriormente de uma perspectiva de 150 quilômetros quadrados em um modelo climático tradicional, agora podem ser vistas em segmentos de 12,5 quilômetros quadrados. O aplicativo de downscaling está disponível em Hugging Face .
O segundo foca na previsão de furacões. Pesquisadores usaram o modelo para reconstruir com precisão a trajetória do furacão Ida, que atingiu Louisiana em 2021 e causou US$ 75 bilhões em danos, tornando-o o quarto furacão mais custoso do Atlântico já registrado. No futuro, esse modelo pode ser usado para rastrear com mais precisão onde reforçar as defesas contra furacões que se aproximam.
O terceiro aplicativo da IBM e da NASA foi projetado para melhorar as estimativas de ondas gravitacionais. Na atmosfera da Terra, as ondas gravitacionais influenciam a formação de nuvens e os padrões climáticos globais, como onde a turbulência das aeronaves aparece. Os modelos climáticos tradicionais falham em capturar adequadamente as ondas gravitacionais em alta resolução, adicionando incerteza às projeções climáticas e meteorológicas. Isso pode mudar o jogo para a orquestração das cadeias de suprimentos globais.
Separadamente, a IBM está trabalhando com a agência meteorológica do Canadá, Environment and Climate Change Canada, para personalizar o modelo base para nowcasting de precipitação, que envolve o uso de dados de radar em tempo real para fazer previsões de precipitação altamente locais com várias horas de antecedência. A esperança é que a abordagem do modelo de base orientado a dados possa potencialmente usar menos recursos de computação e fornecer resultados mais precisos.
Aprendendo a "pensar" como um meteorologista:
Este novo modelo de fundação de clima e tempo se junta a uma família crescente de modelos de código aberto projetados para tornar a coleção de satélites e outros conjuntos de dados observacionais da Terra da NASA mais rápida e fácil de analisar. O modelo deve sua flexibilidade à sua arquitetura híbrida e regime de treinamento incomum.
Ele é construído em um transformador de visão e um autocodificador mascarado , permitindo que o modelo codifique dados espaciais que se desdobram ao longo do tempo. Ao estender o mecanismo de atenção do modelo para incluir o tempo, ele é capaz de analisar dados de reanálise MERRA-2, que integram múltiplos fluxos de dados observacionais.
O modelo também é capaz de rodar tanto em uma esfera, como os modelos climáticos tradicionais em grade, quanto em uma superfície plana e retangular. Essas representações duais permitem que o modelo alterne de visões globais para regionais sem sacrificar a resolução.
Durante o treinamento, os pesquisadores alimentaram o modelo com dados de reanálise climática em grade, fortemente escurecidos, e o fizeram reconstruir cada imagem pixel por pixel. Eles também fizeram o modelo projetar a imagem escurecida no futuro. “O modelo aprende efetivamente como a atmosfera evolui ao longo do tempo”, disse Johannes Schmude, um pesquisador da IBM que ajudou a desenvolver o modelo.
Pedir ao modelo para juntar dados meteorológicos incompletos e prever seu estado futuro teve dois benefícios. Cortou pela metade a quantidade de dados que os pesquisadores precisavam para treinar o modelo, reduzindo o consumo de GPU e energia. Também ensinou ao modelo como preencher informações ausentes, tanto no momento presente quanto além. Isso é essencialmente o que os meteorologistas fazem.
“Dados meteorológicos são inerentemente escassos”, disse Schmude. “Para aprender a fazer previsões, você tem que aprender a preencher lacunas.”
O que vem a seguir:
A IBM e a NASA planejam ver se seu modelo de IA geoespacial de código aberto existente para analisar dados de observação da Terra pode ser combinado com seu novo modelo para clima e tempo. Lançado no ano passado, o modelo Prithvi Earth Observation foi desenvolvido em uma ampla gama de aplicativos que, juntos, foram baixados mais de 10.000 vezes. Entre outras coisas, os aplicativos foram usados para estimar a extensão de inundações passadas e inferir a intensidade de incêndios florestais passados a partir de cicatrizes de queimadas.
Juntos, os modelos de Observação da Terra e de clima e tempo podem ser aplicados a tarefas igualmente desafiadoras, desde a previsão de safras esperadas até a previsão de eventos extremos de inundações e seu impacto nas comunidades.
A IBM também apresentou recentemente uma prévia de uma nova oferta, chamada Environmental Intelligence , que está em versão prévia pública até o início de 2025. Ela combina APIs avançadas sobre clima, condições geoespaciais, flutuações de carbono e informações específicas do setor que podem ajudar os desenvolvedores a reunir dados e insights para criar soluções resilientes ao clima para empresas.
Comments