Morphologies for DECaLS Galaxies through a combination of non-parametric indices and machine learning methods: A comprehensive catalog using the Galaxy Morphology Extractor (galmex) code

Este artigo apresenta o catálogo homogêneo de índices morfológicos não paramétricos para galáxias do DECaLS, gerado pelo código *galmex*, e demonstra que a combinação desses índices com algoritmos de aprendizado de máquina, como o LightGBM, permite uma classificação probabilística eficaz e calibrada entre espirais e elípticas.

V. M. Sampaio, Y. Jaffé, C. Lima-Dias, S. Véliz Astudillo, M. Martínez-Marín, H. Méndez-Hernández, R. Herrera-Camus, A. Monachesi

Publicado 2026-03-05
📖 5 min de leitura🧠 Leitura aprofundada

Each language version is independently generated for its own context, not a direct translation.

Imagine que o universo é uma biblioteca gigante e cada galáxia é um livro. Por muito tempo, os astrônomos tentaram organizar esses livros apenas olhando para a capa e tentando adivinhar o gênero da história (se é uma aventura, um romance ou um documentário). Isso é o que chamamos de "classificação visual". Mas, com milhões de galáxias novas sendo descobertas todo dia, olhar uma a uma ficou impossível.

Este artigo é como a criação de um super-robô bibliotecário chamado galmex, capaz de ler milhões de "livros" (galáxias) em segundos e dizer exatamente do que se trata cada um, sem precisar de um humano para olhar cada capa.

Aqui está a explicação do que eles fizeram, usando analogias do dia a dia:

1. O Problema: Como separar "Redondos" de "Discos"?

As galáxias geralmente se dividem em dois grandes grupos:

  • Elípticas: Parecem bolas de futebol ou ovos. São antigas, calmas e a maioria das estrelas está no centro.
  • Espirais: Parecem discos de vinil ou redemoinhos. Têm braços que giram, onde nascem novas estrelas.

O desafio é que, às vezes, a "capa" do livro (a imagem da galáxia) é borrada, pequena ou tem manchas que confundem o olho humano. Como separar um disco de uma bola quando a foto não está perfeita?

2. A Solução: O "Scanner" de Formas (galmex)

Os autores criaram um código de computador chamado galmex. Pense nele como um scanner de documentos muito inteligente. Antes de tentar classificar a galáxia, ele faz uma "faxina" na imagem:

  • Corta o fundo: Remove o céu escuro e outras estrelas que não são a galáxia principal.
  • Limpa a sujeira: Se houver outra galáxia colada na imagem, ele "pinta" essa área para não atrapalhar a análise.
  • Mede a forma: Ele não tenta adivinhar a história, ele mede a "física" da imagem.

3. As Ferramentas de Medição (Os "Índices")

O galmex usa duas caixas de ferramentas principais para medir a galáxia:

  • A Caixa CAS (Concentração, Assimetria, Suavidade):

    • Concentração: É como medir o quanto a luz está "amontoada" no centro. Galáxias elípticas são como um bolo de chocolate bem compacto no meio; espirais são como um bolo com cobertura espalhada.
    • Assimetria e Suavidade: Servem para detectar se a galáxia está "quebrada" ou chacoalhada (como se tivesse batido em outra galáxia). Elas são ótimas para achar bagunça, mas ruins para diferenciar um disco de uma bola.
  • A Caixa MEGG (M20, Entropia, Gini, G2):

    • Esta é a caixa nova e mais poderosa. Pense na Entropia como uma medida de "desordem". Uma galáxia elíptica é muito organizada (baixa entropia), enquanto uma espiral tem braços e manchas desordenadas (alta entropia).
    • O Índice Gini mede a "desigualdade" da luz. Se toda a luz está em um único ponto (o centro), o Gini é alto. Se a luz está espalhada, o Gini é baixo.
    • Resultado: A caixa MEGG foi muito melhor em separar as galáxias do que a caixa CAS antiga.

4. O Cérebro Artificial (Machine Learning)

Aqui entra a parte mais inteligente. O galmex mede todas essas características, mas não decide sozinho quem é quem. Ele entrega esses dados para um "cérebro" de inteligência artificial chamado LightGBM.

  • O Treinamento: Eles ensinaram esse cérebro usando galáxias que já foram classificadas por humanos (o projeto "Galaxy Zoo"). Eles mostraram: "Olha, essa tem esses números, é uma espiral. Aquela tem aqueles números, é uma elíptica".
  • A Aprendizado: O cérebro aprendeu os padrões. Ele descobriu que, por exemplo, "se a Entropia é alta e o Gini é baixo, é quase certeza que é uma espiral".
  • A Previsão: Depois de treinado, o cérebro olhou para mais de 1,7 milhão de galáxias do levantamento DECaLS (um mapa do céu do hemisfério sul) e deu uma "nota de confiança" para cada uma: "99% de chance de ser espiral" ou "95% de chance de ser elíptica".

5. Por que isso é importante?

  • Precisão: O robô acertou 97% das vezes, muito melhor do que métodos antigos.
  • Escala: Eles conseguiram classificar milhões de galáxias que antes ninguém tinha tempo de olhar.
  • Futuro: Isso ajuda a entender como as galáxias nascem e morrem. Se sabemos que uma galáxia é espiral e está em um aglomerado denso, podemos prever se ela vai parar de formar estrelas no futuro.

Resumo da Ópera

Os autores criaram um scanner de galáxias (galmex) que mede a "física" da luz das estrelas e usou uma inteligência artificial para aprender a diferença entre galáxias redondas (elípticas) e galáxias em disco (espirais).

Eles provaram que, ao usar medidas matemáticas de "desordem" e "concentração" da luz, o computador consegue ver o que o olho humano demoraria séculos para notar. Agora, temos um catálogo público com a "identidade" de quase 2 milhões de galáxias, pronto para que qualquer cientista no mundo use para estudar a evolução do universo.