CADSmith: Multi-Agent CAD Generation with Programmatic Geometric Validation

Each language version is independently generated for its own context, not a direct translation.

Imagine que você quer pedir para um robô desenhar uma peça de engenharia complexa, como uma engrenagem ou uma peça de um motor, apenas descrevendo-a em linguagem natural (falando ou escrevendo). O problema é que os robôs atuais (Inteligências Artificiais) são ótimos em criar "desenhos" que parecem bonitos, mas muitas vezes estão errados nas medidas. É como pedir um bolo de chocolate e receber um que parece igual, mas é feito de plástico: visualmente ok, mas inútil para comer (ou, no caso da engenharia, para fabricar).

O CADSmith é um novo sistema criado por pesquisadores para resolver exatamente esse problema. Eles não deixaram um único robô fazer tudo; em vez disso, criaram uma equipe de especialistas que trabalha juntos, como uma fábrica de alta precisão.

Aqui está como funciona, usando analogias do dia a dia:

1. A Equipe de Especialistas (Os Agentes)

Em vez de um único "gênio" tentando fazer tudo, o CADSmith divide o trabalho em cinco pessoas (agentes) diferentes:

O Planejador (O Arquiteto): Você diz o que quer ("Quero uma caixa com 5 buracos"). O Planejador não desenha nada; ele apenas organiza as ideias, escreve um plano detalhado e mede tudo em milímetros. Ele transforma sua fala em um "receituário" claro.
O Programador (O Carpinteiro): Ele pega o plano e escreve o código (a linguagem que o computador entende para criar a peça). Mas ele não chuta! Ele tem um livro de instruções (biblioteca de API) na mão e consulta o que pode ou não fazer, evitando erros comuns.
O Executor (O Operador de Máquina): Ele tenta construir a peça no computador. Se o código estiver errado e a máquina travar, ele avisa imediatamente.
O Validador (O Inspetor Chefe): Este é o mais importante. Ele tem dois olhos:
1. O Olho Matemático: Ele usa uma régua digital superprecisa (OpenCASCADE) para medir o volume, o tamanho e contar quantos furos existem. Nada escapa: se o furo deve ter 5mm e tem 5,1mm, ele nota.
2. O Olho Humano (IA Visual): Ele olha para a peça gerada em três ângulos diferentes (como se você girasse o objeto na mão) e compara com o que você pediu. Ele verifica se a forma geral faz sentido.
O Refinador (O Mecânico): Se o Validador encontrar um erro, ele não joga a peça fora. Ele pega o código, vê onde está errado (ex: "o furo está 2mm longe demais") e pede ao Programador para consertar.

2. O Processo de "Correção em Dupla Loop"

A mágica acontece porque o sistema não aceita um "quase certo". Ele usa dois ciclos de correção, como se fosse um jogo de "Quente ou Frio":

Loop Interno (Consertando o Código): Se o computador não consegue nem rodar o programa (erro de sintaxe), o sistema conserta o código rapidamente, como corrigir uma vírgula em um texto.
Loop Externo (Consertando a Forma): Se o código roda, mas a peça sai torto ou com medidas erradas, entra o Validador. Ele diz: "A peça tem o tamanho certo, mas está faltando um furo aqui". O Refinador ajusta e tenta de novo. Isso acontece até a peça estar perfeita.

3. Por que isso é diferente dos outros?

Outros sistemas tentam adivinhar a resposta certa de uma vez só (como um aluno que chuta a prova) ou usam apenas fotos para verificar (como alguém que olha uma foto e diz "parece um carro", sem saber se o motor cabe).

O CADSmith é diferente porque:

Não precisa de "treinamento" eterno: Ele consulta manuais atualizados em tempo real. Se a linguagem de programação mudar amanhã, ele se adapta na hora, sem precisar ser reensinado do zero.
Mede com precisão cirúrgica: Ele não confia apenas no que "parece" certo. Ele mede milímetro por milímetro.
Evita o "Eco": O Validador é uma Inteligência Artificial mais inteligente do que a que criou o código. Isso evita que o sistema se engane achando que está certo quando não está (viés de confirmação).

O Resultado

Os pesquisadores testaram o sistema com 100 desafios, desde formas simples (como um cubo) até peças complexas de engenharia (como um eixo com flange).

Sem o sistema: O robô acertava a execução do código em 95% dos casos, mas a peça final muitas vezes estava errada nas medidas.
Com o CADSmith: O sistema atingiu 100% de sucesso em criar peças que funcionam. A precisão melhorou drasticamente: o erro médio de distância entre a peça ideal e a criada caiu de um valor enorme (como se a peça estivesse a 28mm de onde deveria estar) para quase zero (0,74mm).

Em resumo

O CADSmith é como ter um engenheiro sênior (que mede tudo com régua) trabalhando em dupla com um artista experiente (que vê a forma geral), ambos supervisionados por um chefe rigoroso. Juntos, eles transformam uma ideia simples em uma peça de engenharia real, pronta para ser fabricada, eliminando os erros que costumam acontecer quando deixamos a IA trabalhar sozinha.

CADSmith: Multi-Agent CAD Generation with Programmatic Geometric Validation

1. A Equipe de Especialistas (Os Agentes)

2. O Processo de "Correção em Dupla Loop"

3. Por que isso é diferente dos outros?

O Resultado

Em resumo

1. O Problema

2. Metodologia: O Pipeline CADSmith

Arquitetura de Agentes

Loops de Correção

3. Principais Contribuições

4. Resultados

5. Significado e Conclusão

CADSmith: Multi-Agent CAD Generation with Programmatic Geometric Validation

1. A Equipe de Especialistas (Os Agentes)

2. O Processo de "Correção em Dupla Loop"

3. Por que isso é diferente dos outros?

O Resultado

Em resumo

1. O Problema

2. Metodologia: O Pipeline CADSmith

Arquitetura de Agentes

Loops de Correção

3. Principais Contribuições

4. Resultados

5. Significado e Conclusão

Mais como este

ChartDiff: A Large-Scale Benchmark for Comprehending Pairs of Charts

Working Paper: Towards a Category-theoretic Comparative Framework for Artificial General Intelligence

Towards Computational Social Dynamics of Semi-Autonomous AI Agents

Enhancing Policy Learning with World-Action Model

Mimosa Framework: Toward Evolving Multi-Agent Systems for Scientific Research