Agentics 2.0: Logical Transduction Algebra for Agentic Data Workflows

Each language version is independently generated for its own context, not a direct translation.

🚀 핵심 비유: "요리사 vs. 레시피 관리자"

지금까지의 AI 에이전트들은 마치 **"요리사 (LLM)"**에게 "오늘 저녁 메뉴를 만들어줘"라고 말하고, 요리사가 알아서 재료를 찾고, 요리를 하고, 접시에 담는 과정을 맡기는 방식이었습니다.

문제점: 요리사가 실수하면 (예: 소금 대신 설탕을 넣거나, 재료를 잘못 고름) 우리는 그걸 나중에야 알 수 있고, 왜 그런 실수가 났는지 알기 어렵습니다. 또한, 요리사가 너무 많은 일을 한 번에 하려다 지치거나 (확장성 문제), 실수가 반복될 수 있습니다.

**Agentics 2.0**은 이 방식을 완전히 바꿉니다. 이제 AI 는 단순히 "요리사"가 아니라, **"정교한 레시피 관리자 시스템"**이 됩니다.

1. 논리적 전도 대수 (Logical Transduction Algebra): "검증된 레시피 카드"

이 시스템의 핵심은 **Transducible Function (전도 가능한 함수)**이라는 개념입니다. 이를 비유하자면 다음과 같습니다.

기존 방식: 요리사가 "이게 뭐야?"라고 물어보면, 요리사가 머릿속에서 생각해서 답을 줍니다. (블랙박스)
Agentics 2.0 방식: 각 단계마다 **엄격한 '레시피 카드'**가 있습니다.
- 입력 (재료): "감자 2 개, 양파 1 개" (정해진 타입)
- 출력 (요리): "감자볶음 1 접시" (정해진 타입)
- 증거 (왜?): "감자를 2 개 쓴 이유는 레시피에 그렇게 적혀있고, 양파는 1 개만 썼습니다." (이유와 출처 명시)

이 시스템은 AI 가 무언가를 생성할 때, **"이 결과가 입력된 재료와 딱 맞는가?"**를 자동으로 검사합니다. 만약 AI 가 엉뚱한 것을 내놓으면, 시스템은 "에이, 이거 레시피랑 안 맞잖아!"라고 즉시 오류를 띄웁니다. (이걸 타입 안전성이라고 합니다.)

2. 증거의 추적 (Evidence Tracing): "누가 무엇을 했는지 기록하는 로그"

기존 AI 는 "왜 이걸 선택했지?"라고 물어보면 AI 가 즉흥적으로 변명을 늘어놓을 수 있습니다 (할루시네이션).
하지만 Agentics 2.0은 증거 추적을 필수로 합니다.

비유: 요리사가 "감자볶음을 만들었습니다"라고 할 때, 시스템은 **"어떤 감자 (입력 데이터) 를 가져와서, 어떤 조리법 (규칙) 을 적용해서 이 요리 (출력) 가 나왔는지"**를 자동으로 기록합니다.
효과: 나중에 "왜 이 결과가 나왔지?"라고 물으면, AI 가 만든 요리가 어떤 재료를 기반으로 했는지 정확한 경로를 보여줍니다. 이는 AI 의 실수를 찾아내고 수정하는 데 아주 중요합니다.

3. Map-Reduce: "수천 명의 요리사 동시 작업"

기업은 한 번에 수천 개의 데이터를 처리해야 할 때가 많습니다.

기존 방식: 한 명의 요리사가 순서대로 하나씩 요리를 합니다. (느림)
Agentics 2.0 방식: Map-Reduce 방식을 사용합니다.
- Map (분배): 1,000 개의 재료를 1,000 명의 요리사 (비동기 작업) 에게 동시에 나눠줍니다. 각 요리사는 자신의 할 일만 빠르게 끝냅니다.
- Reduce (합치기): 모든 요리사가 끝내면, 한 명의 '수석 셰프'가 1,000 개의 요리를 모아 최종 메뉴판 (결과) 을 만듭니다.
- 장점: 이 과정에서 각 요리사의 작업 기록 (증거) 이 모두 보존되므로, 대규모 작업도 빠르고 정확하게 처리할 수 있습니다.

4. 실제 테스트 결과: "수학 문제와 SQL 쿼리"

저자들은 이 시스템이 실제로 얼마나 잘 작동하는지 두 가지 시험에서 검증했습니다.

데이터 발견 (DiscoveryBench):
- 과제: 복잡한 엑셀 파일 (데이터) 을 보고 "이 데이터가 의미하는 가설 (추측) 은 무엇일까?"를 찾아내는 것.
- 결과: 기존 AI 들은 데이터에서 관계를 찾아내는 데 어려움을 겪었지만, Agentics 2.0은 데이터를 레시피처럼 구조화해서 분석했기 때문에 훨씬 더 높은 점수를 받았습니다. 특히 작은 데이터셋에서는 코드를 짜지 않고도 데이터를 바로 분석해냈습니다.
자연어 → SQL (Archer):
- 과제: "지난달 매출이 가장 높은 지역은?" 같은 말을 컴퓨터가 이해하는 데이터베이스 명령어 (SQL) 로 바꿔주는 것.
- 결과: 이 분야는 매우 어렵지만, Agentics 2.0은 생성 → 검증 → 수정 과정을 반복하며 (논리적 추론), 기존 최고 성능 모델들과 거의 비슷한, 혹은 더 좋은 성적을 거두었습니다.

💡 요약: 왜 이것이 중요한가요?

지금까지 AI 는 "재미있지만 신뢰할 수 없는 마법" 같았습니다. 하지만 Agentics 2.0은 AI 를 **"신뢰할 수 있는 엔지니어"**로 바꿉니다.

신뢰성: 실수가 나면 바로 잡힙니다 (타입 검증).
투명성: 왜 그런 결론을 냈는지 이유를 알 수 있습니다 (증거 추적).
확장성: 수천 개의 작업을 동시에 처리할 수 있습니다 (Map-Reduce).

결론적으로, 이 논문은 AI 를 단순히 "대화하는 친구"가 아니라, 기업이 믿고 맡길 수 있는 엄격한 업무 도구로 만들기 위한 새로운 설계도 (프레임워크) 를 제시한 것입니다.

Each language version is independently generated for its own context, not a direct translation.

1. 문제 정의 (Problem)

기존의 에이전트 기반 AI 시스템은 프로토타입에서 실제 기업용 배포로 빠르게 전환되고 있지만, 다음과 같은 근본적인 한계에 직면해 있습니다.

신뢰성 및 관측 가능성 부족: 대부분의 워크플로가 프롬프트 체이닝 (Prompt Chaining), 상태 그래프 오케스트레이션, 또는 스키마 강제 함수 호출에 의존하고 있어, 대규모 엔터프라이즈 워크로드가 요구하는 신뢰성 (Reliability), 확장성 (Scalability), 관측 가능성 (Observability) 을 충족하지 못합니다.
인간 중심적 접근의 한계: 현재 많은 시스템이 LLM 을 '페르소나와 역할을 가진 대화형 에이전트'로 간주하여 비구조화된 자연어 대화로 태스크를 분할하고 조정합니다. 이는 검증 가능한 제어 흐름이 부족하고, 할루시네이션 (Hallucination) 이 발생하기 쉬우며, 오류 추적이 어렵습니다.
의미론적 격차: 기존 스키마 제약 방식은 다단계 파이프라인에서 상태 간 전이 (State-to-State Transduction) 시 타입 계약과 생성 증거 (Evidence) 의 연속성을 보장하지 못해, 문법적 검사는 통과하지만 의미론적 오류가 누적되는 문제가 발생합니다.

2. 방법론 (Methodology)

이 논문은 Logical Transduction Algebra (논리적 전도 대수) 를 기반으로 한 새로운 프로그래밍 모델인 Agentics 2.0을 제안합니다. 이는 LLM 추론을 대화 (Conversation) 가 아닌 타입이 지정된 의미론적 변환 (Typed Semantic Transformation) 으로 재정의합니다.

핵심 개념: 전도 가능 함수 (Transducible Function)

LLM 추론 호출을 입력 타입 $X$ 에서 출력 타입 $Y$ 로 매핑하는 함수 $f: X \to Y$ 로 정의하며, 다음 4 가지 속성을 만족해야 합니다.

타입 지정 (Typed): 출력은 잘 정의된 타입의 상태여야 함.
설명 가능성 (Explainability): 입력과 출력 간의 변환에 대한 설명이 존재해야 함.
국소적 증거 (Local Evidence): 출력의 각 슬롯 (Slot) 은 입력의 특정 부분집합을 기반으로 계산되어야 함 (할루시네이션 방지).
출처 추적 (Provenance): 출력 슬롯이 어떤 입력 슬롯에서 유래했는지 매핑이 기록되어야 함.

주요 기술 구성 요소

대수적 연산자:
- 전도 연산자 ( $\ll$ ): 타입 $X$ 에서 $Y$ 로의 전도 가능 함수를 생성.
- 병합 (Merge, $\&$ ) 및 투영 (Projection, $\Downarrow$ ): 타입 간의 구조적 조작을 지원.
- 합성 (Composition, $\circ$ ): 여러 전도 함수를 연결하여 복잡한 워크플로 구성.
Map-Reduce 의미론:
- Map: 입력 데이터 집합에 대해 전도 함수를 병렬로 적용 (Stateless Async Execution).
- Reduce: 병렬 처리된 결과를 집계하여 단일 최종 상태로 변환.
- 이 구조는 상태 비저장 (Stateless) 병렬 실행을 통해 확장성을 보장합니다.
Agentics 2.0 프레임워크:
- Python 네이티브 라이브러리로, Pydantic 모델과 비동기 함수를 확장하여 전도 가능 함수를 1 등 시민 (First-class citizen) 으로 다룹니다.
- @transducible 데코레이터를 통해 일반 Python 코드를 LLM 전도 함수와 결합 가능하게 합니다.
- 입력/출력 타입 검증, 증거 추적 (Evidence Tracing), 신뢰도 (Confidence) 추적을 자동화합니다.

3. 주요 기여 (Key Contributions)

타입 지정 가능, 합성 가능한 함수 대수: LLM 계산을 위한 논리적 전도 대수를 공식화하여, LLM 추론을 타입 계약과 증거 보존이 가능한 함수로 변환.
새로운 에이전트 프로그래밍 모델: 결정론적 코드와 LLM 전도를 타입 지정 비동기 코루틴을 통해 교차시키는 모델 제시.
의미론적 관측 가능성 (Semantic Observability): 단순한 API 호출 수준을 넘어, 입력과 출력 슬롯 간의 증거 (Evidence) 와 출처 (Provenance) 를 추적하여 의미론적 신뢰성을 확보.
실증적 검증: DiscoveryBench(데이터 기반 발견) 와 Archer(NL-to-SQL) 와 같은 까다로운 벤치마크에서 최첨단 (SOTA) 성능 달성.

4. 실험 결과 (Results)

A. DiscoveryBench (데이터 기반 발견)

과제: CSV 데이터와 메타데이터를 기반으로 가설 (Hypothesis) 을 도출하는 작업.
결과:
- Agentics 2.0 기반 에이전트 (agentics-both) 는 기존 리더보드 최상위 점수 (33.7) 를 상회하는 평균 최종 점수 37.27을 기록했습니다.
- 구조화된 데이터 (CSV) 만으로도 중간 증거를 추출하여 가설을 생성하는 agentics-agg 전략이 작은 데이터셋에서 매우 효과적이었습니다.
- 한계: 변수 간 관계 (Relation) 를 추출하는 데 있어서는 여전히 어려움을 겪었으나, 문맥 (Context) 과 변수 (Variable) 추출에서는 높은 점수를 기록했습니다.

B. Archer (NL-to-SQL)

과제: 자연어를 SQL 로 변환하는 작업으로, 산술, 상식, 가설적 추론이 요구됨.
결과:
- Agentics 2.0 기반 에이전트는 리더보드에 등재된 대부분의 제출물보다 우수한 성능을 보였습니다.
- 특히 Reasoning-Validation 에이전트는 추론과 검증 단계를 거치며, GPT-o3 모델을 사용할 때 복잡한 추론 (산술 + 상식) 에서 높은 정확도를 달성했습니다.
- OraPlan-SQL(도메인 분석 및 계획에 특화된 모델) 을 제외하고는 모든 리더보드 제출물을 능가했습니다.

5. 의의 및 결론 (Significance & Conclusion)

신뢰성 있는 에이전트 개발: LLM 을 블랙박스 대화자가 아닌, 타입이 지정된 변환기로 취급함으로써 소프트웨어 공학적 품질 (신뢰성, 확장성, 관측 가능성) 을 에이전트 시스템에 도입했습니다.
할루시네이션 감소: 출력 슬롯에 대한 입력 증거 (Evidence) 와 출처 (Provenance) 를 강제함으로써 의미론적 오류와 할루시네이션을 줄였습니다.
확장성: 상태 비저장 (Stateless) Map-Reduce 모델을 통해 대규모 데이터 워크플로를 비동기 병렬로 실행할 수 있게 하여 확장성을 확보했습니다.
미래 전망: 현재는 단일 LLM 백엔드를 가정하고 있으나, 이 프레임워크는 이질적인 모델 통합, 비용 인식 스케줄링, 그리고 더 정교한 논리 시스템으로의 확장을 통해 차세대 에이전트 시스템의 표준이 될 잠재력을 가지고 있습니다.

요약하자면, Agentics 2.0은 LLM 기반 에이전트 시스템을 "대화"가 아닌 "타입 안전성 (Type Safety) 과 논리적 증거를 갖춘 데이터 변환 파이프라인"으로 재설계하여, 엔터프라이즈 환경에서 요구되는 엄격한 품질 기준을 충족시키는 획기적인 접근법을 제시합니다.