SpotIt: Evaluating Text-to-SQL Evaluation with Formal Verification

이 논문은 기존 테스트 기반 평가의 한계를 극복하고 생성된 SQL 과 정답 SQL 의 동등성을 형식적 검증 엔진을 통해 엄격하게 검증하는 새로운 평가 파이프라인 'SpotIt'을 제안하며, 이를 통해 기존 평가 방식이 놓칠 수 있는 차이를 포착하고 Text-to-SQL 평가의 복잡성을 재조명합니다.

Rocky Klopfenstein, Yang He, Andrew Tremante + 3 more2026-03-05🤖 cs.AI

Formal that "Floats" High: Formal Verification of Floating Point Arithmetic

이 논문은 비선형 연산과 제어/데이터 경로 결합으로 인해 어려운 부동소수점 연산의 형식 검증을 위해, 직접적인 RTL 대 RTL 모델 체킹과 분할 정복 전략, 그리고 인간-인-루프 (HITL) 가이드를 통한 AI 기반 속성 생성을 결합한 확장 가능한 검증 방법론을 제시합니다.

Hansa Mohanty, Vaisakh Naduvodi Viswambharan, Deepak Narayan Gadde2026-03-05🤖 cs.AI

Continuous Modal Logical Neural Networks: Modal Reasoning via Stochastic Accessibility

이 논문은 신경 확률 미분 방정식 (Neural SDE) 을 활용하여 이산적 크립크 구조를 연속적 다양체로 확장하고, 논리 식을 손실 함수에 직접 통합하여 확률적 확산과 엔트로피 위험 측정을 통해 모달 논리 추론을 가능하게 하는 '유체 논리 (Fluid Logic)' 및 '논리 정보 신경망 (LINNs)' 프레임워크를 제안합니다.

Antonin Sulc2026-03-05🤖 cs.LG