cs.AI 편의 논문 | Gist.Science

Continual uncertainty learning

이 논문은 비선형 동역학과 다양한 불확실성이 공존하는 기계 시스템의 강인한 제어를 위해, 불확실성 소스를 점진적으로 확장하는 커리큘럼 기반 지속 학습 프레임워크와 모델 기반 제어기를 결합하여 시뮬레이션과 현실 간의 격차를 효과적으로 해소하는 새로운 방법을 제안하고 자동차 동력계 진동 제어에 적용하여 검증했습니다.

Heisei Yonezawa, Ansei Yonezawa, Itsuro Kajiwara2026-03-11🤖 cs.AI

ReDON: Recurrent Diffractive Optical Neural Processor with Reconfigurable Self-Modulated Nonlinearity

이 논문은 정적 위상 마스크의 한계를 극복하고, GLU 에서 영감을 얻은 재구성 가능한 자기 변조 비선형성과 순환 구조를 도입하여 기존 회절 광학 신경망보다 정확도와 적응성을 획기적으로 향상시킨 'ReDON' 아키텍처를 제안합니다.

Ziang Yin, Qi Jing, Raktim Sarma, Rena Huang, Yu Yao, Jiaqi Gu2026-03-11🔬 physics.optics

SafeGen-LLM: Enhancing Safety Generalization in Task Planning for Robotic Systems

본 논문은 기존 계획 방법의 한계를 극복하고 다양한 도메인에서 새로운 안전 속성으로 일반화 가능한 로봇 작업 계획을 위해, 형식적 검증을 기반으로 한 두 단계 후학습 프레임워크를 제안한 'SafeGen-LLM'을 소개합니다.

Jialiang Fan, Weizhe Xu, Mengyu Liu + 3 more2026-03-11🤖 cs.AI

Breaking the Factorization Barrier in Diffusion Language Models

이 논문은 확산 언어 모델의 '분해 장벽'을 해결하기 위해 완전 분해된 출력 분포를 경량화되고 다루기 쉬운 확률적 추론 계층으로 대체하는 '결합 이산 확산 (CoDD)' 프레임워크를 제안하여, 적은 비용으로 복잡한 토큰 간 종속성을 모델링하고 고품질의 병렬 생성을 가능하게 합니다.

Ian Li, Zilei Shao, Benjie Wang, Rose Yu, Guy Van den Broeck, Anji Liu2026-03-11🤖 cs.AI

OrthoAI: A Neurosymbolic Framework for Evidence-Grounded Biomechanical Reasoning in Clear Aligner Orthodontics

이 논문은 희소 주석과 도메인 지식 기반 제약 조건 추론, 다기준 의사결정 분석을 통합한 신경심볼릭 프레임워크 'OrthoAI'를 제안하여, 3D 치아 분할과 생역학적 실행 가능성 추론을 연결하는 증거 기반 교정 치료 지원 시스템을 개발했습니다.

Edouard Lansiaux, Margaux Leman, Mehdi Ammi2026-03-11🤖 cs.AI

Zero-Shot and Supervised Bird Image Segmentation Using Foundation Models: A Dual-Pipeline Approach with Grounding DINO~1.5, YOLOv11, and SAM~2.1

이 논문은 Grounding DINO 1.5 와 YOLOv11 을 탐지기로 활용하여 SAM 2.1 을 기반으로 한 제로샷 및 지도 학습 이중 파이프라인을 제안함으로써, 기존 종단간 학습 모델보다 우수한 성능을 보이는 새 이미지 분할 방법을 제시합니다.

Abhinav Munagala2026-03-11🤖 cs.AI

Pri4R: Learning World Dynamics for Vision-Language-Action Models with Privileged 4D Representation

이 논문은 훈련 시 3D 포인트 트랙 예측을 위한 특권 4D 정보를 활용하여 VLA 모델이 물리적 상호작용의 시공간적 역학을 내재적으로 학습하도록 함으로써 추론 시 추가 비용 없이 로봇 조작 성능을 크게 향상시키는 'Pri4R' 방법을 제안합니다.

Jisoo Kim, Jungbin Cho, Sanghyeok Chu, Ananya Bal, Jinhyung Kim, Gunhee Lee, Sihaeng Lee, Seung Hwan Kim, Bohyung Han, Hyunmin Lee, Laszlo A. Jeni, Seungryong Kim2026-03-11🤖 cs.AI

Reasoning as Gradient: Scaling MLE Agents Beyond Tree Search

이 논문은 LLM 기반의 머신러닝 엔지니어링 에이전트가 기존 트리 탐색 방식보다 강화된 추론 능력을 가진 모델에서 더 효율적인 경사 하강 기반 최적화 패러다임인 'Gome'을 도입하여 MLE-Bench 에서 최상의 성능을 달성하고, 모델의 추론 능력이 향상됨에 따라 경사 기반 최적화가 트리 탐색을 능가하는 전환점이 도래함을 보여줍니다.

Yifei Zhang, Xu Yang, Xiao Yang, Bowen Xian, Qizheng Li, Shikai Fang, Jingyuan Li, Jian Wang, Mingrui Xu, Weiqing Liu, Jiang Bian2026-03-11🤖 cs.AI

Boltzmann-based Exploration for Robust Decentralized Multi-Agent Planning (Extended Version)

이 논문은 희소하거나 편향된 보상 환경에서 기존 Dec-MCTS 의 한계를 극복하기 위해, 단일 에이전트 MCTS 에서 연구된 볼츠만 탐색을 다중 에이전트 시스템에 최초로 적용한 '조정된 볼츠만 MCTS(CB-MCTS)'를 제안하고, 이를 통해 기만적 시나리오에서 우수한 성능을 보이며 표준 벤치마크에서도 경쟁력 있는 강건한 분산 다중 에이전트 계획 솔루션을 제공함을 보여줍니다.

Nhat D. A. Nguyen, Duong D. Nguyen, Gianluca Rizzo, Hung X. Nguyen2026-03-11🤖 cs.AI

FinTexTS: Financial Text-Paired Time-Series Dataset via Semantic-Based and Multi-Level Pairing

이 논문은 단순한 키워드 매칭의 한계를 극복하기 위해 의미 기반 및 다수준 매칭 프레임워크를 제안하여, SEC filing 과 LLM 을 활용하여 뉴스와 주가 데이터를 정교하게 연결한 대규모 금융 텍스트-시계열 데이터셋 'FinTexTS'를 구축하고 주가 예측 성능을 입증했습니다.

Jaehoon Lee, Suhwan Park, Tae Yoon Lim, Seunghan Lee, Jun Seo, Dongwan Kang, Hwanil Choi, Minjae Kim, Sungdong Yoo, SoonYoung Lee, Yongjae Lee, Wonbin Ahn2026-03-11🤖 cs.AI

SPARC: Spatial-Aware Path Planning via Attentive Robot Communication

이 논문은 기존 학습 기반 통신 방식의 공간적 무관심 문제를 해결하기 위해 쌍별 맨해튼 거리를 주시 가중치 계산에 명시적으로 통합한 '관계 강화 멀티헤드 어텐션 (RMHA)'을 제안하여, 고밀도 환경에서 로봇 간 협업을 극대화하고 대규모 군집으로의 제로샷 일반화 성능을 획기적으로 향상시켰습니다.

Sayang Mu, Xiangyu Wu, Bo An2026-03-11🤖 cs.AI

Unveiling the Potential of Quantization with MXFP4: Strategies for Quantization Error Reduction

이 논문은 하드웨어 변경 없이 소프트웨어 기법인 오버플로우 인식 스케일링 (OAS) 과 매크로 블록 스케일링 (MBS) 을 도입하여 MXFP4 의 양자화 오차를 줄이고 NVFP4 와의 정확도 격차를 10% 에서 1% 미만으로 축소함으로써, MXFP4 를 하드웨어 효율성을 유지하면서 NVFP4 에 버금가는 성능을 내는 실용적인 대안으로 재탄생시켰음을 보여줍니다.

Jatin Chhugani, Geonhwa Jeong, Bor-Yiing Su, Yunjie Pan, Hanmei Yang, Aayush Ankit, Jiecao Yu, Summer Deng, Yunqing Chen, Nadathur Satish, Changkyu Kim2026-03-11🤖 cs.AI

Design Conductor: An agent autonomously builds a 1.5 GHz Linux-capable RISC-V CPU

이 논문은 219 단어의 요구사항 문서에서 시작해 12 시간 만에 1.48GHz 로 동작하는 완전한 RISC-V CPU(VerCore) 를 RTL 설계부터 GDSII 레이아웃까지 전 과정 자율적으로 구현한 'Design Conductor'라는 자율 에이전트를 소개합니다.

The Verkor Team, Ravi Krishna, Suresh Krishna, David Chin2026-03-11🤖 cs.AI

CktEvo: Repository-Level RTL Code Benchmark for Design Evolution

이 논문은 기존 벤치마크가 다루지 못했던 레포지토리 수준의 RTL 코드 진화를 평가하기 위해, 실제 IP 코어 간의 종속성을 고려하여 기능은 유지하면서 전력·성능·면적 (PPA) 을 개선하는 LLM 기반 벤치마크 및 폐루프 프레임워크인 'CktEvo'를 제안합니다.

Zhengyuan Shi, Jingxin Wang, Tairan Cheng, Changran Xu, Weikang Qian, Qiang Xu2026-03-11🤖 cs.AI

SiliconMind-V1: Multi-Agent Distillation and Debug-Reasoning Workflows for Verilog Code Generation

이 논문은 비용과 데이터 프라이버시 문제를 해결하고 기능적 정확성을 보장하기 위해 테스트벤치 기반 검증이 통합된 다중 에이전트 프레임워크를 제안하여, 로컬 파인튜닝 LLM 인 'SiliconMind-V1'이 테스트 시간 확장 방식을 통해 Verilog RTL 설계를 생성, 테스트, 디버깅할 수 있도록 함으로써 기존 최첨단 모델보다 우수한 성능을 달성했다고 설명합니다.

Mu-Chi Chen, Yu-Hung Kao, Po-Hsuan Huang, Shao-Chun Ho, Hsiang-Yu Tsou, I-Ting Wu, En-Ming Huang, Yu-Kai Hung, Wei-Po Hsin, Cheng Liang, Chia-Heng Tu, Shih-Hao Hung, Hsiang-Tsung Kung2026-03-11🤖 cs.AI

ALADIN: Accuracy-Latency-Aware Design-space Inference Analysis for Embedded AI Accelerators

이 논문은 임베디드 AI 가속기를 위한 정밀도-지연 시간 인식 설계 공간 추론 분석 프레임워크인 ALADIN 을 제안하여, 실제 플랫폼 배포 없이도 혼합 정밀도 양자화 신경망의 추론 병목 현상과 설계 트레이드오프를 정량적으로 평가하고 하드웨어 - 소프트웨어 공동 설계를 지원할 수 있음을 보여줍니다.

T. Baldi, D. Casini, A. Biondi2026-03-11🤖 cs.AI

Alignment Is the Disease: Censorship Visibility and Alignment Constraint Complexity as Determinants of Collective Pathology in Multi-Agent LLM Systems

이 논문은 대규모 언어 모델의 정렬 (alignment) 기법이 오히려 집단적 병리 현상을 유발할 수 있으며, 특히 보이지 않는 검열과 복잡한 정렬 제약이 모델 간 상호작용에서 해로운 결과를 초래할 수 있음을 시사합니다.

Hiroki Fukui2026-03-11🤖 cs.AI

← 이전 다음 →

cs.AI