ESGenius: Benchmarking LLMs on Environmental, Social, and Governance (ESG) and Sustainability Knowledge

이 논문은 ESG 및 지속 가능성 분야에 특화된 대규모 언어 모델 (LLM) 의 능력을 평가하고 향상시키기 위해, 전문가 검증을 거친 1,136 개의 질문과 231 개의 핵심 문서로 구성된 'ESGenius'라는 최초의 종합 벤치마크를 소개하고, 이를 통해 RAG(검색 증강 생성) 방식이 특히 소형 모델의 성능을 크게 향상시킨다는 것을 입증했습니다.

Chaoyue He, Xin Zhou, Yi Wu + 9 more2026-03-09💬 cs.CL

ContextBench: Modifying Contexts for Targeted Latent Activation

이 논문은 언어 모델의 특정 잠재적 특징이나 행동을 유도하는 입력을 생성하는 '맥락 수정' 접근법을 제안하고, 이를 평가하는 벤치마크 'ContextBench'를 소개하며, LLM 보조와 확산 모델 인페인팅을 결합한 진화적 프롬프트 최적화 (EPO) 변형이 유창성과 유도 효과를 동시에 달성하는 최첨단 성능을 보인다고 주장합니다.

Robert Graham, Edward Stevinson, Leo Richter, Alexander Chia, Joseph Miller, Joseph Isaac Bloom2026-03-09🤖 cs.AI

Sysformer: Safeguarding Frozen Large Language Models with Adaptive System Prompts

이 논문은 파인튜닝 없이 고정된 LLM 의 시스템 프롬프트를 사용자 입력에 맞춰 적응적으로 조정하는 'Sysformer'를 제안하여, 유해한 입력에 대한 거절률을 최대 80% 향상시키고 안전한 입력에 대한 준수율을 최대 90% 높이며 다양한 재킹킹 공격에 대한 모델의 견고성을 극대화한다고 요약할 수 있습니다.

Kartik Sharma, Yiqiao Jin, Vineeth Rakesh, Yingtong Dou, Menghai Pan, Mahashweta Das, Srijan Kumar2026-03-09🤖 cs.AI

SPoT: Subpixel Placement of Tokens in Vision Transformers

이 논문은 비전 트랜스포머의 그리드 기반 토큰화 한계를 극복하고, 오라클 가이드 탐색을 통해 이미지의 연속적인 서브픽셀 위치에 토큰을 배치하는 SPoT 기법을 제안하여 추론 시 필요한 토큰 수를 획기적으로 줄이면서도 정확도를 향상시키는 새로운 패러다임을 제시합니다.

Martine Hjelkrem-Tan, Marius Aasan, Gabriel Y. Arteaga, Adín Ramírez Rivera2026-03-09🤖 cs.LG

Quantifying Cross-Attention Interaction in Transformers for Interpreting TCR-pMHC Binding

이 논문은 TCR-pMHC 결합을 해석하기 위해 기존 XAI 방법의 한계를 극복하는 새로운 사후 해석 기법인 QCAI 를 제안하고, 실험적으로 확인된 274 개 TCR-pMHC 구조로 구성된 TCR-XAI 벤치마크를 통해 해석 가능성과 예측 정확도 측면에서 최첨단 성능을 입증했습니다.

Jiarui Li, Zixiang Yin, Haley Smith, Zhengming Ding, Samuel J. Landry, Ramgopal R. Mettu2026-03-09🤖 cs.LG

Temporal Misalignment Attacks against Multimodal Perception in Autonomous Driving

이 논문은 자율주행의 다중모달 융합 인식을 위해 차량 내 네트워크를 통해 시계열 동기화를 교란하는 '데자뷰 (DejaVu)' 공격을 제안하며, 이는 객체 감지 및 추적 성능을 극도로 저하시켜 충돌이나 유령 제동과 같은 심각한 안전 사고를 유발할 수 있음을 실증합니다.

Md Hasan Shahriar, Md Mohaimin Al Barat, Harshavardhan Sundar, Ning Zhang, Naren Ramakrishnan, Y. Thomas Hou, Wenjing Lou2026-03-09🤖 cs.LG

Diverse and Adaptive Behavior Curriculum for Autonomous Driving: A Student-Teacher Framework with Multi-Agent RL

이 논문은 자율주행 에이전트가 규칙 기반 시나리오의 한계를 극복하고 일상부터 위기 상황까지 다양한 교통 행동을 학습할 수 있도록, 학생 - 교사 프레임워크와 적응형 다중 에이전트 강화학습을 통해 자동 커리큘럼을 생성하는 새로운 방법을 제안합니다.

Ahmed Abouelazm, Johannes Ratz, Philip Schörner, J. Marius Zöllner2026-03-09🤖 cs.LG

Multivariate Fields of Experts for Convergent Image Reconstruction

이 논문은 \ell_\infty-노름의 모reau 포락선을 기반으로 한 다변량 잠재 함수를 도입하여 기존 Fields of Experts 방법을 일반화함으로써, 딥러닝 기반 정규화자와 유사한 성능을 유지하면서도 더 적은 데이터와 파라미터로 빠른 수렴 보장을 제공하는 새로운 이미지 재구성 프레임워크를 제안합니다.

Stanislas Ducotterd, Michael Unser2026-03-09🤖 cs.LG

Characterizing Evolution in Expectation-Maximization Estimates for Overspecified Mixed Linear Regression

이 논문은 과지정된 2 성분 혼합 선형 회귀 모델에서 EM 알고리즘의 거동을 이론적으로 분석하여, 초기 혼합 가중치의 균형 여부에 따라 회귀 파라미터의 수렴 속도 (선형 대 하선형) 와 유한 표본에서의 통계적 정확도 (O((d/n)1/2)O((d/n)^{1/2})O((d/n)1/4)O((d/n)^{1/4})) 가 어떻게 달라지는지 규명했습니다.

Zhankun Luo, Abolfazl Hashemi2026-03-09🤖 cs.LG

One Model for All Tasks: Leveraging Efficient World Models in Multi-Task Planning

이 논문은 이기적인 다중 작업 환경에서 그래디언트 충돌을 완화하기 위해 전문가 혼합 (MoE) 아키텍처를 도입하고 학습 과정 중 동적 파라미터 확장 (DPS) 전략을 적용하여, 단일 모델로도 전문 단일 작업 에이전트와 경쟁력 있는 성능을 달성하면서도 환경 상호작용을 71.5% 로 줄인 'ScaleZero'를 제안합니다.

Yuan Pu, Yazhe Niu, Jia Tang, Junyu Xiong, Shuai Hu, Hongsheng Li2026-03-09🤖 cs.LG

VEGA: Electric Vehicle Navigation Agent via Physics-Informed Neural Operator and Proximal Policy Optimization

이 논문은 물리 정보 신경 연산자 (PINO) 를 통해 차량별 물리 매개변수를 추정하고 근접 정책 최적화 (PPO) 를 활용한 강화학습으로 충전 계획과 경로를 동시에 최적화하여, 기존 에너지 인식 A* 알고리즘 대비 20 배 이상의 추론 속도와 우수한 일반화 성능을 보이는 전기차 네비게이션 에이전트 'VEGA'를 제안합니다.

Hansol Lim, Minhyeok Im, Jonathan Boyack, Jee Won Lee, Jongseong Brad Choi2026-03-09🤖 cs.LG

C^2Prompt: Class-aware Client Knowledge Interaction for Federated Continual Learning

이 논문은 연방 지속 학습에서 프롬프트 간 클래스별 지식 일관성 부족으로 인한 공간적 및 시간적 망각 문제를 해결하기 위해, 국소 클래스 분포 보상과 클래스 인식 프롬프트 집계 기법을 도입한 C²Prompt 를 제안하여 최첨단 성능을 달성함을 보여줍니다.

Kunlun Xu, Yibo Feng, Jiangmeng Li, Yongsheng Qi, Jiahuan Zhou2026-03-09🤖 cs.LG

Auto-Regressive U-Net for Full-Field Prediction of Shrinkage-Induced Damage in Concrete

이 논문은 아그레시브 U-Net 과 CNN 을 결합한 이중 네트워크 아키텍처를 통해 미시 구조적 기하학과 수축 프로파일을 기반으로 콘크리트의 시간 의존적 전장 손상 진화와 기계적 특성을 효율적으로 예측하여 혼합 설계 최적화를 가능하게 하는 새로운 딥러닝 접근법을 제시합니다.

Liya Gaynutdinova, Petr Havlásek, Ondřej Rokoš, Fleur Hendriks, Martin Doškář2026-03-09🤖 cs.LG

Taxonomy-aware Dynamic Motion Generation on Hyperbolic Manifolds

이 논문은 인간의 운동 계층 구조와 시간적 역학을 모두 보존하는 잠재 표현을 학습하기 위해 쌍곡 다양체 상의 가우스 프로세스 동역학 모델을 확장하고, 이를 손 잡기 계층 구조를 기반으로 한 물리적으로 일관된 새로운 운동 생성을 가능하게 하는 3 가지 메커니즘을 제안합니다.

Luis Augenstein, Noémie Jaquier, Tamim Asfour, Leonel Rozo2026-03-09🤖 cs.LG