Viewpoint-Agnostic Grasp Pipeline using VLM and Partial Observations

이 논문은 가시성 제한과 부분 관측이 있는 혼란스러운 환경에서도 자연어 명령에 따라 안전하고 실행 가능한 6 자유도 집기를 보장하기 위해, VLM 기반의 객체 인식과 깊이 보상을 통한 점구름 완성을 결합한 종단간 그립 파이프라인을 제안하고 실제 4 족 보행 로봇을 통해 기존 방식 대비 집기 성공률을 30% 에서 90% 로 획기적으로 향상시켰음을 입증합니다.

Dilermando Almeida, Juliano Negri, Guilherme Lazzarini, Thiago H. Segreto, Ranulfo Bezerra, Ricardo V. Godoy, Marcelo Becker2026-03-10🤖 cs.LG

Hospitality-VQA: Decision-Oriented Informativeness Evaluation for Vision-Language Models

본 논문은 호텔 및 시설 이미지 기반의 소비자 의사결정에 초점을 맞춘 새로운 VQA 데이터셋과 '정보성 (Informativeness)' 평가 프레임워크를 제안하여, 현재 시각 - 언어 모델이 도메인 특화 미세조정 없이는 의사결정에 필요한 핵심 정보를 효과적으로 활용하지 못함을 규명했습니다.

Jeongwoo Lee, Baek Duhyeong, Eungyeol Han, Soyeon Shin, Gukin han, Seungduk Kim, Jaehyun Jeon, Taewoo Jeong2026-03-10🤖 cs.LG

Reject, Resample, Repeat: Understanding Parallel Reasoning in Language Model Inference

이 논문은 입자 필터링 (Sequential Monte Carlo) 알고리즘의 렌즈를 통해 언어 모델 추론 시 다중 샘플을 집계하고 가지치기하는 방법의 정확도 - 비용 트레이드오프를 이론적으로 분석하고 실험적으로 검증하여, 샘플링 오차를 설명하는 기준을 제시하지만 최종 정확도에는 한계가 있음을 밝힙니다.

Noah Golowich, Fan Chen, Dhruv Rohatgi, Raghav Singhal, Carles Domingo-Enrich, Dylan J. Foster, Akshay Krishnamurthy2026-03-10🤖 cs.LG

VLM-SubtleBench: How Far Are VLMs from Human-Level Subtle Comparative Reasoning?

이 논문은 기존 벤치마크가 놓치고 있는 미세한 시각적 차이 식별 능력을 평가하기 위해 산업, 의료, 항공 등 다양한 도메인과 10 가지 차이 유형을 포괄하는 'VLM-SubtleBench'를 제안하고, 이를 통해 현재 VLM 들이 인간 수준의 비교 추론에 도달하기까지 여전히 큰 격차가 있음을 규명합니다.

Minkyu Kim, Sangheon Lee, Dongmin Park2026-03-10🤖 cs.LG

Designing probabilistic AI monsoon forecasts to inform agricultural decision-making

이 논문은 다양한 농가의 상황에 맞춰 최적의 의사결정을 지원하기 위해 의사결정 이론 프레임워크를 도입하고, 인공지능 기상 예측 모델과 진화하는 농가 기대치 통계 모델을 결합하여 인도 몬순 강우 시작 시기를 정확히 예측해 3,800 만 명의 농가에 배포한 사례를 제시합니다.

Colin Aitken, Rajat Masiwal, Adam Marchakitus, Katherine Kowal, Mayank Gupta, Tyler Yang, Amir Jina, Pedram Hassanzadeh, William R. Boos, Michael Kremer2026-03-10🤖 cs.LG

SMGI: A Structural Theory of General Artificial Intelligence

이 논문은 표현 매핑, 가설 공간, 구조적 사전 지식, 평가자, 기억 연산자를 명시적으로 유형화된 동적 구성 요소로 정의하여 기존 학습 최적화 패러다임을 학습 인터페이스의 제어된 진화로 재해석하고, 고전적 및 현대적 AI 접근법을 SMGI 의 구조적 하위 집합으로 포함시키는 일반 인공지능의 구조적 이론을 제시합니다.

Aomar Osmani2026-03-10🤖 cs.LG

LeJOT-AutoML: LLM-Driven Feature Engineering for Job Execution Time Prediction in Databricks Cost Optimization

이 논문은 Databricks 작업 실행 시간 예측을 위해 LLM 에이전트와 검색 증강 생성 (RAG) 을 활용한 LeJOT-AutoML 프레임워크를 제안하여, 기존 수동 피처 엔지니어링의 한계를 극복하고 20~30 분 내에 200 개 이상의 동적 피처를 생성함으로써 19.01% 의 비용 절감 효과를 달성했다고 요약할 수 있습니다.

Lizhi Ma, Yi-Xiang Hu, Yihui Ren, Feng Wu, Xiang-Yang Li2026-03-10🤖 cs.LG

Bayesian Transformer for Probabilistic Load Forecasting in Smart Grids

이 논문은 몬테카를로 드롭아웃, 변분 피드포워드 레이어, 확률적 어텐션 메커니즘을 PatchTST 백본에 통합한 베이지안 트랜스포머 (BT) 를 제안하여, 기존 심층 학습 모델이 극단적인 기상 변화에서 겪는 과도한 자신감 문제를 해결하고 스마트 그리드의 부하 예측 불확실성을 정교하게 추정하는 새로운 기준을 제시합니다.

Sajib Debnath, Md. Uzzal Mia2026-03-10🤖 cs.LG

NaviDriveVLM: Decoupling High-Level Reasoning and Motion Planning for Autonomous Driving

본 논문은 대규모 VLM 의 추론 능력과 경량 모델의 효율성을 결합하여 추론과 동작 계획을 분리한 'NaviDriveVLM'을 제안함으로써, nuScenes 벤치마크에서 기존 대규모 VLM 기반 시스템보다 우수한 종단간 운동 계획 성능을 달성했다고 요약할 수 있습니다.

Ximeng Tao, Pardis Taghavi, Dimitar Filev, Reza Langari, Gaurav Pandey2026-03-10🤖 cs.LG

DyQ-VLA: Temporal-Dynamic-Aware Quantization for Embodied Vision-Language-Action Models

이 논문은 시계열적 동적 민감도를 고려하여 실시간 킨매틱 프로시를 기반으로 비트 폭을 동적으로 할당하는 'DyQ-VLA' 프레임워크를 제안함으로써, embodied Vision-Language-Action 모델의 메모리 사용량을 30.9% 로 줄이면서도 성능을 99.5% 유지하고 추론 속도를 크게 향상시킵니다.

Zihao Zheng, Hangyu Cao, Sicheng Tian, Jiayu Chen, Maoliang Li, Xinhao Sun, Hailong Zou, Zhaobo Zhang, Xuanzhe Liu, Donggang Cao, Hong Mei, Xiang Chen2026-03-10🤖 cs.LG

Rel-MOSS: Towards Imbalanced Relational Deep Learning on Relational Databases

이 논문은 관계형 데이터베이스의 불균형 문제를 해결하기 위해 이웃 메시지 조절을 위한 관계별 게이트 제어기와 관계 일관성을 유지하는 과표본화 합성기를 도입한 'Rel-MOSS'를 제안하고, 다양한 데이터셋에서 기존 최첨단 방법보다 우수한 성능을 입증합니다.

Jun Yin, Peng Huo, Bangguo Zhu, Hao Yan, Senzhang Wang, Shirui Pan, Chengqi Zhang2026-03-10🤖 cs.LG

ELLMob: Event-Driven Human Mobility Generation with Self-Aligned LLM Framework

이 논문은 태풍, 팬데믹, 올림픽과 같은 대규모 사회적 사건을 반영한 이동성 데이터셋을 최초로 구축하고, Fuzzy-Trace 이론을 기반으로 습관적 패턴과 사건 제약 사이의 경쟁적 논리를 추출하여 정렬하는 자기 정렬 LLM 프레임워크 'ELLMob'을 제안함으로써 기존 방법론의 한계를 극복하고 사건에 대응하는 인간 이동성 생성의 정확도를 획기적으로 향상시켰습니다.

Yusong Wang, Chuang Yang, Jiawei Wang, Xiaohang Xu, Jiayi Xu, Dongyuan Li, Chuan Xiao, Renhe Jiang2026-03-10🤖 cs.LG