cs.LG 편의 논문 | Gist.Science

Viewpoint-Agnostic Grasp Pipeline using VLM and Partial Observations

이 논문은 가시성 제한과 부분 관측이 있는 혼란스러운 환경에서도 자연어 명령에 따라 안전하고 실행 가능한 6 자유도 집기를 보장하기 위해, VLM 기반의 객체 인식과 깊이 보상을 통한 점구름 완성을 결합한 종단간 그립 파이프라인을 제안하고 실제 4 족 보행 로봇을 통해 기존 방식 대비 집기 성공률을 30% 에서 90% 로 획기적으로 향상시켰음을 입증합니다.

Dilermando Almeida, Juliano Negri, Guilherme Lazzarini, Thiago H. Segreto, Ranulfo Bezerra, Ricardo V. Godoy, Marcelo Becker2026-03-10🤖 cs.LG

Slumbering to Precision: Enhancing Artificial Neural Network Calibration Through Sleep-like Processes

이 논문은 생물의 수면과 기억 재생 메커니즘에서 영감을 받아, 지도 재학습 없이도 신경망의 확률 예측 정확도를 향상시키는 '수면 재생 통합 (SRC)'이라는 새로운 보정 기법을 제안하고 그 유효성을 입증합니다.

Jean Erik Delanois, Aditya Ahuja, Giri P. Krishnan, Maxim Bazhenov2026-03-10🤖 cs.LG

Hospitality-VQA: Decision-Oriented Informativeness Evaluation for Vision-Language Models

본 논문은 호텔 및 시설 이미지 기반의 소비자 의사결정에 초점을 맞춘 새로운 VQA 데이터셋과 '정보성 (Informativeness)' 평가 프레임워크를 제안하여, 현재 시각 - 언어 모델이 도메인 특화 미세조정 없이는 의사결정에 필요한 핵심 정보를 효과적으로 활용하지 못함을 규명했습니다.

Jeongwoo Lee, Baek Duhyeong, Eungyeol Han, Soyeon Shin, Gukin han, Seungduk Kim, Jaehyun Jeon, Taewoo Jeong2026-03-10🤖 cs.LG

Toward Unified Multimodal Representation Learning for Autonomous Driving

이 논문은 자율주행을 위한 엔드투엔드 성능 향상을 위해 기존 쌍별 유사도 정렬의 한계를 극복하고, 다중 모달리티를 통합된 임베딩 공간에 동시 정렬하는 '대조 텐서 프리트레이닝 (CTP)' 프레임워크를 제안합니다.

Ximeng Tao, Dimitar Filev, Gaurav Pandey2026-03-10🤖 cs.LG

Reject, Resample, Repeat: Understanding Parallel Reasoning in Language Model Inference

이 논문은 입자 필터링 (Sequential Monte Carlo) 알고리즘의 렌즈를 통해 언어 모델 추론 시 다중 샘플을 집계하고 가지치기하는 방법의 정확도 - 비용 트레이드오프를 이론적으로 분석하고 실험적으로 검증하여, 샘플링 오차를 설명하는 기준을 제시하지만 최종 정확도에는 한계가 있음을 밝힙니다.

Noah Golowich, Fan Chen, Dhruv Rohatgi, Raghav Singhal, Carles Domingo-Enrich, Dylan J. Foster, Akshay Krishnamurthy2026-03-10🤖 cs.LG

VLM-SubtleBench: How Far Are VLMs from Human-Level Subtle Comparative Reasoning?

이 논문은 기존 벤치마크가 놓치고 있는 미세한 시각적 차이 식별 능력을 평가하기 위해 산업, 의료, 항공 등 다양한 도메인과 10 가지 차이 유형을 포괄하는 'VLM-SubtleBench'를 제안하고, 이를 통해 현재 VLM 들이 인간 수준의 비교 추론에 도달하기까지 여전히 큰 격차가 있음을 규명합니다.

Minkyu Kim, Sangheon Lee, Dongmin Park2026-03-10🤖 cs.LG

Designing probabilistic AI monsoon forecasts to inform agricultural decision-making

이 논문은 다양한 농가의 상황에 맞춰 최적의 의사결정을 지원하기 위해 의사결정 이론 프레임워크를 도입하고, 인공지능 기상 예측 모델과 진화하는 농가 기대치 통계 모델을 결합하여 인도 몬순 강우 시작 시기를 정확히 예측해 3,800 만 명의 농가에 배포한 사례를 제시합니다.

Colin Aitken, Rajat Masiwal, Adam Marchakitus, Katherine Kowal, Mayank Gupta, Tyler Yang, Amir Jina, Pedram Hassanzadeh, William R. Boos, Michael Kremer2026-03-10🤖 cs.LG

SMGI: A Structural Theory of General Artificial Intelligence

이 논문은 표현 매핑, 가설 공간, 구조적 사전 지식, 평가자, 기억 연산자를 명시적으로 유형화된 동적 구성 요소로 정의하여 기존 학습 최적화 패러다임을 학습 인터페이스의 제어된 진화로 재해석하고, 고전적 및 현대적 AI 접근법을 SMGI 의 구조적 하위 집합으로 포함시키는 일반 인공지능의 구조적 이론을 제시합니다.

Aomar Osmani2026-03-10🤖 cs.LG

LeJOT-AutoML: LLM-Driven Feature Engineering for Job Execution Time Prediction in Databricks Cost Optimization

이 논문은 Databricks 작업 실행 시간 예측을 위해 LLM 에이전트와 검색 증강 생성 (RAG) 을 활용한 LeJOT-AutoML 프레임워크를 제안하여, 기존 수동 피처 엔지니어링의 한계를 극복하고 20~30 분 내에 200 개 이상의 동적 피처를 생성함으로써 19.01% 의 비용 절감 효과를 달성했다고 요약할 수 있습니다.

Lizhi Ma, Yi-Xiang Hu, Yihui Ren, Feng Wu, Xiang-Yang Li2026-03-10🤖 cs.LG

Revisiting Unknowns: Towards Effective and Efficient Open-Set Active Learning

이 논문은 레이블이 지정된 미지 클래스를 활용하여 기존 오픈셋 활성 학습의 한계를 극복하고, 검출기 없이도 높은 정확도와 효율성을 달성하는 통합 프레임워크인 E $^2$ OAL 을 제안합니다.

Chen-Chen Zong, Yu-Qi Chi, Xie-Yang Wang, Yan Cui, Sheng-Jun Huang2026-03-10🤖 cs.LG

Bayesian Transformer for Probabilistic Load Forecasting in Smart Grids

이 논문은 몬테카를로 드롭아웃, 변분 피드포워드 레이어, 확률적 어텐션 메커니즘을 PatchTST 백본에 통합한 베이지안 트랜스포머 (BT) 를 제안하여, 기존 심층 학습 모델이 극단적인 기상 변화에서 겪는 과도한 자신감 문제를 해결하고 스마트 그리드의 부하 예측 불확실성을 정교하게 추정하는 새로운 기준을 제시합니다.

Sajib Debnath, Md. Uzzal Mia2026-03-10🤖 cs.LG

NaviDriveVLM: Decoupling High-Level Reasoning and Motion Planning for Autonomous Driving

본 논문은 대규모 VLM 의 추론 능력과 경량 모델의 효율성을 결합하여 추론과 동작 계획을 분리한 'NaviDriveVLM'을 제안함으로써, nuScenes 벤치마크에서 기존 대규모 VLM 기반 시스템보다 우수한 종단간 운동 계획 성능을 달성했다고 요약할 수 있습니다.

Ximeng Tao, Pardis Taghavi, Dimitar Filev, Reza Langari, Gaurav Pandey2026-03-10🤖 cs.LG

DyQ-VLA: Temporal-Dynamic-Aware Quantization for Embodied Vision-Language-Action Models

이 논문은 시계열적 동적 민감도를 고려하여 실시간 킨매틱 프로시를 기반으로 비트 폭을 동적으로 할당하는 'DyQ-VLA' 프레임워크를 제안함으로써, embodied Vision-Language-Action 모델의 메모리 사용량을 30.9% 로 줄이면서도 성능을 99.5% 유지하고 추론 속도를 크게 향상시킵니다.

Zihao Zheng, Hangyu Cao, Sicheng Tian, Jiayu Chen, Maoliang Li, Xinhao Sun, Hailong Zou, Zhaobo Zhang, Xuanzhe Liu, Donggang Cao, Hong Mei, Xiang Chen2026-03-10🤖 cs.LG

Rel-MOSS: Towards Imbalanced Relational Deep Learning on Relational Databases

이 논문은 관계형 데이터베이스의 불균형 문제를 해결하기 위해 이웃 메시지 조절을 위한 관계별 게이트 제어기와 관계 일관성을 유지하는 과표본화 합성기를 도입한 'Rel-MOSS'를 제안하고, 다양한 데이터셋에서 기존 최첨단 방법보다 우수한 성능을 입증합니다.

Jun Yin, Peng Huo, Bangguo Zhu, Hao Yan, Senzhang Wang, Shirui Pan, Chengqi Zhang2026-03-10🤖 cs.LG

Robust Transfer Learning with Side Information

이 논문은 소스 및 타겟 도메인 간의 동적 특성에 대한 사이드 정보를 통합하여 제약 조건을 가진 추정을 통해 추정 중심의 불확실성 집합을 구축함으로써, 환경 변화 하에서 과도한 보수성을 완화하고 표본 효율성을 향상시킨 강건한 전이 학습 프레임워크를 제안합니다.

Akram S. Awad, Shihab Ahmed, Yue Wang, George K. Atia2026-03-10🤖 cs.LG

Semantic Risk Scoring of Aggregated Metrics: An AI-Driven Approach for Healthcare Data Governance

이 논문은 의료 데이터 거버넌스를 위해 SQL 기반 메트릭 정의의 잠재적 프라이버시 위험을 사전에 평가하고 설명 가능한 위험 점수를 부여하여 통계적 유출을 방지하는 AI 기반 프레임워크를 제안합니다.

Mohammed Omer Shakeel Ahmed2026-03-10🤖 cs.LG

ELLMob: Event-Driven Human Mobility Generation with Self-Aligned LLM Framework

이 논문은 태풍, 팬데믹, 올림픽과 같은 대규모 사회적 사건을 반영한 이동성 데이터셋을 최초로 구축하고, Fuzzy-Trace 이론을 기반으로 습관적 패턴과 사건 제약 사이의 경쟁적 논리를 추출하여 정렬하는 자기 정렬 LLM 프레임워크 'ELLMob'을 제안함으로써 기존 방법론의 한계를 극복하고 사건에 대응하는 인간 이동성 생성의 정확도를 획기적으로 향상시켰습니다.

Yusong Wang, Chuang Yang, Jiawei Wang, Xiaohang Xu, Jiayi Xu, Dongyuan Li, Chuan Xiao, Renhe Jiang2026-03-10🤖 cs.LG

RL unknotter, hard unknots and unknotting number

이 논문은 강화 학습을 활용하여 복잡한 매듭 다이어그램을 단순화하는 파이프라인을 개발하고, 이를 통해 매우 어려운 매듭과 $4_1\#9_{10}$ 매듭의 unknotting number 상한을 3 으로 재확인한 연구 결과를 제시합니다.

Anne Dranowski, Yura Kabkov, Daniel Tubbenhauer2026-03-10🤖 cs.LG

PSTNet: Physically-Structured Turbulence Network

이 논문은 물리 법칙을 아키텍처에 직접 통합하여 제한된 컴퓨팅 자원을 가진 항공기에서 실시간 난기류 강도를 정확하게 추정할 수 있는 경량 모델인 PSTNet 을 제안하고, 이를 통해 기존 방법 대비 성능을 향상시켰음을 입증합니다.

Boris Kriuk, Fedor Kriuk2026-03-10🤖 cs.LG

Local Constrained Bayesian Optimization

이 논문은 고차원 제약 조건 하에서 차원의 저주를 극복하고 기존 전역 베이지안 최적화보다 다항식적으로 우수한 수렴 속도를 보장하는 새로운 프레임워크인 '국소 제약 베이지안 최적화 (LCBO)'를 제안하고, 100 차원 이상의 벤치마크에서 최첨단 기법들을 능가하는 성능을 입증합니다.

Jing Jingzhe, Fan Zheyi, Szu Hui Ng, Qingpei Hu2026-03-10🤖 cs.LG

← 이전 다음 →