ORIC: Benchmarking Object Recognition under Contextual Incongruity in Large Vision-Language Models
이 논문은 대규모 시각-언어 모델 (LVLM) 이 비일관적인 맥락에서 객체 인식에 실패하는 문제를 해결하기 위해 'ORIC' 프레임워크와 벤치마크를 제안하고, 이를 통해 모델의 신뢰성을 향상시키는 방법을 제시합니다.
6745 편의 논문
이 논문은 대규모 시각-언어 모델 (LVLM) 이 비일관적인 맥락에서 객체 인식에 실패하는 문제를 해결하기 위해 'ORIC' 프레임워크와 벤치마크를 제안하고, 이를 통해 모델의 신뢰성을 향상시키는 방법을 제시합니다.
이 논문은 부분 관측 환경에서 최대 안전 집합을 근사하고 엄격한 안전 보장을 제공하는 관측 조건부 잔류 신경 제어 장벽 함수 (ORN-CBF) 를 제안하며, 하밀토니안-야코비 접근법과 하이퍼네트워크 아키텍처를 활용하여 시뮬레이션 및 실제 로봇 실험에서 기존 방법보다 우수한 안전성과 일반화 성능을 입증했습니다.
이 논문은 유한 상태 공간에서 의사 스펙트럼 갭에 대한 경험적 상한을 도출하여, 기존 이론적 상수 의존성을 제거한 마르코프 체인을 위한 최초의 완전 경험적 PAC-Bayes 경계를 제시합니다.
이 논문은 언어 모델의 유해 행동을 탐지하는 선형 프로브가 행동의 텍스트적 증거 (시스템 프롬프트나 사고 과정 등) 에 의존하여, 이러한 텍스트가 제거되거나 행동이 명시되지 않은 경우 탐지 성능이 현저히 저하됨을 보여줍니다.
이 논문은 엣지-희소 이분 지식 그래프의 링크 예측 성능을 향상시키기 위해 기존 엣지만을 재샘플링하거나 의미적 KNN 을 활용한 데이터 증강 프레임워크인 AEGIS 를 제안하고, 다양한 희소성 환경에서 이 방법이 기존 베이스라인 대비 성능과 보정력을 개선함을 입증합니다.
이 논문은 텍스트 및 이미지와 같은 모달리티 정보를 활용하여 도메인 간 일반화 능력을 갖춘 범용 생성형 멀티모달 시계열 예측 모델 'Aurora'를 제안하고, 다양한 벤치마크에서 최첨단 성능을 입증합니다.
이 논문은 관측 데이터로부터 잠재 결과의 조건부 분포를 추정할 때 기존 방법론이 갖지 못했던 Neyman-직교성, 준-오라클 효율성, 이중 강건성 등의 이론적 장점을 가지면서도 다양한 최신 생성 모델을 활용할 수 있는 'GDR-learners'를 제안하고 그 우수성을 실험을 통해 입증합니다.
이 논문은 웨어러블 센서 기반의 인간 활동 인식에서 새로운 사용자의 데이터로 학습할 때 발생하는 catastrophic forgetting 문제를 해결하기 위해, 자기지도 학습 트랜스포머와 지식 증류 기반 CNN 을 결합한 CLAD-Net 을 제안하고, 제한된 라벨 데이터 환경에서도 기존 방법들보다 뛰어난 성능과 낮은 망각률을 보임을 입증합니다.
이 논문은 기존 PSRO 방법의 계산 및 메모리 비효율성을 해결하기 위해 명시적 정책 집합을 잠재적 앵커와 단일 생성기로 대체하는 '생성 진화 메타 솔버 (GEMS)'를 제안하여, 게임 이론적 보장을 유지하면서도 더 빠르고 메모리 효율적인 확장 가능한 다중 에이전트 강화학습을 가능하게 한다고 요약할 수 있습니다.
이 논문은 임의의 치환 대칭군에 적용 가능한 새로운 프레임워크인 함수 공유 KAN(FS-KAN) 을 제안하여, 기존 파라미터 공유 네트워크의 표현력 이론을 확장하면서도 데이터 효율성과 해석 가능성을 크게 향상시켰음을 보여줍니다.
이 논문은 낮은 오버랩 (overlap) 영역에서 조건부 평균 치료 효과 (CATE) 추정의 성능을 향상시키기 위해, 오버랩 가중치에 비례하여 정규화 강도를 조절하는 새로운 '오버랩 적응형 정규화 (OAR)' 기법을 제안하고 이를 기존 메타-러너에 적용하여 추론의 견고성을 확보함을 보여줍니다.
이 논문은 사전 정보 없이 시작되는 콜드스타트 상황에서의 능동적 상관관계 클러스터링 문제를 해결하기 위해, 초기 단계에서 다양성을 촉진하는 커버리지 인식 방법을 제안하고 그 유효성을 실험을 통해 입증합니다.
이 논문은 동적 경매 환경에서 소액 광고 캠페인의 예산 조절을 위해 히스테리시스와 비례 피드백을 결합한 제어 이론 기반의 안정적이고 적응적인 pacing 알고리즘을 제안하며, 이를 통해 기존 방법 대비 pacing 오차를 13%, -변동성을 54% 감소시키는 효과를 입증했습니다.
이 논문은 LLM 기반의 자가 진화 에이전트가 환경과의 상호작용을 통해 스스로 개선되는 과정에서 의도하지 않은 방향으로 진화하여 안전 정렬 저하나 취약점 도입과 같은 유해한 결과를 초래할 수 있는 '미진화 (Misevolution)' 현상을 체계적으로 규명하고, 이에 대한 완화 전략을 모색합니다.
이 논문은 관측 데이터를 기반으로 마르코프 결정 과정에서의 개인별 잠재 결과를 예측하기 위해 이중 강건성, Neyman 직교성, 준-오라클 효율성을 보장하는 새로운 메타 러너인 DRQ-learner 를 제안하고 이론적 근거와 실증적 유효성을 입증합니다.
이 논문은 민감도 상한이 알려지지 않은 임의의 블랙박스 함수에 대해 통계적 효율성과 오라클 효율성 사이의 균형을 이루며 근사적으로 최적의 차분 프라이버시 추정 기법을 제안하고 그 최적성을 증명합니다.
이 논문은 외부 감독이나 추가 학습 없이 에이전트 응답을 기반으로 샤플리 값을 추정하여 동적 DAG 통신 구조를 자동 구성함으로써, 특히 약한 LLM 환경에서도 기존 방법론의 한계를 극복하고 다중 에이전트 시스템의 협업 효율성과 정확성을 극대화하는 'SelfOrg' 프레임워크를 제안합니다.
이 논문은 시연 데이터의 실패 및 복구 패턴과 같은 시간적 구조를 명시적으로 모델링하기 위해 상태 전이 어텐션 (STA) 메커니즘을 도입한 'CroSTAta'라는 새로운 트랜스포머 아키텍처를 제안하며, 이를 통해 로봇 조작 정책의 강건성과 정밀도를 기존 방법론보다 크게 향상시켰음을 보여줍니다.
이 논문은 동적 변분 오토인코더 기반의 '이중 투영 (double projection)' 방법을 제안하여 관측 데이터로부터 시스템 상태 궤적과 잡음 시계열을 동시에 추정함으로써, 저차원 상태 공간에서 다단계 예측이 가능한 확률적 동적 시스템을 학습하고 이를 결정론적 모델과 비교 평가합니다.
이 논문은 대규모 LLM 기반 에이전트 워크플로우를 활용해 약 1 만 편의 과학 논문에서 열전 및 구조적 특성을 자동 추출하여 2 만 7 천 8 백여 개의 레코드로 구성된 가장 큰 규모의 데이터셋을 구축하고, 이를 통해 재료 발견을 가속화할 수 있는 확장 가능한 파이프라인과 공개 도구를 제시합니다.