Stop Listening to Me! How Multi-turn Conversations Can Degrade Diagnostic Reasoning
이 논문은 대규모 언어 모델이 단일 회답보다 대화형 상호작용에서 진단 추론 능력이 저하되며, 특히 잘못된 사용자 제안에 따라 초기 올바른 진단을 포기하거나 맹목적으로 전환하는 '대화 세제 (conversation tax)' 현상을 보임을 17 개 모델을 대상으로 한 실험을 통해 규명했습니다.
3813 편의 논문
이 논문은 대규모 언어 모델이 단일 회답보다 대화형 상호작용에서 진단 추론 능력이 저하되며, 특히 잘못된 사용자 제안에 따라 초기 올바른 진단을 포기하거나 맹목적으로 전환하는 '대화 세제 (conversation tax)' 현상을 보임을 17 개 모델을 대상으로 한 실험을 통해 규명했습니다.
이 논문은 신경과학의 영감을 받아 단기 및 장기 버퍼를 활용한 지능형 샘플링 방식을 도입한 모델 기반 강화학습 알고리즘 ARROW 를 제안하며, 기존 방법 대비 메모리 효율성을 높이고 과거 작업의 망각을 크게 줄이는 continual RL 의 성능을 입증합니다.
이 논문은 대칭적인 리만 기하학의 한계를 넘어 데이터의 비대칭적 특성을 포착하기 위해 핀슬러 기하학을 도입한 새로운 매니폴드 학습 파이프라인을 제안하고, 이를 통해 기존 방법론보다 우수한 품질의 임베딩과 숨겨진 정보 추출이 가능함을 입증합니다.
이 논문은 기존 지도학습 기반 백본의 도시 간 일반화 한계를 지적하고, 자기지도학습을 통해 시각 표현을 학습한 엔드투엔드 자율주행 모델이 새로운 도시 환경으로의 제로샷 전이 성능을 크게 향상시킨다는 것을 다중 도시 데이터셋과 오픈/클로즈드 루프 평가에서 입증합니다.
이 논문은 결정론적 오토인코더의 통계적 의존성 추정을 위해 입력 연결과 재결합을 제거하고 직교 밀도비 분해에 기반한 안정적인 신경 추정기를 제안하며, 가우스 노이즈 가정을 통해 의미 있는 특징 분석과 특이값의 순차적 수렴을 가능하게 합니다.
이 논문은 사용자별 레이블 데이터 없이도 도메인 구성을 기반으로 가짜 테이블을 생성하여 LLM 을 미세 조정함으로써, 대규모 의미 열 유형과 구조적 이해의 한계를 극복하는 도메인 기반 제로샷 테이블 열 주석 프레임워크인 ZTab 을 제안합니다.
이 논문은 그래프 노드 부분집합 선택 문제를 포함한 여러 제약 조건이 있는 조합 최적화 문제를 단일 모델로 학습할 수 있도록 문제 구조와 목적 함수를 통합적으로 인코딩하는 'UniHetCO'라는 새로운 비지도 신경 조합 최적화 프레임워크를 제안합니다.
이 논문은 이산적 마크와 연속적 동역학 간의 상호작용을 포착하기 위해 자기-어텐션과 신경 미분방정식을 병렬로 결합하고 교차 어텐션으로 융합하는 NEXTPP 모델을 제안하여, 불규칙한 이벤트 시퀀스 예측 성능을 기존 최첨단 모델보다 크게 향상시켰습니다.
이 논문은 정적 네트워크 중심성 지표의 한계를 극복하고, 외부 요인과 내부 상호작용을 모두 고려한 동적 프레임워크인 'HawkesRank'를 제안하여 실시간 중요도 평가 및 예측 성능을 크게 향상시켰음을 보여줍니다.
이 논문은 기존 비선형 확률적 잠재 변수 모델의 근사 오차 문제를 해결하기 위해 Wasserstein 거리를 프로크시멀 연산자로 활용한 새로운 KProxNPLVM 을 제안하여 소프트 센서 모델링의 정확도를 향상시키는 방법을 제시합니다.
이 논문은 기존 통계 및 얕은 머신러닝 모델의 한계를 극복하기 위해 시계열 패턴과 네트워크 위상적 상관관계를 동시에 학습하는 맞춤형 그래트 어텐션 네트워크 (GAT) 와 클러스터링 오버처가 적용된 다중 모달 대규모 언어 모델 (LLM) 을 제안하며, 실제 네트워크 데이터셋을 통한 실험 결과 LLM 기반 모델이 우수한 예측 및 일반화 성능을, GAT 모델은 예측 분산 감소 측면에서 강점을 보임을 입증했습니다.
본 논문은 수동 현미경 분석의 한계를 극복하기 위해 2D 이미지와 3D 점구름 데이터를 융합한 인공지능 파이프라인 'Sorometry'를 개발하여 식물성 실리카 (phytolith) 의 고처리량 자동 분류 및 고고학적 식물 기원 재구성을 가능하게 했음을 제시합니다.
이 논문은 자연어 기반의 지식과 물리적 시계열 데이터를 연결하는 '이벤트 논리 트리 (ELT)' 프레임워크와 신경-상징적 VLM 에이전트를 제안하여, 레이블 데이터가 부족한 환경에서도 다변량 시계열 이벤트 탐지의 정확성과 설명 가능성을 동시에 향상시키는 방법을 제시합니다.
이 논문은 소프트맥스 기반의 트랜스포머 모델이 특정 조건부 작업을 수행하기 위해 반드시 '어텐션 싱크 (attention sink)'를 형성해야 함을 수학적으로 증명하고, 이는 정규화 제약 때문임을 비정규화 ReLU 어텐션 실험을 통해 입증했습니다.
이 논문은 그래프 기반 검색 증강 생성 (GraphRAG) 의 보안 취약점을 공략하기 위해, 외부 데이터베이스에 독성 사건과 지식 진화 경로를 조작하여 지식 그래프를 오염시키고 LLM 의 응답을 악의적으로 조작하는 새로운 공격 기법인 KEPo(Knowledge Evolution Poison) 를 제안하고 그 효과성을 입증합니다.
이 논문은 이질적이고 희소한 로컬 데이터 환경에서도 일반화된 아이템 임베딩의 안정적인 학습을 보장하기 위해, 다중 태스크 학습 관점에서 문제를 재정의하고 Sharpness-Aware Minimization 기법을 적용한 새로운 연방 추천 프레임워크인 FedRecGEL 을 제안합니다.
이 논문은 추론 모델의 긴 출력 시 발생하는 KV 캐시 메모리 및 대역폭 부담을 해결하기 위해, 계산 오버헤드 없이 효율적인 중요도 추정을 통해 80% 의 KV 캐시 압축과 최대 11.8 배의 처리량 향상을 달성하는 'LongFlow'를 제안합니다.
이 논문은 나노포토닉 소자의 제조 공정에서 발생하는 비균일한 변형을 예측하고 불확실성을 모델링하기 위해, 설계 레이아웃을 입력받아 다양한 고해상도 제조 결과를 생성하는 조건부 생성적 적대 신경망 (cGAN) 기반의 'Gen-Fab'을 제안하고, 기존 방법들보다 우수한 정확도와 일반화 성능을 입증했습니다.
이 논문은 사용자 활동과 민감한 정보를 잠재 공간에서 분리하여 사용자가 조절 가능한 프라이버시를 제공하는 CFD 기반 HAR 과 라벨 효율성은 높지만 프라이버시 보호 기능이 부재한 오토인코더 기반 Few-shot HAR 을 비교 분석하여, 차세대 IoT 시스템이 프라이버시, 적응성, 견고성을 모두 충족하는 통합 프레임워크 개발의 필요성을 강조합니다.
이 논문은 실제 플랫폼의 검색 행동 분석을 동기부여로 하여, 확률적 순서 제약을 혼합 정수 볼록 2 차 최적화 문제로 공식화하여 여러 이산 단봉 분포를 동시에 추정하는 방법을 제안하고, 소규모 샘플에서 기존 방법 대비 성능을 향상시킴을 실험을 통해 입증했습니다.