Stronger Enforcement of Instruction Hierarchy via Augmented Intermediate Representations
이 논문은 대규모 언어 모델의 프롬프트 주입 공격을 방어하기 위해, 기존에 입력층에만 적용되던 명령어 계층 신호를 네트워크의 중간 레이어 표현에도 주입하는 새로운 방식을 제안하여 공격 성공률을 획기적으로 낮추고 모델의 유용성을 유지함을 보여줍니다.
2462 편의 논문
이 논문은 대규모 언어 모델의 프롬프트 주입 공격을 방어하기 위해, 기존에 입력층에만 적용되던 명령어 계층 신호를 네트워크의 중간 레이어 표현에도 주입하는 새로운 방식을 제안하여 공격 성공률을 획기적으로 낮추고 모델의 유용성을 유지함을 보여줍니다.
이 논문은 고차 공통 이웃의 중복성과 과부드러짐 문제를 해결하기 위해 직교화와 정규화 기법을 도입한 '직교 공통 이웃 (OCN)'을 제안하여 링크 예측 성능을 획기적으로 향상시켰음을 보여줍니다.
이 논문은 원자 기반 기초 모델 (AFM) 의 중간 특징을 활용하여 단백질의 국소 환경을 효과적으로 표현하는 새로운 방식을 제안하고, 이를 통해 국소 구조와 화학적 특성을 포착하는 동시에 NMR 화학 이동 예측에서 최첨단 정확도를 달성하는 물리 기반 예측기를 개발했음을 보여줍니다.
이 논문은 전문가 수준의 테이블 이해, 추론, 조작 능력을 포괄적으로 평가하기 위해 25 가지 실제 태스크와 28,000 개 이상의 질문으로 구성된 대규모 벤치마크인 MMTU 를 소개하고, 최신 선두 모델들조차 이 작업에서 상당한 개선의 여지가 있음을 보여줍니다.
이 논문은 AMP 모듈과 Multi-Envelope Discriminator(MED) 를 도입하여 장기간 오디오 생성의 일관성과 고음질을 향상시키고, 다양한 판별자 조합 전략을 체계적으로 평가한 BemaGANv2 를 제안합니다.
이 논문은 데이터와 모델의 이질성을 모두 고려하여 개인화 연동 학습의 현실적 적용을 가능하게 하는 'Co-LoRA' 프레임워크와 새로운 멀티모달 벤치마크를 제안하고, 이를 통해 기존 방법론보다 우수한 성능을 입증했습니다.
이 논문은 노이즈가 있는 3D 환경에서 고전적 계획과 LLM 을 융합하여 목표의 실현 가능성을 점진적으로 완화하는 'ContextMatters' 프레임워크를 제안함으로써, 기존 방법론 대비 성공률을 52.45% 향상시키고 실제 로봇 (TIAGo) 에 적용 가능한 효율적인 3D 장면 계획을 가능하게 합니다.
이 논문은 밀집된 작물 이미지에서 수동 주석을 최소화하면서도 형태와 질감에 초점을 맞춘 GLMask 를 도입하여 인스턴스 분할 성능을 획기적으로 향상시키는 반-자기지도 학습 접근법을 제안합니다.
이 논문은 DPO(직접 선호도 최적화) 과정 중 모델의 학습 상태 변화에 따라 배치 단위로 샘플을 동적으로 선택하는 'SamS' 알고리즘을 제안하여, 핵심 알고리즘을 수정하지 않고도 추가적인 계산 비용 없이 LLM 의 정렬 성능을 크게 향상시키는 새로운 방향을 제시합니다.
이 논문은 보상 함수를 프롬프트에 명시하여 모델이 최적화 목표를 인지하도록 하는 '동기 부여 강화 미세 조정 (MeRF)' 방법을 제안함으로써, 기존 검증 가능 보상을 활용한 강화 학습의 비효율성을 극복하고 대형 추론 모델의 성능을 크게 향상시킨다고 설명합니다.
이 논문은 저전력 청각 기기 (Hearables) 에서 아날로그 - 디지털 변환기의 샘플링 주파수와 비트 해상도를 의도적으로 낮추어 전력 소모를 3.31 배 감소시키면서도, 서브-나이퀴스트 샘플링 신호를 광대역으로 복원하는 SUBARU 기법을 통해 실시간 음성 향상 성능을 유지하는 실용적인 접근법을 제안합니다.
이 논문은 사전 훈련된 잠재 확산 모델과 다중 모달 이해 모델을 활용하여 데이터셋 없이도 다양한 저해상도 이미지 복원 작업을 통합적으로 수행하는 새로운 제로샷 방법인 LD-RPS 를 제안하고, 반복적 사후 샘플링을 통해 기존 방법들을 능가하는 성능을 입증합니다.
이 논문은 노이즈가 있는 데이터로 물리 정보 신경망 (PINN) 을 학습할 때, 학습 오차가 노이즈 분산 이하로 떨어지려면 네트워크 크기가 특정 임계값을 넘어야 하며 단순히 데이터 양만 늘리는 것은 효과가 없음을 이론적 하한과 실험을 통해 규명했습니다.
이 논문은 센서 고장이나 개인정보 보호로 인한 불완전한 멀티모달 데이터의 감정 인식 성능 저하 문제를 해결하기 위해, 모달리티 조합별 특성을 고려한 저랭크 적응 기법 (MCLA) 과 표현 공간의 분리 가능성을 기반으로 동적 파라미터 미세 조정을 수행하는 (DPFT) 새로운 프레임워크인 MCULoRA 를 제안하여 기존 방법보다 뛰어난 성능을 입증했습니다.
이 논문은 MLLM 검증기에서 발생하는 '동의 편향 (agreement bias)'을 해결하기 위해 사전 지식을 생성한 후 이를 기반으로 추론하는 '자기 기반 검증 (SGV)' 방법을 제안함으로써, 에이전트의 실패 감지 정확도와 태스크 완료율을 기존 최첨단 성능보다 크게 향상시켰다고 설명합니다.
이 논문은 다중 스케일 구조적 이질성으로 인한 기존 의료 영상 분할의 한계를 극복하기 위해 상태 공간 모델을 활용한 'Mamba Snake'를 제안하여, 장기 간 위상적 관계와 미세한 윤곽 정제를 동시에 최적화함으로써 최첨단 방법론 대비 평균 3% 의 Dice 점수 개선을 달성했다고 요약할 수 있습니다.
이 논문은 X-ray 비파괴 검사에서 기존 딥러닝 방식의 한계를 극복하고, SDMSD 탐지기와 증거 기반 반성 (EGR) 도구를 LMM 에이전트가 조율하여 높은 정확도와 해석 가능성을 갖춘 신뢰할 수 있는 분석을 제공하는 'InsightX Agent' 프레임워크를 제안합니다.
본 논문은 손실된 지상 데이터가 부족한 재해 상황에서 TASA 의 EVAP 제품을 보완하기 위해 Sentinel-2 와 Formosat-5 영상을 활용하고 PCA 기반 약지도 학습을 통해 확장된 라벨로 훈련된 비전 트랜스포머 (ViT) 기반 모델을 제안하여 재해 피해 지역 분할의 정확성과 공간적 일관성을 향상시켰음을 보여줍니다.
이 논문은 생물학 및 생명과학 분야에서 유체 매칭 (Flow Matching) 의 기초와 변형, 그리고 생물학적 서열 모델링, 분자 생성 및 설계, 펩타이드 및 단백질 생성에 대한 응용을 체계적으로 검토하고 향후 방향을 제시하는 최초의 포괄적인 조사 연구입니다.
이 논문은 대화형 AI 에서 사용자 시뮬레이터의 일관된 목표 달성 능력을 향상시키기 위해 사용자 목표 상태 추적 (UGST) 프레임워크와 3 단계 개발 방법론을 제안하고, 이를 통해 MultiWOZ 2.4 와 -Bench 벤치마크에서 목표 정렬 성능을 크게 개선했음을 보여줍니다.