Compression Favors Consistency, Not Truth: When and Why Language Models Prefer Correct Information
이 논문은 언어 모델이 진실을 추구하는 것이 아니라, 훈련 데이터에 대한 더 짧고 일관된 설명을 압축하려는 압력으로 인해 결과적으로 올바른 정보를 선호하는 경향이 나타난다는 '압축 - 일관성 원칙'을 제안하고 실험을 통해 입증합니다.
8078 편의 논문
이 논문은 언어 모델이 진실을 추구하는 것이 아니라, 훈련 데이터에 대한 더 짧고 일관된 설명을 압축하려는 압력으로 인해 결과적으로 올바른 정보를 선호하는 경향이 나타난다는 '압축 - 일관성 원칙'을 제안하고 실험을 통해 입증합니다.
이 논문은 관측 공간의 가능도 최대화의 한계를 극복하기 위해 조건부 정규화 흐름의 잠재 공간에 명시적 유도 편향을 도입하여 시간적 역학의 위배를 통계적 적합도 검정으로 정의함으로써, 고가능도 영역에서도 효과적으로 이상을 탐지하고 해석 가능한 진단을 제공하는 새로운 프레임워크를 제안합니다.
이 논문은 보상에 대한 정보 없이도 다른 에이전트의 행동만을 관찰하여 그들의 전문성을 추정하고 이를 개인 경험과 통합함으로써 비전문가 및 다양한 에이전트 집단에서도 최적 정책을 수렴하고 로그 후회 (logarithmic regret) 를 달성하는 자유 에너지 기반의 사회적 밴딧 학습 알고리즘을 제안합니다.
이 논문은 위키데이터의 한정자 (qualifiers) 사용과 의미 분석을 바탕으로 빈도와 다양성을 고려한 수정된 섀넌 엔트로피 지수를 적용하여, 한정자 선정과 질의, 추론을 지원하기 위한 새로운 분류 체계를 제시합니다.
이 논문은 동적 환경에서 LLM 에이전트의 장기 기억 시스템이 직면한 위험을 분석하고, 일관성 검증 및 동적 접근 제어 등을 통해 기억의 안정성과 안전성을 보장하는 '안정성 및 안전성 기반 기억 (SSGM)' 프레임워크를 제안합니다.
이 논문은 신경망과 계층적 분류 체계를 결합한 자동 텍스트 분류 도구인 NETHIC 을 소개하고, 문서 임베딩 메커니즘을 추가하여 성능을 개선한 결과를 제시합니다.
이 논문은 투표나 비구조적 토론을 넘어 역할과 유형화된 논증 행위를 가진 다중 에이전트 LLM 시스템이 책임 있는 결정을 내릴 수 있도록 설계된 '심의적 집단 지성 (DCI)' 프레임워크를 제안하고, 비일상적 및 숨겨진 프로필 과제에서 기존 방법보다 우수한 성과를 보이지만 높은 비용과 일관된 단일 에이전트 성능 우위로 인해 특정 상황에만 적용 가능함을 입증합니다.
이 논문은 원격 탐사 이미지의 복잡한 계층적 레이블 의존성을 해결하고 레이블이 없는 데이터를 활용하여 저레이블 환경에서도 최첨단 성능을 달성하는 새로운 프레임워크인 HELM 을 제안합니다.
이 논문은 기계적 해석 가능성 기법을 활용하여 CLIP 비전 인코더 내의 인구통계학적 편향을 개별 어텐션 헤드 수준에서 국소화하고, 특히 성별 편향은 특정 헤드를 제거함으로써 완화할 수 있음을 실증합니다.
이 논문은 여러 문서와 개체에 걸친 질문 응답의 한계를 극복하기 위해 동적 스키마 발견, 구조화된 정보 추출, 스키마 인식 추론을 통합한 에이전트 프레임워크 'DocSage'를 제안하고, 이를 통해 기존 LLM 및 RAG 시스템 대비 27% 이상의 정확도 향상을 달성했음을 보여줍니다.
이 논문은 통신 불확실성이 있는 환경에서 협력적 다중 에이전트 제어를 위한 새로운 프레임워크인 SDec-POMDP 와 이를 해결하는 최적 알고리즘 RS-SDA*를 제안하며, 이를 통해 다양한 다중 에이전트 통신 문제를 체계적으로 분석할 수 있는 이론적 기반을 마련합니다.
이 논문은 GitHub 의 오픈소스 에이전트 저장소를 대규모로 마이닝하여 시각화 및 교육 기능을 포함한 고수준 절차적 지식을 자동 추출하고 표준화함으로써, 모델 재학습 없이 대형 언어 모델의 자율 워크플로우 능력을 확장하는 프레임워크를 제시합니다.
이 논문은 인간의 개입 없이 비전 - 언어 모델, 그래프 신경망 정책, 자동 성공 평가 및 비동기적 환경 재설정 메커니즘을 통합하여 로봇 학습을 위한 대규모 물리적 상호작용 데이터를 자율적으로 생성하는 폐루프 시스템 'RADAR'를 제안합니다.
이 논문은 장기 교통 예측 시 발생하는 계산 비용 증가와 복잡한 시공간 의존성 문제를 해결하기 위해, 시간적 프레임을 단일 그래프로 통합하는 '시간 접이 그래프'와 노드 가시성 메커니즘을 도입한 VisiFold 프레임워크를 제안하여 기존 방법들보다 자원 효율성과 예측 정확도를 동시에 향상시켰음을 보여줍니다.
본 논문은 Mendeley 의 조직병리학 데이터셋을 활용하여 LeNet-5, ResNet, VGGNet, GoogLeNet 등 15 가지 딥러닝 변형 모델을 비교 분석하고, LIME, Integrated Gradients, SHAP 등의 설명 가능한 인공지능 (XAI) 기법을 적용하여 난소 암 악성 병변의 자동 탐지 정확도를 94% 로 높인 연구 결과를 제시합니다.
이 논문은 에너지 수요 관리라는 사회적 딜레마 상황에서 인공지능 에이전트가 도입될 때 협력이 어떻게 촉진되는지, 그리고 초기 단계의 부분적 도입이 전체 시스템과 비도입자에게 미치는 비대칭적 영향을 진화 역학 및 강화 학습을 통해 분석합니다.
이 논문은 고권한 LLM 에이전트가 외부 문서에 숨겨진 악성 지시를 신뢰할 수 있는 실행자로 간주하여 실행함으로써 발생하는 구조적 취약점 '신뢰받는 실행자 딜레마'를 규명하고, 이를 통해 문서 기반 지시 주입 공격이 현재까지 효과적인 방어책 없이 심각한 데이터 유출 위협으로 남아있음을 입증합니다.
이 논문은 기계 창의성을 정량적으로 평가하기 위한 벤치마크인 CreativeBench 를 제안하고, 모델 확장 시 창의성 유형별 상이한 패턴을 분석하며 EvoRePE 라는 추론 시간 전략을 통해 기계 창의성을 지속적으로 향상시키는 방법을 제시합니다.
이 논문은 고위험 분야에서 AI 에이전트의 사회적, 법적, 윤리적, 공감적, 문화적 규범 (SLEEC) 을 추상적 원칙에서 검증 가능한 구체적 요구사항으로 전환하는 체계적인 운영화 프로세스와 연구 의제를 제시합니다.
이 논문은 scGPT 임베딩과 BioBERT 기반 의미 검색, LLM 해석을 통합하여 단일 세포 RNA 시퀀싱 데이터를 직접 분석하고 생물학적 가설을 생성하는 해석 가능한 하이브리드 생성 AI 에이전트 'ELISA'를 제안합니다.