LLMs can construct powerful representations and streamline sample-efficient supervised learning
이 논문은 LLM 이 소량의 데이터로 전역 및 로컬 규칙을 생성하여 복잡한 임상 데이터를 표준화함으로써, 기존 모델보다 우수한 성능과 감사 용이성, 확장성을 갖춘 효율적인 지도 학습 파이프라인을 제안합니다.
3834 편의 논문
이 논문은 LLM 이 소량의 데이터로 전역 및 로컬 규칙을 생성하여 복잡한 임상 데이터를 표준화함으로써, 기존 모델보다 우수한 성능과 감사 용이성, 확장성을 갖춘 효율적인 지도 학습 파이프라인을 제안합니다.
이 논문은 정책 경사 알고리즘이 학습 과정에서 엔트로피가 감소하여 탐색 다양성이 저하되는 문제를 지적하고, REPO 와 ADAPO 와 같은 엔트로피 보존 메커니즘을 제안하여 학습 중 다양성을 유지함으로써 최종 성능과 새로운 환경에서의 연속 학습 능력을 향상시키는 방법을 제시합니다.
이 논문은 FastSpeech2 아키텍처에 명시적인 감정 조건부와 반사실적 훈련 목표를 도입하여 텍스트, 감정, 화자가 말초리 (지속 시간, 피치, 에너지) 를 통해 음성 파형에 미치는 인과적 관계를 모델링함으로써, 언어적 내용과 감정적 프로소디를 분리하고 자연스러운 감정 표현과 정교한 프로소디 제어가 가능한 새로운 TTS 프레임워크를 제안합니다.
이 논문은 사전 정의와 문장 인코더만을 활용하여 자동적으로 생성되는 경량화되고 언어에 구애받지 않는 SemBench 프레임워크를 제안함으로써, 대규모 언어 모델의 의미적 이해 능력을 다양한 언어와 모델에 걸쳐 효율적으로 평가할 수 있음을 보여줍니다.
이 논문은 블랙박스 형태의 멀티모달 대규모 언어 모델 (MLLM) 의 제로샷 작업 성능을 검증하고 향상시키기 위해, 명시적 논리 추론 채널을 도입하여 일관성 지표를 통한 모델 선택과 신뢰할 수 있는 성능 개선을 가능하게 하는 프레임워크를 제안합니다.
이 논문은 다양한 에이전트 수와 미시적 관측 환경에서 장기적 시간 의존성과 에이전트 간 협력을 효과적으로 포착하기 위해 공간 및 시간 계층 구조와 인터리브드 재귀적 구조를 도입한 STAIRS-Former 를 제안하고, 이를 통해 오프라인 다중 작업 다중 에이전트 강화학습에서 기존 방법들을 능가하는 새로운 최고 성능을 달성했음을 보여줍니다.
이 논문은 텍스트 기반 비디오 생성 모델의 객체 상태 변화 (OSC) 능력을 평가하기 위해 요리 데이터를 기반으로 한 새로운 벤치마크인 OSCBench 를 제안하고, 기존 모델들이 의미적 정합성은 우수하지만 새로운 및 복합적인 상황에서의 객체 상태 변화 구현에는 여전히 한계가 있음을 밝힙니다.
이 논문은 모델 크기뿐만 아니라 역할 정의, 기술 깊이, 도구 완성도 등 구조적 차원을 체계적으로 확장하는 '에이전트 스케일링 법칙'을 제안하고, 이를 구현한 EduClaw 플랫폼을 통해 교육용 AI 에이전트의 성능이 프로필의 구조적 풍부함에 따라 예측 가능하게 향상됨을 실증합니다.
이 논문은 발화 및 무성 발화 중 얼굴과 목의 표면 근전도 (sEMG) 신호를 분석하여 좌절감을 포함한 감정을 0.845 AUC 의 정확도로 식별할 수 있음을 입증하고, 무성 발화에서도 감정 신호가 유지됨을 보여줌으로써 감성 인식 무성 발화 인터페이스의 가능성을 제시합니다.
이 논문은 안전성, 투명성, 감사 가능성을 보장하기 위해 제한된 실행 환경, 문서 중심 상호작용, 페이지 인덱싱 메모리, 그리고 커스텀 의료 기술 라이브러리를 통합하여 병원 환경에 적합한 '에이전트 운영체제'를 제안합니다.
이 논문은 정류장 대기 시간 (buffer time) 을 고려할 때 기존 Dijkstra 기반 필터링이 부적합하다는 점을 지적하고, 이를 해결하여 MR 알고리즘보다 2 배 이상 빠른 성능을 내는 '전송 인지 Dijkstra(TAD)' 알고리즘을 제안합니다.
이 논문은 GPT-5 를 활용한 시뮬레이션 연구를 통해 채용 과정에서 성별에 따른 직무 추천 차이는 없었으나, 여성에게는 감정적·공감적 특성을, 남성에게는 전략적·분석적 특성을 부여하는 언어적 편향이 존재함을 발견하고 Generative AI 의 채용 활용에 대한 윤리적 투명성과 공정성의 필요성을 강조합니다.
이 논문은 전력망과 같은 복잡한 시계열 데이터의 노이즈와 이상치를 처리하기 위해 이상 탐지와 결측치 보정을 단일 엔드투엔드 시스템으로 통합한 확률적 프레임워크 'CINDI'를 제안하고, 이를 통해 데이터의 물리적 및 통계적 특성을 보존하면서 강건한 성능을 입증합니다.
이 논문은 언어 모델이 진실을 추구하는 것이 아니라, 훈련 데이터에 대한 더 짧고 일관된 설명을 압축하려는 압력으로 인해 결과적으로 올바른 정보를 선호하는 경향이 나타난다는 '압축 - 일관성 원칙'을 제안하고 실험을 통해 입증합니다.
이 논문은 관측 공간의 가능도 최대화의 한계를 극복하기 위해 조건부 정규화 흐름의 잠재 공간에 명시적 유도 편향을 도입하여 시간적 역학의 위배를 통계적 적합도 검정으로 정의함으로써, 고가능도 영역에서도 효과적으로 이상을 탐지하고 해석 가능한 진단을 제공하는 새로운 프레임워크를 제안합니다.
이 논문은 보상에 대한 정보 없이도 다른 에이전트의 행동만을 관찰하여 그들의 전문성을 추정하고 이를 개인 경험과 통합함으로써 비전문가 및 다양한 에이전트 집단에서도 최적 정책을 수렴하고 로그 후회 (logarithmic regret) 를 달성하는 자유 에너지 기반의 사회적 밴딧 학습 알고리즘을 제안합니다.
이 논문은 위키데이터의 한정자 (qualifiers) 사용과 의미 분석을 바탕으로 빈도와 다양성을 고려한 수정된 섀넌 엔트로피 지수를 적용하여, 한정자 선정과 질의, 추론을 지원하기 위한 새로운 분류 체계를 제시합니다.
이 논문은 동적 환경에서 LLM 에이전트의 장기 기억 시스템이 직면한 위험을 분석하고, 일관성 검증 및 동적 접근 제어 등을 통해 기억의 안정성과 안전성을 보장하는 '안정성 및 안전성 기반 기억 (SSGM)' 프레임워크를 제안합니다.
이 논문은 신경망과 계층적 분류 체계를 결합한 자동 텍스트 분류 도구인 NETHIC 을 소개하고, 문서 임베딩 메커니즘을 추가하여 성능을 개선한 결과를 제시합니다.
이 논문은 투표나 비구조적 토론을 넘어 역할과 유형화된 논증 행위를 가진 다중 에이전트 LLM 시스템이 책임 있는 결정을 내릴 수 있도록 설계된 '심의적 집단 지성 (DCI)' 프레임워크를 제안하고, 비일상적 및 숨겨진 프로필 과제에서 기존 방법보다 우수한 성과를 보이지만 높은 비용과 일관된 단일 에이전트 성능 우위로 인해 특정 상황에만 적용 가능함을 입증합니다.