Telogenesis: Goal Is All U Need
이 논문은 외부 목표 없이도 무지, 놀라움, 경시라는 세 가지 인식적 격차에서 내생적으로 주의를 생성하는 '텔로제네시스' 메커니즘을 제안하여, 고정된 전략보다 우수한 적응적 우선순위를 형성하고 환경의 잠재적 구조를 무감독으로 복원할 수 있음을 입증했습니다.
2393 편의 논문
이 논문은 외부 목표 없이도 무지, 놀라움, 경시라는 세 가지 인식적 격차에서 내생적으로 주의를 생성하는 '텔로제네시스' 메커니즘을 제안하여, 고정된 전략보다 우수한 적응적 우선순위를 형성하고 환경의 잠재적 구조를 무감독으로 복원할 수 있음을 입증했습니다.
이 논문은 대규모 언어 모델 (LLM) 을 활용한 진화 알고리즘을 통해 PDDL 로 기술된 고전적 계획 작업에 대해 다양한 문제 인스턴스에서 최적의 해결책을 생성하는 일반화된 계획자 'GenePlan'을 제안하며, 기존 최첨단 계획자와 유사한 성능을 보이고 다른 LLM 기반 방법론보다 월등히 우수한 결과를 입증했습니다.
이 논문은 인간과 생성형 AI 의 상호작용이 단순한 도구 사용이나 협력을 넘어 '제 3 의 존재'라는 새로운 인지 - 인식론적 형식을 창출하며, 이를 '분위기 창조 (vibe-creation)'와 '비대칭적 창발' 개념으로 설명하고 교육 및 지적 역량 재정의에 대한 함의를 제시합니다.
이 논문은 이전 관측치에 기반한 조건부 정규화 흐름 (tcNF) 을 제안하여 시계열 데이터의 복잡한 시간적 의존성과 불확실성을 정밀하게 모델링함으로써 기존 방법보다 우수한 정확도와 강건성을 갖춘 다변량 시계열 이상 탐지 프레임워크를 제시합니다.
이 논문은 사전 학습된 비전 - 언어 모델의 지식을 유지하면서 소량의 데이터로 안정적으로 적응할 수 있도록 프롬프트의 진화 경로를 제어하는 새로운 프레임워크인 EvoPrompt 를 제안합니다.
이 논문은 타겟 모델의 미세 조정으로 인한 성능 저하를 해결하기 위해 공유 및 비공유 구성 요소를 분리하고, 미세 조정된 타겟 모델을 활용한 데이터 재생성 및 고가치 데이터 선별을 통해 파라미터와 데이터 효율성을 극대화하는 '효율적인 초안 적응 (EDA)' 프레임워크를 제안합니다.
이 논문은 빅 5 성격 특성에 기반한 프롬프트를 통해 대형 언어 모델 (LLM) 이 가짜 뉴스에 대한 맞춤형 debunking 메시지를 생성하고, 또 다른 LLM 을 자동 평가자로 활용해 일반적 메시지보다 설득력이 높음을 입증하는 동시에 윤리적 문제도 제기합니다.
이 논문은 Mamba-2 의 상태 공간 이중성 알고리즘을 XLA 의 퓨전 및 타일링 최적화에 매핑하여 커스텀 커널 없이 CPU, NVIDIA GPU, Google Cloud TPU 등 다양한 하드웨어에서 자동회귀 캐싱을 지원하는 포터블 컴파일러 기반 구현을 제시합니다.
이 논문은 온라인 연속 학습 환경에서 반복적인 최적화 없이 단일 단계의 연관성 기반 검색을 통해 동적 프롬프트를 생성함으로써 기존 프롬프트 기반 방법보다 뛰어난 성능을 보이는 '잊지 않는 라우팅 (Routing without Forgetting)'이라는 새로운 트랜스포머 아키텍처를 제안합니다.
이 논문은 에너지 보존과 극값 작용 원리를 기반으로 시간 연속 신경망의 역전파 (BPTT) 를 생물학적으로 타당한 국소적 방식으로 근사하는 새로운 변분 잠재 평형 프레임워크를 제시하여 뇌의 시공간 학습 메커니즘과 물리적 회로 구현을 위한 청사진을 제공합니다.
이 논문은 프롬프트 엔지니어링의 한계를 넘어 기업용 다중 에이전트 시스템의 성숙도를 위한 새로운 패러다임으로 '컨텍스트 엔지니어링'을 제안하고, 이를 의도 엔지니어링과 명세 엔지니어링과 함께 에이전트 엔지니어링의 피라미드 성숙도 모델로 정립합니다.
이 논문은 원격 탐사 분야에서 생성 모델, 시맨틱 분할, 이미지 캡셔닝을 결합하여 해석 가능한 합성 데이터 증강 및 평가를 가능하게 하는 'ARAS400k'라는 대규모 데이터셋과 프레임워크를 제안하며, 이를 통해 합성 데이터와 실데이터를 함께 학습한 모델이 기존 실데이터 기반 모델보다 우수한 성능을 보임을 입증했습니다.
이 논문은 LLM 에이전트의 지식 검색 저하, 규칙 조합 실패, 그리고 노후화된 지식 탐지 부재 문제를 해결하기 위해, 결정론적 규칙 검색, 충돌 인식 메모리, 그리고 파레토 기반 프롬프트 진화를 통합한 테스트 시간 적응 프레임워크인 PRECEPT 를 제안하고, 이를 통해 기존 방법 대비 우수한 성능과 강건성을 입증합니다.
이 논문은 GPT-5 와 같은 최첨단 LLM 을 포함한 멀티모달 에이전트의 강건성을 평가하기 위해 사용자 페르소나 적응과 이중 제어 환경을 고려한 12 개의 새로운 지표를 제시하는 'MM-tau-p' 벤치마크를 제안합니다.
이 논문은 대규모 언어 모델 (LLM) 이 정적 텍스트에서 인터랙티브 HTML 애플리케이션 (MiniApp) 생성으로 전환됨에 따라 기존 벤치마크의 한계를 극복하기 위해, 실제 데이터로 구축된 'MiniAppBench'와 인간 판단과 높은 일치도를 보이는 에이전트 평가 프레임워크 'MiniAppEval'을 제안하고 현재 모델의 한계를 규명합니다.
이 논문은 배경 일관성을 유지하면서 전경 품질을 향상시키기 위해, 할루시네이션 감지를 통해 캐시된 배경 키 - 값과 생성된 키 - 값의 융합 비율 및 CFG 스케일을 동적으로 조절하는 훈련 불필요 KV-Lock 프레임워크를 제안합니다.
이 논문은 그래프 신경망 (GNN) 을 활용한 시계열 이상 탐지를 위한 오픈소스 프레임워크를 제시하고, 이를 통해 GNN 기반 모델이 탐지 성능과 해석 가능성 측면에서 우수하며 평가 방법론의 개선이 필요함을 비판적으로 분석합니다.
이 논문은 문서, 이미지, 오디오·비주얼 스트림의 이질적인 비정형 데이터를 기계가 읽을 수 있는 구조화된 지식으로 변환하기 위해, 전역적 감지에서 국소적 인식, 논리적 해석까지 이어지는 계층적 파싱 프레임워크인 '오미 파싱 (Omni Parsing)'과 이를 검증하는 벤치마크 및 모델을 제안합니다.
이 논문은 대규모 언어 모델이 기존 코드 생성 벤치마크에서 높은 점수를 얻는 것이 단순 암기에 불과할 수 있음을 지적하며, 데이터 오염 가능성이 낮은 에소테릭 프로그래밍 언어를 활용한 'EsoLang-Bench'를 통해 모델들의 진정한 추론 능력을 평가했을 때 기존 벤치마크 점수와 극명하게 대비되는 낮은 성능을 확인했다고 요약할 수 있습니다.
본 논문은 3,482 명의 노인 환자 데이터를 활용하여 비구조화된 전자의무기록 (EHR) 을 기반으로 심혈관 위험을 자동 분류하는 프레임워크를 제안하고, 기존 기계학습 및 생성형 LLM 보다 장기 의존성을 포착하는 맞춤형 트랜스포머 아키텍처가 가장 우수한 성능을 보임을 입증했습니다.