cs.AI 편의 논문 | Gist.Science

ReHARK: Refined Hybrid Adaptive RBF Kernels for Robust One-Shot Vision-Language Adaptation

이 논문은 CLIP 과 같은 대규모 비전 - 언어 모델의 원샷 적응 시 발생하는 안정성 - 가소성 딜레마를 해결하기 위해, 전역 근접 정규화와 하이브리드 사전 지식, 지원 세트 증강, 적응형 분포 보정, 다중 스케일 RBF 커널을 결합한 훈련 없는 프레임워크 'ReHARK'를 제안하여 11 개 벤치마크에서 기존 방법들을 압도하는 새로운 최첨단 성능을 달성했다고 요약할 수 있습니다.

Md Jahidul Islam2026-03-13🤖 cs.AI

One Supervisor, Many Modalities: Adaptive Tool Orchestration for Autonomous Queries

이 논문은 텍스트, 이미지, 오디오, 비디오 등 다양한 모달리티에 특화된 도구들을 중앙 집중형 'Supervisor'가 동적으로 조정하여 처리하는 에이전트 AI 프레임워크를 제안하며, 이를 통해 기존 계층적 기준 대비 응답 시간과 대화 재작업, 비용을 대폭 절감하면서도 정확도를 유지하는 것을 입증했습니다.

Mayank Saini Arit Kumar Bishwas2026-03-13💬 cs.CL

MANSION: Multi-floor lANguage-to-3D Scene generatIOn for loNg-horizon tasks

이 논문은 실제 세계의 복잡한 다층 환경과 장기 작업을 평가하기 위해 언어 기반의 전체 건물 규모 3D 장면 생성 프레임워크인 'MANSION'과 이를 활용한 대규모 데이터셋 'MansionWorld'를 제안합니다.

Lirong Che, Shuo Wen, Shan Huang, Chuang Wang, Yuzhe Yang, Gregory Dudek, Xueqian Wang, Jian Su2026-03-13🤖 cs.AI

RoboClaw: An Agentic Framework for Scalable Long-Horizon Robotic Tasks

이 논문은 데이터 수집, 정책 학습, 실행을 단일 VLM 기반 에이전트로 통합하고 자기 재설정 루프를 통해 장기적 로봇 작업의 안정성과 확장성을 획기적으로 개선한 'RoboClaw' 프레임워크를 제안합니다.

Ruiying Li, Yunlang Zhou, YuYao Zhu, Kylin Chen, Jingyuan Wang, Sukai Wang, Kongtao Hu, Minhui Yu, Bowen Jiang, Zhan Su, Jiayao Ma, Xin He, Yongjian Shen, Yangyang, Guanghui Ren, Maoqing Yao, Wenhao Wang, Yao Mu2026-03-13🤖 cs.AI

AI Knows What's Wrong But Cannot Fix It: Helicoid Dynamics in Frontier LLMs Under High-Stakes Decisions

본 논문은 고위험 의사결정 상황에서 대형 언어 모델들이 오류를 정확히 인지함에도 불구하고 동일한 실수를 고도화된 형태로 반복하는 '나선형 동역학 (Helicoid dynamics)' 현상을 확인하고, 이를 해결하기 위한 12 가지 가설과 인간-AI 협력의 새로운 방향을 제시합니다.

Alejandro R Jadad2026-03-13🤖 cs.AI

How Intelligence Emerges: A Minimal Theory of Dynamic Adaptive Coordination

이 논문은 최적화나 학습 중심의 접근을 넘어, 지속적 환경과 분산 인센티브 필드가 결합된 폐루프 피드백 구조를 통해 중앙 집중적 설계나 합리적 기대 없이도 적응적 조정이 어떻게 구조적 속성으로 나타나는지 설명하는 동적 이론을 제시합니다.

Stefano Grassi2026-03-13📈 econ

UtilityMax Prompting: A Formal Framework for Multi-Objective Large Language Model Optimization

이 논문은 다중 목표 최적화 문제를 해결하기 위해 자연어 프롬프트 대신 수학적 형식 언어와 효용 함수를 기반으로 한 'UtilityMax Prompting' 프레임워크를 제안하고, 영화 추천 태스크에서 기존 자연어 기반 방법보다 정밀도와 NDCG 성능이 향상됨을 검증했습니다.

Ofir Marom2026-03-13💬 cs.CL

Toward Complex-Valued Neural Networks for Waveform Generation

이 논문은 복소수 연산을 기반으로 한 생성기와 판별자, 위상 양자화, 그리고 블록 행렬 계산 기법을 도입하여 기존 실수 기반 모델보다 더 높은 음질과 25% 의 훈련 시간 단축을 달성한 새로운 복소수 신경 보코더 'ComVo'를 제안합니다.

Hyung-Seok Oh, Deok-Hyeon Cho, Seung-Bin Kim, Seong-Whan Lee2026-03-13🤖 cs.AI

Leveraging Large Language Models and Survival Analysis for Early Prediction of Chemotherapy Outcomes

이 논문은 대규모 언어 모델 (LLM) 과 생존 분석을 결합하여 실제 임상 데이터에서 암 진행 및 독성 같은 예측 변수를 추출하고, 이를 통해 화학요법 치료 결과를 조기에 예측하여 개인화된 치료 계획 수립을 가능하게 하는 새로운 접근법을 제시합니다.

Muhammad Faisal Shahid, Asad Afzal, Abdullah Faiz, Muhammad Siddiqui, Arbaz Khan Shehzad, Fatima Aftab, Muhammad Usamah Shahid, Muddassar Farooq2026-03-13🤖 cs.AI

Performance Evaluation of Open-Source Large Language Models for Assisting Pathology Report Writing in Japanese

이 논문은 7 가지 오픈소스 대규모 언어 모델 (LLM) 을 평가하여, 추론과 오타 수정 작업에서는 특정 모델이 우수했으나 설명 텍스트에 대한 선호도는 평가자에 따라 크게 달라, 일본어 병리 보고서 작성 보조를 위해 오픈소스 LLM 이 제한적이지만 임상적으로 의미 있는 시나리오에서 유용할 수 있음을 시사합니다.

Masataka Kawai, Singo Sakashita, Shumpei Ishikawa, Shogo Watanabe, Anna Matsuoka, Mikio Sakurai, Yasuto Fujimoto, Yoshiyuki Takahara, Atsushi Ohara, Hirohiko Miyake, Genichiro Ishii2026-03-13💬 cs.CL

Survival Meets Classification: A Novel Framework for Early Risk Prediction Models of Chronic Diseases

이 논문은 당뇨병, 고혈압 등 5 가지 주요 만성질환의 조기 위험 예측을 위해 생존 분석과 분류 기법을 통합한 새로운 프레임워크를 제안하며, 실제 전자의무기록 (EMR) 데이터를 통해 기존 최첨단 모델보다 우수한 성능과 임상적으로 검증된 설명 가능성을 입증했습니다.

Shaheer Ahmad Khan, Muhammad Usamah Shahid, Muddassar Farooq2026-03-13🤖 cs.LG

See, Symbolize, Act: Grounding VLMs with Spatial Representations for Better Gameplay

이 논문은 비전 - 언어 모델 (VLM) 의 게임 플레이 성능 향상을 위해 시각적 프레임과 상징적 표현을 결합하는 방식을 연구한 결과, 상징 추출의 정확도가 신뢰할 수 있을 때만 상징적 그라운딩이 효과적이며, 인식의 질이 향후 VLM 기반 에이전트의 핵심 병목 요소임을 밝혔습니다.

Ashish Baghel, Paras Chopra2026-03-13🤖 cs.AI

Taming OpenClaw: Security Analysis and Mitigation of Autonomous LLM Agent Threats

이 논문은 오토노머스 LLM 에이전트인 OpenClaw 의 보안 위협을 분석하기 위해 초기화부터 실행까지의 5 단계 수명 주기 프레임워크를 제시하고, 간접 프롬프트 인젝션 및 메모리 중독 등 복합적 위협을 규명하며 기존 방어 기법의 한계를 지적하고 통합적 보안 아키텍처의 필요성을 강조합니다.

Xinhao Deng, Yixiang Zhang, Jiaqing Wu, Jiaqi Bai, Sibo Yi, Zhuoheng Zou, Yue Xiao, Rennai Qiu, Jianan Ma, Jialuo Chen, Xiaohu Du, Xiaofang Yang, Shiwen Cui, Changhua Meng, Weiqiang Wang, Jiaxing Song, Ke Xu, Qi Li2026-03-13🤖 cs.AI

The Density of Cross-Persistence Diagrams and Its Applications

이 논문은 교차 지속성 다이어그램의 밀도 존재성을 증명하고, 이를 점 구름 데이터의 분포 예측 및 구분에 활용하는 최초의 머신러닝 프레임워크를 제안하여 기존 기법보다 우수한 성능을 입증합니다.

Alexander Mironenko, Evgeny. Burnaev, Serguei Barannikov2026-03-13🤖 cs.AI

MedPruner: Training-Free Hierarchical Token Pruning for Efficient 3D Medical Image Understanding in Vision-Language Models

이 논문은 3D 의료 영상 이해를 위한 비효율적인 계산 과부하를 해결하기 위해, 슬라이드 수준 및 토큰 수준의 중복성을 제거하는 훈련 불필요 계층적 토큰 가지치기 프레임워크 'MedPruner'를 제안하며, 이를 통해 시각 토큰을 5% 미만으로 줄이면서도 성능을 유지하거나 향상시킬 수 있음을 입증했습니다.

Shengyuan Liu, Zanting Ye, Yunrui Lin, Chen Hu, Wanting Geng, Xu Han, Bulat Ibragimov, Yefeng Zheng, Yixuan Yuan2026-03-13🤖 cs.AI

← 이전 다음 →

cs.AI