cs.AI 편의 논문 | Gist.Science

AgentOS: From Application Silos to a Natural Language-Driven Data Ecosystem

이 논문은 기존 운영체제의 한계를 극복하고 자연어 기반의 개인 에이전트 운영체제 (AgentOS) 를 제안하며, 이를 구현하기 위한 핵심 과제를 의도 마이닝과 지식 발견을 위한 실시간 데이터 마이닝 파이프라인 구축으로 정의합니다.

Rui Liu, Tao Zhe, Dongjie Wang, Zijun Yao, Kunpeng Liu, Yanjie Fu, Huan Liu, Jian Pei2026-03-11🤖 cs.AI

BiCLIP: Domain Canonicalization via Structured Geometric Transformation

이 논문은 소수의 앵커를 활용하여 도메인 간 시각 - 언어 특징을 정형화된 기하학적 변환으로 정렬하는 단순하고 매개변수가 적은 BiCLIP 프레임워크를 제안함으로써, 다양한 벤치마크에서 최첨단 성능을 달성하는 도메인 적응 방법을 제시합니다.

Pranav Mantini, Shishir K. Shah2026-03-11🤖 cs.AI

A Consensus-Driven Multi-LLM Pipeline for Missing-Person Investigations

이 논문은 72 시간이라는 골든타임을 활용하여 실종 아동 수색을 지원하기 위해, 여러 특화 LLM 과 합의 엔진을 조율하고 QLoRA 미세조정 기법을 적용한 '가디언' 시스템의 설계와 검증을 제시합니다.

Joshua Castillo, Ravi Mukkamala2026-03-11🤖 cs.AI

Automated Tensor-Relational Decomposition for Large-Scale Sparse Tensor Computation

이 논문은 대규모 희소 텐서 계산을 위해 관계형 시스템의 희소성 처리 능력과 고성능 수치 커널을 결합하여, 기존 에인슈타인 합계 표기법을 자동으로 'EinSum'으로 변환하는 방법을 제시합니다.

Yuxin Tang, Zhiyuan Xin, Zhimin Ding, Xinyu Yao, Daniel Bourgeois, Tirthak Patel, Chris Jermaine2026-03-11🤖 cs.AI

The FABRIC Strategy for Verifying Neural Feedback Systems

이 논문은 신경망 제어 비선형 동적 시스템의 역방향 도달 가능 집합을 계산하는 새로운 알고리즘을 제안하고 이를 기존 순방향 분석과 통합한 'FaBRIC' 전략을 통해 기존 최첨단 기법보다 훨씬 뛰어난 성능을 입증합니다.

I. Samuel Akinwande, Sydney M. Katz, Mykel J. Kochenderfer, Clark Barrett2026-03-11🤖 cs.AI

Semantic Level of Detail: Multi-Scale Knowledge Representation via Heat Kernel Diffusion on Hyperbolic Manifolds

이 논문은 쌍곡 다양체 상의 열 커널 확산을 통해 지식 그래프의 연속적인 해상도 조절을 가능하게 하고, 스펙트럼 갭을 기반으로 자동으로 의미적 추상화 수준을 탐지하는 '의미적 상세도 (SLoD)' 프레임워크를 제안합니다.

Edward Izgorodin2026-03-11🤖 cs.AI

Arbiter: Detecting Interference in LLM Agent System Prompts

이 논문은 LLM 기반 코딩 에이전트의 시스템 프롬프트 간섭 패턴을 탐지하기 위해 공식 평가 규칙과 다중 모델 스캐닝을 결합한 'Arbiter' 프레임워크를 제안하고, 주요 벤더들의 프롬프트에서 다양한 취약점을 발견하며 프롬프트 아키텍처와 실패 유형 간의 상관관계를 규명했습니다.

Tony Mason2026-03-11🤖 cs.AI

Security Considerations for Multi-agent Systems

이 논문은 다중 에이전트 시스템 (MAS) 의 고유한 보안 위협을 체계적으로 분석하고 16 가지 기존 보안 프레임워크를 평가한 결과, 현재 어떤 프레임워크도 모든 위협 카테고리를 충분히 커버하지 못하며 OWASP Agentic Security Initiative 와 CDAO Responsible AI 툴킷이 각각 설계 및 운영 단계에서 상대적으로 가장 높은 점수를 받았음을 밝혔습니다.

Tam Nguyen, Moses Ndebugre, Dheeraj Arremsetty2026-03-11🤖 cs.AI

Gender Fairness in Audio Deepfake Detection: Performance and Disparity Analysis

이 논문은 ASVspoof 5 데이터셋을 활용하여 오디오 딥페이크 탐지 모델의 전반적인 성능과 성별 간 편향을 분석한 결과, 기존 성능 지표만으로는 성별에 따른 오류 분포의 불균형을 파악하기 어렵지만 공정성 지표를 적용함으로써 이러한 편향을 발견하고 보다 공정하고 견고한 탐지 시스템 개발의 중요성을 강조합니다.

Aishwarya Fursule, Shruti Kshirsagar, Anderson R. Avila2026-03-11🤖 cs.AI

Improving through Interaction: Searching Behavioral Representation Spaces with CMA-ES-IG

이 논문은 로봇이 인간의 선호도를 학습할 때 단순한 학습 효율성뿐만 아니라 사용자의 경험까지 고려하여, CMA-ES-IG 알고리즘을 통해 더 효과적이고 사용자 친화적인 행동 표현 공간을 탐색하는 방법을 제안하고 실험을 통해 검증합니다.

Nathaniel Dennler, Zhonghao Shi, Yiran Tao, Andreea Bobu, Stefanos Nikolaidis, Maja Mataric2026-03-11🤖 cs.AI

Meissa: Multi-modal Medical Agentic Intelligence

고비용과 지연 시간, 개인정보 보호 문제를 해결하기 위해 제안된 'Meissa'는 40K 개의 정제된 궤적 데이터를 기반으로 학습된 4B 파라미터 규모의 경량 멀티모달 의료 에이전트 모델로, 오프라인 환경에서도 선진 모델에 버금가는 성능을 발휘하며 복잡한 의료 의사결정을 지원합니다.

Yixiong Chen, Xinyi Bai, Yue Pan, Zongwei Zhou, Alan Yuille2026-03-11🤖 cs.AI

AI Phenomenology for Understanding Human-AI Experiences Across Eras

이 논문은 AI 와의 상호작용을 단순한 성능 평가가 아닌 사용자의 주관적 체험으로 이해하기 위해 현상학적 접근을 제안하고, 이를 위한 방법론적 도구와 디자인 개념을 제시합니다.

Bhada Yun, Evgenia Taranova, Dana Feng, Renn Su, April Yi Wang2026-03-11🤖 cs.AI

MEMO: Memory-Augmented Model Context Optimization for Robust Multi-Turn Multi-Agent LLM Games

본 논문은 다중 에이전트 LLM 게임의 불안정성과 성능 저하를 해결하기 위해, 자기대결을 통해 구조화된 통찰력을 기억하고 불확실성을 고려한 탐색을 결합한 'MEMO' 프레임워크를 제안하여 다양한 텍스트 기반 게임에서 승률을 크게 향상시키고 결과의 변동성을 줄이는 효과를 입증했습니다.

Yunfei Xie, Kevin Wang, Bobby Cheng, Jianzhu Yao, Zhizhou Sha, Alexander Duffy, Yihan Xi, Hongyuan Mei, Cheston Tan, Chen Wei, Pramod Viswanath, Zhangyang Wang2026-03-11🤖 cs.AI

The Missing Memory Hierarchy: Demand Paging for LLM Context Windows

이 논문은 LLM 의 컨텍스트 창을 메모리 계층 구조로 재해석하고, Pichay 라는 수요 기반 페이징 시스템을 통해 생산 환경에서 컨텍스트 소비를 최대 93% 까지 줄이는 동시에 상태 유지 문제를 해결하는 방법을 제시합니다.

Tony Mason2026-03-11🤖 cs.AI

Automating Detection and Root-Cause Analysis of Flaky Tests in Quantum Software

이 논문은 양자 소프트웨어의 비결정적 특성으로 인한 '플래키 테스트'를 탐지하고 근본 원인을 분석하기 위해 대규모 언어 모델 (LLM) 을 활용한 자동화 파이프라인을 제안하며, 이를 통해 기존 데이터셋을 54% 확장하고 플래키 테스트 분류 및 원인 규명에서 높은 정확도를 입증했습니다.

Janakan Sivaloganathan, Ainaz Jamshidi, Andriy Miranskyy, Lei Zhang2026-03-11🤖 cs.AI

PlayWorld: Learning Robot World Models from Autonomous Play

이 논문은 성공 편향된 인간 시연 대신 자율적 로봇 놀이 (self-play) 를 통해 물리적으로 일관된 고충실도 비디오 세계 모델을 학습하는 'PlayWorld'를 제안하며, 이를 통해 접촉이 많은 상호작용 예측 정확도를 높이고 실제 환경에서의 정책 성공률을 65% 까지 향상시킨다고 설명합니다.

Tenny Yin, Zhiting Mei, Zhonghe Zheng, Miyu Yamane, David Wang, Jade Sceats, Samuel M. Bateman, Lihan Zha, Apurva Badithela, Ola Shorinwa, Anirudha Majumdar2026-03-11🤖 cs.AI

WS-Net: Weak-Signal Representation Learning and Gated Abundance Reconstruction for Hyperspectral Unmixing via State-Space and Weak Signal Attention Fusion

이 논문은 상태 공간 모델링과 약한 신호 어텐션 융합을 통해 하이퍼스펙트럼 이미지 내 약한 신호의 붕괴 문제를 해결하고, 기존 최첨단 방법들보다 RMSE 와 SAD 를 각각 최대 55% 와 63% 까지 감소시킨 새로운 심층 분해 프레임워크인 WS-Net 을 제안합니다.

Zekun Long, Ali Zia, Guanyiman Fu, Vivien Rolland, Jun Zhou2026-03-11🤖 cs.AI

← 이전 다음 →

cs.AI