cs.AI 편의 논문 | Gist.Science

Turn: A Language for Agentic Computation

이 논문은 LLM 추론을 타입 안전성, 신뢰성, 격리된 컨텍스트, 자격 증명 보호, 컴파일 시 스키마 바인딩을 보장하는 언어 수준 원시 기능으로 통합하여 자율적 에이전트 소프트웨어를 위한 컴파일된 액터 기반 프로그래밍 언어 'Turn'을 제안합니다.

Muyukani KizitoWed, 11 Ma🤖 cs.AI

Generalized Reduction to the Isotropy for Flexible Equivariant Neural Fields

이 논문은 군 $G$ 가 공간 $M$ 에 전이적으로 작용할 때, $X \times M$ 위의 $G$ -불변 함수를 $M$ 의 등방성 부분군 $H$ 가 $X$ 에 작용하는 불변 함수로 명시적으로 축소하는 이론을 제시하여, 기존 방법의 구조적 제약을 해소하고 임의의 군 작용과 균질한 조건부 공간에 적용 가능한 일반화된 등변 신경장 (Equivariant Neural Fields) 을 확장합니다.

Alejandro García-Castellanos, Gijs Bellaard, Remco Duits, Daniel Pelt, Erik J BekkersWed, 11 Ma🤖 cs.AI

EDMFormer: Genre-Specific Self-Supervised Learning for Music Structure Segmentation

이 논문은 EDM 의 구조적 특성에 맞춰 전문적으로 주석된 EDM-98 데이터셋과 자기지도 학습을 결합한 'EDMFormer' 모델을 제안하여, 기존 모델들이 어려움을 겪던 EDM 곡의 구조 분할 및 레이블링 성능을 크게 향상시켰음을 보여줍니다.

Sahal Sajeer, Krish Patel, Oscar Chung, Joel Song BaeWed, 11 Ma🤖 cs.AI

Clear, Compelling Arguments: Rethinking the Foundations of Frontier AI Safety Cases

이 논문은 항공, 원자력 등 안전 중대 산업에서 발전한 안전 사례 (safety case) 방법론의 교훈을 바탕으로, 정렬 (alignment) 커뮤니티의 기존 접근법의 한계를 지적하고 프런티어 AI 시스템의 안전성을 입증하기 위한 더 견고하고 포괄적인 안전 사례 프레임워크를 제안합니다.

Shaun Feakins, Ibrahim Habli, Phillip MorganWed, 11 Ma🤖 cs.AI

Multi-level meta-reinforcement learning with skill-based curriculum

이 논문은 하위 작업들을 계층적으로 압축하고 기술을 임베딩과 기능으로 분해하여 커리큘럼 학습 프레임워크 내에서 복잡한 의사결정 문제의 효율성을 높이고 작업 간 전이를 가능하게 하는 다단계 메타-강화 학습 방법을 제안합니다.

Sichen Yang (Johns Hopkins University), Mauro Maggioni (Johns Hopkins University)Wed, 11 Ma🤖 cs.AI

Large Language Model-Assisted Superconducting Qubit Experiments

이 논문은 지식 기반을 활용해 도구 생성 및 호출을 자동화하는 대규모 언어 모델 (LLM) 프레임워크를 제안하여 초전도 큐비트의 제어 및 측정 실험을 자동화하고, 공진기 특성 분석 및 양자 비파괴 측정 재현 등 다양한 실험을 성공적으로 수행한 사례를 소개합니다.

Shiheng Li, Jacob M. Miller, Phoebe J. Lee, Gustav Andersson, Christopher R. Conner, Yash J. Joshi, Bayan Karimi, Amber M. King, Howard L. Malc, Harsh Mishra, Hong Qiao, Minseok Ryu, Xuntao Wu, Siyuan Xing, Haoxiong Yan, Jian Shi, Andrew N. ClelandWed, 11 Ma⚛️ quant-ph

Test-Driven AI Agent Definition (TDAD): Compiling Tool-Using Agents from Behavioral Specifications

이 논문은 프롬프트를 실행 가능한 테스트로 변환하고 이를 기반으로 반복적으로 개선하는 '테스트 주도 AI 에이전트 정의 (TDAD)' 방법론을 제안하여, 도구 사용형 LLM 에이전트의 행동 준수성을 측정 가능하게 하고 배포 전 사양 게임링 및 회귀 오류를 방지하는 체계를 제시합니다.

Tzafrir RehanWed, 11 Ma🤖 cs.AI

Scale-Plan: Scalable Language-Enabled Task Planning for Heterogeneous Multi-Robot Teams

이 논문은 자연어 지시에서 작업 관련 정보를 추출하여 불필요한 정보를 필터링하고 구조화된 그래프 탐색을 통해 효율적인 장기 계획 생성을 가능하게 하는 확장 가능한 다중 로봇 팀 작업 계획 프레임워크인 'Scale-Plan'을 제안하고, 이를 통해 기존 LLM 기반 접근법의 한계를 극복하고 신뢰성과 확장성을 향상시켰음을 보여줍니다.

Piyush Gupta, Sangjae Bae, Jiachen Li, David IseleWed, 11 Ma🤖 cs.AI

Beyond Relevance: On the Relationship Between Retrieval and RAG Information Coverage

이 논문은 TREC NeuCLIR 2024, TREC RAG 2024, WikiVideo 등 다양한 벤치마크를 통해 검색 단계의 정보 커버리지 지표가 RAG 시스템의 최종 생성 응답 품질을 예측하는 신뢰할 수 있는 지표가 될 수 있음을 실증적으로 입증했습니다.

Saron Samuel, Alexander Martin, Eugene Yang, Andrew Yates, Dawn Lawrie, Ian Soborof, Laura Dietz, Benjamin Van DurmeWed, 11 Ma🤖 cs.AI

Fish Audio S2 Technical Report

이 논문은 자연어 지시를 통해 다화자 및 다턴 생성이 가능한 오픈소스 TTS 시스템 'Fish Audio S2'를 소개하고, 확장 가능한 훈련 레시피와 실시간 스트리밍이 가능한 고효율 추론 엔진을 공개합니다.

Shijia Liao, Yuxuan Wang, Songting Liu, Yifan Cheng, Ruoyi Zhang, Tianyu Li, Shidong Li, Yisheng Zheng, Xingwei Liu, Qingzheng Wang, Zhizhuo Zhou, Jiahua Liu, Xin Chen, Dawei HanWed, 11 Ma🤖 cs.AI

Are Expressive Encoders Necessary for Discrete Graph Generation?

이 논문은 트랜스포머와 같은 고도로 표현력 있는 백본 없이도, GenGNN 이라는 모듈형 메시지 전달 프레임워크를 사용하여 이산 그래프 생성에서 높은 유효성과 빠른 추론 속도를 달성할 수 있음을 보여줍니다.

Jay Revolinsky, Harry Shomer, Jiliang TangWed, 11 Ma🤖 cs.AI

MASEval: Extending Multi-Agent Evaluation from Models to Systems

이 논문은 LLM 기반 에이전트 시스템의 성능에 모델뿐만 아니라 토폴로지나 오케스트레이션 로직과 같은 구현 선택도 결정적인 영향을 미친다는 점을 강조하며, 전체 시스템을 분석 단위로 삼아 프레임워크 간 비교를 가능하게 하는 'MASEval' 평가 프레임워크를 제안합니다.

Cornelius Emde, Alexander Rubinstein, Anmol Goel, Ahmed Heakl, Sangdoo Yun, Seong Joon Oh, Martin GubriWed, 11 Ma🤖 cs.AI

A Lightweight Multi-Cancer Tumor Localization Framework for Deployable Digital Pathology

이 논문은 4 가지 암종으로 훈련된 경량화 다중 암종 종양 국소화 모델 (MuCTaL) 이 새로운 암종에서도 높은 성능을 보이며, 디지털 병리학에 배포 가능한 확장성 있는 공간 종양 확률 히트맵 생성 워크플로우를 제시합니다.

Brian Isett, Rebekah Dadey, Aofei Li, Ryan C. Augustin, Kate Smith, Aatur D. Singhi, Qiangqiang Gu, Riyue BaoWed, 11 Ma🤖 cs.AI

LDP: An Identity-Aware Protocol for Multi-Agent LLM Systems

이 논문은 다중 에이전트 LLM 시스템의 효율성과 거버넌스를 향상시키기 위해 모델 정체성, 점진적 페이로드, 통제된 세션, 구조화된 출처 추적, 신뢰 도메인 등 다섯 가지 메커니즘을 도입한 AI 네이티브 통신 프로토콜인 LDP(LLM Delegate Protocol) 를 제안하고, 이를 통해 지연 시간 감소와 토큰 효율성 증대 등의 효과를 입증했습니다.

Sunil PrakashWed, 11 Ma🤖 cs.AI

Unpacking Interpretability: Human-Centered Criteria for Optimal Combinatorial Solutions

이 논문은 최적의 조합 해법 중 인간이 이해하기 쉬운 것을 선택하게 하는 실험을 통해, 해법의 구조적 특성 (그리드 휴리스틱 정렬, 단순한 구성, 정렬된 시각적 표현) 이 해석 가능성에 결정적인 영향을 미친다는 것을 규명하고, 이를 통해 최적성과 해석 가능성 간의 균형을 고려한 알고리즘 설계의 기반을 마련했습니다.

Dominik Pegler, Frank Jäkel, David Steyrl, Frank Scharnowski, Filip MelinscakWed, 11 Ma🤖 cs.AI

Quantifying the Accuracy and Cost Impact of Design Decisions in Budget-Constrained Agentic LLM Search

이 논문은 예산 제약 하의 에이전트 RAG 시스템에서 검색 깊이, 검색 전략, 완료 예산이 정확도와 비용에 미치는 영향을 체계적으로 분석하여, 예산이 제한된 에이전트 검색 파이프라인 구성을 위한 실용적인 지침을 제시합니다.

Kyle McCleary, James GhawalyWed, 11 Ma🤖 cs.AI

A New Modeling to Feature Selection Based on the Fuzzy Rough Set Theory in Normal and Optimistic States on Hybrid Information Systems

이 논문은 하이브리드 정보 시스템에서 고차원 공간의 계산 비용과 노이즈 문제를 해결하기 위해, 객체 간 결합 거리를 기반으로 한 새로운 퍼지 근사 집합 기반 특성 선택 모델 (FSbuHD) 을 제안하고 이를 정상 및 낙관적 두 가지 모드에서 최적화 문제로 재구성하여 UCI 데이터셋을 통해 기존 방법들보다 효율성과 효과성이 입증되었음을 보여줍니다.

Mohammad Hossein Safarpour, Seyed Mohammad Alavi, Mohammad Izadikhah, Hossein DibachiWed, 11 Ma🤖 cs.AI

NetDiffuser: Deceiving DNN-Based Network Attack Detection Systems with Diffusion-Generated Adversarial Traffic

이 논문은 네트워크 트래픽의 독립적인 특징을 식별하고 확산 모델을 활용하여 자연스러운 적대적 예제를 생성함으로써 딥러닝 기반 네트워크 침입 탐지 시스템의 성능을 효과적으로 우회하는 새로운 프레임워크 'NetDiffuser'를 제안합니다.

Pratyay Kumar, Abu Saleh Md Tayeen, Satyajayant Misra, Huiping Cao, Jiefei Liu, Qixu Gong, Jayashree HarikumarWed, 11 Ma🤖 cs.AI

Cross-Domain Uncertainty Quantification for Selective Prediction: A Comprehensive Bound Ablation with Transfer-Informed Betting

이 논문은 소스 도메인의 위험 프로파일을 활용하여 데이터가 부족한 환경에서도 더 엄격한 위험 보장을 제공하는 '전이 기반 베팅 (Transfer-Informed Betting)'을 포함한 선택적 예측을 위한 9 가지 유한 표본 경계 가족에 대한 포괄적인 분석과 벤치마크 평가를 제시합니다.

Abhinaba BasuWed, 11 Ma🤖 cs.AI

FedLECC: Cluster- and Loss-Guided Client Selection for Federated Learning under Non-IID Data

이 논문은 비독립적·동일분포 (Non-IID) 데이터 환경에서 클라이언트 선택을 위해 클러스터 유사성과 손실 값을 고려한 경량화 전략인 FedLECC 를 제안하여, 테스트 정확도를 최대 12% 향상시키고 통신 라운드 및 오버헤드를 각각 약 22% 및 50% 감소시킨다고 설명합니다.

Daniel M. Jimenez-Gutierrez, Giovanni Giunta, Mehrdad Hassanzadeh, Aris Anagnostopoulos, Ioannis Chatzigiannakis, Andrea VitalettiWed, 11 Ma🤖 cs.AI

← 이전 다음 →