Turn: A Language for Agentic Computation
이 논문은 LLM 추론을 타입 안전성, 신뢰성, 격리된 컨텍스트, 자격 증명 보호, 컴파일 시 스키마 바인딩을 보장하는 언어 수준 원시 기능으로 통합하여 자율적 에이전트 소프트웨어를 위한 컴파일된 액터 기반 프로그래밍 언어 'Turn'을 제안합니다.
2278 편의 논문
이 논문은 LLM 추론을 타입 안전성, 신뢰성, 격리된 컨텍스트, 자격 증명 보호, 컴파일 시 스키마 바인딩을 보장하는 언어 수준 원시 기능으로 통합하여 자율적 에이전트 소프트웨어를 위한 컴파일된 액터 기반 프로그래밍 언어 'Turn'을 제안합니다.
이 논문은 군 가 공간 에 전이적으로 작용할 때, 위의 -불변 함수를 의 등방성 부분군 가 에 작용하는 불변 함수로 명시적으로 축소하는 이론을 제시하여, 기존 방법의 구조적 제약을 해소하고 임의의 군 작용과 균질한 조건부 공간에 적용 가능한 일반화된 등변 신경장 (Equivariant Neural Fields) 을 확장합니다.
이 논문은 EDM 의 구조적 특성에 맞춰 전문적으로 주석된 EDM-98 데이터셋과 자기지도 학습을 결합한 'EDMFormer' 모델을 제안하여, 기존 모델들이 어려움을 겪던 EDM 곡의 구조 분할 및 레이블링 성능을 크게 향상시켰음을 보여줍니다.
이 논문은 항공, 원자력 등 안전 중대 산업에서 발전한 안전 사례 (safety case) 방법론의 교훈을 바탕으로, 정렬 (alignment) 커뮤니티의 기존 접근법의 한계를 지적하고 프런티어 AI 시스템의 안전성을 입증하기 위한 더 견고하고 포괄적인 안전 사례 프레임워크를 제안합니다.
이 논문은 하위 작업들을 계층적으로 압축하고 기술을 임베딩과 기능으로 분해하여 커리큘럼 학습 프레임워크 내에서 복잡한 의사결정 문제의 효율성을 높이고 작업 간 전이를 가능하게 하는 다단계 메타-강화 학습 방법을 제안합니다.
이 논문은 지식 기반을 활용해 도구 생성 및 호출을 자동화하는 대규모 언어 모델 (LLM) 프레임워크를 제안하여 초전도 큐비트의 제어 및 측정 실험을 자동화하고, 공진기 특성 분석 및 양자 비파괴 측정 재현 등 다양한 실험을 성공적으로 수행한 사례를 소개합니다.
이 논문은 프롬프트를 실행 가능한 테스트로 변환하고 이를 기반으로 반복적으로 개선하는 '테스트 주도 AI 에이전트 정의 (TDAD)' 방법론을 제안하여, 도구 사용형 LLM 에이전트의 행동 준수성을 측정 가능하게 하고 배포 전 사양 게임링 및 회귀 오류를 방지하는 체계를 제시합니다.
이 논문은 자연어 지시에서 작업 관련 정보를 추출하여 불필요한 정보를 필터링하고 구조화된 그래프 탐색을 통해 효율적인 장기 계획 생성을 가능하게 하는 확장 가능한 다중 로봇 팀 작업 계획 프레임워크인 'Scale-Plan'을 제안하고, 이를 통해 기존 LLM 기반 접근법의 한계를 극복하고 신뢰성과 확장성을 향상시켰음을 보여줍니다.
이 논문은 TREC NeuCLIR 2024, TREC RAG 2024, WikiVideo 등 다양한 벤치마크를 통해 검색 단계의 정보 커버리지 지표가 RAG 시스템의 최종 생성 응답 품질을 예측하는 신뢰할 수 있는 지표가 될 수 있음을 실증적으로 입증했습니다.
이 논문은 자연어 지시를 통해 다화자 및 다턴 생성이 가능한 오픈소스 TTS 시스템 'Fish Audio S2'를 소개하고, 확장 가능한 훈련 레시피와 실시간 스트리밍이 가능한 고효율 추론 엔진을 공개합니다.
이 논문은 트랜스포머와 같은 고도로 표현력 있는 백본 없이도, GenGNN 이라는 모듈형 메시지 전달 프레임워크를 사용하여 이산 그래프 생성에서 높은 유효성과 빠른 추론 속도를 달성할 수 있음을 보여줍니다.
이 논문은 LLM 기반 에이전트 시스템의 성능에 모델뿐만 아니라 토폴로지나 오케스트레이션 로직과 같은 구현 선택도 결정적인 영향을 미친다는 점을 강조하며, 전체 시스템을 분석 단위로 삼아 프레임워크 간 비교를 가능하게 하는 'MASEval' 평가 프레임워크를 제안합니다.
이 논문은 4 가지 암종으로 훈련된 경량화 다중 암종 종양 국소화 모델 (MuCTaL) 이 새로운 암종에서도 높은 성능을 보이며, 디지털 병리학에 배포 가능한 확장성 있는 공간 종양 확률 히트맵 생성 워크플로우를 제시합니다.
이 논문은 다중 에이전트 LLM 시스템의 효율성과 거버넌스를 향상시키기 위해 모델 정체성, 점진적 페이로드, 통제된 세션, 구조화된 출처 추적, 신뢰 도메인 등 다섯 가지 메커니즘을 도입한 AI 네이티브 통신 프로토콜인 LDP(LLM Delegate Protocol) 를 제안하고, 이를 통해 지연 시간 감소와 토큰 효율성 증대 등의 효과를 입증했습니다.
이 논문은 최적의 조합 해법 중 인간이 이해하기 쉬운 것을 선택하게 하는 실험을 통해, 해법의 구조적 특성 (그리드 휴리스틱 정렬, 단순한 구성, 정렬된 시각적 표현) 이 해석 가능성에 결정적인 영향을 미친다는 것을 규명하고, 이를 통해 최적성과 해석 가능성 간의 균형을 고려한 알고리즘 설계의 기반을 마련했습니다.
이 논문은 예산 제약 하의 에이전트 RAG 시스템에서 검색 깊이, 검색 전략, 완료 예산이 정확도와 비용에 미치는 영향을 체계적으로 분석하여, 예산이 제한된 에이전트 검색 파이프라인 구성을 위한 실용적인 지침을 제시합니다.
이 논문은 하이브리드 정보 시스템에서 고차원 공간의 계산 비용과 노이즈 문제를 해결하기 위해, 객체 간 결합 거리를 기반으로 한 새로운 퍼지 근사 집합 기반 특성 선택 모델 (FSbuHD) 을 제안하고 이를 정상 및 낙관적 두 가지 모드에서 최적화 문제로 재구성하여 UCI 데이터셋을 통해 기존 방법들보다 효율성과 효과성이 입증되었음을 보여줍니다.
이 논문은 네트워크 트래픽의 독립적인 특징을 식별하고 확산 모델을 활용하여 자연스러운 적대적 예제를 생성함으로써 딥러닝 기반 네트워크 침입 탐지 시스템의 성능을 효과적으로 우회하는 새로운 프레임워크 'NetDiffuser'를 제안합니다.
이 논문은 소스 도메인의 위험 프로파일을 활용하여 데이터가 부족한 환경에서도 더 엄격한 위험 보장을 제공하는 '전이 기반 베팅 (Transfer-Informed Betting)'을 포함한 선택적 예측을 위한 9 가지 유한 표본 경계 가족에 대한 포괄적인 분석과 벤치마크 평가를 제시합니다.
이 논문은 비독립적·동일분포 (Non-IID) 데이터 환경에서 클라이언트 선택을 위해 클러스터 유사성과 손실 값을 고려한 경량화 전략인 FedLECC 를 제안하여, 테스트 정확도를 최대 12% 향상시키고 통신 라운드 및 오버헤드를 각각 약 22% 및 50% 감소시킨다고 설명합니다.