Uncovering a Winning Lottery Ticket with Continuously Relaxed Bernoulli Gates

이 논문은 비가분한 스코어 기반 선택의 한계를 극복하기 위해 연속적으로 완화된 베르누이 게이트를 도입하여, 가중치를 고정된 초기값으로 유지한 채 게이트 파라미터만 학습하는 완전히 미분 가능한 방식으로 강력한 로또 티켓 (Strong Lottery Ticket) 을 효율적으로 발견하는 새로운 프레임워크를 제안합니다.

Itamar Tsayag, Ofir LindenbaumWed, 11 Ma🤖 cs.AI

Using Vision Language Foundation Models to Generate Plant Simulation Configurations via In-Context Learning

이 논문은 드론 원격 감지 이미지를 기반으로 비전 언어 모델 (VLM) 을 활용하여 농작물 디지털 트윈을 위한 기능적 - 구조적 식물 모델 (FSPM) 시뮬레이션 설정을 생성하는 새로운 접근법과 이를 평가하기 위한 합성 벤치마크를 제시합니다.

Heesup Yun, Isaac Kazuo Uyehara, Earl Ranario, Lars Lundqvist, Christine H. Diepenbrock, Brian N. Bailey, J. Mason EarlesWed, 11 Ma🤖 cs.AI

Interpretable Markov-Based Spatiotemporal Risk Surfaces for Missing-Child Search Planning with Reinforcement Learning and LLM-Based Quality Assurance

이 논문은 실종 아동 수색을 위해 비정형 데이터를 시공간적 위험 표면으로 변환하고, 마르코프 체인, 강화 학습, 그리고 LLM 기반 품질 보증을 결합한 3 층 아키텍처를 가진 '가디언' 시스템의 예측 모델과 검증 결과를 제시합니다.

Joshua Castillo, Ravi MukkamalaWed, 11 Ma🤖 cs.AI

PathoScribe: Transforming Pathology Data into a Living Library with a Unified LLM-Driven Framework for Semantic Retrieval and Clinical Integration

이 논문은 7 만 건의 다기관 수술 병리 보고서를 기반으로 자연어 검색, 자동 코호트 구축, 임상 질의 응답 등을 통합하여 정적인 병리 아카이브를 능동적인 임상 지능 플랫폼으로 전환하는 통합 LLM 기반 프레임워크 'PathoScribe'를 제안하고 그 유효성을 입증합니다.

Abdul Rehman Akbar, Samuel Wales-McGrath, Alejadro Levya, Lina Gokhale, Rajendra Singh, Wei Chen, Anil Parwani, Muhammad Khalid Khan NiaziWed, 11 Ma🤖 cs.AI

VoxEmo: Benchmarking Speech Emotion Recognition with Speech LLMs

이 논문은 언어별 다양성과 인간 감정의 모호성을 반영하기 위해 35 개 감정 말뭉치와 표준화된 툴킷을 포함한 음성 감정 인식 (SER) 벤치마크인 VoxEmo 를 제안하며, 이를 통해 생성형 음성 LLM 이 하드 라벨 정확도에서는 기존 모델을 따르지 못하지만 인간의 주관적 감정 분포에는 더 잘 부합함을 입증했습니다.

Hezhao Zhang, Huang-Cheng Chou, Shrikanth Narayanan, Thomas HainWed, 11 Ma🤖 cs.AI

Security Considerations for Multi-agent Systems

이 논문은 다중 에이전트 시스템 (MAS) 의 고유한 보안 위협을 체계적으로 분석하고 16 가지 기존 보안 프레임워크를 평가한 결과, 현재 어떤 프레임워크도 모든 위협 카테고리를 충분히 커버하지 못하며 OWASP Agentic Security Initiative 와 CDAO Responsible AI 툴킷이 각각 설계 및 운영 단계에서 상대적으로 가장 높은 점수를 받았음을 밝혔습니다.

Tam Nguyen, Moses Ndebugre, Dheeraj ArremsettyWed, 11 Ma🤖 cs.AI

Gender Fairness in Audio Deepfake Detection: Performance and Disparity Analysis

이 논문은 ASVspoof 5 데이터셋을 활용하여 오디오 딥페이크 탐지 모델의 전반적인 성능과 성별 간 편향을 분석한 결과, 기존 성능 지표만으로는 성별에 따른 오류 분포의 불균형을 파악하기 어렵지만 공정성 지표를 적용함으로써 이러한 편향을 발견하고 보다 공정하고 견고한 탐지 시스템 개발의 중요성을 강조합니다.

Aishwarya Fursule, Shruti Kshirsagar, Anderson R. AvilaWed, 11 Ma🤖 cs.AI

Improving through Interaction: Searching Behavioral Representation Spaces with CMA-ES-IG

이 논문은 로봇이 인간의 선호도를 학습할 때 단순한 학습 효율성뿐만 아니라 사용자의 경험까지 고려하여, CMA-ES-IG 알고리즘을 통해 더 효과적이고 사용자 친화적인 행동 표현 공간을 탐색하는 방법을 제안하고 실험을 통해 검증합니다.

Nathaniel Dennler, Zhonghao Shi, Yiran Tao, Andreea Bobu, Stefanos Nikolaidis, Maja MataricWed, 11 Ma🤖 cs.AI

MEMO: Memory-Augmented Model Context Optimization for Robust Multi-Turn Multi-Agent LLM Games

본 논문은 다중 에이전트 LLM 게임의 불안정성과 성능 저하를 해결하기 위해, 자기대결을 통해 구조화된 통찰력을 기억하고 불확실성을 고려한 탐색을 결합한 'MEMO' 프레임워크를 제안하여 다양한 텍스트 기반 게임에서 승률을 크게 향상시키고 결과의 변동성을 줄이는 효과를 입증했습니다.

Yunfei Xie, Kevin Wang, Bobby Cheng, Jianzhu Yao, Zhizhou Sha, Alexander Duffy, Yihan Xi, Hongyuan Mei, Cheston Tan, Chen Wei, Pramod Viswanath, Zhangyang WangWed, 11 Ma🤖 cs.AI