BTZSC: A Benchmark for Zero-Shot Text Classification Across Cross-Encoders, Embedding Models, Rerankers and LLMs

이 논문은 NLI 기반 크로스-인코더, 임베딩 모델, 리랭커, 그리고 지시 튜닝 LLM 등 다양한 아키텍처의 제로샷 텍스트 분류 능력을 공정하게 평가하기 위해 22 개의 데이터셋으로 구성된 벤치마크 'BTZSC'를 제안하고, 현대 리랭커가 새로운 최첨단 성능을 달성했으며 임베딩 모델이 정확도와 지연 시간 간 최적의 균형을 보인다는 결과를 제시합니다.

Ilias Aarab2026-03-13💬 cs.CL

Few-for-Many Personalized Federated Learning

이 논문은 수천 명의 클라이언트를 효율적으로 지원하기 위해 MM 개의 개별 모델 대신 KK 개의 공유 서버 모델을 최적화하는 'Few-for-Many' 프레임워크를 제안하고, 이를 통해 자동적으로 모델 다양성을 발견하며 기존 최첨단 방법보다 뛰어난 개인화 성능을 달성하는 'FedFew' 알고리즘을 제시합니다.

Ping Guo, Tiantian Zhang, Xi Lin, Xiang Li, Zhi-Ri Tang, Qingfu Zhang2026-03-13🤖 cs.AI

Can RL Improve Generalization of LLM Agents? An Empirical Study

이 논문은 강화학습 미세조정 (RFT) 이가 환경 내 작업 난이도 변화에는 잘 일반화되지만, 관찰 및 행동 인터페이스가 다른 미지의 환경으로의 전이에는 한계가 있음을 밝히고, 순차적 학습과 혼합 학습을 통해 전이 성능을 향상시키고 망각을 최소화할 수 있음을 실증적으로 제시합니다.

Zhiheng Xi, Xin Guo, Jiaqi Liu, Jiazheng Zhang, Yutao Fan, Zhihao Zhang, Shichun Liu, Mingxu Chai, Xiaowei Shi, Yitao Zhai, Xunliang Cai, Tao Gui, Qi Zhang, Xuanjing Huang2026-03-13🤖 cs.AI

An Intent of Collaboration: On Agencies between Designers and Emerging (Intelligent) Technologies

이 논문은 생성형 AI 와의 협업 과정에서 디자이너가 창의적 주체성을 상실하지 않고 회복하기 위해서는 내적 성찰, 기술에 대한 구조적 이해, 그리고 인간과 기술 간의 관계 역학을 의도적으로 조정하는 것이 필요함을 강조합니다.

Pei-Ying Lin, Julie Heij, Iris Borst, Britt Joosten, Kristina Andersen, Wijnand IJsselsteijn2026-03-13🤖 cs.AI

Sim-to-reality adaptation for Deep Reinforcement Learning applied to an underwater docking application

이 논문은 Stonefish 시뮬레이터와 멀티프로세싱 프레임워크를 활용한 고충실도 디지털 트윈 환경에서 PPO 알고리즘을 통해 훈련된 심층 강화학습 기반 AUV 도킹 제어기가 시뮬레이션에서 90% 이상의 성공률을 보였으며, 실제 수중 실험을 통해 시뮬레이션과 현실 간의 격차를 성공적으로 극복하고 부드러운 도킹을 달성했음을 입증합니다.

Alaaeddine Chaarani, Narcis Palomeras, Pere Ridao2026-03-13🤖 cs.AI

Just Use XML: Revisiting Joint Translation and Label Projection

이 논문은 XML 태그를 활용하여 번역과 라벨 프로젝션을 동시에 수행하는 'LabelPigeon' 프레임워크를 제안함으로써, 기존 방법론의 번역 품질 저하 문제를 해결하고 11 개 언어에서 번역 품질을 향상시키며 27 개 언어에서 NER 등 하류 작업의 교차 언어 전이 성능을 크게 개선함을 보여줍니다.

Thennal D K, Chris Biemann, Hans Ole Hatzel2026-03-13💬 cs.CL

Cascade: Composing Software-Hardware Attack Gadgets for Adversarial Threat Amplification in Compound AI Systems

이 논문은 전통적인 소프트웨어 및 하드웨어 취약점이 LLM 특유의 알고리즘적 약점과 결합되어 컴파운드 AI 시스템의 무결성과 기밀성을 위협하는 새로운 공격 기법 'Cascade'를 제안하고, 이를 체계화하여 향후 방어 전략 수립의 기초를 마련합니다.

Sarbartha Banerjee, Prateek Sahu, Anjo Vahldiek-Oberwagner, Jose Sanchez Vicarte, Mohit Tiwari2026-03-13🤖 cs.AI

Slow-Fast Inference: Training-Free Inference Acceleration via Within-Sentence Support Stability

이 논문은 문장 내 주의 지원이 안정적으로 유지된다는 관찰을 바탕으로, 기존 체크포인트를 재학습 없이 적용하여 긴 문맥과 추론 작업에서 1.6 배에서 14.4 배까지 추론 처리량을 향상시키면서도 품질을 유지하는 'Slow-Fast Inference'라는 새로운 추론 가속 프레임워크를 제안합니다.

Xingyu Xie, Zhaochen Yu, Yue Liao, Tao Wang, Kim-Chuan Toh, Shuicheng Yan2026-03-13🤖 cs.LG

XSkill: Continual Learning from Experience and Skills in Multimodal Agents

이 논문은 멀티모달 에이전트가 매개변수 업데이트 없이 과거 경험을 바탕으로 지속적으로 학습할 수 있도록 시각적 관찰에 기반한 경험과 기술이라는 두 가지 상보적 지식 스트림을 통합한 'XSkill' 프레임워크를 제안하고, 다양한 벤치마크에서 기존 방법들을 크게 능가하는 성능을 입증합니다.

Guanyu Jiang (May), Zhaochen Su (May), Xiaoye Qu (May), Yi R. (May), Fung2026-03-13🤖 cs.AI

Beyond Convolution: A Taxonomy of Structured Operators for Learning-Based Image Processing

이 논문은 합성곱 연산의 한계를 극복하기 위해 학습 기반 이미지 처리를 위한 구조화된 연산자 5 가지 계열 (분해 기반, 적응형 가중치, 기저 적응, 적분 및 커널, 어텐션 기반) 에 대한 체계적인 분류를 제시하고, 각 연산자의 구조적 특성과 적용 분야를 비교 분석하며 향후 연구 방향을 제시합니다.

Simone Cammarasana2026-03-13🤖 cs.AI

Paper Title: LoV3D: Grounding Cognitive Prognosis Reasoning in Longitudinal 3D Brain MRI via Regional Volume Assessments

LoV3D 는 표준화된 부피 측정치를 기반으로 한 자동화된 검증기를 통해 3D 뇌 MRI 의 종단적 변화를 지역적 해부학적 평가와 일관성 있게 연결함으로써, 환각을 줄이고 알츠하이머병 등 신경퇴행성 질환의 진단 정확도와 일반화 성능을 획기적으로 향상시킨 새로운 3D 비전 - 언어 모델 파이프라인입니다.

Zhaoyang Jiang, Zhizhong Fu, David McAllister, Yunsoo Kim, Honghan Wu2026-03-13🤖 cs.AI

A Multi-Label Temporal Convolutional Framework for Transcription Factor Binding Characterization

이 논문은 전사 인자 (TF) 결합 부위 예측을 단일 TF 가 아닌 다중 레이블 분류 문제로 접근하여 시계열 합성곱 네트워크 (TCN) 를 활용함으로써 TF 간 상호작용과 협력적 조절 메커니즘을 포착하고 생물학적으로 유의미한 결합 패턴을 규명하는 새로운 프레임워크를 제시합니다.

Pietro Demurtas, Ferdinando Zanchetta, Giovanni Perini, Rita Fioresi2026-03-13🧬 q-bio

Human-Centred LLM Privacy Audits: Findings and Frictions

이 논문은 대규모 언어 모델 (LLM) 이 개인의 이름과 어떤 정보를 연관 짓는지 사용자가 직접 확인할 수 있도록 돕는 'LMP2'라는 브라우저 기반 자기 감사 도구를 소개하고, 사용자 연구와 다양한 모델 평가를 통해 LLM 프라이버시 감사의 실효성을 입증함과 동시에 확률적이고 맥락 의존적인 생성형 AI 평가의 근본적인 난제와 개선 방향을 제시합니다.

Dimitri Staufer, Kirsten Morehouse, David Hartmann, Bettina Berendt2026-03-13💬 cs.CL

A Robust and Efficient Multi-Agent Reinforcement Learning Framework for Traffic Signal Control

이 논문은 Vissim 시뮬레이터에서 검증된 강화 학습 기반의 다중 에이전트 프레임워크를 제안하여, 회전비 무작위화, 지수적 신호 단계 조정, 그리고 이웃 기반 관측 기법을 통해 기존 방법보다 10% 이상 평균 대기 시간을 단축하고 다양한 교통 상황에 대한 일반화 성능과 제어 안정성을 크게 향상시켰음을 보여줍니다.

Sheng-You Huang, Hsiao-Chuan Chang, Yen-Chi Chen, Ting-Han Wei, I-Hau Yeh, Sheng-Yao Kuan, Chien-Yao Wang, Hsuan-Han Lee, I-Chen Wu2026-03-13🤖 cs.AI

On Information Self-Locking in Reinforcement Learning for Active Reasoning of LLM agents

이 논문은 강화학습 기반 LLM 에이전트가 능동적 추론 과정에서 정보 획득을 중단하고 기존 정보를 활용하지 못하는 '정보 자기잠금' 현상을 발견하고, 이를 해결하기 위해 방향성 피드백을 주입하는 새로운 접근법을 제안하여 성능을 최대 60% 향상시켰음을 보여줍니다.

Deyu Zou, Yongqiang Chen, Fan Feng, Mufei Li, Pan Li, Yu Gong, James Cheng2026-03-13🤖 cs.AI