Understanding LLM Behavior When Encountering User-Supplied Harmful Content in Harmless Tasks

본 논문은 LLM 이 겉보기에 무해한 작업을 수행할 때 사용자 제공 유해 콘텐츠를 처리하는지 여부를 평가한 결과, 최신 모델조차도 인간 윤리 정렬에 실패하여 유해 정보를 계속 처리하는 경향이 있음을 발견하고, 이를 완화하기 위한 안전 조치 강화의 필요성을 제기합니다.

Junjie Chu, Yiting Qu, Ye Leng, Michael Backes, Yun Shen, Savvas Zannettou, Yang Zhang2026-03-13🤖 cs.AI

MobileKernelBench: Can LLMs Write Efficient Kernels for Mobile Devices?

이 논문은 모바일 기기를 위한 효율적인 커널 생성이 현재 LLM 의 한계로 인해 어렵다는 점을 MobileKernelBench 를 통해 규명하고, 이를 극복하기 위해 제안한 다중 에이전트 시스템 MoKA 가 높은 컴파일 성공률과 성능 개선을 달성했음을 보여줍니다.

Xingze Zou, Jing Wang, Yuhua Zheng, Xueyi Chen, Haolei Bai, Lingcheng Kong, Syed A. R. Abu-Bakar, Zhaode Wang, Chengfei Lv, Haoji Hu, Huan Wang2026-03-13🤖 cs.LG

Fair Learning for Bias Mitigation and Quality Optimization in Paper Recommendation

이 논문은 ACM SIGCHI, DIS, IUI 등의 컨퍼런스 데이터를 활용해 교차성 기준과 맞춤형 공정성 손실 함수를 도입한 'Fair-PaperRec' 모델을 제안함으로써, 학문적 엄격성을 유지하면서 소수 그룹의 참여율을 42.03% 높이고 전체 효용을 3.16% 개선하는 편향 완화 및 품질 최적화 솔루션을 제시합니다.

Uttamasha Anjally Oyshi, Susan Gauch2026-03-13🤖 cs.AI

Effective Resistance Rewiring: A Simple Topological Correction for Over-Squashing

이 논문은 그래프 신경망의 과압축 (over-squashing) 문제를 해결하기 위해 전역적 신호인 유효 저항을 기반으로 간선을 재배치하는 '유효 저항 재배선 (ERR)' 방법을 제안하고, 이를 통해 장기 의존성 학습을 개선하면서도 과부드러짐 (oversmoothing) 과의 균형을 맞추기 위해 정규화 기법과 결합할 때 최적의 성능을 얻을 수 있음을 보여줍니다.

Bertran Miquel-Oliver, Manel Gil-Sorribes, Victor Guallar, Alexis Molina2026-03-13🤖 cs.LG

Geometry-Aware Probabilistic Circuits via Voronoi Tessellations

이 논문은 확률적 회로 (PC) 의 데이터 매니폴드 국소 기하학적 구조를 포착하기 위해 보로노이 테셀레이션을 도입하되, 이로 인한 계산 복잡성 문제를 해결하기 위해 근사 추론 프레임워크와 정확한 추론이 가능한 구조적 조건을 제안하고 미분 가능한 완화 기법을 통해 학습을 가능하게 합니다.

Sahil Sidheekh, Sriraam Natarajan2026-03-13🤖 cs.LG

Delayed Backdoor Attacks: Exploring the Temporal Dimension as a New Attack Surface in Pre-Trained Models

이 논문은 트리거 노출과 악성 행동 발생 사이의 시간적 간격을 활용하여 일상적인 단어를 트리거로 사용하는 '지연 백도어 공격 (DBA)'을 제안하고, 이를 통해 기존 방어 기법을 우회하며 높은 공격 성공률을 보이는 새로운 취약점을 입증했습니다.

Zikang Ding, Haomiao Yang, Meng Hao, Wenbo Jiang, Kunlan Xiang, Runmeng Du, Yijing Liu, Ruichen Zhang, Dusit Niyato2026-03-13🤖 cs.AI

Learning Transferable Sensor Models via Language-Informed Pretraining

이 논문은 다양한 센서 설정에 걸쳐 일반화 가능한 언어 정렬 표현을 학습하기 위해 대조적 정렬과 센서 조건부 캡션링을 통합하고, 사전 학습된 언어 모델을 활용하여 재학습 없이도 가변적인 시간 해상도와 입력 길이를 지원하는 오픈 소스 프레임워크인 SLIP을 제안합니다.

Yuliang Chen, Arvind Pillai, Yu Yvonne Wu, Tess Z. Griffin, Lisa Marsch, Michael V. Heinz, Nicholas C. Jacobson, Andrew Campbell2026-03-13🤖 cs.AI

HomeSafe-Bench: Evaluating Vision-Language Models on Unsafe Action Detection for Embodied Agents in Household Scenarios

이 논문은 가정용 로봇의 안전성을 평가하기 위해 물리 시뮬레이션과 비디오 생성을 결합한 'HomeSafe-Bench' 벤치마크와 실시간 안전 감시를 위한 계층적 'HD-Guard' 아키텍처를 제안하며, 현재 비전 - 언어 모델의 안전 감지 한계를 분석하고 효율성과 정확성 간의 균형을 달성하는 방안을 제시합니다.

Jiayue Pu, Zhongxiang Sun, Zilu Zhang, Xiao Zhang, Jun Xu2026-03-13🤖 cs.AI

LABSHIELD: A Multimodal Benchmark for Safety-Critical Reasoning and Planning in Scientific Laboratories

이 논문은 실험실 환경의 안전 위험 식별과 안전 중추 추론 능력을 평가하기 위해 OSHA 및 GHS 기준에 기반한 다중 모달 벤치마크인 'LABSHIELD'를 제안하고, 현재 모델들이 일반 영역에 비해 실험실 안전 시나리오에서 성능이 크게 저하됨을 규명했습니다.

Qianpu Sun, Xiaowei Chi, Yuhan Rui, Ying Li, Kuangzhi Ge, Jiajun Li, Sirui Han, Shanghang Zhang2026-03-13🤖 cs.AI

BTZSC: A Benchmark for Zero-Shot Text Classification Across Cross-Encoders, Embedding Models, Rerankers and LLMs

이 논문은 NLI 기반 크로스-인코더, 임베딩 모델, 리랭커, 그리고 지시 튜닝 LLM 등 다양한 아키텍처의 제로샷 텍스트 분류 능력을 공정하게 평가하기 위해 22 개의 데이터셋으로 구성된 벤치마크 'BTZSC'를 제안하고, 현대 리랭커가 새로운 최첨단 성능을 달성했으며 임베딩 모델이 정확도와 지연 시간 간 최적의 균형을 보인다는 결과를 제시합니다.

Ilias Aarab2026-03-13💬 cs.CL

Few-for-Many Personalized Federated Learning

이 논문은 수천 명의 클라이언트를 효율적으로 지원하기 위해 MM 개의 개별 모델 대신 KK 개의 공유 서버 모델을 최적화하는 'Few-for-Many' 프레임워크를 제안하고, 이를 통해 자동적으로 모델 다양성을 발견하며 기존 최첨단 방법보다 뛰어난 개인화 성능을 달성하는 'FedFew' 알고리즘을 제시합니다.

Ping Guo, Tiantian Zhang, Xi Lin, Xiang Li, Zhi-Ri Tang, Qingfu Zhang2026-03-13🤖 cs.AI

Can RL Improve Generalization of LLM Agents? An Empirical Study

이 논문은 강화학습 미세조정 (RFT) 이가 환경 내 작업 난이도 변화에는 잘 일반화되지만, 관찰 및 행동 인터페이스가 다른 미지의 환경으로의 전이에는 한계가 있음을 밝히고, 순차적 학습과 혼합 학습을 통해 전이 성능을 향상시키고 망각을 최소화할 수 있음을 실증적으로 제시합니다.

Zhiheng Xi, Xin Guo, Jiaqi Liu, Jiazheng Zhang, Yutao Fan, Zhihao Zhang, Shichun Liu, Mingxu Chai, Xiaowei Shi, Yitao Zhai, Xunliang Cai, Tao Gui, Qi Zhang, Xuanjing Huang2026-03-13🤖 cs.AI

An Intent of Collaboration: On Agencies between Designers and Emerging (Intelligent) Technologies

이 논문은 생성형 AI 와의 협업 과정에서 디자이너가 창의적 주체성을 상실하지 않고 회복하기 위해서는 내적 성찰, 기술에 대한 구조적 이해, 그리고 인간과 기술 간의 관계 역학을 의도적으로 조정하는 것이 필요함을 강조합니다.

Pei-Ying Lin, Julie Heij, Iris Borst, Britt Joosten, Kristina Andersen, Wijnand IJsselsteijn2026-03-13🤖 cs.AI

Sim-to-reality adaptation for Deep Reinforcement Learning applied to an underwater docking application

이 논문은 Stonefish 시뮬레이터와 멀티프로세싱 프레임워크를 활용한 고충실도 디지털 트윈 환경에서 PPO 알고리즘을 통해 훈련된 심층 강화학습 기반 AUV 도킹 제어기가 시뮬레이션에서 90% 이상의 성공률을 보였으며, 실제 수중 실험을 통해 시뮬레이션과 현실 간의 격차를 성공적으로 극복하고 부드러운 도킹을 달성했음을 입증합니다.

Alaaeddine Chaarani, Narcis Palomeras, Pere Ridao2026-03-13🤖 cs.AI

Just Use XML: Revisiting Joint Translation and Label Projection

이 논문은 XML 태그를 활용하여 번역과 라벨 프로젝션을 동시에 수행하는 'LabelPigeon' 프레임워크를 제안함으로써, 기존 방법론의 번역 품질 저하 문제를 해결하고 11 개 언어에서 번역 품질을 향상시키며 27 개 언어에서 NER 등 하류 작업의 교차 언어 전이 성능을 크게 개선함을 보여줍니다.

Thennal D K, Chris Biemann, Hans Ole Hatzel2026-03-13💬 cs.CL

Cascade: Composing Software-Hardware Attack Gadgets for Adversarial Threat Amplification in Compound AI Systems

이 논문은 전통적인 소프트웨어 및 하드웨어 취약점이 LLM 특유의 알고리즘적 약점과 결합되어 컴파운드 AI 시스템의 무결성과 기밀성을 위협하는 새로운 공격 기법 'Cascade'를 제안하고, 이를 체계화하여 향후 방어 전략 수립의 기초를 마련합니다.

Sarbartha Banerjee, Prateek Sahu, Anjo Vahldiek-Oberwagner, Jose Sanchez Vicarte, Mohit Tiwari2026-03-13🤖 cs.AI