cs.AI 편의 논문 | Gist.Science

HomeSafe-Bench: Evaluating Vision-Language Models on Unsafe Action Detection for Embodied Agents in Household Scenarios

이 논문은 가정용 로봇의 안전성을 평가하기 위해 물리 시뮬레이션과 비디오 생성을 결합한 'HomeSafe-Bench' 벤치마크와 실시간 안전 감시를 위한 계층적 'HD-Guard' 아키텍처를 제안하며, 현재 비전 - 언어 모델의 안전 감지 한계를 분석하고 효율성과 정확성 간의 균형을 달성하는 방안을 제시합니다.

Jiayue Pu, Zhongxiang Sun, Zilu Zhang, Xiao Zhang, Jun Xu2026-03-13🤖 cs.AI

LABSHIELD: A Multimodal Benchmark for Safety-Critical Reasoning and Planning in Scientific Laboratories

이 논문은 실험실 환경의 안전 위험 식별과 안전 중추 추론 능력을 평가하기 위해 OSHA 및 GHS 기준에 기반한 다중 모달 벤치마크인 'LABSHIELD'를 제안하고, 현재 모델들이 일반 영역에 비해 실험실 안전 시나리오에서 성능이 크게 저하됨을 규명했습니다.

Qianpu Sun, Xiaowei Chi, Yuhan Rui, Ying Li, Kuangzhi Ge, Jiajun Li, Sirui Han, Shanghang Zhang2026-03-13🤖 cs.AI

BTZSC: A Benchmark for Zero-Shot Text Classification Across Cross-Encoders, Embedding Models, Rerankers and LLMs

이 논문은 NLI 기반 크로스-인코더, 임베딩 모델, 리랭커, 그리고 지시 튜닝 LLM 등 다양한 아키텍처의 제로샷 텍스트 분류 능력을 공정하게 평가하기 위해 22 개의 데이터셋으로 구성된 벤치마크 'BTZSC'를 제안하고, 현대 리랭커가 새로운 최첨단 성능을 달성했으며 임베딩 모델이 정확도와 지연 시간 간 최적의 균형을 보인다는 결과를 제시합니다.

Ilias Aarab2026-03-13💬 cs.CL

Few-for-Many Personalized Federated Learning

이 논문은 수천 명의 클라이언트를 효율적으로 지원하기 위해 $M$ 개의 개별 모델 대신 $K$ 개의 공유 서버 모델을 최적화하는 'Few-for-Many' 프레임워크를 제안하고, 이를 통해 자동적으로 모델 다양성을 발견하며 기존 최첨단 방법보다 뛰어난 개인화 성능을 달성하는 'FedFew' 알고리즘을 제시합니다.

Ping Guo, Tiantian Zhang, Xi Lin, Xiang Li, Zhi-Ri Tang, Qingfu Zhang2026-03-13🤖 cs.AI

Can RL Improve Generalization of LLM Agents? An Empirical Study

이 논문은 강화학습 미세조정 (RFT) 이가 환경 내 작업 난이도 변화에는 잘 일반화되지만, 관찰 및 행동 인터페이스가 다른 미지의 환경으로의 전이에는 한계가 있음을 밝히고, 순차적 학습과 혼합 학습을 통해 전이 성능을 향상시키고 망각을 최소화할 수 있음을 실증적으로 제시합니다.

Zhiheng Xi, Xin Guo, Jiaqi Liu, Jiazheng Zhang, Yutao Fan, Zhihao Zhang, Shichun Liu, Mingxu Chai, Xiaowei Shi, Yitao Zhai, Xunliang Cai, Tao Gui, Qi Zhang, Xuanjing Huang2026-03-13🤖 cs.AI

Flowcean - Model Learning for Cyber-Physical Systems

이 논문은 사이버-물리 시스템 (CPS) 의 복잡한 모델링 과정을 자동화하고 모듈성 및 사용성을 강화하기 위해 다양한 학습 전략과 평가 지표를 통합한 데이터 기반 프레임워크 'Flowcean'을 제안합니다.

Maximilian Schmidt, Swantje Plambeck, Markus Knitt, Hendrik Rose, Goerschwin Fey, Jan Christian Wieck, Stephan Balduin2026-03-13🤖 cs.LG

An Intent of Collaboration: On Agencies between Designers and Emerging (Intelligent) Technologies

이 논문은 생성형 AI 와의 협업 과정에서 디자이너가 창의적 주체성을 상실하지 않고 회복하기 위해서는 내적 성찰, 기술에 대한 구조적 이해, 그리고 인간과 기술 간의 관계 역학을 의도적으로 조정하는 것이 필요함을 강조합니다.

Pei-Ying Lin, Julie Heij, Iris Borst, Britt Joosten, Kristina Andersen, Wijnand IJsselsteijn2026-03-13🤖 cs.AI

Sim-to-reality adaptation for Deep Reinforcement Learning applied to an underwater docking application

이 논문은 Stonefish 시뮬레이터와 멀티프로세싱 프레임워크를 활용한 고충실도 디지털 트윈 환경에서 PPO 알고리즘을 통해 훈련된 심층 강화학습 기반 AUV 도킹 제어기가 시뮬레이션에서 90% 이상의 성공률을 보였으며, 실제 수중 실험을 통해 시뮬레이션과 현실 간의 격차를 성공적으로 극복하고 부드러운 도킹을 달성했음을 입증합니다.

Alaaeddine Chaarani, Narcis Palomeras, Pere Ridao2026-03-13🤖 cs.AI

Just Use XML: Revisiting Joint Translation and Label Projection

이 논문은 XML 태그를 활용하여 번역과 라벨 프로젝션을 동시에 수행하는 'LabelPigeon' 프레임워크를 제안함으로써, 기존 방법론의 번역 품질 저하 문제를 해결하고 11 개 언어에서 번역 품질을 향상시키며 27 개 언어에서 NER 등 하류 작업의 교차 언어 전이 성능을 크게 개선함을 보여줍니다.

Thennal D K, Chris Biemann, Hans Ole Hatzel2026-03-13💬 cs.CL

Cascade: Composing Software-Hardware Attack Gadgets for Adversarial Threat Amplification in Compound AI Systems

이 논문은 전통적인 소프트웨어 및 하드웨어 취약점이 LLM 특유의 알고리즘적 약점과 결합되어 컴파운드 AI 시스템의 무결성과 기밀성을 위협하는 새로운 공격 기법 'Cascade'를 제안하고, 이를 체계화하여 향후 방어 전략 수립의 기초를 마련합니다.

Sarbartha Banerjee, Prateek Sahu, Anjo Vahldiek-Oberwagner, Jose Sanchez Vicarte, Mohit Tiwari2026-03-13🤖 cs.AI

Slow-Fast Inference: Training-Free Inference Acceleration via Within-Sentence Support Stability

이 논문은 문장 내 주의 지원이 안정적으로 유지된다는 관찰을 바탕으로, 기존 체크포인트를 재학습 없이 적용하여 긴 문맥과 추론 작업에서 1.6 배에서 14.4 배까지 추론 처리량을 향상시키면서도 품질을 유지하는 'Slow-Fast Inference'라는 새로운 추론 가속 프레임워크를 제안합니다.

Xingyu Xie, Zhaochen Yu, Yue Liao, Tao Wang, Kim-Chuan Toh, Shuicheng Yan2026-03-13🤖 cs.LG

XSkill: Continual Learning from Experience and Skills in Multimodal Agents

이 논문은 멀티모달 에이전트가 매개변수 업데이트 없이 과거 경험을 바탕으로 지속적으로 학습할 수 있도록 시각적 관찰에 기반한 경험과 기술이라는 두 가지 상보적 지식 스트림을 통합한 'XSkill' 프레임워크를 제안하고, 다양한 벤치마크에서 기존 방법들을 크게 능가하는 성능을 입증합니다.

Guanyu Jiang (May), Zhaochen Su (May), Xiaoye Qu (May), Yi R. (May), Fung2026-03-13🤖 cs.AI

Coarse-Guided Visual Generation via Weighted h-Transform Sampling

이 논문은 사전 학습된 확산 모델을 활용하여 훈련 없이 저해상도 참조 이미지로부터 고품질 시각 콘텐츠를 생성하기 위해, h-변환을 기반으로 한 드리프트 함수와 노이즈 수준 인식 스케줄을 도입한 새로운 유도 생성 방법을 제안합니다.

Yanghao Wang, Ziqi Jiang, Zhen Wang, Long Chen2026-03-13🤖 cs.AI

Chemical Reaction Networks Learn Better than Spiking Neural Networks

이 논문은 은닉층이 없는 화학 반응 네트워크가 은닉층이 필요한 스파이킹 신경망보다 분류 작업을 더 정확하게 효율적으로 학습할 수 있음을 수학적으로 증명하고 실험을 통해 검증함으로써, 화학적 컴퓨터의 기계 학습 가능성과 생물학적 세포의 학습 효율성을 설명합니다.

Sophie Jaffard, Ivo F. Sbalzarini2026-03-13📊 stat

Beyond Convolution: A Taxonomy of Structured Operators for Learning-Based Image Processing

이 논문은 합성곱 연산의 한계를 극복하기 위해 학습 기반 이미지 처리를 위한 구조화된 연산자 5 가지 계열 (분해 기반, 적응형 가중치, 기저 적응, 적분 및 커널, 어텐션 기반) 에 대한 체계적인 분류를 제시하고, 각 연산자의 구조적 특성과 적용 분야를 비교 분석하며 향후 연구 방향을 제시합니다.

Simone Cammarasana2026-03-13🤖 cs.AI

Paper Title: LoV3D: Grounding Cognitive Prognosis Reasoning in Longitudinal 3D Brain MRI via Regional Volume Assessments

LoV3D 는 표준화된 부피 측정치를 기반으로 한 자동화된 검증기를 통해 3D 뇌 MRI 의 종단적 변화를 지역적 해부학적 평가와 일관성 있게 연결함으로써, 환각을 줄이고 알츠하이머병 등 신경퇴행성 질환의 진단 정확도와 일반화 성능을 획기적으로 향상시킨 새로운 3D 비전 - 언어 모델 파이프라인입니다.

Zhaoyang Jiang, Zhizhong Fu, David McAllister, Yunsoo Kim, Honghan Wu2026-03-13🤖 cs.AI

A Multi-Label Temporal Convolutional Framework for Transcription Factor Binding Characterization

이 논문은 전사 인자 (TF) 결합 부위 예측을 단일 TF 가 아닌 다중 레이블 분류 문제로 접근하여 시계열 합성곱 네트워크 (TCN) 를 활용함으로써 TF 간 상호작용과 협력적 조절 메커니즘을 포착하고 생물학적으로 유의미한 결합 패턴을 규명하는 새로운 프레임워크를 제시합니다.

Pietro Demurtas, Ferdinando Zanchetta, Giovanni Perini, Rita Fioresi2026-03-13🧬 q-bio

Resource-Efficient Iterative LLM-Based NAS with Feedback Memory

이 논문은 피드백 메모리와 이중 LLM 전략을 활용하여 단일 소비자용 GPU 에서만 실행 가능한 자원 효율적인 반복형 신경망 구조 탐색 (NAS) 파이프라인을 제안하며, 대규모 클라우드 인프라 없이도 이미지 분류 성능을 크게 향상시킵니다.

Xiaojie Gu, Dmitry Ignatov, Radu Timofte2026-03-13🤖 cs.LG

Human-Centred LLM Privacy Audits: Findings and Frictions

이 논문은 대규모 언어 모델 (LLM) 이 개인의 이름과 어떤 정보를 연관 짓는지 사용자가 직접 확인할 수 있도록 돕는 'LMP2'라는 브라우저 기반 자기 감사 도구를 소개하고, 사용자 연구와 다양한 모델 평가를 통해 LLM 프라이버시 감사의 실효성을 입증함과 동시에 확률적이고 맥락 의존적인 생성형 AI 평가의 근본적인 난제와 개선 방향을 제시합니다.

Dimitri Staufer, Kirsten Morehouse, David Hartmann, Bettina Berendt2026-03-13💬 cs.CL

A Robust and Efficient Multi-Agent Reinforcement Learning Framework for Traffic Signal Control

이 논문은 Vissim 시뮬레이터에서 검증된 강화 학습 기반의 다중 에이전트 프레임워크를 제안하여, 회전비 무작위화, 지수적 신호 단계 조정, 그리고 이웃 기반 관측 기법을 통해 기존 방법보다 10% 이상 평균 대기 시간을 단축하고 다양한 교통 상황에 대한 일반화 성능과 제어 안정성을 크게 향상시켰음을 보여줍니다.

Sheng-You Huang, Hsiao-Chuan Chang, Yen-Chi Chen, Ting-Han Wei, I-Hau Yeh, Sheng-Yao Kuan, Chien-Yao Wang, Hsuan-Han Lee, I-Chen Wu2026-03-13🤖 cs.AI

← 이전 다음 →