Retrieving Patient-Specific Radiomic Feature Sets for Transparent Knee MRI Assessment

이 논문은 환자별 MRI 영상에 대해 투명성과 해석 가능성을 유지하면서도 딥러닝 모델과 경쟁력 있는 진단 성능을 내기 위해, 기존 상위 k 개 특징 선택 방식의 한계를 극복하고 각 환자마다 최적의 상호보완적 특징 집합을 2 단계 검색 전략으로 효율적으로 추출하는 새로운 프레임워크를 제안합니다.

Yaxi Chen, Simin Ni, Jingjing Zhang + 7 more2026-03-04💻 cs

Cultural Counterfactuals: Evaluating Cultural Biases in Large Vision-Language Models with Counterfactual Examples

이 논문은 인종이나 성별과 같은 외형적 특성이 아닌 종교, 국적, 사회경제적 지위와 같은 문화적 맥락에 따른 편향을 측정하기 위해, 동일한 인물을 다양한 실제 문화적 배경에 배치한 약 6 만 개의 합성 반사실 (counterfactual) 이미지 데이터셋인 'Cultural Counterfactuals'를 제안하고 이를 통해 대규모 시각 - 언어 모델 (LVLM) 의 문화적 편향을 정량화하는 방법을 제시합니다.

Phillip Howard, Xin Su, Kathleen C. Fraser2026-03-04💻 cs

Authenticated Contradictions from Desynchronized Provenance and Watermarking

이 논문은 C2PA 메타데이터와 워터마킹 검사가 서로 독립적으로 작동할 때 발생하는 '무결성 충돌' 문제를 실증적으로 규명하고, 메타데이터 조작을 통해 생성된 AI 콘텐츠가 인간 제작으로 위장할 수 있음을 보여주며, 두 계층을 통합하여 검증하는 교차 계층 감사 프로토콜을 제안합니다.

Alexander Nemecek, Hengzhi He, Guang Cheng + 1 more2026-03-04⚡ eess

Advancing Earth Observation Through Machine Learning: A TorchGeo Tutorial

이 논문은 지리 공간 데이터의 고유한 특성을 고려한 머신러닝 파이프라인 구축을 위해 PyTorch 기반 라이브러리인 TorchGeo 의 핵심 추상화를 소개하고, Sentinel-2 영상을 활용한 다중 스펙트럼 수역 분할을 위한 종단간 사례 연구를 통해 지리 공간 분석을 위한 예측 결과 생성 방법까지 다루는 튜토리얼을 제안합니다.

Caleb Robinson, Nils Lehmann, Adam J. Stewart + 4 more2026-03-04💻 cs

OpenMarcie: Dataset for Multimodal Action Recognition in Industrial Environments

이 논문은 스마트 공장의 작업자 활동 모니터링을 위해 웨어러블 센서와 카메라를 활용한 36 명의 참가자로부터 수집된 37 시간 이상의 다중 모달 데이터로 구성된 'OpenMarcie'라는 대규모 데이터셋을 소개하고, 이를 활동 분류, 오픈 보카불러리 캡셔닝, 교차 모달 정렬 등 세 가지 작업에서 벤치마크한 내용을 담고 있습니다.

Hymalai Bello, Lala Ray, Joanna Sorysz + 2 more2026-03-04⚡ eess

From Fewer Samples to Fewer Bits: Reframing Dataset Distillation as Joint Optimization of Precision and Compactness

이 논문은 데이터셋 증류의 효율성을 높이기 위해 샘플 수와 정밀도를 고정된 비트 예산 하에 공동으로 최적화하는 '양자화 인식 데이터셋 증류 (QuADD)' 프레임워크를 제안하고, 이를 통해 기존 방법들보다 비트당 정확도가 뛰어난 성능을 입증합니다.

My H. Dinh, Aditya Sant, Akshay Malhotra + 2 more2026-03-04🤖 cs.AI

ORCA: Orchestrated Reasoning with Collaborative Agents for Document Visual Question Answering

이 논문은 복잡한 문서 시각적 질문 응답 (DocVQA) 과제를 해결하기 위해 논리적 단계 분해, 전문 에이전트 협업, 그리고 논쟁 기반 검증 메커니즘을 통합한 다중 에이전트 프레임워크 'ORCA'를 제안하고, 이를 통해 기존 최첨단 방법론보다 우수한 성능을 입증합니다.

Aymen Lassoued, Mohamed Ali Souibgui, Yousri Kessentini2026-03-04💻 cs

Large-Scale Dataset and Benchmark for Skin Tone Classification in the Wild

이 논문은 10 단계 MST 척도로 라벨링된 대규모 오픈 액세스 데이터셋 STW 와 이를 기반으로 한 딥러닝 기반의 최첨단 피부 톤 분류 모델 SkinToneNet 을 제안하여, 기존 방법론의 한계를 극복하고 공개 데이터셋의 공정성을 신뢰할 수 있게 평가할 수 있는 체계를 마련했습니다.

Vitor Pereira Matias, Márcus Vinícius Lobo Costa, João Batista Neto + 1 more2026-03-04🤖 cs.LG

MUSE: A Run-Centric Platform for Multimodal Unified Safety Evaluation of Large Language Models

이 논문은 텍스트 중심의 기존 안전 평가 한계를 극복하기 위해 자동 크로스모달 페이로드 생성, 다중 턴 공격 알고리즘, 그리고 인터-턴 모달리티 스위칭 (ITMS) 을 통합한 오픈소스 플랫폼 'MUSE'를 제안하며, 이를 통해 멀티모달 LLM 의 정렬이 오디오, 이미지, 비디오 등 다른 모달리티로 일반화되지 않을 수 있음을 실험적으로 입증했습니다.

Zhongxi Wang, Yueqian Lin, Jingyang Zhang + 2 more2026-03-04⚡ eess