Visually-Guided Controllable Medical Image Generation via Fine-Grained Semantic Disentanglement

이 논문은 복잡한 시각적 세부 사항과 추상적인 임상 텍스트 간의 모달리티 격차와 의미적 얽힘 문제를 해결하기 위해, 시각적 사전 지식을 활용한 교차 모드 잠재 정렬 메커니즘과 하이브리드 특징 융합 모듈을 통해 의료 이미지의 미세한 구조적 제어를 가능하게 하는 '시각 유도형 텍스트 해리 (Visually-Guided Text Disentanglement)' 프레임워크를 제안합니다.

Xin Huang, Junjie Liang, Qingshan Hou, Peng Cao, Jinzhu Yang, Xiaoli Liu, Osmar R. Zaiane2026-03-12💻 cs

Sparse Task Vector Mixup with Hypernetworks for Efficient Knowledge Transfer in Whole-Slide Image Prognosis

본 논문은 희소 태스크 벡터 믹스업과 하이퍼네트워크를 활용하여 다양한 암 데이터에서 일반화 가능한 지식을 효율적으로 전이하고, 대규모 연합 학습이나 다중 모델 추론 없이도 전장 슬라이드 이미지 (WSI) 기반 암 예후 예측 성능을 획기적으로 향상시킨 'STEPH'라는 새로운 기법을 제안합니다.

Pei Liu, Xiangxiang Zeng, Tengfei Ma, Yucheng Xing, Xuanbai Ren, Yiping Liu2026-03-12💻 cs

BinWalker: Development and Field Evaluation of a Quadruped Manipulator Platform for Sustainable Litter Collection

이 논문은 험한 지형에서도 자율적으로 쓰레기를 탐지, 집어 담을 수 있는 4 족 보행 로봇 플랫폼 'BinWalker'의 개발과 야외 실증 평가를 통해 환경 정화 작업의 자동화 가능성을 입증했습니다.

Giulio Turrisi, Angelo Bratta, Giovanni Minelli, Gabriel Fischer Abati, Amir H. Rad, João Carlos Virgolino Soares, Claudio Semini2026-03-12💻 cs

Graphing Inline: Understanding Word-scale Graphics Use in Scientific Papers

이 논문은 12 만 6 천여 편의 과학 논문에서 추출한 909 개의 단어 규모 그래픽을 분석하여 그 위치, 기능, 시각적 표현을 체계화하는 프레임워크를 제시하고, 현재는 아이콘이 주를 이루며 사용 빈도가 낮다는 점을 밝힘으로써 학술적 소통을 개선할 수 있는 기술적·행정적 방안을 논의합니다.

Siyu Lu, Yanhan Liu, Shiyu Xu, Ruishi Zou, Chen Ye2026-03-12💻 cs

An Event-Driven E-Skin System with Dynamic Binary Scanning and real time SNN Classification

이 논문은 16x16 압저항성 촉각 어레이와 이벤트 기반 바이너리 스캔 전략을 통합하여 데이터 수집 오버헤드를 획기적으로 줄이고, FPGA 기반의 스파이킹 신경망 (Conv-SNN) 을 통해 실시간 손글씨 숫자 인식 정확도 92.11% 를 달성한 효율적인 뉴로모픽 전자 피부 시스템을 제안합니다.

Gaishan Li, Zhengnan Fu, Anubhab Tripathi, Junyi Yang, Arindam Basu2026-03-12💻 cs

In-Memory ADC-Based Nonlinear Activation Quantization for Efficient In-Memory Computing

이 논문은 메모리 내 연산 (IMC) 시스템에서 아날로그 - 디지털 변환기 (ADC) 의 해상도 요구 사항을 줄이고 양자화 오차를 최소화하기 위해 경계 이상치를 억제하는 새로운 비선형 양자화 기법인 BS-KMQ 를 제안하고, 이를 통해 기존 설계 대비 7 배의 면적 개선과 최대 24 배의 에너지 효율 향상을 달성함을 보여줍니다.

Shuai Dong, Junyi Yang, Biyan Zhou, Hongyang Shang, Gourav Datta, Arindam Basu2026-03-12💻 cs

P-GSVC: Layered Progressive 2D Gaussian Splatting for Scalable Image and Video

이 논문은 이미지와 비디오의 확장 가능한 재구성을 위해 베이스 레이어와 향상 레이어로 구성된 2D 가우스 스플래팅을 제안하고, 레이어 간 호환성과 안정적인 점진적 재구성을 보장하기 위해 레이어 간 가우스를 동시에 최적화하는 결합 학습 전략을 통해 기존 순차적 학습 방식보다 PSNR 을 크게 향상시킨 P-GSVC 프레임워크를 소개합니다.

Longan Wang, Yuang Shi, Wei Tsang Ooi2026-03-12💻 cs

FP-Predictor - False Positive Prediction for Static Analysis Reports

이 논문은 정적 분석 도구의 높은 오탐지율을 해결하기 위해 코드 속성 그래프를 기반으로 한 그래프 합성곱 신경망 (GCN) 모델을 제안하여, CamBenchCAP 및 CryptoAPI-Bench 데이터셋에서 각각 100% 및 최대 96.6% 의 정확도로 오탐지를 효과적으로 예측하고 보안 취약점을 식별하는 데 성공했다고 요약할 수 있습니다.

Tom Ohlmer, Michael Schlichtig, Eric Bodden2026-03-12💻 cs

PET-F2I: A Comprehensive Benchmark and Parameter-Efficient Fine-Tuning of LLMs for PET/CT Report Impression Generation

이 논문은 41,000 건 이상의 실제 PET/CT 보고서로 구성된 대규모 벤치마크 'PET-F2I-41K'를 제시하고, 이를 통해 기존 LLM 들의 한계를 극복하며 임상적 정확도와 사실성을 크게 향상시킨 파라미터 효율적 미세조정 모델 'PET-F2I-7B'를 개발하고 평가한 연구입니다.

Yuchen Liu, Wenbo Zhang, Liling Peng, Yichi Zhang, Yu Fu, Xin Guo, Chao Qu, Yuan Qi, Le Xue2026-03-12💻 cs

R4-CGQA: Retrieval-based Vision Language Models for Computer Graphics Image Quality Assessment

이 논문은 CG 이미지 품질 평가의 한계를 해결하기 위해 6 가지 지각 차원을 기반으로 한 대규모 데이터셋과 질의응답 벤치마크를 구축하고, 시각적으로 유사한 이미지의 설명을 검색하여 증강 생성하는 R4-CGQA 프레임워크를 제안함으로써 비전 언어 모델의 CG 품질 평가 성능을 크게 향상시켰습니다.

Zhuangzi Li, Jian Jin, Shilv Cai, Weisi Lin2026-03-12💻 cs

Attribution as Retrieval: Model-Agnostic AI-Generated Image Attribution

이 논문은 기존 방법의 모델 의존성 한계를 극복하기 위해 AI 생성 이미지 출처 추적을 이미지 분류가 아닌 인스턴스 검색 문제로 재정의하고, 저비트 지문 생성과 비지도 사전 학습을 기반으로 한 모델 독립적 프레임워크 'LIDA'를 제안하여 제로샷 및 퓨샷 환경에서 최첨단 성능을 달성함을 보여줍니다.

Hongsong Wang, Renxi Cheng, Chaolei Han, Jie Gui2026-03-12💻 cs

Need for Speed: Zero-Shot Depth Completion with Single-Step Diffusion

이 논문은 테스트 시간 최적화의 부담을 제거하고 추론 속도를 획기적으로 개선하면서도 강력한 확산 모델의 사전 지식을 활용하여, 4.5 GPU 일의 낮은 학습 비용으로 다양한 환경에서 제로샷 성능을 달성하는 단일 단계 확산 기반 깊이 완성 프레임워크 'Marigold-SSD'를 제안합니다.

Jakub Gregorek, Paraskevas Pegios, Nando Metzger, Konrad Schindler, Theodora Kontogianni, Lazaros Nalpantidis2026-03-12💻 cs

Distilling LLM Semantic Priors into Encoder-Only Multi-Talker ASR with Talker-Count Routing

이 논문은 LLM 의 의미적 사전 지식을 인코더에 증류하고 화자 수를 예측하여 동적으로 디코딩 분기를 선택하는 Talker-Count Routing 을 도입함으로써, 계산 비용은 낮추면서도 화자 수가 증가할수록 성능이 향상되는 효율적인 인코더 전용 다화자 음성 인식 프레임워크를 제안합니다.

Hao Shi, Yusuke Fujita, Roman Koshkin, Mengjie Zhao, Yuan Gao, Lianbo Liu, Yui Sudo2026-03-12💻 cs

Layer Consistency Matters: Elegant Latent Transition Discrepancy for Generalizable Synthetic Image Detection

이 논문은 생성형 AI 로 생성된 합성 이미지와 실제 사진의 잠재 표현 내 계층 간 일관성 차이를 포착하는 '잠재 전이 불일치 (LTD)' 방법을 제안하여, 기존 방법들보다 뛰어난 일반화 성능과 탐지 정확도를 달성했다고 요약할 수 있습니다.

Yawen Yang, Feng Li, Shuqi Kong, Yunfeng Diao, Xinjian Gao, Zenglin Shi, Meng Wang2026-03-12💻 cs