cs 편의 논문 | Gist.Science

ID-LoRA: Identity-Driven Audio-Video Personalization with In-Context LoRA

이 논문은 텍스트 프롬프트, 참조 이미지, 짧은 오디오 클립을 단일 생성 과정으로 통합하여 시각적 외모와 목소리를 동시에 개인화하는 새로운 모델 'ID-LoRA'를 제안하며, 이를 통해 기존 방법론 대비 뛰어난 음성 유사도와 화자 특성을 구현하고 단일 GPU 에서 3 천 개의 훈련 쌍만으로 학습이 가능함을 보여줍니다.

Aviad Dahan, Moran Yanuka, Noa Kraicer, Lior Wolf, Raja Giryes2026-03-12💻 cs

Two-Path Operators, Triadic Decompositions, and Safe Quotients for Ego-Centered Network Compression

이 논문은 이차 경로 (wedges) 를 기반으로 한 연산자 관점을 도입하여 에고 중심 네트워크를 압축하는 삼중 분해와 안전한 몫 (quotient) 구성 방법을 제시하고, 이를 통해 이차 보행 질량의 전이 부등식과 오차 특성을 증명하며 10 개의 벤치마크 그래프에서 그 유효성을 입증합니다.

Moses Boudourides2026-03-12💻 cs

Design of a Robot-Assisted Chemical Dialysis System

이 논문은 과학자들의 번거로운 실험 작업을 자동화하기 위해 사용자 중심 접근법을 통해 로봇 보조 투석 시스템을 설계하고, 이를 통해 과학적 발견을 가속화하고 연구자의 업무 부담을 줄일 수 있음을 보여줍니다.

Diane Jung, Caleb Escobedo, Noah Liska, Maitrey Gramopadhye, Daniel Szafir, Alessandro Roncone, Carson Bruns2026-03-12💻 cs

MALTA: Maintenance-Aware Technical Lag, Estimation to Address Software Abandonment

이 논문은 기존 기술적 지연 (Technical Lag) 지표가 소프트웨어 방치 상태를 놓치는 한계를 지적하고, 개발 활동 및 유지보수자 반응성 등을 종합적으로 평가하여 방치된 종속성을 효과적으로 식별하는 'MALTA' 프레임워크를 제안합니다.

Shane K. Panter, Nasir U. Eisty2026-03-12💻 cs

A Robust Deep Learning Framework for Bangla License Plate Recognition Using YOLO and Vision-Language OCR

이 논문은 복잡한 문자 체계와 불규칙한 레이아웃으로 인해 어려움이 많았던 방글라데시 번호판 인식을 위해 YOLOv8 기반의 적응형 훈련 전략과 비전 - 언어 OCR 모델을 결합하여 다양한 환경에서 97.83% 의 높은 정확도로 번호판을 정확하게 인식하는 강건한 딥러닝 프레임워크를 제안합니다.

Nayeb Hasin, Md. Arafath Rahman Nishat, Mainul Islam, Khandakar Shakib Al Hasan, Asif Newaz2026-03-12💻 cs

SpecOps: A Fully Automated AI Agent Testing Framework in Real-World GUI Environments

이 논문은 실제 GUI 환경에서 LLM 기반 자율 에이전트의 신뢰성을 평가하기 위해 4 단계 전문 에이전트 아키텍처를 갖춘 완전 자동화 테스트 프레임워크 'SpecOps'를 제안하며, 기존 방법론 대비 뛰어난 버그 탐지 능력과 비용 효율성을 입증합니다.

Syed Yusuf Ahmed, Shiwei Feng, Chanwoo Bae, Calix Barrus Xiangyu Zhang2026-03-12💻 cs

HiFIVE: High-Fidelity Vector-Tile Reduction for Interactive Map Exploration

이 논문은 대규모 공간 데이터의 시각적 충실도와 상호작용 성능을 유지하면서 클라이언트 측 렌더링을 위한 타일 크기를 효율적으로 축소하는 새로운 데이터 관리 프레임워크인 HiFIVE 를 제안하고, 이를 위한 NP-난해한 문제를 정의하고 해결하는 두 단계 방식을 제시합니다.

Tarlan Bahadori, Ahmed Eldawy2026-03-12💻 cs

Post-Quantum Entropy as a Service for Embedded Systems

이 논문은 임베디드 시스템의 엔트로피 부족 문제를 해결하기 위해 양자 난수 생성기를 서버로 활용하고 ML-KEM 및 ML-DSA 같은 포스트 양자 암호 기술을 적용한 '엔트로피 서비스 (QEaaS)' 아키텍처를 제안하며, ESP32 기반 벤치마크를 통해 포스트 양자 구성이 기존 고전 암호 방식보다 오히려 더 빠른 성능을 보임을 입증했습니다.

Javier Blanco-Romero, Yuri Melissa Garcia-Niño, Florina Almenares Mendoza, Daniel Díaz-Sánchez, Carlos García-Rubio, Celeste Campo2026-03-12💻 cs

Update-Free On-Policy Steering via Verifiers

이 논문은 베이스 정책의 매개변수를 변경하지 않고도 실행 시 성공 확률을 예측하여 행동을 유도하는 'UF-OPS'라는 업데이트 없는 온-폴리시 조향 방법을 제안함으로써, 블랙박스 확산 정책의 성공률을 평균 49% 향상시킨다고 설명합니다.

Maria Attarian, Ian Vyse, Claas Voelcker, Jasper Gerigk, Evgenii Opryshko, Anas Almasri, Sumeet Singh, Yilun Du, Igor Gilitschenski2026-03-12💻 cs

Instant Runoff Voting on Graphs: Exclusion Zones and Distortion

이 논문은 그래프 기반 메트릭 선호도 환경에서 즉각 결선투표 (IRV) 의 배제 구역 (exclusion zone) 문제와 왜곡 (distortion) 을 연구하여, 일반 그래프에서는 NP-난해하지만 트리 구조에서는 다항 시간 내에 해결 가능함을 증명하고, 특정 조건을 만족하는 모든 순위 기반 탈락 규칙에 대해 해당 문제의 계산적 한계를 규명했습니다.

Georgios Birmpas, Georgios Chionas, Efthyvoulos Drousiotis, Soodeh Habibi, Marios Mavronicolas, Paul Spirakis2026-03-12💻 cs

From Imitation to Intuition: Intrinsic Reasoning for Open-Instance Video Classification

이 논문은 기존 모델의 단순 모방을 넘어 강화를 학습과 직관적 보정을 통해 추론 능력을 갖춘 'DeepIntuit' 프레임워크를 제안함으로써, 기존 벤치마크를 벗어난 광범위한 변이를 가진 오픈 인스턴스 비디오 분류 문제를 해결합니다.

Ke Zhang, Xiangchen Zhao, Yunjie Tian, Jiayu Zheng, Vishal M. Patel, Di Fu2026-03-12💻 cs

SteadyTray: Learning Object Balancing Tasks in Humanoid Tray Transport via Residual Reinforcement Learning

이 논문은 ReST-RL 이라는 계층적 강화학습 아키텍처를 통해 보행 진동과 화물 안정화를 분리 제어함으로써, 인간형 로봇이 외부 방해와 다양한 물체를 운반할 때에도 높은 성공률과 제로샷 시뮬레이션-실제 일반화 능력을 달성함을 보여줍니다.

Anlun Huang, Zhenyu Wu, Soofiyan Atar, Yuheng Zhi, Michael Yip2026-03-12💻 cs

Towards Modeling Situational Awareness Through Visual Attention in Clinical Simulations

이 연구는 40 명의 임상 전문가가 참여한 가상현실 심정지 시뮬레이션 중의 안구 추적 데이터를 전환 네트워크 분석 (TNA) 에 적용하여, 역할과 시나리오 단계에 따라 시각적 주의가 어떻게 역동적으로 재분배되는지를 규명함으로써 팀 인지 기능의 분화를 매핑하고 급성 요양 훈련을 위한 새로운 분석 도구를 제시합니다.

Haoting Gao, Kapotaksha Das, Mohamed Abouelenien, Michael Cole, James Cooke, Vitaliy Popov2026-03-12💻 cs

PRoADS: Provably Secure and Robust Audio Diffusion Steganography with latent optimization and backward Euler Inversion

이 논문은 직교 행렬 투영을 통해 초기 노이즈에 비밀 메시지를 임베딩하고, 잠재 공간 최적화와 역방향 오일러 역변환을 도입하여 재구성 오차를 최소화함으로써 64kbps MP3 압축 하에서도 0.15% 의 매우 낮은 비트 오류율을 달성하는 증명 가능한 보안성과 강인성을 갖춘 오디오 확산 스테가노그래피 프레임워크 'PRoADS'를 제안합니다.

YongPeng Yan, Yanan Li, Qiyang Xiao, Yanzhen Ren2026-03-12💻 cs

The Orthogonal Vulnerabilities of Generative AI Watermarks: A Comparative Empirical Benchmark of Spatial and Latent Provenance

이 논문은 공간 도메인 (RivaGAN) 과 잠재 도메인 (Tree-Ring) 수학적 매니폴드에서 작동하는 현재 최첨단 AI 워터마크가 각각 알고리즘적 픽셀 재작성과 기하학적 불일치에 대해 상호 배타적이고 직교하는 취약점을 보이며 단일 도메인 방식으로는 현대적 적대적 공격에 대응할 수 없음을 실증적 벤치마크를 통해 규명하고, 다중 도메인 암호화 아키텍처의 필요성을 제시합니다.

Jesse Yu, Nicholas Wei2026-03-12💻 cs

← 이전 다음 →

cs