cs 편의 논문 | Gist.Science

Stay in your Lane: Role Specific Queries with Overlap Suppression Loss for Dense Video Captioning

이 논문은 밀집 비디오 캡셔닝의 다중 작업 간섭과 시간적 중복성을 해결하기 위해 국소화와 캡션 생성을 위한 역할별 쿼리를 분리하고, 의미적 일관성을 위한 대비 정렬, 시간적 중복을 억제하는 새로운 손실 함수, 그리고 개념 수준의 표현을 강화하는 경량 모듈을 제안합니다.

Seung Hyup Baek, Jimin Lee, Hyeongkeun Lee + 1 more2026-03-13💻 cs

Detect Anything in Real Time: From Single-Prompt Segmentation to Multi-Class Detection

이 논문은 SAM3 의 비전 백본이 클래스와 무관하다는 구조적 불변성을 활용하여 가중치 수정 없이 실시간 다중 클래스 검출을 가능하게 하는 훈련 없는 프레임워크인 DART 를 제안함으로써, 기존 오픈-보카불러리 검출기보다 뛰어난 성능과 속도를 달성함을 보여줍니다.

Mehmet Kerem Turkcan2026-03-13💻 cs

EducaSim: Interactive Simulacra for CS1 Instructional Practice

이 논문은 대규모 온라인 강의를 위한 초보 교사들의 교수법 연수를 위해 생성형 에이전트를 활용한 대화형 시뮬레이션 프레임워크인 'EducaSim'을 제안하고, 20,000 명의 학생을 지원하는 6 주간의 CS1 과정에서 이를 실험적으로 적용하여 긍정적인 효과를 확인한 내용을 다룹니다.

Cameron Mohne, Nicholas Vo, Dora Demszky + 1 more2026-03-13💻 cs

Enhancing Lightweight Vision Language Models through Group Competitive Learning for Socially Compliant Navigation

이 논문은 사회적 준수 내비게이션을 위한 경량 비전 언어 모델의 추론 능력을 향상시키기 위해 그룹 경쟁 학습 (GCL) 전략을 제안하며, 이를 통해 소형 모델이 대규모 모델보다 뛰어난 성능을 달성하고 실시간 배포의 효율성과 정확성을 동시에 확보할 수 있음을 입증합니다.

Xinyu Zhang, Atsushi Konno, Toshihiko Yamasaki + 1 more2026-03-13💻 cs

Follow the Saliency: Supervised Saliency for Retrieval-augmented Dense Video Captioning

이 논문은 기존 검색 기반 밀도 비디오 캡셔닝의 한계를 극복하기 위해, DVC 지상 진실 주석을 기반으로 추가 주석 없이 학습된 하이라이트 감지 모듈을 통해 프레임 수준의 중요도 (saliency) 를 지도 학습하고, 이를 검색 및 캡션 생성에 통합하여 시간적 일관성을 높인 STaRC 프레임워크를 제안하며 YouCook2 와 ViTT 벤치마크에서 최첨단 성능을 달성함을 보여줍니다.

Seung hee Choi, MinJu Jeon, Hyunwoo Oh + 2 more2026-03-13💻 cs

CoViLLM: An Adaptive Human-Robot Collaborative Assembly Framework Using Large Language Models for Manufacturing

이 논문은 자연어 지시와 LLM 기반의 작업 계획, 객체 인식 기술을 결합하여 기존 규칙 기반의 한계를 극복하고 맞춤형 및 미처 보지 못한 제품 조립을 지원하는 적응형 인간 - 로봇 협업 프레임워크 'CoViLLM'을 제안하고 그 유효성을 검증합니다.

Jiabao Zhao, Jonghan Lim, Hongliang Li + 1 more2026-03-13💻 cs

NFPO: Stabilized Policy Optimization of Normalizing Flow for Robotic Policy Learning

이 논문은 다중 모드 분포 모델링 능력을 갖춘 정규화 흐름 (Normalizing Flow) 을 로봇 정책 학습에 적용하되, 온라인 강화학습에서의 훈련 불안정성을 해결하여 NFPO 라는 안정화된 알고리즘을 제안하고 시뮬레이션 및 실제 로봇 환경에서 우수한 성능을 입증합니다.

Diyuan Shi, Yiqi Tang, Zifeng Zhuang + 1 more2026-03-13💻 cs

A scalable framework for correcting public transport timetables using real-time data for accessibility analysis

이 논문은 영국의 실시간 버스 데이터를 활용하여 정시표 기반의 접근성 분석 한계를 극복하고, 대규모 공간적·시간적 범위에서 실제 운행 성능을 반영한 확장 가능한 접근성 분석 프레임워크를 제시합니다.

Zihao Chen, Federico Botta2026-03-13💻 cs

SPARK: Skeleton-Parameter Aligned Retargeting on Humanoid Robots with Kinodynamic Trajectory Optimization

이 논문은 인간 동작 데이터를 로봇의 구조와 역학에 맞춰 보정하는 스키레톤 정렬 기법과 점진적 운동역학 궤적 최적화를 결합하여, 다양한 휴머노이드 로봇에 적용 가능한 자연스럽고 물리적으로 일관된 모션 참조를 생성하는 SPARK 프레임워크를 제안합니다.

Hanwen Wang, Qiayuan Liao, Bike Zhang + 3 more2026-03-13💻 cs

Quantized Inference for OneRec-V2

이 논문은 LLM 과 유사한 통계적 특성과 높은 하드웨어 활용도를 보이는 생성형 추천 모델 OneRec-V2 에 FP8 양자화 기법을 적용하여, 추천 시스템의 성능 저하 없이 지연 시간을 49% 단축하고 처리량을 92% 증가시키는 효율적인 추론 프레임워크를 제안합니다.

Yi Su, Xinchen Luo, Hongtao Cheng + 7 more2026-03-13💻 cs

AutoVeriFix+: High-Correctness RTL Generation via Trace-Aware Causal Fix and Semantic Redundancy Pruning

이 논문은 고수준 의미 추론과 상태 공간 탐색을 통합한 3 단계 프레임워크인 AutoVeriFix+ 를 제안하여, LLM 기반 Verilog RTL 생성의 기능적 정확도를 80% 이상으로 높이고 불필요한 논리를 25% 제거하여 면적 최적화를 달성함을 보여줍니다.

Yan Tan, Xiangchen Meng, Zijun Jiang + 1 more2026-03-13💻 cs

PRMB: Benchmarking Reward Models in Long-Horizon CBT-based Counseling Dialogue

이 논문은 장기적 CBT 상담 대화에서 기존 평가의 한계를 극복하고 추론 시 전략 및 생성형 보상 모델의 잠재력을 규명하기 위해, 다중 세션 상담을 위한 포괄적인 보상 모델 벤치마크인 PRMB 를 제안하고 그 유효성을 입증합니다.

Yougen Zhou, Qin Chen, Ningning Zhou + 2 more2026-03-13💻 cs

ActiveFreq: Integrating Active Learning and Frequency Domain Analysis for Interactive Segmentation

이 논문은 활성 학습과 주파수 영역 분석을 통합하여 사용자의 개입을 최소화하면서도 의료 이미지 분할의 정확도를 극대화하는 새로운 프레임워크인 ActiveFreq 를 제안하고, 이를 통해 기존 방법 대비 분할 성능과 효율성을 크게 향상시켰음을 ISIC-2017 및 OAI-ZIB 데이터셋 실험을 통해 입증합니다.

Lijun Guo, Qian Zhou, Zidi Shi + 2 more2026-03-13💻 cs

Manifold-Optimal Guidance: A Unified Riemannian Control View of Diffusion Guidance

이 논문은 고도화된 안내 스케일에서 발생하는 생성 품질 저하 문제를 해결하기 위해, 데이터 매니폴드 상의 기하학적 일치를 보장하는 리만 제어 관점의 'Manifold-Optimal Guidance (MOG)' 프레임워크와 자동 튜닝이 가능한 'Auto-MOG'를 제안합니다.

Zexi Jia, Pengcheng Luo, Zhengyao Fang + 2 more2026-03-13💻 cs

From Pen Strokes to Sleep States: Detecting Low-Recovery Days Using Sigma-Lognormal Handwriting Features

이 연구는 28 일간의 야생 데이터 수집을 통해 시그마 - 로그정규 모델 기반의 필기 동역학 특징을 활용하여 건강한 개인의 수면 회복 상태를 비침습적으로 탐지할 수 있음을 입증했습니다.

Chisa Tanaka, Andrew Vargo, Anna Scius-Bertrand + 2 more2026-03-13💻 cs

Prediction of Grade, Gender, and Academic Performance of Children and Teenagers from Handwriting Using the Sigma-Lognormal Model

이 논문은 일본 학생들의 손글씨 운동 데이터를 시그마 - 로그정규 모델 등 다양한 특징 추출 기법과 머신러닝 모델을 활용해 분석한 결과, 손글씨 역학이 학년, 성별, 학업 성취도 예측에 유의미한 정보를 담고 있으며 특히 학년 예측에 효과적임을 입증했습니다.

Adrian Iste, Kazuki Nishizawa, Chisa Tanaka + 4 more2026-03-13💻 cs

← 이전 다음 →

cs