cs 편의 논문 | Gist.Science

DSER: Spectral Epipolar Representation for Efficient Light Field Depth Estimation

이 논문은 희소 각도 샘플링, 가림, 무질감 영역 및 다중 뷰 매칭 비용과 같은 과제를 해결하기 위해 에피폴라 도메인에서 주파수 일관성을 모델링하는 '심층 스펙트럴 에피폴라 표현 (DSER)'을 제안하여 정확도와 효율성을 모두 갖춘 밀도 광장 깊이 추정을 가능하게 합니다.

Noor Islam S. Mohammad, Md Muntaqim Meherab2026-03-12💻 cs

From Law to Gherkin: A Human-Centred Quasi-Experiment on the Quality of LLM-Generated Behavioural Specifications from Food-Safety Regulations

이 연구는 식품 안전 규정을 기반으로 Claude 와 Llama 를 활용해 생성된 Gherkin 행동 명세서의 품질을 평가한 결과, 높은 관련성과 명확성을 보였으나 환각 및 누락 가능성이 있어 안전-중요 분야에서 여전히 체계적인 인간 검토가 필요함을 밝혔습니다.

Shabnam Hassani, Mehrdad Sabetzadeh, Daniel Amyot2026-03-12💻 cs

Pixel Motion Diffusion is What We Need for Robot Control

이 논문은 고수준 의도와 저수준 로봇 동작을 구조화된 픽셀 모션 표현으로 연결하는 통합 확산 기반 프레임워크인 DAWN 을 제안하여, CALVIN 및 MetaWorld 벤치마크에서 최첨단 성능을 달성하고 적은 양의 실제 데이터로도 현실 세계로의 효과적인 전이를 입증했습니다.

E-Ro Nguyen, Yichi Zhang, Kanchana Ranasinghe, Xiang Li, Michael S. Ryoo2026-03-12💻 cs

Efficient Audio-Visual Speech Separation with Discrete Lip Semantics and Multi-Scale Global-Local Attention

이 논문은 시각적 구강 움직임을 이산적 의미 토큰으로 변환하는 DP-LipCoder 와 다중 스케일 전역 - 국소 어텐션 메커니즘을 활용한 경량화 모델 'Dolphin'을 제안하여, 기존 최첨단 모델 대비 분리 품질은 유지하거나 향상시키면서도 파라미터 수와 연산량을 획기적으로 줄인 효율적인 오디오 - 비주얼 음성 분리 솔루션을 제시합니다.

Kai Li, Kejun Gao, Xiaolin Hu2026-03-12💻 cs

PD-Diag-Net: Clinical-Priors guided Network on Brain MRI for Auxiliary Diagnosis of Parkinson's Disease

이 논문은 뇌 MRI 스캔에서 파킨슨병을 보조 진단하기 위해 임상적 사전 지식 (관련 뇌 영역 및 노화 패턴) 을 통합한 종단적 자동화 진단 프레임워크인 PD-Diag-Net 을 제안하며, 외부 테스트에서 기존 최첨단 방법보다 20% 이상 높은 성능을 입증했습니다.

Shuai Shao, Yan Wang, Shu Jiang, Shiyuan Zhao, Di Yang, Jiangtao Wang, Yutong Bai, Jianguo Zhang2026-03-12💻 cs

Seeing Space and Motion: Enhancing Latent Actions with Geometric and Dynamic Awareness for Vision-Language-Action Models

이 논문은 공간 이해와 시간적 지각의 한계를 극복하기 위해 기하학적 인식을 갖춘 Farsighted-LAM 과 시각적 사고 과정을 통합한 SSM-VLA 를 제안하여, 시뮬레이션 및 실제 환경에서 최첨단 성능을 보이는 견고한 체화 지능 모델을 제시합니다.

Zhejia Cai, Yandan Yang, Xinyuan Chang, Shiyi Liang, Ronghan Chen, Feng Xiong, Mu Xu, Ruqi Huang2026-03-12💻 cs

Adaptive Event Stream Slicing for Open-Vocabulary Event-Based Object Detection via Vision-Language Knowledge Distillation

이 논문은 이미지 기반 지식 증류와 적응형 이벤트 슬라이싱을 결합한 하이브리드 SNN-CNN 프레임워크를 제안하여, 텍스처와 색상 정보가 부재한 이벤트 카메라 데이터에서도 CLIP 의 시맨틱 지식을 활용하여 오픈-보카불러리 객체 감지를 가능하게 합니다.

Jinchang Zhang, Zijun Li, Jiakai Lin, Guoyu Lu2026-03-12💻 cs

Equivariant Splitting: Self-supervised learning from incomplete data

이 논문은 단일 불완전 관측 모델에서 자기지도 학습을 가능하게 하는 새로운 분할 손실과 등변성 재구성 네트워크를 결합하여, 정답 데이터 없이도 역문제 해결을 위한 편향 없는 추정과 최첨단 성능을 달성하는 방법을 제안합니다.

Victor Sechaud, Jérémy Scanvic, Quentin Barthélemy, Patrice Abry, Julián Tachella2026-03-12💻 cs

Symskill: Symbol and Skill Co-Invention for Data-Efficient and Reactive Long-Horizon Manipulation

이 논문은 레이블이 지정되지 않은 미분할 데모에서 기호 추상화와 목표 지향적 기술을 공동으로 학습하여, 동적 환경에서 실시간 오류 복구와 구성적 일반화를 동시에 달성하는 'Symskill'이라는 통합 프레임워크를 제안합니다.

Yifei Simon Shao, Yuchen Zheng, Sunan Sun, Pratik Chaudhari, Vijay Kumar, Nadia Figueroa2026-03-12💻 cs

A Graded Modal Type Theory for Pulse Schedules

이 논문은 양자 회로를 하드웨어 펄스 스케줄로 변환하기 위한 형식적 의미론을 제공하는 'GRAMPUS'라는 등급 모달 타입 이론을 제안하고, 이를 카테고리 이론과 초기 모델론을 통해 검증합니다.

Robin Adams, Jean-Philippe Bernardy, Lorenzo Perticone, Jeremy Pope2026-03-12💻 cs

From Text to Alpha: Can LLMs Track Evolving Signals in Corporate Disclosures?

이 논문은 기업 공시 문서에서 LLM 을 활용해 맥락적 정량 지표의 변화를 포착하는 새로운 프레임워크를 제안하며, 기존 방법론 대비 두 배 이상의 위험 조정 초과수익 (알파) 을 예측하는 것을 입증했습니다.

Chanyeol Choi, Yoon Kim, Yu Yu, Young Cha, V. Zach Golkhou, Igor Halperin, Georgios Papaioannou, Minkyu Kim, Zhangyang Wang, Jihoon Kwon, Minjae Kim, Alejandro Lopez-Lira, Yongjae Lee2026-03-12💻 cs

R v F (2025): Addressing the Defence of Hacking

이 논문은 '해킹 방어' (또는 'SODDI 방어') 를 주장한 R v F 사건을 사례로 들어, 디지털 포렌식 조사관이 이 방어를 어떻게 반박하고 법정에 실증적 증거를 제시할 수 있는지에 대한 실용적인 교훈과 기법을 제시합니다.

Junade Ali2026-03-12💻 cs

Computational Complexity in Property Testing

이 논문은 속성 테스트에서 쿼리 복잡도와 시간 복잡도 간의 관계를 체계적으로 연구하여 시간 - 쿼리 위계 정리를 제시하고, $k$ -SUM 가설과 통계적 쿼리 모델을 기반으로 반공간 (halfspace) 문제에서 두 복잡도 간의 본질적인 격차를 증명합니다.

Renato Ferreira Pinto Jr., Diptaksho Palit, Sofya Raskhodnikova2026-03-12💻 cs

CompassNav: Steering From Path Imitation To Decision Understanding In Navigation

이 논문은 내비게이션 에이전트가 단순한 경로 모방을 넘어 모든 가능한 이동의 상대적 품질을 평가하는 '의사결정 이해' 패러다임으로 전환하도록 하는 CompassNav 프레임워크를 제안하고, 이를 통해 물리적 로봇을 포함한 다양한 벤치마크에서 최첨단 성능을 달성했음을 보여줍니다.

LinFeng Li, Jian Zhao, Yuan Xie, Xin Tan, Xuelong Li2026-03-12💻 cs

SDGraph: Multi-Level Sketch Representation Learning by Sparse-Dense Graph Architecture

이 논문은 스케치의 희소성과 추상성을 고려하여 스케치, 획, 점 수준의 세 가지 계층으로 유효 정보를 식별하고, 이를 활용하는 희소-밀도 그래프 아키텍처인 SDGraph 를 제안하여 분류, 검색, 벡터 생성 등 다양한 스케치 관련 작업에서 기존 최첨단 기법 대비 성능을 크게 향상시켰습니다.

Xi Cheng, Pingfa Feng, Mingyu Fan, Zhichao Liao, Hang Cheng, Long Zeng2026-03-12💻 cs

InstantSfM: Towards GPU-Native SfM for the Deep Learning Era

이 논문은 기존 CPU 기반 SfM 시스템의 한계를 극복하고 대규모 장면에서 COLMAP 대비 약 40 배의 속도 향상을 이루면서도 높은 정확도를 유지하는, 메트릭 깊이 사전 지식을 통합한 완전 GPU 기반의 SfM 시스템 'InstantSfM'을 제안합니다.

Jiankun Zhong, Zitong Zhan, Quankai Gao, Ziyu Chen, Haozhe Lou, Jiageng Mao, Ulrich Neumann, Chen Wang, Yue Wang2026-03-12💻 cs

UltraGen: Efficient Ultra-High-Resolution Image Generation with Hierarchical Local Attention

UltraGen 은 계층적 로컬 어텐션과 저해상도 전역 가이드를 도입하여 어텐션 복잡도를 선형 수준으로 낮추고, 사전 훈련된 모델을 8K 이상의 초고해상도 이미지 생성에 효율적으로 확장하면서도 구조와 디테일의 일관성을 유지하는 새로운 프레임워크를 제안합니다.

Yuyao Zhang, Yu-Wing Tai2026-03-12💻 cs

REALM: An MLLM-Agent Framework for Open World 3D Reasoning Segmentation and Editing on Gaussian Splatting

이 논문은 3D 가우시안 스플래팅 표현과 다중 모달 LLM 에이전트를 결합하여 복잡한 자연어 지시를 정밀한 3D 객체 분할 및 편집으로 변환하는 'REALM' 프레임워크를 제안하며, 특히 전역에서 국소로 이어지는 공간적 그라운딩 전략을 통해 견고한 3D 추론 성능을 달성합니다.

Changyue Shi, Minghao Chen, Yiping Mao, Chuxiao Yang, Xinyuan Hu, Jiajun Ding, Zhou Yu2026-03-12💻 cs

Opinion Maximization in Social Networks by Modifying Internal Opinions

이 논문은 기존 행렬 역행렬 계산의 높은 비용 문제를 해결하기 위해 효율적인 샘플링 기반 알고리즘과 대규모 네트워크에서도 최적의 노드 집합을 정확하게 식별하는 결정론적 비동기 알고리즘을 제안하여 소셜 네트워크 내 전체 의견을 극대화하는 방법을 제시합니다.

Gengyu Wang, Runze Zhang, Zhongzhi Zhang2026-03-12💻 cs

Importance of Overlapping Network Nodes in Influence Spreading

이 논문은 복잡한 네트워크에서 중첩된 노드가 단순 및 복잡 전염 과정 전반에 걸쳐 비중첩 노드보다 일관되게 더 큰 영향력을 발휘하며, 특히 '원 (circle)' 구조의 정의 방식이 이러한 중첩 효과에 중요한 역할을 한다는 점을 확률적 전염 모델을 통해 규명했습니다.

Kosti Koistinen, Vesa Kuikka, Kimmo Kaski2026-03-12💻 cs

← 이전 다음 →