Adaptive Event Stream Slicing for Open-Vocabulary Event-Based Object Detection via Vision-Language Knowledge Distillation

이 논문은 이미지 기반 지식 증류와 적응형 이벤트 슬라이싱을 결합한 하이브리드 SNN-CNN 프레임워크를 제안하여, 텍스처와 색상 정보가 부재한 이벤트 카메라 데이터에서도 CLIP 의 시맨틱 지식을 활용하여 오픈-보카불러리 객체 감지를 가능하게 합니다.

Jinchang Zhang, Zijun Li, Jiakai Lin, Guoyu Lu2026-03-12💻 cs

Symskill: Symbol and Skill Co-Invention for Data-Efficient and Reactive Long-Horizon Manipulation

이 논문은 레이블이 지정되지 않은 미분할 데모에서 기호 추상화와 목표 지향적 기술을 공동으로 학습하여, 동적 환경에서 실시간 오류 복구와 구성적 일반화를 동시에 달성하는 'Symskill'이라는 통합 프레임워크를 제안합니다.

Yifei Simon Shao, Yuchen Zheng, Sunan Sun, Pratik Chaudhari, Vijay Kumar, Nadia Figueroa2026-03-12💻 cs

From Text to Alpha: Can LLMs Track Evolving Signals in Corporate Disclosures?

이 논문은 기업 공시 문서에서 LLM 을 활용해 맥락적 정량 지표의 변화를 포착하는 새로운 프레임워크를 제안하며, 기존 방법론 대비 두 배 이상의 위험 조정 초과수익 (알파) 을 예측하는 것을 입증했습니다.

Chanyeol Choi, Yoon Kim, Yu Yu, Young Cha, V. Zach Golkhou, Igor Halperin, Georgios Papaioannou, Minkyu Kim, Zhangyang Wang, Jihoon Kwon, Minjae Kim, Alejandro Lopez-Lira, Yongjae Lee2026-03-12💻 cs

CompassNav: Steering From Path Imitation To Decision Understanding In Navigation

이 논문은 내비게이션 에이전트가 단순한 경로 모방을 넘어 모든 가능한 이동의 상대적 품질을 평가하는 '의사결정 이해' 패러다임으로 전환하도록 하는 CompassNav 프레임워크를 제안하고, 이를 통해 물리적 로봇을 포함한 다양한 벤치마크에서 최첨단 성능을 달성했음을 보여줍니다.

LinFeng Li, Jian Zhao, Yuan Xie, Xin Tan, Xuelong Li2026-03-12💻 cs

SDGraph: Multi-Level Sketch Representation Learning by Sparse-Dense Graph Architecture

이 논문은 스케치의 희소성과 추상성을 고려하여 스케치, 획, 점 수준의 세 가지 계층으로 유효 정보를 식별하고, 이를 활용하는 희소-밀도 그래프 아키텍처인 SDGraph 를 제안하여 분류, 검색, 벡터 생성 등 다양한 스케치 관련 작업에서 기존 최첨단 기법 대비 성능을 크게 향상시켰습니다.

Xi Cheng, Pingfa Feng, Mingyu Fan, Zhichao Liao, Hang Cheng, Long Zeng2026-03-12💻 cs

REALM: An MLLM-Agent Framework for Open World 3D Reasoning Segmentation and Editing on Gaussian Splatting

이 논문은 3D 가우시안 스플래팅 표현과 다중 모달 LLM 에이전트를 결합하여 복잡한 자연어 지시를 정밀한 3D 객체 분할 및 편집으로 변환하는 'REALM' 프레임워크를 제안하며, 특히 전역에서 국소로 이어지는 공간적 그라운딩 전략을 통해 견고한 3D 추론 성능을 달성합니다.

Changyue Shi, Minghao Chen, Yiping Mao, Chuxiao Yang, Xinyuan Hu, Jiajun Ding, Zhou Yu2026-03-12💻 cs

Compiler.next: A Search-Based Compiler to Power the AI-Native Future of Software Engineering

이 논문은 인간의 의도를 입력받아 프롬프트, 모델 구성, 시스템 파라미터 등을 동적으로 최적화하는 탐색 기반 컴파일러인 'Compiler.next'를 제안하여, AI 네이티브 소프트웨어 개발의 장벽을 낮추고 Software Engineering 3.0 시대를 위한 자동화된 소프트웨어 생성 패러다임을 제시합니다.

Filipe R. Cogo, Gustavo A. Oliva, Ahmed E. Hassan2026-03-12💻 cs

Taming the Long Tail: Denoising Collaborative Information for Robust Semantic ID Generation

이 논문은 협업 정보의 노이즈가 장기 꼬리 항목의 콘텐츠 표현을 훼손하고 중요한 행동 기반 시드 (SID) 를 가리는 문제를 해결하기 위해, 적응적 행동 - 콘텐츠 정렬과 동적 행동 가중치 메커니즘을 통해 협업 정보를 적응적으로 제거하는 ADC-SID 프레임워크를 제안합니다.

Yi Xu, Moyu Zhang, Chaofan Fan, Jinxin Hu, Xiaochen Li, Yu Zhang, Xiaoyi Zeng, Jing Zhang2026-03-12💻 cs

EyeAgent: An Agentic AI System for Multimodal Clinical Decision Support in Ophthalmology

이 논문은 23 가지 영상 모달리티에 걸친 53 개의 검증된 도구를 동적으로 조율하는 대형 언어 모델을 기반으로 하여, 안과 진단 정확도와 보고서 품질을 획기적으로 향상시키고 전문가 수준의 해석 가능성을 제공하는 최초의 다중 모드 임상 의사결정 지원 에이전트 AI 시스템인 'EyeAgent'를 제시합니다.

Danli Shi, Xiaolan Chen, Bingjie Yan, Weiyi Zhang, Pusheng Xu, Jiancheng Yang, Ruoyu Chen, Siyu Huang, Bowen Liu, Xinyuan Wu, Meng Xie, Ziyu Gao, Yue Wu, Senlin Lin, Kai Jin, Xia Gong, Yih Chung Tham, Xiujuan Zhang, Li Dong, Yuzhou Zhang, Jason Yam, Guangming Jin, Xiaohu Ding, Haidong Zou, Yalin Zheng, Zongyuan Ge, Mingguang He2026-03-12💻 cs

MergeVLA: Cross-Skill Model Merging Toward a Generalist Vision-Language-Action Agent

이 논문은 다양한 VLA 전문가 모델을 단일 모델로 통합할 때 발생하는 병합 불가 문제를 해결하기 위해, LoRA 어댑터의 일관성 유지와 행동 전문가의 모듈성 강화를 통해 설계된 'MergeVLA' 아키텍처를 제안하고, 이를 통해 단일 모델이 다양한 작업과 환경에서 개별 전문가 수준의 성능을 발휘함을 입증합니다.

Yuxia Fu, Zhizhen Zhang, Yuqi Zhang, Zijian Wang, Zi Huang, Yadan Luo2026-03-12💻 cs