Exploring Modality-Aware Fusion and Decoupled Temporal Propagation for Multi-Modal Object Tracking

이 논문은 다양한 모달리티 간의 고유한 차이를 고려한 모달리티 인식 퓨전과 RGB 및 X 모달 스트림의 시계열 정보를 독립적으로 처리하는 분해된 시간 전파 메커니즘을 도입하여, 다섯 가지 멀티모달 추적 벤치마크에서 최첨단 성능을 달성한 새로운 프레임워크 MDTrack 을 제안합니다.

Shilei Wang, Pujian Lai, Dong Gao, Jifeng Ning, Gong ChengWed, 11 Ma💻 cs

ToolRosetta: Bridging Open-Source Repositories and Large Language Model Agents through Automated Tool Standardization

이 논문은 오픈소스 코드 저장소를 자동으로 표준화하여 LLM 에이전트가 신뢰성 있게 실행할 수 있는 MCP 호환 도구를 생성하고, 이를 통해 인간의 개입을 최소화하면서 다양한 과학 분야에서 작업 수행 능력을 향상시키는 'ToolRosetta' 프레임워크를 제안합니다.

Shimin Di, Xujie Yuan, Hanghui Guo, Chaoqian Ouyang, Zhangze Chen, Ling Yue, Libin Zheng, Jia Zhu, Shaowu Pan, Jian Yin, Min-Ling Zhang, Yong RuiWed, 11 Ma💻 cs

See, Plan, Rewind: Progress-Aware Vision-Language-Action Models for Robust Robotic Manipulation

이 논문은 작업 진행 상황을 명시적인 마일스톤으로 감지하고 실패 시 복구하는 'See, Plan, Rewind (SPR)' 프레임워크를 제안하여, 추가 학습 없이도 LIBERO 및 LIBERO-Plus 벤치마크에서 기존 모델보다 뛰어난 강건성과 일반화 성능을 달성함을 보여줍니다.

Tingjun Dai, Mingfei Han, Tingwen Du, Zhiheng Liu, Zhihui Li, Salman Khan, Jun Yu, Xiaojun ChangWed, 11 Ma💻 cs

Paralinguistic Emotion-Aware Validation Timing Detection in Japanese Empathetic Spoken Dialogue

이 논문은 텍스트 맥락에 의존하지 않고 음성 내의 비언어적 단서와 감정 정보를 융합하여 일본어 공감 대화에서 적절한 감정적 수용 (Validation) 시점을 탐지하는 새로운 모델을 제안하고, 이를 통해 더 공감적인 인간 - 로봇 상호작용을 가능하게 함을 보여줍니다.

Zi Haur Pang, Yahui Fu, Yuan Gao, Tatsuya KawaharaWed, 11 Ma💻 cs

External entropy supply for IoT devices employing a RISC-V Trusted Execution Environment

이 논문은 제한된 엔트로피를 생성하는 IoT 장치들을 위해 RISC-V 기반의 신뢰 실행 환경 (TEE) 을 활용하여 외부 엔트로피 공급 서비스를 구축하고, 이를 통해 암호화 키 생성에 필요한 안전한 무작위성을 효과적으로 해결하는 방안을 제시합니다.

Arttu Paju, Alejandro Cabrera Aldaya, Nicola Tuveri, Juha Savimäki, Marko Kivikangas, Brian McGillionWed, 11 Ma💻 cs

IntroSVG: Learning from Rendering Feedback for Text-to-SVG Generation via an Introspective Generator-Critic Framework

이 논문은 생성된 SVG 의 렌더링 결과를 시각적으로 피드백하여 생성기와 비판가가 상호작용하는 '생성 - 검토 - 정제' 루프를 통해 텍스트 기반 SVG 생성의 품질과 복잡성을 획기적으로 향상시킨 'IntroSVG' 프레임워크를 제안합니다.

Feiyu Wang, Jiayuan Yang, Zhiyuan Zhao, Da Zhang, Bingyu Li, Peng Liu, Junyu GaoWed, 11 Ma💻 cs

OddGridBench: Exposing the Lack of Fine-Grained Visual Discrepancy Sensitivity in Multimodal Large Language Models

이 논문은 MLLM 의 정밀한 시각적 불일치 감지 능력을 평가하기 위한 'OddGridBench' 벤치마크를 제안하고, 커리큘럼 학습과 거리 기반 보상을 결합한 강화학습 프레임워크 'OddGrid-GRPO' 를 통해 해당 능력을 획기적으로 향상시키는 방법을 제시합니다.

Tengjin Weng, Wenhao Jiang, Jingyi Wang, Ming Li, Lin Ma, Zhong MingWed, 11 Ma💻 cs

Dynamic Precision Math Engine for Linear Algebra and Trigonometry Acceleration on Xtensa LX6 Microcontrollers

이 논문은 ESP32 의 Xtensa LX6 마이크로컨트롤러에서 부동소수점 연산의 오버헤드를 줄이고 실시간 성능을 향상시키기 위해 Q16.16 고정소수점 연산, CORDIC 삼각함수 모듈, 그리고 런타임 정밀도 전환 메커니즘을 통합한 동적 정밀도 수학 엔진을 설계하고 평가한 연구입니다.

Elian Alfonso Lopez PreciadoWed, 11 Ma💻 cs

Can ChatGPT Generate Realistic Synthetic System Requirement Specifications? Results of a Case Study

이 논문은 ChatGPT 를 활용해 실제 시스템 요구사항 명세서 (SyRS) 에 접근하지 않고도 10 개 산업 분야에서 300 개의 합성 명세서를 생성한 탐색적 연구 결과를 바탕으로, 생성된 명세서가 전문가 평가에서 62% 의 현실성을 보였으나 모순과 결함이 발견되어 LLM 기반 품질 평가는 전문가 평가를 완전히 대체할 수 없음을 시사합니다.

Alex R. Mattukat, Florian M. Braun, Horst LichterWed, 11 Ma💻 cs

ProvAgent: Threat Detection Based on Identity-Behavior Binding and Multi-Agent Collaborative Attack Investigation

이 논문은 기존 인간과 모델의 협력 방식을 넘어 다중 에이전트 시스템과 전통적 모델이 협력하는 'ProvAgent' 프레임워크를 제안하여, 정교한 신원 - 행동 바인딩과 가설 검증 기반의 자율 조사를 통해 고급 지속 위협 (APT) 의 탐지 및 재구성을 효율적으로 수행함을 보여줍니다.

Wenhao Yan, Ning An, Linxu Li, Bingsheng Bi, Bo Jiang, Zhigang Lu, Baoxu Liu, Junrong Liu, Cong DongWed, 11 Ma💻 cs

Evidential Perfusion Physics-Informed Neural Networks with Residual Uncertainty Quantification

이 논문은 뇌졸중 평가용 CT 관류 이미징의 비정형 역문제 해결을 위해 물리 법칙과 증거론적 딥러닝을 결합하여 물리 제약 위반에 따른 불확실성을 정량화하고 정확도와 신뢰성을 동시에 향상시킨 'EPPINN' 프레임워크를 제안하고 임상 데이터에서 우수한 성능을 입증했습니다.

Junhyeok Lee, Minseo Choi, Han Jang, Young Hun Jeon, Heeseong Eum, Joon Jang, Chul-Ho Sohn, Kyu Sung ChoiWed, 11 Ma💻 cs