cs.AI 편의 논문 | Gist.Science

Logos: An evolvable reasoning engine for rational molecular design

이 논문은 물리적 정확성과 투명한 추론을 모두 충족시키는 새로운 분자 설계 모델 'Logos'를 소개하며, 다단계 추론과 화학적 일관성을 통합한 훈련 전략을 통해 기존 대형 모델보다 효율적이고 해석 가능한 AI 기반 분자 발견을 가능하게 함을 보여줍니다.

Haibin Wen, Zhe Zhao, Fanfu Wang, Tianyi Xu, Hao Zhang, Chao Yang, Ye WeiWed, 11 Ma🤖 cs.AI

DendroNN: Dendrocentric Neural Networks for Energy-Efficient Classification of Event-Based Data

이 논문은 뇌의 수지상 구조에서 영감을 받아 시공간 스파이크 시퀀스를 식별하고 그래디언트 없이 재배선 학습을 수행하는 'DendroNN'을 제안하며, 이를 통해 기존 뉴로모픽 하드웨어 대비 최대 4 배의 에너지 효율성을 달성하는 비동기 디지털 하드웨어 아키텍처를 제시합니다.

Jann Krausse, Zhe Su, Kyrus Mama, Maryada, Klaus Knobloch, Giacomo Indiveri, Jürgen BeckerWed, 11 Ma🤖 cs.AI

DenoiseSplat: Feed-Forward Gaussian Splatting for Noisy 3D Scene Reconstruction

이 논문은 잡음이 포함된 다중 뷰 이미지로부터 3D 장면을 재구성하기 위해, 깨끗한 2D 렌더링만으로 학습 가능한 경량 피드포워드 백본과 대규모 잡음 - 청정 벤치마크를 제안하는 'DenoiseSplat'을 소개합니다.

Fuzhen Jiang, Zhuoran Li, Yinlin ZhangWed, 11 Ma🤖 cs.AI

Rescaling Confidence: What Scale Design Reveals About LLM Metacognition

이 논문은 LLM 의 언어적 신뢰도 평가에서 표준 0~100 척도 대신 0~20 척도를 사용할 때 메타인지 민감도가 향상되며, 척도 설계가 신뢰도 추정의 질에 직접적인 영향을 미치므로 실험 변수로 엄격히 다뤄야 함을 보여줍니다.

Yuyang DaiWed, 11 Ma🤖 cs.AI

Curveball Steering: The Right Direction To Steer Isn't Always Linear

이 논문은 대규모 언어 모델의 활성화 공간이 전역적으로 선형이라는 가정이 실제로는 왜곡되어 있음을 규명하고, 다항식 커널 PCA 를 기반으로 한 비선형 '커브볼 조향 (Curveball steering)' 기법을 제안하여 기존 선형 방법보다 일관되게 우수한 성능을 보인다고 주장합니다.

Shivam Raval, Hae Jin Song, Linlin Wu, Abir Harrasse, Jeff Phillips, Amirali AbdullahWed, 11 Ma🤖 cs.AI

CLoE: Expert Consistency Learning for Missing Modality Segmentation

이 논문은 결손된 모달리티가 있는 의료 영상 분할에서 전문가 간의 일관성을 제어하고 임상적으로 중요한 전경 영역에 초점을 맞춘 'CLoE' 프레임워크를 제안하여, 불완전한 입력 상황에서도 강력한 성능과 일반화 능력을 달성함을 보여줍니다.

Xinyu Tong, Meihua Zhou, Bowu Fan, Haitao LiWed, 11 Ma🤖 cs.AI

SpaceSense-Bench: A Large-Scale Multi-Modal Benchmark for Spacecraft Perception and Pose Estimation

이 논문은 Unreal Engine 5 기반의 고충실도 시뮬레이션으로 생성된 136 개의 위성 모델을 포함하는 대규모 다중 모달 벤치마크 'SpaceSense-Bench'를 제안하여, 궤도상 자율 우주 임무를 위한 정밀한 우주선 인식 및 자세 추정 연구의 한계를 극복하고 데이터 확장성의 중요성을 입증했습니다.

Aodi Wu, Jianhong Zuo, Zeyuan Zhao, Xubo Luo, Ruisuo Wang, Xue WanWed, 11 Ma🤖 cs.AI

Reading the Mood Behind Words: Integrating Prosody-Derived Emotional Context into Socially Responsive VR Agents

이 논문은 VR 환경에서 사용자의 말투에서 감정을 실시간으로 추출하여 대화 맥락에 반영하는 새로운 에이전트 파이프라인을 제안하고, 이를 통해 대화의 자연스러움과 몰입감이 크게 향상됨을 30 명 대상 실험을 통해 입증했습니다.

SangYeop Jeong, Yeongseo Na, Seung Gyu Jeong, Jin-Woo Jeong, Seong-Eun KimWed, 11 Ma🤖 cs.AI

TimberAgent: Gram-Guided Retrieval for Executable Music Effect Control

이 논문은 Wav2Vec2 활성화의 그람 행렬을 기반으로 한 텍스처 공명 검색 (TRR) 을 제안하여, 디지털 오디오 워크스테이션의 저수준 신호 처리 매개변수와 사용자의 지각적 의도 간의 격차를 해소하고 편집 가능한 오디오 효과 제어를 위한 새로운 기준을 제시합니다.

Shihao He, Yihan Xia, Fang Liu, Taotao Wang, Shengli ZhangWed, 11 Ma🤖 cs.AI

Beyond Scaling: Assessing Strategic Reasoning and Rapid Decision-Making Capability of LLMs in Zero-sum Environments

이 논문은 정적 추론을 넘어 경쟁적이고 시간 제약이 있는 환경에서의 LLM 전략적 의사결정 능력을 평가하기 위해 1 대 1 제로섬 상호작용을 기반으로 한 'STAR' 벤치마크를 제안하고, 추론의 깊이뿐만 아니라 신속한 실행 능력이 전략적 지능에 필수적임을 규명합니다.

Yang Li, Xing Chen, Yutao Liu, Gege Qi, Yanxian BI, Zizhe Wang, Yunjian Zhang, Yao ZhuWed, 11 Ma🤖 cs.AI

TaSR-RAG: Taxonomy-guided Structured Reasoning for Retrieval-Augmented Generation

이 논문은 복잡한 질의를 관계 삼중체로 분해하고 경량화된 계층 분류법을 활용하여 단계별 증거 선택을 수행함으로써, 기존 RAG 시스템의 구조적 한계를 극복하고 다단계 추론 정확도를 크게 향상시킨 'TaSR-RAG' 프레임워크를 제안합니다.

Jiashuo Sun, Yixuan Xie, Jimeng Shi, Shaowen Wang, Jiawei HanWed, 11 Ma🤖 cs.AI

Robust Regularized Policy Iteration under Transition Uncertainty

이 논문은 오프라인 강화학습의 전이 불확실성과 정책 유도 외삽 문제를 통합적으로 해결하기 위해, KL 정규화 기반의 실용적인 대안 목적 함수와 수렴 보장이 있는 로버스트 정규화 정책 반복 (RRPI) 알고리즘을 제안하고 D4RL 벤치마크에서 우수한 성능을 입증합니다.

Hongqiang Lin, Zhenghui Fu, Weihao Tang, Pengfei Wang, Yiding Sun, Qixian Huang, Dongxu ZhangWed, 11 Ma🤖 cs.AI

TA-GGAD: Testing-time Adaptive Graph Model for Generalist Graph Anomaly Detection

이 논문은 그래프 이상 탐지에서의 도메인 이동 문제를 '이상 비연성 (Anomaly Disassortativity)'으로 정의하고, 이를 해결하여 단일 학습 단계로 다양한 도메인에서 최첨단 성능을 보이는 테스트 시간 적응형 그래프 모델 TA-GGAD 를 제안합니다.

Xiong Zhang, Hong Peng, Changlong Fu, Xin Jin, Yun Yang, Cheng XieWed, 11 Ma🤖 cs.AI

Democratising Clinical AI through Dataset Condensation for Classical Clinical Models

이 논문은 결정 트리나 콕스 회귀와 같은 비미분 가능 임상 모델에도 적용 가능한 차분 프라이버시를 갖춘 영차 최적화 기반 데이터 증류 프레임워크를 제안하여, 민감한 환자 정보를 보호하면서도 임상 예측 모델의 성능을 유지하는 데이터 공유를 가능하게 합니다.

Anshul Thakur, Soheila Molaei, Pafue Christy Nganjimi, Joshua Fieggen, Andrew A. S. Soltan, Danielle Belgrave, Lei Clifton, David A. CliftonWed, 11 Ma🤖 cs.AI

M3GCLR: Multi-View Mini-Max Infinite Skeleton-Data Game Contrastive Learning For Skeleton-Based Action Recognition

이 논문은 기존 자기지도 학습의 한계를 극복하기 위해 다중 뷰 회전 증강과 균형을 기반으로 한 적대적 미니맥스 게임을 도입한 'M3GCLR' 프레임워크를 제안하여, NTU RGB+D 및 PKU-MMD 데이터셋에서 최첨단 성능을 달성한 뼈 기반 동작 인식 연구를 소개합니다.

Yanshan Li, Ke Ma, Miaomiao Wei, Linhui DaiWed, 11 Ma🤖 cs.AI

MIL-PF: Multiple Instance Learning on Precomputed Features for Mammography Classification

이 논문은 제한된 주석과 고해상도 의료 영상 처리의 어려움을 해결하기 위해 프리컴퓨팅된 특징을 활용하고 경량화된 다중 인스턴스 학습 헤드를 결합하여, 대규모 유방 촬영 이미지 분류에서 최상의 성능을 달성하면서도 훈련 복잡성을 획기적으로 줄인 'MIL-PF' 프레임워크를 제안합니다.

Nikola Jovišic, Milica Škipina, Nicola Dall'Asen, Dubravko CulibrkWed, 11 Ma🤖 cs.AI

SPAARS: Safer RL Policy Alignment through Abstract Exploration and Refined Exploitation of Action Space

이 논문은 오프라인 데이터의 행동 지원 범위 내에서 안전한 온라인 탐색을 보장하면서도 디코더의 재구성 손실로 인한 성능 한계를 우회하기 위해, 저차원 잠재 공간 탐색에서 원시 행동 공간 활용으로 점진적으로 전환하는 커리큘럼 학습 프레임워크인 SPAARS 를 제안하고 그 유효성을 입증합니다.

Swaminathan S K, Aritra HazraWed, 11 Ma🤖 cs.AI

Physics-Informed Neural Engine Sound Modeling with Differentiable Pulse-Train Synthesis

이 논문은 엔진 소리를 지속된 조화 진동이 아닌 배기 압력 펄스 시퀀스로 간주하고, 물리 정보 기반의 인덕티브 바이어를 통합한 미분 가능한 펄스-트레인-레조네이터 (PTR) 모델을 제안하여 기존 모델 대비 조화 재구성 성능을 21% 향상시키고 물리적 현상에 대응하는 해석 가능한 매개변수를 제공함을 보여줍니다.

Robin Doerfler, Lonce WyseWed, 11 Ma🤖 cs.AI

ICDAR 2025 Competition on End-to-End Document Image Machine Translation Towards Complex Layouts

이 논문은 2024 년 12 월부터 2025 년 4 월까지 진행된 ICDAR 2025 복잡한 레이아웃 문서 이미지 기계 번역 (DIMT) 경연대회에 대한 개요, 데이터셋, 작업 정의, 평가 프로토콜 및 69 개 팀의 참가 결과를 요약하고, 대규모 모델 접근법이 복잡한 레이아웃 문서 번역을 위한 유망한 패러다임을 제시함을 보여줍니다.

Yaping Zhang, Yupu Liang, Zhiyang Zhang, Zhiyuan Chen, Lu Xiang, Yang Zhao, Yu Zhou, Chengqing ZongWed, 11 Ma🤖 cs.AI

Reviving ConvNeXt for Efficient Convolutional Diffusion Models

이 논문은 트랜스포머 기반의 확산 모델에 비해 계산 효율성과 훈련 속도가 월등히 뛰어난 'FCDM(Fully Convolutional Diffusion Model)'을 제안하며, 이를 통해 현대적인 합성곱 설계가 효율적인 생성 모델링을 위한 강력한 대안이 될 수 있음을 입증합니다.

Taesung Kwon, Lorenzo Bianchi, Lennart Wittke, Felix Watine, Fabio Carrara, Jong Chul Ye, Romann Weber, Vinicius AzevedoWed, 11 Ma🤖 cs.AI

← 이전 다음 →