cs.LG 편의 논문 | Gist.Science

Foley-Flow: Coordinated Video-to-Audio Generation with Masked Audio-Visual Alignment and Dynamic Conditional Flows

이 논문은 마스킹 오디오 - 비주얼 정렬과 동적 조건부 흐름을 통해 비디오의 의미론적 및 리듬적 특성과 정밀하게 동기화된 고품질 사운드를 생성하는 'FoleyFlow' 모델을 제안합니다.

Shentong Mo, Yibing Song2026-03-10🤖 cs.LG

TRIAGE: Type-Routed Interventions via Aleatoric-Epistemic Gated Estimation in Robotic Manipulation and Adaptive Perception -- Don't Treat All Uncertainty the Same

이 논문은 로봇 조작 및 적응적 인식에서 불확실성을 우연적 (aleatoric) 과 인식적 (epistemic) 요소로 분리하여 관측 복구와 제어 동작 조절 등 유형별 맞춤형 대응을 가능하게 함으로써, 기존 단일 불확실성 기반 접근법보다 성능을 획기적으로 향상시키는 경량 사후 프레임워크 'TRIAGE'를 제안합니다.

Divake Kumar, Sina Tayebati, Devashri Naik, Patrick Poggi, Amanda Sofie Rios, Nilesh Ahuja, Amit Ranjan Trivedi2026-03-10🤖 cs.LG

← 이전 다음 →

cs.LG

Foley-Flow: Coordinated Video-to-Audio Generation with Masked Audio-Visual Alignment and Dynamic Conditional Flows

TRIAGE: Type-Routed Interventions via Aleatoric-Epistemic Gated Estimation in Robotic Manipulation and Adaptive Perception -- Don't Treat All Uncertainty the Same

Explainable Condition Monitoring via Probabilistic Anomaly Detection Applied to Helicopter Transmissions

Mitigating Homophily Disparity in Graph Anomaly Detection: A Scalable and Adaptive Approach

DARC: Disagreement-Aware Alignment via Risk-Constrained Decoding

Training event-based neural networks with exact gradients via Differentiable ODE Solving in JAX

C $^2$ FG: Control Classifier-Free Guidance via Score Discrepancy Analysis

Are We Winning the Wrong Game? Revisiting Evaluation Practices for Long-Term Time Series Forecasting

Outlier-robust Autocovariance Least Square Estimation via Iteratively Reweighted Least Square

Learning Hierarchical Knowledge in Text-Rich Networks with Taxonomy-Informed Representation Learning

Covenant-72B: Pre-Training a 72B LLM with Trustless Peers Over-the-Internet

Is continuous CoT better suited for multi-lingual reasoning?

ALOOD: Exploiting Language Representations for LiDAR-based Out-of-Distribution Object Detection

AutoAdapt: An Automated Domain Adaptation Framework for LLMs

SERQ: Saliency-Aware Low-Rank Error Reconstruction for LLM Quantization

Sequential Service Region Design with Capacity-Constrained Investment and Spillover Effect

Distributional Regression with Tabular Foundation Models: Evaluating Probabilistic Predictions via Proper Scoring Rules

Revisiting Gradient Staleness: Evaluating Distance Metrics for Asynchronous Federated Learning Aggregation

Wiener Chaos Expansion based Neural Operator for Singular Stochastic Partial Differential Equations

The Struggle Between Continuation and Refusal: A Mechanistic Analysis of the Continuation-Triggered Jailbreak in LLMs

cs.LG

Foley-Flow: Coordinated Video-to-Audio Generation with Masked Audio-Visual Alignment and Dynamic Conditional Flows

TRIAGE: Type-Routed Interventions via Aleatoric-Epistemic Gated Estimation in Robotic Manipulation and Adaptive Perception -- Don't Treat All Uncertainty the Same

Explainable Condition Monitoring via Probabilistic Anomaly Detection Applied to Helicopter Transmissions

Mitigating Homophily Disparity in Graph Anomaly Detection: A Scalable and Adaptive Approach

DARC: Disagreement-Aware Alignment via Risk-Constrained Decoding

Training event-based neural networks with exact gradients via Differentiable ODE Solving in JAX

C2^22FG: Control Classifier-Free Guidance via Score Discrepancy Analysis

Are We Winning the Wrong Game? Revisiting Evaluation Practices for Long-Term Time Series Forecasting

Outlier-robust Autocovariance Least Square Estimation via Iteratively Reweighted Least Square

Learning Hierarchical Knowledge in Text-Rich Networks with Taxonomy-Informed Representation Learning

Covenant-72B: Pre-Training a 72B LLM with Trustless Peers Over-the-Internet

Is continuous CoT better suited for multi-lingual reasoning?

ALOOD: Exploiting Language Representations for LiDAR-based Out-of-Distribution Object Detection

AutoAdapt: An Automated Domain Adaptation Framework for LLMs

SERQ: Saliency-Aware Low-Rank Error Reconstruction for LLM Quantization

Sequential Service Region Design with Capacity-Constrained Investment and Spillover Effect

Distributional Regression with Tabular Foundation Models: Evaluating Probabilistic Predictions via Proper Scoring Rules

Revisiting Gradient Staleness: Evaluating Distance Metrics for Asynchronous Federated Learning Aggregation

Wiener Chaos Expansion based Neural Operator for Singular Stochastic Partial Differential Equations

The Struggle Between Continuation and Refusal: A Mechanistic Analysis of the Continuation-Triggered Jailbreak in LLMs

C $^2$ FG: Control Classifier-Free Guidance via Score Discrepancy Analysis