cs.AI 篇论文 | Gist.Science

Telogenesis: Goal Is All U Need

该论文提出了一种名为“目标生成（Telogenesis）”的机制，证明仅通过利用无知、意外和过时性这三种认知差距来内生地生成注意力优先级，无需外部奖励即可使智能体在部分可观测环境中自适应地分配注意力，不仅优于固定策略，还能无监督地恢复环境波动结构。

Zhuoran Deng, Yizhi Zhang, Ziyi Zhang, Wan Shen2026-03-11🤖 cs.AI

GenePlan: Evolving Better Generalized PDDL Plans using Large Language Models

GenePlan 是一个利用大语言模型辅助进化算法的框架，通过迭代优化可解释的 Python 规划器，在多个基准领域中以低成本实现了接近最先进水平且显著优于传统提示方法的 PDDL 泛化规划性能。

Andrew Murray, Danial Dervovic, Alberto Pozanco, Michael Cashmore2026-03-11🤖 cs.AI

Vibe-Creation: The Epistemology of Human-AI Emergent Cognition

该论文提出“第三实体”概念，认为人类与生成式人工智能的交互并非简单的工具协作，而是通过“氛围创造”（vibe-creation）这一前反思认知模式，在两种不可通约的认知方式耦合中涌现出一种兼具新颖性与人类责任归属的不对称认知形态，从而深刻重塑了认识论、心灵哲学及教育理论。

Ilya Levin2026-03-11🤖 cs.AI

Temporal-Conditioned Normalizing Flows for Multivariate Time Series Anomaly Detection

本文提出了一种名为“时间条件归一化流（tcNF）”的新框架，通过利用自回归机制对时间序列中的复杂依赖关系和不确定性进行精确建模，从而实现高效且鲁棒的异常检测。

David Baumgartner, Helge Langseth, Kenth Engø-Monsen, Heri Ramampiaro2026-03-11🤖 cs.AI

Evolving Prompt Adaptation for Vision-Language Models

本文提出了名为 EvoPrompt 的新框架，通过模态共享提示投影器、解耦进化训练策略以及特征几何正则化，在实现少样本任务高性能适配的同时，有效解决了视觉语言模型微调过程中的灾难性遗忘问题，从而在保留预训练零样本能力的同时完成稳定进化。

Enming Zhang, Jiayang Li, Yanru Wu, Zhenyu Liu, Yang Li2026-03-11🤖 cs.AI

Efficiently Aligning Draft Models via Parameter- and Data-Efficient Adaptation

该论文提出了名为 EDA 的参数与数据高效框架，通过解耦架构、数据再生策略及样本选择机制，在显著降低训练成本的同时，有效解决了目标模型微调后推测解码性能下降的问题。

Luxi Lin, Zhihang Lin, Zhanpeng Zeng, Yuhao Chen, Qingyu Zhang, Jixiang Luo, Xuelong Li, Rongrong Ji2026-03-11🤖 cs.AI

Enhancing Debunking Effectiveness through LLM-based Personality Adaptation

该研究提出了一种利用大语言模型（LLM）结合大五人格特质生成个性化辟谣信息的新方法，并通过模拟相应人格的 LLM 评估器验证了此类定制化信息通常比通用信息更具说服力，同时指出了该技术带来的伦理挑战。

Pietro Dell'Oglio, Alessandro Bondielli, Francesco Marcelloni, Lucia C. Passaro2026-03-11🤖 cs.AI

Compiler-First State Space Duality and Portable $O(1)$ Autoregressive Caching for Inference

该论文提出了一种基于 XLA 编译器的 Mamba-2 状态空间模型实现方案，通过仅使用标准算子而非定制 CUDA 内核，在 CPU、NVIDIA GPU 和 Google TPU 上实现了可移植的 $O(1)$ 自回归缓存推理，并达到了与 PyTorch/CUDA 参考实现一致的精度和显著的性能。

Cosmo Santoni2026-03-11🤖 cs.AI

Routing without Forgetting

该论文提出了“无遗忘路由”（RwF）架构，通过在 Transformer 中引入基于能量的关联检索层（受现代 Hopfield 网络启发），实现了无需任务标识或迭代优化的动态提示生成，从而在严格在线持续学习场景下显著优于现有的提示微调方法。

Alessio Masano, Giovanni Bellitto, Dipam Goswani, Joost Van de Weijer, Concetto Spampinato2026-03-11🤖 cs.AI

A Variational Latent Equilibrium for Learning in Cortex

该论文提出了一种基于能量守恒和极值作用原理的变分潜在平衡框架，通过推导实时误差动力学，将时间连续的反向传播算法转化为生物可实现的局部时空学习规则，从而为大脑的时空深度学习及物理电路实现提供了严谨的理论基础。

Simon Brandt, Paul Haider, Walter Senn, Federico Benitez, Mihai A. Petrovici2026-03-11🤖 cs.AI

Context Engineering: From Prompts to Corporate Multi-Agent Architecture

该论文提出从提示工程演进为包含上下文工程、意图工程和规格工程的四层成熟度模型，旨在通过系统化设计信息环境、组织目标及机器可读规范，解决企业多智能体系统在规模化部署中面临的复杂性与控制难题。

Vera V. Vishnyakova2026-03-11🤖 cs.AI

Grounding Synthetic Data Generation With Vision and Language Models

该论文提出了一种结合视觉与语言模型的基于地面真值的合成数据生成与评估框架，并发布了包含 40 万张图像的大规模遥感数据集 ARAS400k，实验证明将合成数据与真实数据结合使用能显著提升语义分割和图像描述任务的性能。

Ümit Mert Ça\u{g}lar, Alptekin Temizel2026-03-11🤖 cs.AI

PRECEPT: Planning Resilience via Experience, Context Engineering & Probing Trajectories A Unified Framework for Test-Time Adaptation with Compositional Rule Learning and Pareto-Guided Prompt Evolution

PRECEPT 是一个统一的测试时适应框架，通过结合确定性精确规则检索、冲突感知记忆机制以及由 COMPASS 驱动的帕累托引导提示演化，有效解决了大语言模型在条件增多时的检索退化、规则组合困难及知识陈旧问题，并在多项基准测试中展现出显著的鲁棒性与性能提升。

Arash Shahmansoori2026-03-11🤖 cs.AI

cs.AI

Telogenesis: Goal Is All U Need

GenePlan: Evolving Better Generalized PDDL Plans using Large Language Models

Vibe-Creation: The Epistemology of Human-AI Emergent Cognition

Temporal-Conditioned Normalizing Flows for Multivariate Time Series Anomaly Detection

Evolving Prompt Adaptation for Vision-Language Models

Efficiently Aligning Draft Models via Parameter- and Data-Efficient Adaptation

Enhancing Debunking Effectiveness through LLM-based Personality Adaptation

Compiler-First State Space Duality and Portable $O(1)$ Autoregressive Caching for Inference

Routing without Forgetting

A Variational Latent Equilibrium for Learning in Cortex

Context Engineering: From Prompts to Corporate Multi-Agent Architecture

Grounding Synthetic Data Generation With Vision and Language Models

PRECEPT: Planning Resilience via Experience, Context Engineering & Probing Trajectories A Unified Framework for Test-Time Adaptation with Compositional Rule Learning and Pareto-Guided Prompt Evolution

MM-tau-p $^2$ : Persona-Adaptive Prompting for Robust Multi-Modal Agent Evaluation in Dual-Control Settings

MiniAppBench: Evaluating the Shift from Text to Interactive HTML Responses in LLM-Powered Assistants

When to Lock Attention: Training-Free KV Control in Video Diffusion

GNNs for Time Series Anomaly Detection: An Open-Source Framework and a Critical Evaluation

Logics-Parsing-Omni Technical Report

EsoLang-Bench: Evaluating Genuine Reasoning in Large Language Models via Esoteric Programming Languages

Automatic Cardiac Risk Management Classification using large-context Electronic Patients Health Records

cs.AI

Telogenesis: Goal Is All U Need

GenePlan: Evolving Better Generalized PDDL Plans using Large Language Models

Vibe-Creation: The Epistemology of Human-AI Emergent Cognition

Temporal-Conditioned Normalizing Flows for Multivariate Time Series Anomaly Detection

Evolving Prompt Adaptation for Vision-Language Models

Efficiently Aligning Draft Models via Parameter- and Data-Efficient Adaptation

Enhancing Debunking Effectiveness through LLM-based Personality Adaptation

Compiler-First State Space Duality and Portable O(1)O(1)O(1) Autoregressive Caching for Inference

Routing without Forgetting

A Variational Latent Equilibrium for Learning in Cortex

Context Engineering: From Prompts to Corporate Multi-Agent Architecture

Grounding Synthetic Data Generation With Vision and Language Models

PRECEPT: Planning Resilience via Experience, Context Engineering & Probing Trajectories A Unified Framework for Test-Time Adaptation with Compositional Rule Learning and Pareto-Guided Prompt Evolution

MM-tau-p2^22: Persona-Adaptive Prompting for Robust Multi-Modal Agent Evaluation in Dual-Control Settings

MiniAppBench: Evaluating the Shift from Text to Interactive HTML Responses in LLM-Powered Assistants

When to Lock Attention: Training-Free KV Control in Video Diffusion

GNNs for Time Series Anomaly Detection: An Open-Source Framework and a Critical Evaluation

Logics-Parsing-Omni Technical Report

EsoLang-Bench: Evaluating Genuine Reasoning in Large Language Models via Esoteric Programming Languages

Automatic Cardiac Risk Management Classification using large-context Electronic Patients Health Records

Compiler-First State Space Duality and Portable $O(1)$ Autoregressive Caching for Inference

MM-tau-p $^2$ : Persona-Adaptive Prompting for Robust Multi-Modal Agent Evaluation in Dual-Control Settings