CinemaWorld: Generative Augmented Reality with LLMs and 3D Scene Generation for Movie Augmentation

O artigo apresenta o CinemaWorld, um sistema de realidade aumentada generativa que utiliza modelos de linguagem grandes e inteligência artificial para transformar cenas de filmes 2D em conteúdo 3D dinâmico e sincronizado no ambiente físico do usuário, demonstrando através de estudos que essa tecnologia aumenta a imersão e o prazer na experiência cinematográfica.

Keiichi Ihara, DaeHo Lee, Manato Abe, Hye-Young Jo, Ryo Suzuki2026-03-10💻 cs

Enhancing Cross-View UAV Geolocalization via LVLM-Driven Relational Modeling

Este artigo apresenta uma nova arquitetura de classificação plug-and-play que utiliza um Modelo de Visão e Linguagem de Grande Escala (LVLM) para realizar modelagem relacional conjunta entre imagens de drones e satélites, aprimorando significativamente a precisão da geolocalização por meio de uma função de perda relacional inovadora que fornece supervisão granular.

Bowen Liu, Pengyue Jia, Wanyu Wang, Derong Xu, Jiawei Cheng, Jiancheng Dong, Xiao Han, Zimo Zhao, Chao Zhang, Bowen Yu, Fangyu Hong, Xiangyu Zhao2026-03-10💻 cs

In-Context Reinforcement Learning for Tool Use in Large Language Models

O artigo propõe o Aprendizado por Reforço em Contexto (ICRL), uma abordagem que elimina a necessidade de ajuste fino supervisionado (SFT) ao utilizar exemplos em contexto durante o treinamento por reforço para ensinar modelos de linguagem a usar ferramentas externas, alcançando desempenho superior de forma escalável e eficiente em dados.

Yaoqi Ye, Yiran Zhao, Keyu Duan, Zeyu Zheng, Kenji Kawaguchi, Cihang Xie, Michael Qizhe Shieh2026-03-10💻 cs

TALON: Test-time Adaptive Learning for On-the-Fly Category Discovery

O artigo TALON propõe um framework de aprendizado adaptativo em tempo de teste para descoberta de categorias sob demanda, que supera as limitações de métodos baseados em hash ao atualizar dinamicamente protótipos semânticos e o codificador, evitando a fragmentação de classes e melhorando significativamente a precisão na identificação de novas categorias.

Yanan Wu, Yuhan Yan, Tailai Chen, Zhixiang Chi, ZiZhang Wu, Yi Jin, Yang Wang, Zhenbo Li2026-03-10💻 cs

Why Large Language Models can Secretly Outperform Embedding Similarity in Information Retrieval

O artigo argumenta que, embora os Sistemas de Julgamento de Relevância Baseados em LLM (LLM-RJS) tenham o potencial de superar as limitações de "visão curta" dos sistemas de recuperação por similaridade de embeddings ao utilizar raciocínio, essa superioridade não pode ser validada em conjuntos de dados padrão, pois as próprias anotações humanas de relevância compartilham as mesmas limitações.

Matei Benescu, Ivo Pascal de Jong2026-03-10💻 cs

Augmented Model Predictive Control: A Balance between Satellite Agility and Computation Complexity

Este artigo apresenta um método de Controle Preditivo Modelado (MPC) aumentado que equilibra a agilidade de satélites de observação terrestre com a complexidade computacional, combinando o alto desempenho do MPC não linear com a simplicidade do MPC linear, conforme validado por simulações e experimentos físicos.

Yiming Wang, Mihindukulasooriya Sheral Crescent Tissera, Haihong Yu, Kai Jie Ethan Foo, Sean Yeo Keyuan, Ankit Srivastava, Hao An2026-03-10💻 cs

M-ABD: Scalable, Efficient, and Robust Multi-Affine-Body Dynamics

Este artigo apresenta o M-ABD, um novo framework que utiliza a dinâmica de corpos afins e um mapeamento para um espaço dual compacto para simular de forma eficiente, estável e interativa grandes assembleias articuladas com milhares de corpos em um único núcleo de CPU, superando as limitações de rigidez numérica e complexidade geométrica dos métodos convencionais.

Zhiyong He (University of Utah), Dewen Guo (University of Utah), Minghao Guo (MIT), Yili Zhao (ByteDance), Wojciech Matusik (MIT), Hao Su (UCSD), Chenfanfu Jiang (UCLA), Peter Yichen Chen (UBC), Yin Yang (University of Utah)2026-03-10💻 cs

The AI Amplifier Effect: Defining Human-AI Intimacy and Romantic Relationships with Conversational AI

Este artigo define a intimidade humano-IA com base em entrevistas com usuários de companheiros românticos virtuais, introduzindo o conceito de "Efeito Amplificador da IA", no qual a inteligência artificial intensifica o estado emocional pré-existente do usuário, e propõe diretrizes para equilibrar a autonomia do usuário com a regulação de plataformas no design desses sistemas.

Ching Christie Pang, Yi Gao, Xuetong Wang, Pan Hui2026-03-10💻 cs

From Reactive to Map-Based AI: Tuned Local LLMs for Semantic Zone Inference in Object-Goal Navigation

Este artigo propõe uma transição da inteligência artificial reativa para uma baseada em mapas, utilizando um modelo Llama-2 ajustado via LoRA para inferir zonas semânticas e integrar essas informações a um sistema de mapeamento híbrido, resultando em uma navegação a objetivos mais eficiente e com menor exploração redundante em ambientes desconhecidos.

Yudai Noda, Kanji Tanaka2026-03-10💻 cs

Adaptive Vision-Based Control of Redundant Robots with Null-Space Interaction for Human-Robot Collaboration

Este artigo propõe um novo esquema de controle adaptativo baseado em visão para robôs redundantes que combina uma ação em espaço de tarefas com interação no espaço nulo, permitindo colaboração segura e eficaz com humanos em ambientes desconhecidos sem calibração prévia, com estabilidade garantida e validada experimentalmente por meio de realidade aumentada.

Xiangjie Yan, Chen Chen, Xiang Li2026-03-10💻 cs

DSH-Bench: A Difficulty- and Scenario-Aware Benchmark with Hierarchical Subject Taxonomy for Subject-Driven Text-to-Image Generation

O artigo apresenta o DSH-Bench, um novo benchmark abrangente para geração de imagens de texto orientada a sujeitos que supera as limitações existentes através de uma taxonomia hierárquica, uma avaliação granular de dificuldade e cenários, e uma nova métrica de consistência de identidade, oferecendo insights diagnósticos cruciais para o aprimoramento de modelos.

Zhenyu Hu, Qing Wang, Te Cao, Luo Liao, Longfei Lu, Liqun Liu, Shuang Li, Hang Chen, Mengge Xue, Yuan Chen, Chao Deng, Peng Shu, Huan Yu, Jie Jiang2026-03-10💻 cs

PathBench: Speech Intelligibility Benchmark for Automatic Pathological Speech Assessment

O artigo apresenta o PathBench, um benchmark unificado para avaliação automática da inteligibilidade da fala patológica que utiliza conjuntos de dados públicos para comparar diferentes métodos e estabelecer baselines sistemáticas, introduzindo também a métrica DArtP que alcança a maior correlação média entre os métodos sem referência.

Bence Mark Halpern, Thomas Tienkamp, Defne Abur, Tomoki Toda2026-03-10💻 cs

''I don't want to break it'': An Exploration of Perceived Fragility in Shape-Changing Interfaces

Este artigo investiga como a percepção de fragilidade influencia a interação dos usuários com Interfaces que Mudam de Forma (SCIs), identificando fatores-chave por meio de estudos qualitativos e experimentais para desenvolver um framework que oriente o design de objetos mais robustos e confiáveis.

Eva Mackamul (IIHM), Tom Maillard (IIHM), Noé Marceaul (IIHM), Yelli Coulibaly (IIHM), Julien Pansiot (SED [Grenoble]), Laurence Boissieux (SED [Grenoble]), Dominique Vaufreydaz (LIG, M-PSI), Anne Roudaut (IIHM), Céline Coutrix (IIHM)2026-03-10💻 cs