Cutting the Cord: System Architecture for Low-Cost, GPU-Accelerated Bimanual Mobile Manipulation

Cet article présente la conception d'un manipulateur mobile bimanuel à faible coût (moins de 1300 $) et autonome, intégrant un calcul embarqué NVIDIA Jetson Orin Nano et une architecture mécanique et électrique optimisée pour la téléopération et l'apprentissage robotique sans dépendances externes.

Artemis Shaw, Chen Liu, Justin Costa, Rane Gray, Alina Skowronek, Kevin Diaz, Nam Bui, Nikolaus CorrellWed, 11 Ma💻 cs

Tracing Everyday AI Literacy Discussions at Scale: How Online Creative Communities Make Sense of Generative AI

Cette étude analyse à grande échelle les discussions de communautés créatives en ligne pour révéler que l'alphabétisation à l'IA générative émerge de manière dynamique et ancrée dans la pratique, se concentrant principalement sur l'usage des outils plutôt que sur des concepts éthiques ou théoriques, sauf lors d'événements majeurs.

Haidan Liu, Poorvi Bhatia, Nicholas Vincent, Parmit ChilanaWed, 11 Ma💻 cs

Intelligent Spatial Estimation for Fire Hazards in Engineering Sites: An Enhanced YOLOv8-Powered Proximity Analysis Framework

Cette étude propose un cadre d'analyse de proximité amélioré basé sur YOLOv8 pour la détection intelligente des incendies et l'évaluation des risques sur les chantiers, combinant la segmentation du feu et de la fumée avec la détection d'objets environnants afin de calculer des distances réelles et d'attribuer des scores de risque quantitatifs avec une précision supérieure à 90 %.

Ammar K. AlMhdawi, Nonso Nnamoko, Alaa Mashan UbaidWed, 11 Ma💻 cs

3D UAV Trajectory Estimation and Classification from Internet Videos via Language Model

Cet article présente un cadre novateur qui extrait automatiquement des trajectoires 3D et des catégories d'UAV à partir de vidéos Internet sans annotation manuelle, en combinant acquisition pilotée par le langage, génération de labels cross-modale et raffinement physique pour améliorer les performances des systèmes anti-UAV via un transfert zéro-shot.

Haoxiang Lei, Daotong Wang, Shenghai Yuan, Jianbo SuWed, 11 Ma💻 cs

High-Slip-Ratio Control for Peak Tire-Road Friction Estimation Using Automated Vehicles

Cet article propose un cadre de contrôle à haut glissement pour les véhicules automatisés permettant d'estimer avec précision le coefficient de friction pic pneu-chaussée en excitant activement cette région lors d'opérations à vide, tout en garantissant la sécurité grâce à une stratégie de contrôle optimal et une méthode d'estimation statistique robuste.

Zhaohui Liang, Hang Zhou, Heye Huanh, Xiaopeng LiWed, 11 Ma💻 cs

Provably Safe Trajectory Generation for Manipulators Under Motion and Environmental Uncertainties

Cet article présente un cadre de planification de mouvement à risque borné intégrant un opérateur de Koopman stochastique profond et une vérification hiérarchique par programmation de sommes de carrés pour générer des trajectoires sûres et efficaces pour des manipulateurs robotiques évoluant dans des environnements incertains et non convexes.

Fei Meng, Zijiang Yang, Xinyu Mao, Haobo Liang, Max Q. -H. MengWed, 11 Ma💻 cs

MedKCO: Medical Vision-Language Pretraining via Knowledge-Driven Cognitive Orchestration

Le papier propose MedKCO, une méthode de pré-entraînement vision-langage médical qui améliore les représentations de caractéristiques en orchestrant l'apprentissage via un curriculum à deux niveaux basé sur la sensibilité diagnostique et la représentativité des échantillons, ainsi qu'une perte contrastive asymétrique auto-pace pour gérer les similarités inter-classes.

Chenran Zhang, Ruiqi Wu, Tao Zhou, Yi ZhouWed, 11 Ma💻 cs

From Verification to Amplification: Auditing Reverse Image Search as Algorithmic Gatekeeping in Visual Misinformation Fact-checking

Cette étude audite l'algorithme de recherche d'images inversée de Google et révèle qu'il fonctionne comme un garde-fou inefficace contre la désinformation visuelle, car les résultats de vérification des faits y sont minoritaires et noyés dans un flot d'informations irrélevantes et de fausses images récurrentes.

Cong Lin, Yifei Chen, Jiangyue Chen, Yingdan Lu, Yilang Peng, Cuihua ShenWed, 11 Ma💻 cs

Transformer-Based Multi-Region Segmentation and Radiomic Analysis of HR-pQCT Imaging

Cette étude présente un cadre automatisé utilisant l'architecture SegFormer pour segmenter l'os et les tissus mous dans les images HR-pQCT, démontrant que les caractéristiques radiomiques des tissus mous surpassent les paramètres osseux traditionnels pour la détection de l'ostéoporose.

Mohseu Rashid Subah, Mohammed Abdul Gani Zilani, Thomas L. Nickolas, Matthew R. Allen, Stuart J. Warden, Rachel K. SurowiecWed, 11 Ma💻 cs

Agentic AI as a Network Control-Plane Intelligence Layer for Federated Learning over 6G

Cet article propose une architecture d'IA agentique agissant comme couche d'intelligence pour le plan de contrôle des réseaux 6G, afin d'optimiser l'apprentissage fédéré en traduisant les objectifs de haut niveau en actions adaptatives tenant compte des conditions réseau et des capacités des appareils.

Loc X. Nguyen, Ji Su Yoon, Huy Q. Le, Yu Qiao, Avi Deb Raha, Eui-Nam Huh, Nguyen H. Tran, Choong Seon HongWed, 11 Ma💻 cs