cs articles | Gist.Science

Gesture-based Smart Home Control for Special Needs Individuals Using Computer Vision

Ce document présente un système de contrôle de maison intelligente, de bout en bout et en temps réel, destiné aux personnes souffrant de troubles de la parole, qui intègre un modèle de reconnaissance de gestes manuels basé sur un CNN avec un pipeline d'inférence OpenCV et une couche d'action modulaire pour traduire les entrées de caméra en direct en commandes d'appareils exécutables.

Kareem Mohamed, Walaa Abo Elenin, Yiming Ji2026-07-15

💻 computer science

Uncertainty-Aware Assessment of LLM-Enhanced Topic Models: An Experton-Based Approach to Interpretability

Cette étude introduit un cadre d'évaluation sensible à l'incertitude basé sur la théorie des expertons pour évaluer les modèles thématiques dans des corpus touristiques spécialisés, démontrant que le BERTopic amélioré par les LLM surpasse les approches traditionnelles et neuronales tout en révélant que la température de décodage impacte significativement l'interprétabilité.

Eddy Soria, Antonio Moreno, Jordi Pascual, Ana Beatriz Hernández-Lara2026-07-15

💻 computer science

A New Meta-Heuristic for Improving General Multi-Start Procedures, With an Application to the Planar p-Median Location Problem

Cet article propose une métaheuristique de post-optimisation générale et à faible coût qui améliore les algorithmes de multi-départs en générant et en améliorant de manière itérative des descendants à partir d'un ensemble de solutions d'élite, améliorant avec succès les meilleurs résultats connus pour les 48 instances de p-médian planaires testées dans des temps d'exécution comparables.

Zvi Drezner, Jack Brimberg2026-07-15

💻 computer science

Robust Score-Based Generative Modelling withTsallis–Gaussian Perturbations

Cet article propose un cadre de modélisation générative par score robuste utilisant des perturbations de Tsallis–Gaussian et une architecture neuronale à double tête afin d'atténuer efficacement l'impact des données à queue lourde et de la contamination tout en maintenant des performances génératives compétitives.

Shenghan Gao, Spiridon Penev, Libo Li2026-07-15

💻 computer science

Multi-view Patch Inference with Frozen DINOv3 for Industrial Anomaly Detection

Cet article propose un cadre pour la détection d'anomalies industrielles qui combine une dorsale DINOv3 gelée avec une stratégie d'inférence de patchs multi-vues pour surmonter la perte d'informations de bordure et un Transformer de fusion de reconstruction multi-échelle pour modéliser les distributions de caractéristiques normales, atteignant des performances de pointe sur plusieurs ensembles de données de référence.

Chaoqun Wang, Wenjing Zhang, Bo Qi, Xiaoyu Huang, Ning He2026-07-15

💻 computer science

LAR-Net: A Lightweight Adaptive Receptive Field Network for Point Cloud Segmentation of Pharmaceutical Deposits on Reactor Inner Walls

Cet article propose LAR-Net, un réseau à champ récepteur adaptatif léger construit sur l'architecture LitePT qui s'ajuste dynamiquement aux complexités géométriques locales pour obtenir une segmentation de nuages de points de haute précision des dépôts pharmaceutiques sur les parois internes des réacteurs, surmontant ainsi les limites des méthodes d'inspection conventionnelles et permettant un nettoyage intelligent automatisé.

Jiajia Liu, Haiyang Wang, Zhongli Ma, Yuedong Shi, Bingyu Chen, Sidong Wu, Ting Zhang2026-07-15

💻 computer science

Captioning Daily Activity Images in Early Childhood Education: Benchmark and Algorithm

Cet article présente KinderMM-Cap, un système de légendage multimédia spécialisé pour l'éducation de la petite enfance qui exploite le benchmark ECAC et un nouveau cadre d'entraînement hybride conditionné par récompense (RSRS) afin d'améliorer significativement la précision de la génération de légendes à portée éducative pour les scènes de classe complexes et les jouets pédagogiques.

Sixing Li, Zhibin Gu, Ziqi Zhang, Weiguo Pan, Bing Li, Ying Wang, Hongzhe Liu2026-07-15

💻 computer science

Decentralised Federated Learning Framework for Privacy-Preserving Medical Insurance and Sustainable Rural Economic Development in Tamil Nadu

Cet article propose et évalue rigoureusement TW-DP-FedAvg, un cadre d'apprentissage fédéré respectueux de la vie privée et adapté au secteur de l'assurance médicale du Tamil Nadu rural, démontrant que bien que la confidentialité différentielle entraîne un coût de précision mesurable par rapport à un entraînement centralisé, l'approche demeure statistiquement équivalente et viable au regard des nouvelles réglementations indiennes sur la protection des données.

Janarthanam S, Raja Sarath Kumar Boddu, Vivekanadam B2026-07-15

💻 computer science

Mothership and multi-drone routing for spatial marine management

Cet article introduit un nouveau problème de routage de navire-mère et de drones multiples pour la gestion marine spatiale, proposant une solution métaheuristique qui atteint des résultats quasi optimaux avec un temps de calcul considérablement réduit par rapport aux méthodes exactes, permettant ainsi une coordination à échelle pratique pour des applications telles que la restauration des récifs coralliens.

Ryu B. Lippmann, Kate J. Helmstedt, Paul Corry2026-07-15

💻 computer science

Meta-PPO: Lightweight Meta-Control for Online Joint Hyperparameter Adaptation in Proximal Policy Optimization

Cet article introduit Meta-PPO, un cadre de méta-contrôle léger qui ajuste dynamiquement les hyperparamètres de PPO en ligne en fonction des statistiques d'entraînement, démontrant une amélioration de la performance, de l'efficacité et de la robustesse sur plusieurs benchmarks de contrôle continu par rapport au PPO standard.

Guinan Cai, Jiayu Yao2026-07-15

← Précédent Suivant →