Modeling Concurrency Control as a Learnable Function

Ce papier présente NeurCC, un nouvel algorithme de contrôle de concurrence appris qui, grâce à une fonction optimisée par recherche bayésienne et réduction de graphe, surpasse systématiquement les méthodes de l'état de l'art en termes de débit transactionnel et de rapidité d'adaptation face à des charges de travail variées et dynamiques.

Hexiang Pan, Shaofeng Cai, Tien Tuan Anh Dinh, Yuncheng Wu, Yeow Meng Chee, Gang Chen, Beng Chin OoiWed, 11 Ma💻 cs

Semi-Supervised Biomedical Image Segmentation via Diffusion Models and Teacher-Student Co-Training

Cet article présente une nouvelle approche semi-supervisée pour la segmentation d'images biomédicales, qui combine un cadre d'entraînement collaboratif enseignant-élève avec des modèles de diffusion pour générer des masques de segmentation informatifs et améliorer les performances dans des scénarios où les données annotées sont limitées.

Luca Ciampi, Gabriele Lagani, Giuseppe Amato, Fabrizio FalchiWed, 11 Ma💻 cs

Zooming In on Fakes: A Novel Dataset for Localized AI-Generated Image Detection with Forgery Amplification Approach

Cet article présente BR-Gen, un nouveau jeu de données à grande échelle de 150 000 images forgées localement, et NFA-ViT, un modèle de vision par transformer guidé par le bruit qui amplifie les traces de falsification pour améliorer la détection des contrefaçons générées par l'IA dans des scènes complexes.

Lvpan Cai, Haowei Wang, Jiayi Ji, Yanshu Zhoumen, Shen Chen, Taiping Yao, Xiaoshuai SunWed, 11 Ma💻 cs

Scalable and Performant Data Loading

Ce papier présente SPDL, une bibliothèque open-source agnostique aux frameworks qui surmonte les goulots d'étranglement du chargement de données pour l'IA en libérant le verrou global de l'interpréteur (GIL) de Python, permettant ainsi d'accélérer considérablement l'entraînement des modèles tout en réduisant l'utilisation du CPU et de la mémoire.

Moto Hira, Christian Puhrsch, Valentin Andrei, Roman Malinovskyy, Gael Le Lan, Abhinandan Krishnan, Joseph Cummings, Victor Bourgin, Olga Gerasimova, Miguel Martin, Gokul Gunasekaran, Yuta Inoue, Alex J Turner, Raghuraman KrishnamoorthiWed, 11 Ma💻 cs

Evaluating Large Language Models for Multilingual Vulnerability Detection at Dual Granularities

Cette étude empirique démontre que les grands modèles de langage (LLM), notamment GPT-4o optimisé par ajustement d'instructions et quelques exemples, surpassent les modèles de langage préentraînés (PLM) pour la détection de vulnérabilités multilingues à la fois au niveau des fonctions et des lignes de code.

Honglin Shu, Michael Fu, Junji Yu, Dong Wang, Chakkrit Tantithamthavorn, Junjie Chen, Yasutaka KameiWed, 11 Ma💻 cs

SpikeSMOKE: Spiking Neural Networks for Monocular 3D Object Detection with Cross-Scale Gated Coding

Cet article présente SpikeSMOKE, une architecture de réseaux de neurones à impulsions (SNN) intégrant un mécanisme de codage à porte croisée multi-échelle (CSGC) et des blocs résiduels légers pour réaliser une détection d'objets 3D monoculaire à faible consommation énergétique avec des performances améliorées sur les jeux de données KITTI, NuScenes-mini et CIFAR.

Xuemei Chen, Huamin Wang, Jing Peng, Hangchi Shen, Shukai Duan, Shiping Wen, Tingwen HuangWed, 11 Ma💻 cs

A Decade of News Forum Interactions: Threaded Conversations, Signed Votes, and Topical Tags

Cet article présente un jeu de données longitudinal à grande échelle couvrant dix ans d'interactions sur le forum de l'hebdomadaire autrichien DerStandard, incluant des millions de commentaires et de votes anonymisés sous forme de représentations vectorielles pour faciliter l'analyse du discours en allemand tout en préservant la vie privée des utilisateurs.

Emma Fraxanet, Vicenç Gómez, Andreas Kaltenbrunner, Max PellertWed, 11 Ma💻 cs

Improving Large Vision-Language Models' Understanding for Flow Field Data

Ce papier présente FieldLVLM, un cadre novateur qui améliore la compréhension des modèles vision-langage de grande taille face aux données de champs physiques en combinant une stratégie de génération linguistique axée sur les caractéristiques physiques et un ajustement de modèle multimodal compressé, surpassant ainsi les méthodes existantes sur des benchmarks scientifiques.

Xiaomei Zhang, Hanyu Zheng, Xiangyu Zhu, Jinghuan Wei, Junhong Zou, Zhen Lei, Zhaoxiang ZhangWed, 11 Ma💻 cs

Lightening the Load: A Cluster-Based Framework for A Lower-Overhead, Provable Website Fingerprinting Defense

Ce papier présente un cadre unifié pour une défense adaptative contre la fingerprinting de sites web, nommé Adaptive Tamaraw, qui combine le regroupement de traces en ensembles d'anonymat et des paramètres de régularisation spécifiques à chaque cluster pour réduire considérablement la surcharge tout en maintenant des garanties de sécurité prouvables.

Khashayar Khajavi, Tao WangWed, 11 Ma💻 cs

CoRe-GS: Coarse-to-Refined Gaussian Splatting with Semantic Object Focus

L'article présente CoRe-GS, un cadre de reconstruction 3D par splatting gaussien qui optimise de manière sélective et efficace uniquement les objets d'intérêt spécifiques, réduisant ainsi considérablement le temps de calcul tout en améliorant la qualité de la reconstruction pour les applications robotiques en temps réel.

Hannah Schieber, Dominik Frischmann, Victor Schaack, Simon Boche, Angela Schoellig, Stefan Leutenegger, Daniel RothWed, 11 Ma💻 cs

Floating-Point Usage on GitHub: A Large-Scale Study of Statically Typed Languages

Cette étude empirique à grande échelle analyse l'utilisation de l'arithmétique à virgule flottante dans des millions de dépôts GitHub de langages typés statiquement, révélant que les benchmarks existants ne reflètent que partiellement la réalité du code et publiant un jeu de données de 10 millions de fonctions pour guider les futures recherches.

Andrea Gilot, Tobias Wrigstad, Eva DarulovaWed, 11 Ma💻 cs

VocSegMRI: Multimodal Learning for Precise Vocal Tract Segmentation in Real-time MRI

Ce papier présente VocSegMRI, un cadre d'apprentissage multimodal qui intègre des données vidéo, audio et phonologiques via une fusion par attention croisée et un apprentissage contrastif pour atteindre une segmentation précise et robuste des voies vocales en IRM temps réel, surpassant les méthodes existantes avec un score Dice de 0,95.

Daiqi Liu, Tomás Arias-Vergara, Johannes Enk, Fangxu Xing, Maureen Stone, Jerry L. Prince, Jana Hutter, Andreas Maier, Jonghye Woo, Paula Andrea Pérez-ToroWed, 11 Ma💻 cs

Multi-Quadruped Cooperative Object Transport: Learning Decentralized Pinch-Lift-Move

Cet article présente une approche décentralisée permettant à des équipes de robots quadrupèdes d'armes de transporter coopérativement des objets non saisissables uniquement par contact physique, en utilisant une architecture de politique hiérarchique et une formulation de récompense astucieuse pour coordonner le pincement, le soulèvement et le déplacement sans communication ni contrôle centralisé.

Bikram Pandit, Aayam Kumar Shrestha, Alan FernWed, 11 Ma💻 cs

Designing Culturally Aligned AI Systems For Social Good in Non-Western Contexts

En s'appuyant sur l'analyse de huit déploiements réels dans sept pays, cette étude identifie six facteurs clés et propose douze lignes directrices pour concevoir des systèmes d'IA socialement bénéfiques et culturellement adaptés aux contextes non occidentaux, en soulignant l'importance cruciale de la collaboration interdisciplinaire sur l'expertise technologique pure.

Deepak Varuvel Dennison, Mohit Jain, Tanuja Ganu, Aditya VashisthaWed, 11 Ma💻 cs