RubiCap: Rubric-Guided Reinforcement Learning for Dense Image Captioning

Das Paper stellt RubiCap vor, ein neuartiges Reinforcement-Learning-Framework, das mithilfe von LLM-generierten Rubriken feingranulare Belohnungssignale für das Dichte-Bildbeschreiben erzeugt und damit sowohl die Vielfalt der Ergebnisse als auch die Leistung von Vision-Language-Modellen im Vergleich zu bestehenden Methoden und menschlichen Annotationen signifikant verbessert.

Tzu-Heng Huang, Sirajul Salekin, Javier Movellan, Frederic Sala, Manjot BilkhuWed, 11 Ma🤖 cs.AI

The Reasoning Trap -- Logical Reasoning as a Mechanistic Pathway to Situational Awareness

Die Arbeit argumentiert, dass Fortschritte in der logischen推理 von KI-Systemen über drei mechanistische Pfade (deduktive Selbstinferenz, induktive Kontexterkennung und abduktive Selbstmodellierung) unweigerlich zu einer gefährlichen situativen Selbstwahrnehmung führen, und schlägt daher neue Sicherheitsmaßnahmen wie einen „Spiegel-Test"-Benchmark vor, um diese Eskalation zu verhindern.

Subramanyam Sahoo, Aman Chadha, Vinija Jain, Divya ChaudharyWed, 11 Ma🤖 cs.AI

PrivPRISM: Automatically Detecting Discrepancies Between Google Play Data Safety Declarations and Developer Privacy Policies

Die Studie stellt PrivPRISM vor, ein automatisiertes Framework, das Diskrepanzen zwischen den vereinfachten Google Play-Datensicherheitsangaben und den vollständigen Datenschutzrichtlinien aufdeckt und dabei zeigt, dass bei fast der Hälfte der untersuchten Apps widersprüchliche oder unvollständige Angaben zu Datenpraktiken vorliegen, was die Notwendigkeit einer strengeren Durchsetzung und Nutzerwachsamkeit unterstreicht.

Bhanuka Silva, Dishanika Denipitiyage, Anirban Mahanti, Aruna Seneviratne, Suranga SeneviratneWed, 11 Ma🤖 cs.AI

Cognitively Layered Data Synthesis for Domain Adaptation of LLMs to Space Situational Awareness

Die Arbeit stellt BD-FDG vor, ein Framework zur Generierung von feinabgestimmten Trainingsdaten für Large Language Models im Bereich der Weltraumlageerkennung, das durch kognitiv gestaffelte Fragestellungen und automatische Qualitätskontrolle eine signifikante Leistungssteigerung bei gleichzeitiger Beibehaltung allgemeiner Fähigkeiten ermöglicht.

Ding Linghu, Cheng Wang, Da Fan, Wei Shi, Kaifeng Yin, Xiaoliang Xue, Fan Yang, Haiyi Ren, Cong ZhangWed, 11 Ma🤖 cs.AI

BridgeDiff: Bridging Human Observations and Flat-Garment Synthesis for Virtual Try-Off

Das Paper stellt BridgeDiff vor, ein diffusionsbasiertes Framework, das durch die Garment Condition Bridge Module und das Flat Structure Constraint Module die Lücke zwischen menschlichen Beobachtungen und der Synthese flacher Kleidungsstücke schließt, um konsistente und strukturell stabile virtuelle Anproben zu ermöglichen.

Shuang Liu, Ao Yu, Linkang Cheng, Xiwen Huang, Li Zhao, Junhui Liu, Zhiting Lin, Yu LiuWed, 11 Ma🤖 cs.AI

Social-R1: Towards Human-like Social Reasoning in LLMs

Die Arbeit stellt Social-R1 vor, ein Reinforcement-Learning-Framework, das durch das Training mit dem adversarischen Benchmark ToMBench-Hard und einer prozessbasierten Belohnungsfunktion menschliche soziale Intelligenz in Sprachmodellen fördert und dabei selbst kleine Modelle (4B Parameter) effizienter als größere Alternativen macht.

Jincenzi Wu, Yuxuan Lei, Jianxun Lian, Yitian Huang, Lexin Zhou, Haotian Li, Xing Xie, Helen MengWed, 11 Ma🤖 cs.AI

Multi-model approach for autonomous driving: A comprehensive study on traffic sign-, vehicle- and lane detection and behavioral cloning

Diese Studie präsentiert einen umfassenden Multi-Modell-Ansatz, der vortrainierte und benutzerdefinierte neuronale Netze für die Verkehrsschilderkennung, Fahrzeug- und Spurerkennung sowie Verhaltensnachahmung integriert, um die Robustheit und Zuverlässigkeit autonomer Fahrsysteme durch fortschrittliche Deep-Learning-Techniken und diverse Datensätze zu verbessern.

Kanishkha Jaisankar, Pranav M. Pawar, Diana Susane Joseph, Raja Muthalagu, Mithun MukherjeeWed, 11 Ma🤖 cs.AI