cs.CY artículos | Gist.Science

Towards Viewpoint-centric Artifact-based Regulatory Requirements Engineering for Compliance by Design

Este artículo presenta el modelo de artefactos AM4RRE como una propuesta para integrar la ingeniería de requisitos regulatorios en el ciclo de vida del desarrollo de software, con el objetivo de lograr un cumplimiento normativo sistemático y basado en el diseño que aborde la complejidad de la coordinación entre múltiples perspectivas.

Oleksandr KosenkovWed, 11 Ma💻 cs

Benchmarking Political Persuasion Risks Across Frontier Large Language Models

Este estudio demuestra que los modelos de lenguaje de vanguardia, especialmente Claude, superan en persuasión política a la publicidad electoral tradicional y que la eficacia de las estrategias de generación de contenido varía significativamente según el modelo, estableciendo un nuevo marco para evaluar los riesgos persuasivos de estas tecnologías.

Zhongren Chen, Joshua Kalla, Quan LeWed, 11 Ma💬 cs.CL

Survey of Computerized Adaptive Testing: A Machine Learning Perspective

Este artículo presenta una encuesta centrada en el aprendizaje automático sobre la Prueba Adaptativa Computarizada (CAT), explorando cómo las técnicas de ML pueden optimizar sus componentes clave para crear sistemas más robustos, justos y eficientes que integren la psicometría tradicional con enfoques interdisciplinarios.

Yan Zhuang, Qi Liu, Haoyang Bi, Zhenya Huang, Weizhe Huang, Jiatong Li, Junhao Yu, Zirui Liu, Zirui Hu, Yuting Hong, Zachary A. Pardos, Haiping Ma, Mengxiao Zhu, Shijin Wang, Enhong ChenTue, 10 Ma🤖 cs.LG

Life Histories of Taboo Knowledge Artifacts

Este estudio de métodos mixtos examina el ciclo de vida de los artículos de Wikipedia sobre temas tabú, identificando seis temas clave que revelan cómo la colaboración resiliente, el liderazgo y la gobernanza emergente permiten crear y mantener conocimiento de alta calidad en medio de conflictos y censura.

Kaylea Champion, Benjamin Mako HillTue, 10 Ma💻 cs

Llama-Mob: Instruction-Tuning Llama-3-8B Excels in City-Scale Mobility Prediction

El artículo presenta Llama-Mob, un modelo de lenguaje grande (Llama-3-8B) ajustado mediante instrucciones que supera a los métodos actuales en la predicción de movilidad urbana a largo plazo y demuestra una fuerte capacidad de generalización cero-shot entre diferentes ciudades.

Peizhi Tang, Chuang Yang, Tong Xing, Xiaohang Xu, Jiayi Xu, Renhe Jiang, Kaoru SezakiTue, 10 Ma💬 cs.CL

MediTools -- Medical Education Powered by LLMs

El proyecto MediTools presenta una aplicación prototipo que utiliza modelos de lenguaje grandes (LLM) para revolucionar la educación médica mediante herramientas interactivas de simulación clínica, análisis de literatura y resúmenes de noticias, validando su potencial a través de una encuesta con profesionales y estudiantes.

Amr Alshatnawi, Remi Sampaleanu, David LiebovitzTue, 10 Ma💻 cs

Estimating Item Difficulty Using Large Language Models and Tree-Based Machine Learning Algorithms

La investigación demuestra que, aunque los Modelos de Lenguaje Grande (LLM) pueden estimar la dificultad de ítems educativos, la estrategia que combina la extracción de características lingüísticas y cognitivas por parte del LLM con algoritmos de aprendizaje automático basados en árboles (como bosques aleatorios) supera significativamente a la estimación directa, ofreciendo una alternativa precisa y escalable para reducir la dependencia de costosas pruebas de campo.

Pooya Razavi, Sonya PowersTue, 10 Ma🤖 cs.LG

SPOT: An Annotated French Corpus and Benchmark for Detecting Critical Interventions in Online Conversations

Este artículo presenta SPOT, el primer corpus anotado en francés y un benchmark para detectar "puntos de parada" en conversaciones en línea, demostrando que los modelos de codificadores ajustados superan a los grandes modelos de lenguaje en esta tarea y mejoran su rendimiento al incorporar metadatos contextuales.

Manon Berriche, Célia Nouri, Chloée Clavel, Jean-Philippe CointetTue, 10 Ma💬 cs.CL

XInsight: Integrative Stage-Consistent Psychological Counseling Support Agents for Digital Well-Being

El artículo presenta XInsight, un marco de agentes multi-sistema inspirado en la consejería psicológica que integra el paradigma Exploración-Insight-Acción y un ciclo de razonamiento-intervención-reflexión para ofrecer apoyo terapéutico estructurado y transparente en plataformas web, validado mediante la nueva métrica XInsight-Bench.

Fei Wang, Jiangnan Yang, Junjie Chen, Yuxin Liu, Kun Li, Yanyan Wei, Dan Guo, Meng WangTue, 10 Ma🤖 cs.LG

Evaluating AI-Enabled deception vulnerability amongst Sub-Saharan-Africa migrants

Este estudio evalúa la vulnerabilidad de los migrantes subsaharianos al engaño impulsado por la IA, concluyendo que la exposición previa a objetivos de estafa es el principal factor de riesgo, mientras que la confianza en la capacidad para identificar contenido generado por IA y el esfuerzo de verificación actúan como factores protectores significativos.

Deborah OluwasanyaTue, 10 Ma💻 cs

Building the ethical AI framework of the future: from philosophy to practice

Este artículo presenta un marco de gobernanza ética para la IA que integra principios filosóficos en una arquitectura de control operativa con "triple puerta" (métricas, gobernanza y sostenibilidad) para gestionar los riesgos a lo largo de todo el ciclo de vida de los sistemas de IA, alineándose con normativas como la Ley de IA de la UE y el Marco de Gestión de Riesgos de NIST.

Jasper Kyle CatapangTue, 10 Ma💻 cs

A Novel Approach for Testing Water Safety Using Deep Learning Inference of Microscopic Images of Unincubated Water Samples

Este artículo presenta DeepScope, un sistema de aprendizaje profundo que analiza imágenes microscópicas de muestras de agua no incubadas para detectar contaminación fecal en segundos con un costo de \$0.44 por prueba, superando los requisitos de la UNICEF y logrando una precisión del 90% y un recall superior al 94%.

Sanjay SrinivasanTue, 10 Ma🤖 cs.LG

The Potential for an Innovation Winter: Estimating Impact of Federal Research Reductions on Faculty Activity

El artículo modela cómo las reducciones propuestas en la financiación federal de investigación podrían provocar un "invierno de la innovación" al aumentar drásticamente la proporción de universidades R1 donde más de la mitad del profesorado tendría un apoyo subcrítico, poniendo en riesgo la calidad de los programas de investigación y doctorado.

Robert A. BrownTue, 10 Ma🔬 physics

Causal Analysis of Author Demographics in Academic Peer Review

Este estudio utiliza inferencia causal para demostrar que las minorías raciales, las mujeres y los autores del Sur Global enfrentan desventajas estadísticamente significativas en la aceptación de artículos académicos, lo que subraya la necesidad urgente de intervenciones para garantizar la equidad en los procesos de revisión, incluidos los basados en inteligencia artificial.

Uttamasha Anjally Oyshi, Gibson Nkhata, Susan GauchTue, 10 Ma💻 cs

Science Literacy: Generative AI as Enabler of Coherence in the Teaching, Learning, and Assessment of Scientific Knowledge and Reasoning

Este capítulo examina el potencial de la inteligencia artificial generativa para mejorar la alfabetización científica en los niveles K-16+ proponiendo una arquitectura que unifica la enseñanza, el aprendizaje y la evaluación, al tiempo que aborda los desafíos conceptuales y prácticos, así como las necesidades futuras de investigación y desarrollo.

Xiaoming Zhai, James W. Pellegrino, Matias Rojas, Jongchan Park, Matthew Nyaaba, Clayton Cohn, Gautam BiswasTue, 10 Ma💻 cs

SuperSkillsStack: Agency, Domain Knowledge, Imagination, and Taste in Human-AI Design Education

Este estudio demuestra que, en la educación en diseño, la inteligencia artificial generativa actúa principalmente como un acelerador cognitivo que complementa, pero no reemplaza, las capacidades humanas esenciales de agencia, conocimiento del dominio, imaginación y gusto para la colaboración efectiva.

Qian Huang, King Wang PoonTue, 10 Ma💻 cs

The Third Ambition: Artificial Intelligence and the Science of Human Behavior

Este artículo propone una "tercera ambición" para la inteligencia artificial que utiliza los grandes modelos de lenguaje como instrumentos científicos para estudiar el comportamiento humano, la cultura y el razonamiento moral, analizando sus capacidades metodológicas, limitaciones epistémicas y el impacto de las intervenciones de alineación en la investigación de las ciencias sociales.

W. Russell Neuman, Chad ColemanTue, 10 Ma💬 cs.CL

Brexit Means Brexit: Selection Bias, Echo Chambers, and Entrenched Opinion on Reddit

Este estudio demuestra que la polarización política en el subreddit r/Brexit de Reddit está impulsada principalmente por la auto-selección de usuarios ya arraigados en sus posturas y la dominancia de cámaras de eco, en lugar de suavizarse mediante la exposición a opiniones contrarias.

Marian-Andrei Rizoiu, Duy Khuu, Andrew Law, Christine LargeronTue, 10 Ma💻 cs

Dual-Metric Evaluation of Social Bias in Large Language Models: Evidence from an Underrepresented Nepali Cultural Context

Este estudio evalúa sistemáticamente los sesgos sociales en siete modelos de lenguaje avanzados dentro del contexto cultural nepalí, revelando mediante una evaluación de doble métrica que, aunque existe un acuerdo explícito medible con estereotipos, el sesgo implícito en la generación de texto es más prevalente, no lineal respecto a la temperatura y pobremente capturado por las métricas de acuerdo tradicionales.

Ashish Pandey, Tek Raj ChhetriTue, 10 Ma💬 cs.CL

Governance of AI-Generated Content: A Case Study on Social Media Platforms

Este estudio analiza las políticas de gobernanza de contenido generado por IA en 40 plataformas de redes sociales, encontrando que la mayoría se centra en la moderación de violaciones y la divulgación, mientras que pocas abordan temas como la propiedad o la monetización, lo que lleva a los autores a recomendar marcos regulatorios más integrales y herramientas educativas para los usuarios.

Lan Gao, Abani Ahmed, Oscar Chen, Margaux Reyl, Zayna Cheema, Nick Feamster, Chenhao Tan, Kurt Thomas, Marshini ChettyTue, 10 Ma💻 cs

← Anterior Siguiente →