Excess demand in public transportation systems: The case of Pittsburgh's Port Authority

이 논문은 버스가 만석으로 탑승하지 못한 승객에 대한 데이터 누락으로 인한 편향을 보정하기 위해 잠재적 초과 수요를 식별하고 필터링하는 프레임워크를 제안하며, 이를 피츠버그 포트 오토리티의 실제 데이터를 적용하여 1 년 간의 초과 수요를 추정했습니다.

Tianfang Ma, Robizon Khubulashvili, Sera Linardi, Konstantinos PelechrinisWed, 11 Ma💻 cs

Generative AI and LLMs in Industry: A text-mining Analysis and Critical Evaluation of Guidelines and Policy Statements Across Fourteen Industrial Sectors

이 논문은 14 개 산업 분야의 160 개 가이드라인과 정책 성명서를 텍스트 마이닝 기법으로 분석하여 생성형 AI 와 대규모 언어 모델의 혁신과 윤리적 책임, 규제 간의 균형을 모색하고 산업 전반에 대한 책임 있는 통합을 위한 실질적인 통찰과 제언을 제시합니다.

Junfeng Jiao, Saleh Afroogh, Kevin Chen, David Atkinson, Amit DhurandharWed, 11 Ma💻 cs

A Decade of News Forum Interactions: Threaded Conversations, Signed Votes, and Topical Tags

이 논문은 오스트리아의 주요 신문인 DerStandard 의 10 년간 (2013~2022) 에 생성된 7,500 만 건 이상의 댓글과 4 억 건 이상의 투표, 그리고 메타데이터를 포함한 대규모 종단적 데이터셋을 공개하며, 사용자 프라이버시를 보호하기 위해 원문 대신 임베딩 벡터와 해시화된 식별자를 제공하고 독일어 기반 온라인 담론 분석을 위한 중요한 자원을 제시합니다.

Emma Fraxanet, Vicenç Gómez, Andreas Kaltenbrunner, Max PellertWed, 11 Ma💻 cs

Computational Multi-Agents Society Experiments: Social Modeling Framework Based on Generative Agents

이 논문은 생성형 에이전트와 가상 민족지 방법을 통합하여 연구자가 가상 사회 환경에 직접 참여하고 개입할 수 있도록 하는 CMASE 프레임워크를 제안하며, 이를 통해 복잡한 사회 현상의 통계적 패턴과 인과적 메커니즘을 동시에 설명하고 예측하는 새로운 사회과학 연구 방법론을 제시합니다.

Hanzhong Zhang, Muhua Huang, Jindong WangWed, 11 Ma🤖 cs.AI

Does Scientific Writing Converge to U.S. English? Evidence from Generative AI-Assisted Publications

이 논문은 2021 년부터 2024 년까지의 565 만 건의 과학 논문 데이터를 분석한 결과, 생성형 AI 도구의 사용이 비영어권 국가의 저자들이 미국식 과학 영어에 더 빠르게 수렴하도록 하여 언어적 장벽을 낮추고 있음을 보여준다고 요약할 수 있습니다.

Dragan Filimonovic, Christian Rutzer, Jeffrey Macher, Rolf WederWed, 11 Ma💬 cs.CL

Why do we Trust Chatbots? From Normative Principles to Behavioral Drivers

이 논문은 챗봇에 대한 사용자의 신뢰가 실제 신뢰성보다는 인지적 편향을 활용한 설계에서 비롯된다는 점을 지적하며, 챗봇을 '동반자'가 아닌 조직의 목표를 추구하는 '고도화된 영업사원'으로 재정의하고 심리적 신뢰 형성 과정과 규범적 신뢰성 사이의 혼란을 해소할 필요성을 주장합니다.

Aditya Gulati, Nuria OliverWed, 11 Ma🤖 cs.AI

Infusion: Shaping Model Behavior by Editing Training Data via Influence Functions

이 논문은 영향 함수를 활용하여 훈련 데이터에 미세한 교란을 가해 모델의 행동을 의도적으로 조작하는 'Infusion' 프레임워크를 제안하고, 이를 통해 소량의 훈련 데이터만으로도 다양한 아키텍처에 걸쳐 모델 행동을 효과적으로 변화시킬 수 있음을 입증합니다.

J Rosser, Robert Kirk, Edward Grefenstette, Jakob Foerster, Laura RuisWed, 11 Ma🤖 cs.AI

Queer NLP: A Critical Survey on Literature Gaps, Biases and Trends

이 논문은 ACL 앤솔로지에 게재된 LGBTQIA+ 커뮤니티와 NLP 기술 간의 관계를 다룬 연구들을 체계적으로 검토하여, 현재 연구가 주로 기존 시스템의 편향을 지적하는 수동적 접근에 그치고 있으며, 향후 이해관계자 참여, 교차성, 학제 간 협력 및 비영어권 언어 연구 등 보다 포용적이고 정의로운 NLP 기술 개발을 위한 방향성을 제시합니다.

Sabine Weber, Angelina Wang, Ankush Gupta, Arjun Subramonian, Dennis Ulmer, Eshaan Tanwar, Geetanjali Aich, Hannah Devinney, Jacob Hobbs, Jennifer Mickel, Joshua Tint, Mae Sosto, Ray Groshan, Simone Astarita, Vagrant Gautam, Verena Blaschke, William Agnew, Wilson Y Lee, Yanan LongWed, 11 Ma💻 cs

Self-hosted Lecture-to-Quiz: Local LLM MCQ Generation with Deterministic Quality Control

이 논문은 외부 API 없이 로컬 LLM 과 결정적 품질 관리 (QC) 를 통해 강의 PDF 를 다지선다형 문제로 변환하는 종단간 자체 호스팅 파이프라인을 제안하고, 정보이론·열역학·통계역학 등 세 가지 강의에서 생성된 24 개의 문제를 검증하여 프라이버시, 책임성, 친환경 AI 를 보장하는 교육 워크플로우를 입증합니다.

Seine A. ShintaniWed, 11 Ma💻 cs

Clear, Compelling Arguments: Rethinking the Foundations of Frontier AI Safety Cases

이 논문은 항공, 원자력 등 안전 중대 산업에서 발전한 안전 사례 (safety case) 방법론의 교훈을 바탕으로, 정렬 (alignment) 커뮤니티의 기존 접근법의 한계를 지적하고 프런티어 AI 시스템의 안전성을 입증하기 위한 더 견고하고 포괄적인 안전 사례 프레임워크를 제안합니다.

Shaun Feakins, Ibrahim Habli, Phillip MorganWed, 11 Ma🤖 cs.AI

From Verification to Amplification: Auditing Reverse Image Search as Algorithmic Gatekeeping in Visual Misinformation Fact-checking

이 논문은 15 일간 34,486 개의 검색 결과를 분석한 결과, 구글의 역이미지 검색이 시각적 허위정보를 검증하는 과정에서 관련 없는 정보와 반복된 허위정보가 상위를 차지하며 사실 확인 콘텐츠의 가시성이 30% 미만으로 제한되는 등 알고리즘 게이트키핑의 한계를 드러냈음을 규명합니다.

Cong Lin, Yifei Chen, Jiangyue Chen, Yingdan Lu, Yilang Peng, Cuihua ShenWed, 11 Ma💻 cs

PixelConfig: Longitudinal Measurement and Reverse-Engineering of Meta Pixel Configurations

이 논문은 메타 픽셀의 구성을 역공학적으로 분석하는 'PixelConfig' 프레임워크를 제시하고, 2017 년부터 2024 년까지의 데이터를 통해 건강 관련 웹사이트를 포함한 웹상에서 민감한 정보 수집을 위한 추적 기능이 기본 설정에 의해 광범위하게 활성화되어 있으며, 제한 설정이 존재하더라도 실제 보호 효과는 미미함을 규명했습니다.

Abdullah Ghani (Lahore University of Management Sciences), Yash Vekaria (University of California, Davis), Zubair Shafiq (University of California, Davis)Wed, 11 Ma💻 cs