Towards Viewpoint-centric Artifact-based Regulatory Requirements Engineering for Compliance by Design

この論文は、複雑化する規制への対応を目的として、異なる視点間の調整を可能にする統合的なコンプライアンス・バイ・デザインを実現するための「規制要件工学のためのアーティファクトモデル(AM4RRE)」の合成と今後の評価計画について報告し、学術的な議論を喚起することを目的としています。

Oleksandr KosenkovWed, 11 Ma💻 cs

Benchmarking Political Persuasion Risks Across Frontier Large Language Models

この論文は、19,145 人の参加者による大規模調査を通じて、Claude や GPT などの最先端大規模言語モデル(LLM)が従来の政治広告よりも効果的に世論を形成しうることを示し、モデル間の説得力の差異や情報提示プロンプトの影響の多様性を明らかにするとともに、説得リスクを評価する新たな枠組みを提案しています。

Zhongren Chen, Joshua Kalla, Quan LeWed, 11 Ma💬 cs.CL

Survey of Computerized Adaptive Testing: A Machine Learning Perspective

本論文は、従来の心理測定学に依存するコンピュータ適応型テスト(CAT)の枠組みを、測定モデルや問題選択アルゴリズムなどの主要構成要素に機械学習を統合する新たな視点から包括的に調査し、より強健で公平かつ効率的な次世代テストシステムの構築を提唱するものです。

Yan Zhuang, Qi Liu, Haoyang Bi, Zhenya Huang, Weizhe Huang, Jiatong Li, Junhao Yu, Zirui Liu, Zirui Hu, Yuting Hong, Zachary A. Pardos, Haiping Ma, Mengxiao Zhu, Shijin Wang, Enhong ChenTue, 10 Ma🤖 cs.LG

Life Histories of Taboo Knowledge Artifacts

この混合研究法による比較プロジェクトは、ウィキペディアにおけるタブー知識の生成と維持の過程を分析し、その発展における 6 つのテーマを特定するとともに、限定的な識別性と断片的な意味付けという条件下でタブー記事が存続するために必要なレジリエントなリーダーシップや組織的関与、そして参加者のガバナンスと公衆の想像力について明らかにした。

Kaylea Champion, Benjamin Mako HillTue, 10 Ma💻 cs

Llama-Mob: Instruction-Tuning Llama-3-8B Excels in City-Scale Mobility Prediction

この論文は、大規模言語モデル Llama-3-8B を指示チューニングした「Llama-Mob」を提案し、複数の都市における大規模な移動データを用いた検証により、従来の手法を凌駕する長期的な都市規模の移動予測能力と、限られたデータからの高いゼロショット汎化性能を実証したものです。

Peizhi Tang, Chuang Yang, Tong Xing, Xiaohang Xu, Jiayi Xu, Renhe Jiang, Kaoru SezakiTue, 10 Ma💬 cs.CL

Estimating Item Difficulty Using Large Language Models and Tree-Based Machine Learning Algorithms

この論文は、K-5 数学・読解問題の難易度推定において、大規模言語モデル(LLM)による直接的な推定よりも、LLM で抽出した特徴量を木ベース機械学習モデルに入力する手法の方が高い精度(相関係数 0.87)を達成し、大規模なフィールドテストへの依存を減らす有望なアプローチであることを示している。

Pooya Razavi, Sonya PowersTue, 10 Ma🤖 cs.LG

SPOT: An Annotated French Corpus and Benchmark for Detecting Critical Interventions in Online Conversations

本論文は、オンライン議論を中断または方向転換させる「クリティカルな介入」を検出するための初の注釈付きフランス語コーパス「SPOT」を構築し、文脈メタデータを活用した微調整エンコーダーモデルがプロンプト型大規模言語モデルを上回る性能を示すことを実証したものです。

Manon Berriche, Célia Nouri, Chloée Clavel, Jean-Philippe CointetTue, 10 Ma💬 cs.CL

XInsight: Integrative Stage-Consistent Psychological Counseling Support Agents for Digital Well-Being

本論文は、従来の LLM チャットボットの課題を克服し、デジタルウェルビーイングを促進する Web アプリケーション向けに、古典的な「探索・洞察・行動」のカウンセリングパラダイムに沿った多エージェントフレームワーク「XInsight」と、その評価基準「XInsight-Bench」を提案するものである。

Fei Wang, Jiangnan Yang, Junjie Chen, Yuxin Liu, Kun Li, Yanyan Wei, Dan Guo, Meng WangTue, 10 Ma🤖 cs.LG

Building the ethical AI framework of the future: from philosophy to practice

この論文は、EU AI 法や NIST のリスク管理フレームワークなどの既存のガイドラインを実用的な運用管理へと昇華させるため、AI ライフサイクルの各段階に功利主義・義務論・徳倫理学の原理を組み込み、定量的指標・ガバナンス・環境制約の「3 つのゲート」による制御アーキテクチャを提案するものです。

Jasper Kyle CatapangTue, 10 Ma💻 cs

The Potential for an Innovation Winter: Estimating Impact of Federal Research Reductions on Faculty Activity

トランプ政権が 2026 年に提案した連邦研究資金の削減は、確率モデルを用いた分析により、多くの R1 大学で研究活動が維持不可能な水準に陥る「イノベーションの冬」を招き、質の高い研究や博士課程の存続を脅かす深刻な影響を及ぼす可能性があると結論付けられています。

Robert A. BrownTue, 10 Ma🔬 physics

Science Literacy: Generative AI as Enabler of Coherence in the Teaching, Learning, and Assessment of Scientific Knowledge and Reasoning

この論文は、生成 AI が科学リテラシーの定義や教育課題を再考させ、科学知識と推論の教授・学習・評価の一貫性を高めるためのアーキテクチャの構築とその実装、さらには今後の研究開発の方向性を論じています。

Xiaoming Zhai, James W. Pellegrino, Matias Rojas, Jongchan Park, Matthew Nyaaba, Clayton Cohn, Gautam BiswasTue, 10 Ma💻 cs

Brexit Means Brexit: Selection Bias, Echo Chambers, and Entrenched Opinion on Reddit

この論文は、Reddit の r/Brexit サブreddit における Brexit に関する議論を分析し、説得可能なユーザーの離脱による生存者バイアスと、同調的なユーザー間の相互作用が支配的なエコーチェンバー効果により、意見が軟化されずに固定化されていることを明らかにしています。

Marian-Andrei Rizoiu, Duy Khuu, Andrew Law, Christine LargeronTue, 10 Ma💻 cs

Dual-Metric Evaluation of Social Bias in Large Language Models: Evidence from an Underrepresented Nepali Cultural Context

本論文は、ネパールという未代表文化圏における大規模言語モデルの社会的バイアスを評価する「二重指標評価(DMBA)」フレームワークを提案し、明示的な同意バイアスと暗黙的な生成バイアスの間に強い相関がないこと、および温度パラメータやドメインによってバイアスの現れ方が異なることを実証しています。

Ashish Pandey, Tek Raj ChhetriTue, 10 Ma💬 cs.CL

Governance of AI-Generated Content: A Case Study on Social Media Platforms

この論文は、40 の主要なソーシャルメディアプラットフォームを対象とした調査を通じて、生成 AI によるコンテンツのガバナンス現状を分析し、多くのプラットフォームが既存のルール違反や開示に焦点を当てる一方で、所有権や収益化などの課題への対応が不十分であるため、より包括的で前向きなガバナンス枠組みやユーザー教育の必要性を提言しています。

Lan Gao, Abani Ahmed, Oscar Chen, Margaux Reyl, Zayna Cheema, Nick Feamster, Chenhao Tan, Kurt Thomas, Marshini ChettyTue, 10 Ma💻 cs