cs.CY 件の論文 | Gist.Science

Towards Viewpoint-centric Artifact-based Regulatory Requirements Engineering for Compliance by Design

この論文は、複雑化する規制への対応を目的として、異なる視点間の調整を可能にする統合的なコンプライアンス・バイ・デザインを実現するための「規制要件工学のためのアーティファクトモデル（AM4RRE）」の合成と今後の評価計画について報告し、学術的な議論を喚起することを目的としています。

Oleksandr KosenkovWed, 11 Ma💻 cs

Benchmarking Political Persuasion Risks Across Frontier Large Language Models

この論文は、19,145 人の参加者による大規模調査を通じて、Claude や GPT などの最先端大規模言語モデル（LLM）が従来の政治広告よりも効果的に世論を形成しうることを示し、モデル間の説得力の差異や情報提示プロンプトの影響の多様性を明らかにするとともに、説得リスクを評価する新たな枠組みを提案しています。

Zhongren Chen, Joshua Kalla, Quan LeWed, 11 Ma💬 cs.CL

Survey of Computerized Adaptive Testing: A Machine Learning Perspective

本論文は、従来の心理測定学に依存するコンピュータ適応型テスト（CAT）の枠組みを、測定モデルや問題選択アルゴリズムなどの主要構成要素に機械学習を統合する新たな視点から包括的に調査し、より強健で公平かつ効率的な次世代テストシステムの構築を提唱するものです。

Yan Zhuang, Qi Liu, Haoyang Bi, Zhenya Huang, Weizhe Huang, Jiatong Li, Junhao Yu, Zirui Liu, Zirui Hu, Yuting Hong, Zachary A. Pardos, Haiping Ma, Mengxiao Zhu, Shijin Wang, Enhong ChenTue, 10 Ma🤖 cs.LG

Life Histories of Taboo Knowledge Artifacts

この混合研究法による比較プロジェクトは、ウィキペディアにおけるタブー知識の生成と維持の過程を分析し、その発展における 6 つのテーマを特定するとともに、限定的な識別性と断片的な意味付けという条件下でタブー記事が存続するために必要なレジリエントなリーダーシップや組織的関与、そして参加者のガバナンスと公衆の想像力について明らかにした。

Kaylea Champion, Benjamin Mako HillTue, 10 Ma💻 cs

Llama-Mob: Instruction-Tuning Llama-3-8B Excels in City-Scale Mobility Prediction

この論文は、大規模言語モデル Llama-3-8B を指示チューニングした「Llama-Mob」を提案し、複数の都市における大規模な移動データを用いた検証により、従来の手法を凌駕する長期的な都市規模の移動予測能力と、限られたデータからの高いゼロショット汎化性能を実証したものです。

Peizhi Tang, Chuang Yang, Tong Xing, Xiaohang Xu, Jiayi Xu, Renhe Jiang, Kaoru SezakiTue, 10 Ma💬 cs.CL

MediTools -- Medical Education Powered by LLMs

この論文は、大規模言語モデルを活用して皮膚科症例シミュレーション、論文検索、医療ニュース要約などの対話型ツールを提供する「MediTools」という医療教育プラットフォームを開発し、その有効性を医療従事者や学生への調査を通じて検証したことを報告しています。

Amr Alshatnawi, Remi Sampaleanu, David LiebovitzTue, 10 Ma💻 cs

Estimating Item Difficulty Using Large Language Models and Tree-Based Machine Learning Algorithms

この論文は、K-5 数学・読解問題の難易度推定において、大規模言語モデル（LLM）による直接的な推定よりも、LLM で抽出した特徴量を木ベース機械学習モデルに入力する手法の方が高い精度（相関係数 0.87）を達成し、大規模なフィールドテストへの依存を減らす有望なアプローチであることを示している。

Pooya Razavi, Sonya PowersTue, 10 Ma🤖 cs.LG

SPOT: An Annotated French Corpus and Benchmark for Detecting Critical Interventions in Online Conversations

本論文は、オンライン議論を中断または方向転換させる「クリティカルな介入」を検出するための初の注釈付きフランス語コーパス「SPOT」を構築し、文脈メタデータを活用した微調整エンコーダーモデルがプロンプト型大規模言語モデルを上回る性能を示すことを実証したものです。

Manon Berriche, Célia Nouri, Chloée Clavel, Jean-Philippe CointetTue, 10 Ma💬 cs.CL

XInsight: Integrative Stage-Consistent Psychological Counseling Support Agents for Digital Well-Being

本論文は、従来の LLM チャットボットの課題を克服し、デジタルウェルビーイングを促進する Web アプリケーション向けに、古典的な「探索・洞察・行動」のカウンセリングパラダイムに沿った多エージェントフレームワーク「XInsight」と、その評価基準「XInsight-Bench」を提案するものである。

Fei Wang, Jiangnan Yang, Junjie Chen, Yuxin Liu, Kun Li, Yanyan Wei, Dan Guo, Meng WangTue, 10 Ma🤖 cs.LG

Evaluating AI-Enabled deception vulnerability amongst Sub-Saharan-Africa migrants

この研究は、サハラ以南アフリカ出身の移民を対象とした調査と統計分析を通じて、AI による詐欺への脆弱性の主要な指標は過去の標的化経験であり、AI コンテンツの識別自信や高い検証行動が保護要因となることを明らかにしたものである。

Deborah OluwasanyaTue, 10 Ma💻 cs

Building the ethical AI framework of the future: from philosophy to practice

この論文は、EU AI 法や NIST のリスク管理フレームワークなどの既存のガイドラインを実用的な運用管理へと昇華させるため、AI ライフサイクルの各段階に功利主義・義務論・徳倫理学の原理を組み込み、定量的指標・ガバナンス・環境制約の「3 つのゲート」による制御アーキテクチャを提案するものです。

Jasper Kyle CatapangTue, 10 Ma💻 cs

A Novel Approach for Testing Water Safety Using Deep Learning Inference of Microscopic Images of Unincubated Water Samples

この論文は、培養を不要とし、深層学習と画像拡張技術を用いて数秒で水質安全性を判定する低コストなシステム「DeepScope」を開発し、実地試験で高い精度を達成したことを報告しています。

Sanjay SrinivasanTue, 10 Ma🤖 cs.LG

The Potential for an Innovation Winter: Estimating Impact of Federal Research Reductions on Faculty Activity

トランプ政権が 2026 年に提案した連邦研究資金の削減は、確率モデルを用いた分析により、多くの R1 大学で研究活動が維持不可能な水準に陥る「イノベーションの冬」を招き、質の高い研究や博士課程の存続を脅かす深刻な影響を及ぼす可能性があると結論付けられています。

Robert A. BrownTue, 10 Ma🔬 physics

Causal Analysis of Author Demographics in Academic Peer Review

この論文は、530 件の論文データを用いた因果推論分析により、人種、性別、所属機関の国（特にグローバル・サウス）が査読結果に統計的に有意な負の因果効果をもたらすことを実証し、AI を含めた学術査読プロセスにおける公平性介入の緊急性を訴えています。

Uttamasha Anjally Oyshi, Gibson Nkhata, Susan GauchTue, 10 Ma💻 cs

Science Literacy: Generative AI as Enabler of Coherence in the Teaching, Learning, and Assessment of Scientific Knowledge and Reasoning

この論文は、生成 AI が科学リテラシーの定義や教育課題を再考させ、科学知識と推論の教授・学習・評価の一貫性を高めるためのアーキテクチャの構築とその実装、さらには今後の研究開発の方向性を論じています。

Xiaoming Zhai, James W. Pellegrino, Matias Rojas, Jongchan Park, Matthew Nyaaba, Clayton Cohn, Gautam BiswasTue, 10 Ma💻 cs

SuperSkillsStack: Agency, Domain Knowledge, Imagination, and Taste in Human-AI Design Education

この論文は、デザイン教育における生成AIの活用を「主体性、領域知識、想像力、審美眼」の4要素から分析し、AIは創造性の代替ではなく認知の加速装置として機能し、その効果的な協働には人間の高度な能力の育成が不可欠であると結論付けています。

Qian Huang, King Wang PoonTue, 10 Ma💻 cs

The Third Ambition: Artificial Intelligence and the Science of Human Behavior

この論文は、大規模言語モデルを「生産性」や「整合性」に次ぐ第三の目標として、人間の行動・文化・道徳的推論を研究するための科学的ツールとして位置づけ、その方法論的アプローチと認識論的限界を論じています。

W. Russell Neuman, Chad ColemanTue, 10 Ma💬 cs.CL

Brexit Means Brexit: Selection Bias, Echo Chambers, and Entrenched Opinion on Reddit

この論文は、Reddit の r/Brexit サブreddit における Brexit に関する議論を分析し、説得可能なユーザーの離脱による生存者バイアスと、同調的なユーザー間の相互作用が支配的なエコーチェンバー効果により、意見が軟化されずに固定化されていることを明らかにしています。

Marian-Andrei Rizoiu, Duy Khuu, Andrew Law, Christine LargeronTue, 10 Ma💻 cs

Dual-Metric Evaluation of Social Bias in Large Language Models: Evidence from an Underrepresented Nepali Cultural Context

本論文は、ネパールという未代表文化圏における大規模言語モデルの社会的バイアスを評価する「二重指標評価（DMBA）」フレームワークを提案し、明示的な同意バイアスと暗黙的な生成バイアスの間に強い相関がないこと、および温度パラメータやドメインによってバイアスの現れ方が異なることを実証しています。

Ashish Pandey, Tek Raj ChhetriTue, 10 Ma💬 cs.CL

Governance of AI-Generated Content: A Case Study on Social Media Platforms

この論文は、40 の主要なソーシャルメディアプラットフォームを対象とした調査を通じて、生成 AI によるコンテンツのガバナンス現状を分析し、多くのプラットフォームが既存のルール違反や開示に焦点を当てる一方で、所有権や収益化などの課題への対応が不十分であるため、より包括的で前向きなガバナンス枠組みやユーザー教育の必要性を提言しています。

Lan Gao, Abani Ahmed, Oscar Chen, Margaux Reyl, Zayna Cheema, Nick Feamster, Chenhao Tan, Kurt Thomas, Marshini ChettyTue, 10 Ma💻 cs

← 前へ次へ →