More Signal vs. More Noise - Comparing Full Text and Abstract as Inputs for Large Language Model-based Classification of Oncology Trial Eligibility Criteria

⚕️

Dies ist eine KI-generierte Erklärung eines Preprints, das nicht peer-reviewed wurde. Dies ist kein medizinischer Rat. Treffen Sie keine Gesundheitsentscheidungen auf Grundlage dieses Inhalts. Vollständigen Haftungsausschluss lesen

Each language version is independently generated for its own context, not a direct translation.

🧠 Das große Rätsel: Kurzfassung oder ganzer Bericht?

Stellen Sie sich vor, Sie wollen herausfinden, ob ein bestimmtes medizinisches Experiment (ein klinischer Test) für Patienten geeignet ist, die einen Krebs im Frühstadium haben, oder nur für solche, bei denen der Krebs bereits im ganzen Körper gestreut hat (Metastasen).

Früher haben Forscher dafür meist nur die Kurzfassung (Abstract) eines wissenschaftlichen Artikels gelesen. Das ist wie ein Filmtrailer: Er ist kurz, spannend und fasst das Wichtigste zusammen. Aber er verrät oft nicht alle Details.

Die Frage der Forscher war nun: Macht es einen Unterschied, wenn wir dem KI-Modell den ganzen Film (den vollständigen Artikel) zeigen, statt nur den Trailer?

Das Problem: Der ganze Film ist viel länger. Er enthält viele Szenen, die für Ihre spezifische Frage gar nicht wichtig sind (das ist das „Rauschen" oder die „Störung"). Man könnte denken: „Wenn ich dem Computer zu viel unnötiges Zeug zeige, wird er verwirrt und macht mehr Fehler."
Die Hoffnung: Vielleicht sind die entscheidenden Details aber genau in den langen Szenen versteckt, die im Trailer weggelassen wurden (das ist das „Signal").

🤖 Der Test: Ein KI-Experte im Einsatz

Die Forscher haben eine sehr starke Künstliche Intelligenz (GPT-5) getestet. Sie gaben ihr 200 medizinische Studien.

Runde 1: Die KI bekam nur den Trailer (die Kurzfassung).
Runde 2: Die KI bekam den ganzen Film (den Volltext).

Dann haben sie geprüft, wie gut die KI die Patienten-Eignung erraten hat, verglichen mit der Antwort von echten menschlichen Experten.

🏆 Das Ergebnis: Mehr Informationen sind besser!

Das Ergebnis war überraschend klar: Die KI war mit dem ganzen Film deutlich besser!

Beim Trailer (Kurzfassung): Die KI lag in etwa 86 % der Fälle richtig.
Beim ganzen Film (Volltext): Die KI lag in etwa 92 % der Fälle richtig.

Warum war das so?
Stellen Sie sich vor, ein Autor schreibt einen Artikel über einen neuen Krebsmedikament. Im Trailer (Abstract) sagt er vielleicht nur: „Dieses Medikament hilft bei fortgeschrittenem Krebs." Das klingt nach Metastasen.
Aber im ganzen Film (Volltext) steht in einem kleinen Absatz weiter unten: „Wir haben auch Patienten mit lokal fortgeschrittenem, aber noch nicht gestreutem Krebs aufgenommen."

Die KI hat diesen kleinen, wichtigen Satz im langen Text gefunden. Die Kurzfassung hatte diesen Satz einfach weggelassen, weil sie zu kurz war. Die KI war also nicht verwirrt durch den langen Text, sondern hat die „Nadel im Heuhaufen" gefunden.

💡 Die wichtigsten Erkenntnisse für den Alltag

Qualität vor Quantität (aber hier hilft Quantität): Normalerweise denkt man, zu viel Information verwirrt einen. Aber bei modernen KI-Modellen ist das anders. Sie sind wie sehr erfahrene Detektive: Sie können durch den ganzen langen Text „blättern" und genau das finden, was sie brauchen, ohne von den unwichtigen Teilen abgelenkt zu werden.
Der Trailer lügt (oder verschweigt): Kurzfassungen sind oft zu knapp. Wichtige Details, die für die Entscheidung „Darf mein Patient teilnehmen?" entscheidend sind, fehlen dort oft.
Die Zukunft: Wenn wir KI nutzen wollen, um medizinische Studien zu finden, sollten wir ihr nicht nur die Kurzfassung geben. Es lohnt sich, ihr den ganzen Text zu zeigen, auch wenn das mehr Rechenleistung kostet. Die Genauigkeit steigt spürbar.

🎯 Fazit in einem Satz

Die Studie zeigt, dass es sich lohnt, der KI den ganzen, langen Text zu geben, weil sie darin die entscheidenden Details findet, die in der kurzen Zusammenfassung oft fehlen – und dabei nicht durch die vielen unnötigen Worte verwirrt wird.

More Signal vs. More Noise - Comparing Full Text and Abstract as Inputs for Large Language Model-based Classification of Oncology Trial Eligibility Criteria

🧠 Das große Rätsel: Kurzfassung oder ganzer Bericht?

🤖 Der Test: Ein KI-Experte im Einsatz

🏆 Das Ergebnis: Mehr Informationen sind besser!

💡 Die wichtigsten Erkenntnisse für den Alltag

🎯 Fazit in einem Satz

Titel: Mehr Signal vs. mehr Rauschen – Vergleich von Volltext und Abstract als Eingabe für die Klassifizierung von Onkologie-Studienkriterien durch Large Language Models (LLMs)

1. Problemstellung

2. Methodik

3. Wichtige Ergebnisse

4. Hauptbeiträge und Erkenntnisse

5. Signifikanz und Implikationen

More Signal vs. More Noise - Comparing Full Text and Abstract as Inputs for Large Language Model-based Classification of Oncology Trial Eligibility Criteria

🧠 Das große Rätsel: Kurzfassung oder ganzer Bericht?

🤖 Der Test: Ein KI-Experte im Einsatz

🏆 Das Ergebnis: Mehr Informationen sind besser!

💡 Die wichtigsten Erkenntnisse für den Alltag

🎯 Fazit in einem Satz

Titel: Mehr Signal vs. mehr Rauschen – Vergleich von Volltext und Abstract als Eingabe für die Klassifizierung von Onkologie-Studienkriterien durch Large Language Models (LLMs)

1. Problemstellung

2. Methodik

3. Wichtige Ergebnisse

4. Hauptbeiträge und Erkenntnisse

5. Signifikanz und Implikationen

Mehr davon

A case report on gendered biases in a Finnish healthcare AI assistant

An End-to-End Synthetic Oncology Clinical Trial Framework Integrating Radiographic Response, Circulating Tumor DNA, Safety, and Survival for Decision-Oriented Clinical Data Science

Who is leading medical AI? A systematic review and scientometric analysis of chest x-ray research

High-Throughput Observational Evidence Generation Using Linked Electronic Health Record and Claims Data

Perception of Safety in Behavioral Health Crisis Units among Patients and Care Partners versus Artificial Intelligence (AI): A Multimethod Study