Large language models can disambiguate opioid slang on social media

Each language version is independently generated for its own context, not a direct translation.

Stel je voor dat je probeert een enkele, specifieke druppel water te vinden in een gigantische oceaan. Die druppel is een bericht over drugsgebruik, en de oceaan is alles wat mensen op sociale media posten. Dat is precies het probleem waar deze onderzoekers tegenaan liepen.

Hier is een simpele uitleg van wat ze deden, vertaald naar alledaags Nederlands:

Het Grote Probleem: De "Naaald in de Hooiberg"

In de Verenigde Staten sterven duizenden mensen per jaar aan een overdosis opioïden (zoals heroïne of fentanyl). Om te zien wat er gebeurt, kijken experts naar sociale media. Maar daar zit een enorm probleem: 99,9% van de berichten heeft niets met drugs te maken.

Als je gewoon zoekt op woorden als "blues" (bluesmuziek of verdriet) of "smack" (iets hard slaan), krijg je duizenden berichten die niets met drugs te maken hebben. Het is alsof je zoekt naar een speld in een hooiberg, maar de hele hooiberg is vol met andere spelden.

Vroeger gebruikten onderzoekers een woordenlijst (een "lexicon"). Ze zeiden: "Zoek op woord X, Y en Z." Maar dit werkt slecht omdat:

Drugsgebruikers gebruiken vaak slang die ze veranderen om te ontsnappen aan censuur (bijvoorbeeld "fenty" in plaats van "fentanyl").
Diezelfde woorden ook andere betekenissen hebben (zoals "lean" wat kan betekenen: "leunen", "slank zijn" of een drankje met codeïne).

De Oplossing: De Slimme AI-Detective

De onderzoekers van Stanford hebben gekeken of Grote Taalmodellen (LLMs) – zoals de slimme AI's die je misschien kent van ChatGPT – dit probleem kunnen oplossen.

In plaats van een starre woordenlijst te gebruiken, hebben ze vier van de slimste AI's ter wereld (GPT-4, GPT-5, Claude en Gemini) getest. Ze gaven deze AI's een taak: "Lees dit bericht en vertel me: gaat het hier over drugs, of niet?"

De AI's werken als een super-slimme detective die de context begrijpt. Ze kijken niet alleen naar het woord, maar naar de hele zin.

Als iemand zegt: "Ik ga naar de blues concert," denkt de AI: "Ah, dat gaat over muziek."
Als iemand zegt: "Deze blues doet me pijn," denkt de AI: "Wacht, in deze context gaat het waarschijnlijk over de drug oxycodone."

De Drie Proeven

Ze hebben de AI's op drie manieren getest:

De Woord-Test: Ze gaven de AI een lijst met dubbelzinnige woorden (zoals "fenty" of "smack") en keken of de AI kon raden of het over drugs ging.
- Resultaat: De AI's waren fantastisch. De oude woordenlijsten faalden bijna volledig. De AI's haalden de juiste druppels uit de oceaan zonder verstrikt te raken in de rest.
De Vrije Test: Ze lieten de AI's los op een grote stapel berichten zonder een woordenlijst. Ze moesten zelf ontdekken wat relevant was.
- Resultaat: Ook hier waren de AI's veel beter dan de oude methoden. Ze vonden veel meer echte drugsberichten (hoge "recall") zonder dat ze te veel rommel meenamen.
De Nieuwe Slang-Test: Dit was de spannendste test. Ze verwijsden alle echte drugswaarden in de berichten naar namen van Pokémon (zoals "Pikachu" in plaats van "fentanyl").
- Doel: Kijken of de AI kon begrijpen dat "Pikachu" in deze context waarschijnlijk een code was voor drugs, puur op basis van de rest van de zin.
- Resultaat: De AI's waren verrassend goed in het raden van deze nieuwe, verzonnen codes. Ze zagen de context en snapten dat het om iets verbods ging, zelfs als ze het woord nog nooit eerder hadden gehoord.

Waarom is dit belangrijk?

De onderzoekers concluderen dat deze AI's een revolutie kunnen zijn in het bestrijden van de drugscrisis.

Sneller en slimmer: Mensen kunnen niet miljoenen berichten per dag lezen. AI kan dat wel.
Beter dan woordenlijsten: Woordenlijsten worden snel verouderd omdat slang verandert. AI's begrijpen de sfeer en de context, dus ze blijven werken zelfs als de slang verandert.
Veiligheid: De AI's helpen beleidsmakers om te zien waar de problemen zitten, zodat ze hulp en preventie op de juiste plekken kunnen zetten.

Belangrijke kanttekening: De onderzoekers benadrukken dat dit alleen bedoeld is om trends te volgen (bijvoorbeeld: "Er is een nieuwe soort drugs in stad X"). Ze willen geen individuele mensen opsporen, censureren of straffen. De AI's zijn hier om de "hooiberg" te scannen, niet om de "naald" te gebruiken om iemand te prikken.

Kortom: De onderzoekers hebben bewezen dat slimme AI's beter zijn in het vinden van gevaarlijke drugsberichten op het internet dan de oude, stijve methoden. Ze zijn als een super-detective die de context snapt, zelfs als de boodschapper in code praat.

Large language models can disambiguate opioid slang on social media

Het Grote Probleem: De "Naaald in de Hooiberg"

De Oplossing: De Slimme AI-Detective

De Drie Proeven

Waarom is dit belangrijk?

Titel: Grote Taalmodellen kunnen op sociale media gebruikte opioïd-slang ontwarren

1. Het Probleem

2. Methodologie

3. Belangrijkste Bijdragen

4. Resultaten

5. Betekenis en Conclusie

Large language models can disambiguate opioid slang on social media

Het Grote Probleem: De "Naaald in de Hooiberg"

De Oplossing: De Slimme AI-Detective

De Drie Proeven

Waarom is dit belangrijk?

Titel: Grote Taalmodellen kunnen op sociale media gebruikte opioïd-slang ontwarren

1. Het Probleem

2. Methodologie

3. Belangrijkste Bijdragen

4. Resultaten

5. Betekenis en Conclusie

Meer zoals dit

Speculative Decoding Scaling Laws (SDSL): Throughput Optimization Made Simple

Summarize Before You Speak with ARACH: A Training-Free Inference-Time Plug-In for Enhancing LLMs via Global Attention Reallocation

DeReason: A Difficulty-Aware Curriculum Improves Decoupled SFT-then-RL Training for General Reasoning

MDER-DR: Multi-Hop Question Answering with Entity-Centric Summaries

Markovian Generation Chains in Large Language Models