Bayesian Modeling of Collatz Stopping Times: A Probabilistic Machine Learning Perspective

Diese Arbeit untersucht die Kollatz-Stop-Zeit über n107n \le 10^7 mittels eines bayesschen hierarchischen Negativ-Binomial-Modells und einer mechanistischen Generatormethode, wobei die Ergebnisse zeigen, dass die Berücksichtigung modularer Restklassen die Verteilungsanpassung erheblich verbessert und das NB2-GLM die höchste Vorhersagegüte erzielt.

Nicolò Bonacorsi, Matteo Bordoni

Veröffentlicht 2026-03-06
📖 5 Min. Lesezeit🧠 Tiefgang

Each language version is independently generated for its own context, not a direct translation.

Stell dir vor, das Collatz-Problem ist ein riesiges, chaotisches Labyrinth, in dem jede Zahl einen eigenen Weg zum Ausgang (der Zahl 1) hat. Die Regeln sind einfach: Ist die Zahl gerade, teile sie durch 2. Ist sie ungerade, multipliziere sie mit 3 und addiere 1. Wiederhole das, bis du bei 1 ankommst.

Die große Frage ist: Kommt jede Zahl irgendwann bei 1 an? Niemand weiß es sicher. Aber in diesem Papier schauen sich die Autoren nicht den Weg einer einzelnen Zahl an, sondern sie fragen: „Wie sieht der durchschnittliche Weg für Millionen von Zahlen aus?"

Sie haben sich 10 Millionen Zahlen vorgenommen und gemessen, wie viele Schritte jede braucht, um bei 1 anzukommen. Das Ergebnis war ein riesiger, unordentlicher Haufen Daten. Hier ist, wie sie versucht haben, dieses Chaos zu verstehen – erklärt mit einfachen Bildern:

1. Das Problem: Ein unordentlicher Haufen

Stell dir vor, du wirfst 10 Millionen Bälle in einen Korb und zählst, wie oft sie aufspringen, bevor sie liegen bleiben.

  • Die meisten Bälle springen ein paar Mal.
  • Einige springen sehr oft.
  • Ein paar springen extrem oft und landen weit weg.

In der Statistik nennt man das „überdispersiert". Es ist nicht vorhersehbar wie ein Würfelwurf (wo die Wahrscheinlichkeiten klar sind). Es ist wie ein Sturm: Man weiß, dass es regnet, aber nicht genau, wo die größten Pfützen entstehen. Die Autoren haben festgestellt, dass die Anzahl der Schritte (die „Stoppzeit") nicht einfach einer normalen Glockenkurve folgt, sondern einen langen, wilden Schweif hat.

2. Modell A: Der Wettervorhersager (Die statistische Regression)

Der erste Ansatz der Autoren ist wie ein sehr cleverer Wettervorhersager.
Er sagt nicht: „Ich verstehe die Physik des Sturms." Er sagt: „Ich habe die letzten 10 Millionen Tage geschaut, und wenn es heute so aussieht (große Zahl) und die Farbe des Himmels so ist (Rest der Zahl bei Division durch 8), dann wird es wahrscheinlich regnen."

  • Wie es funktioniert: Sie nutzen ein mathematisches Werkzeug (eine „Negative Binomial-Regression"), das zwei Dinge beachtet:
    1. Die Größe der Zahl: Je größer die Zahl, desto länger dauert es im Durchschnitt (wie ein längerer Weg).
    2. Die „Farbe" der Zahl: Wenn man die Zahl durch 8 teilt, bleibt ein Rest (z. B. 1, 3, 5...). Dieser Rest ist wie ein versteckter Code. Zahlen mit demselben Rest verhalten sich oft ähnlich.
  • Das Ergebnis: Dieser Vorhersager ist extrem gut darin, zu sagen, wie viele Schritte wahrscheinlich nötig sind. Er ist wie ein erfahrener Kapitän, der die Wellen kennt, ohne zu wissen, wie der Wind physikalisch entsteht. Er gewinnt den Wettbewerb, wenn es nur darum geht, die richtige Vorhersage zu treffen.

3. Modell B: Der Mechaniker (Der generative Prozess)

Der zweite Ansatz ist wie ein Mechaniker, der versucht, den Motor des Labyrinths nachzubauen.
Statt nur zu schauen, wo die Bälle landen, versuchen sie, den Motor zu verstehen, der die Bälle wirft.

  • Die Idee: Wenn eine ungerade Zahl „3n+1" macht, wird sie gerade. Dann wird sie durch 2 geteilt, bis sie wieder ungerade ist. Dieser Zyklus (ungerade → 3n+1 → viele Halbierungen → wieder ungerade) ist wie ein Baustein.
  • Der Zufall: Die Autoren sagen: „Statt die exakte Mathematik für jede Zahl zu berechnen, bauen wir einen Zufallsgenerator." Sie nehmen an, dass die Anzahl der Halbierungsschritte (der Baustein) zufällig ist, aber nach bestimmten Regeln.
  • Die Entdeckung: Anfangs dachten sie, diese Bausteine wären völlig zufällig (wie ein Würfelwurf). Aber als sie genauer hinschauten, merkten sie: Nein! Die Art und Weise, wie viele Halbierungsschritte nötig sind, hängt stark davon ab, welchen Rest die Zahl bei 8 lässt.
    • Analogie: Stell dir vor, du hast 8 verschiedene Arten von Schrauben. Du dachtest, sie wären alle gleich. Aber wenn du genauer hinschaust, merkst du: Schrauben mit Rest 1 brauchen immer 2 Drehungen, Schrauben mit Rest 3 brauchen 4. Das ist der „arithmetische Code".

4. Der Showdown: Wer gewinnt?

Am Ende haben sie beide Modelle gegeneinander antreten lassen, um zu sehen, wer die 10 Millionen Zahlen besser vorhersagen kann.

  • Der Wettervorhersager (Modell A) hat gewonnen. Er war viel genauer darin, die tatsächlichen Ergebnisse vorherzusagen. Er ist pragmatisch und nutzt die Muster, die er sieht, ohne sich um die tiefe Physik zu kümmern.
  • Der Mechaniker (Modell B) war etwas ungenauer, aber er hat etwas Wichtigeres gelernt: Er hat entdeckt, dass das „Zufallsspiel" gar nicht zufällig ist. Es folgt einer versteckten Struktur (dem Rest bei 8).

Fazit für den Alltag

Das Papier sagt uns zwei Dinge:

  1. Pragmatismus siegt: Wenn du nur wissen willst, wie lange ein Weg dauert, reicht es oft, einfache Muster (Größe der Zahl + Rest bei 8) zu nutzen. Du musst den ganzen Motor nicht verstehen.
  2. Versteckte Ordnung: Selbst in einem chaotischen System wie dem Collatz-Problem gibt es tiefe, versteckte Regeln. Wenn man den Mechanismus (den Motor) baut, muss man diese versteckten Regeln (die Reste bei 8) einbauen, sonst funktioniert das Modell nicht richtig.

Es ist wie beim Kochen:

  • Der Statistiker sagt: „Wenn du 100 Eier hast und den Ofen auf 200 Grad stellst, brennen sie zu 90% an." (Er hat die Daten).
  • Der Mechaniker sagt: „Ah, ich verstehe jetzt, warum sie brennen! Es liegt an der Hitzeverteilung im Ofen, die von der Form des Blechs abhängt." (Er hat das Prinzip verstanden).

Beide haben recht, aber der Statistiker liefert die bessere Vorhersage für das nächste Gericht, während der Mechaniker uns hilft, den Ofen zu reparieren.