🧠 Was ist stilometrische Identifikation?
In der modernen digitalen Forensik spielt die sogenannte Stilometrie eine zentrale Rolle. Dabei handelt es sich um ein Verfahren, mit dem man Texte auf sprachliche Eigenheiten hin analysiert, um Rückschlüsse auf den Autor ziehen zu können. Jeder Mensch schreibt auf seine ganz eigene Weise – das betrifft Wortwahl, Satzstruktur, Phrasen, sogar Zeichensetzung. Diese Muster können so präzise sein, dass sie wie ein digitaler Fingerabdruck funktionieren.
Wenn genügend Textmaterial eines Autors vorliegt, kann man ein Modell seines Schreibstils erstellen. Mit diesem Modell lassen sich neue, unbekannte Texte überprüfen – und mit erstaunlicher Genauigkeit sagen: „Das könnte von Person X stammen.“
Selbst wenn Namen fehlen, IPs verschleiert sind oder über anonyme Dienste kommuniziert wird – der Stil bleibt oft lesbar. Für Geheimdienste, Plattformbetreiber und Ermittlungsbehörden ist das ein mächtiges Werkzeug. Für Aktivisten, Whistleblower oder Menschen mit Schutzbedürfnis ist es jedoch ein echtes Risiko.
🔧 Un wat hett dat mit Plattdüütsch to doon?
Also pass op, mien Jung:
Jeder snackt und schrievt so’n büschen anders, ne? De een nimmt immer „also“, de anner „wohl“. Einer setzt siene Kommata wie’n Maschinengewehr, de anner gar keen. Und genau doran kann man halt sehen: „Aha, dat is wieder der Kerl von neulich!“
Dat is so’n bisschen wie Handschrift, bloß eben mit Buchstaben in’n Computer. Wenn man denn lang genug Teks von jemand hätt, kann man ’n Programm bauen, dat sagt: „Jo, dat klinkt verdächtig nach dem Günther!“
Un nu stell di mol för, du schriebst wat Geheimes. Du meintest, du büst anonym – aber nö, dien „Snack“ verrät di doch!
Und da kummt nu de Trick: Lass de KI dat mol umschrieven, büschen anders, aber mit glieken Inhalt.
So kann keen mehr genau sagen: „Dat is von Angela!“ – sondern nur noch: „Irgendwer snackt hier wat… aber keen Idee wer.“
🧠 Warum Verschlüsselung allein nicht reicht
In der digitalen Kommunikation verlassen wir uns oft auf starke Verschlüsselung – AES, RSA, TLS und Co. Das ist gut, aber es ist nicht genug. Denn Verschlüsselung schützt zwar den Inhalt eines Pakets, aber nicht unbedingt die Muster drumherum.
Metadaten – wie wann, wohin, wie oft, in welchem Stil – bleiben häufig lesbar. Und genau hier setzt stilometrische Analyse an: Sie braucht gar nicht den entschlüsselten Inhalt, sondern analysiert alles, was außen rum schwingt – die Frequenz, den Rhythmus, den sprachlichen Fingerabdruck.
Das bedeutet: Auch wenn deine Nachrichten verschlüsselt sind, kann jemand mit genug Kontext und Rechenpower trotzdem sagen:
„Ey, das ist wieder der Typ mit den vielen „…“, der immer montags zwischen 8 und 9 schreibt – und so einen leichten Ruhrpott-Platt-Touch hat.“
Fazit: Verschlüsselung ist wie ein Vorhängeschloss – nützt aber nix, wenn dein Fahrrad pink ist und jeder weiß, dass du’s bist.
🔧 Un dat mit de Schlüssel – dat geiht so nich!
Jo, Verschlüsselung is wie’n Vorhängeschloss op’n Gatter, ne?
Dat ding is dicht, aber jeder sieht: „Aha, dat is der Torsten sien Gatter – dat is immer so bunt angestrichen!“
Un nu stell di för: Du schickst jeden Tach de glieke Art von Nachricht – immer morgens, immer mit’n „Moin“ vorn un’n „Wat’n Kram“ hinten. Is zwar verschlüsselt, aber wenn de Dorfbäcker jeden Tach um sieb’n bi di runtütet mit’n Brötchenbeutel, denn weet ook jeder, dat du Hunger hest.
Dat bedeutet: Verschlüsselung allene maakt di nich unsichtbar. Dat is ok so’n büschen wie Sonnenbrillen tragen im Dorf – schützt dien Blick, aber jeder weet, dat du’s büst.
Drum braucht man dor wat obendrauf:
🏠 Stil ändern, Spuren verwischen, anonym snacken – un dat maakt de KI för di.
🧠 Die Stimme als Fingerabdruck – auch bei KI
Nicht nur unser Schreibstil verrät uns – auch unsere Stimme ist einzigartig. Sprachmuster, Betonung, Atempausen, Sprechtempo: All das ergibt einen individuellen akustischen Fingerabdruck.
Und jetzt kommt der Clou: Auch synthetische Stimmen – also Text-to-Speech (TTS) – haben einen Stil. Wenn du immer dieselbe KI-Stimme nutzt (z. B. für Blogartikel), kann man nach einer Weile deren Eigenheiten erkennen. Eine forensische Software könnte sagen:
„Diese Stimme wurde von der gleichen TTS-KI erzeugt wie 23 andere Posts aus Region XY.“
Wenn das Ziel ist, anonym zu bleiben oder „nicht verfolgt zu werden“, müsste man also auch die Stimme regelmäßig variieren oder maskieren – z. B. durch Stimmfilter, unterschiedliche Engines oder gezielte stilistische Variation im Text, die die Stimme beeinflusst.
Denn auch ohne echten Menschen am Mikrofon kann es heißen:
„Diese Stimme kennen wir doch…“
🔧 Un nu hör mol hinner d’Wörtern to
Weißt du, mien Jung, de Lüt snackt nich allens mit Münd – manchmal verrät se mehr mit’n Husten, ’n Luftschnappen oder dat Brummen zwischen de Sätz.
Und dat gifft ok bi künstliche Stimmen! Wenn du immer den glieken Vorleser nimmst – ob dat nu de Siri is oder de Hans-Peter-KI – dann weet irgendwann jeder:
„Dat is wieder de KI-Stimme, de allens vörlesen dor op dat Blog!“
Und nu stell di för: Du wullt eigentlich unerkannt bleiben. Aber de Stimme verrät di doch. Also musst du mol wat tricksen:
Mal ’n annern Vorleser nehmen, mol de Stimme durch’n Filter jagen, oder mol wat anneres in’n Text schrieven, damit de Klang sich ännert.
Denn sonst hett man keen Gesicht, aber doch ’n Abdruck in’n Ohr! 🎧
To be continued …