28. März 2024

Die Statistik bei Linguist Schweiger ist ohne Aussage

Die Richterin hat den linguistischen Gutachter Wolfgang Schweiger doch wieder aufgerufen. Der letzte Prozesstag mit ihm dauerte von 9-21:15 Uhr und war schlicht ein Alptraum. Ich werde noch davon berichten. Trotzdem Schweiger jetzt schon zum 6. Mal vor Gericht war, habe ich ihn immer noch nichts fragen können. Deshalb habe ich ihm jetzt schriftlich mitgeteilt, warum, mathematisch gesehen, seine Statistik, mit der er die Autorenschaft nachweisen will, völlig ohne jede Aussage ist.

Sehr geehrter Herr Schweiger,

die große Mehrheit der 56 von Ihnen präsentierten Indizien, um einen Text einem Autor bzw. mich als Autor zuzuordnen, besteht aus statistischen Mittelwerten. Ich als Mathematiker habe mich mit Ihren Statistiken befasst und möchte Sie im Vorfeld auf meine Ergebnisse hinweisen, weil ich Sie dazu vor Gericht zu befragen gedenke.

Signifikanz

 

Zunächst zur Frage, wie signifikant eine Stichprobe von 252 Worten für einen Gesamttext ist bzw. wie viel man aus 252 Worten mittels Ihrer Mittelwerte über die Mittelwerte eines Gesamttextes aussagen kann. Aus dem Denunziationstext haben sie 252 Worte analysiert, der Gesamttext hat fast 20.000 Worte. Mit den üblichen Methoden der mathematischen Statistik habe ich die Signifikanz der Mittelwerte für die Anzahl der Buchstaben pro Wort, die Anzahl der Worte pro Satz, den Prozentsatz der Hauptworte von allen Worten, den Prozentsatz der Worte mit mehr als 6 Buchstaben von allen Worten und den Prozentsatz von Worten mit 7-9 Buchstaben von allen Worten errechnet. Hier ist das Resultat:

Buchstaben pro Wort
Gesamtmittelwert = 6,13
Standardabweichung = 3,75
Stichprobe
:
Anzahl = 252
Mittelwert = 6,21
Standardabweichung der Stichprobe = 0,236
->  Z = 0,339
->  p < 0,37

Worte pro Satz
Gesamtmittelwert = 18,97
Standardabweichung = 11,11
Stichprobe
:
Anzahl = 15
Mittelwert = 16,8
Standardabweichung der Stichprobe = 2,87
->  Z = -0,756
->  p < 0,225

Hauptworte als Prozentsatz aller Worte
Gesamtmittelwert = 25,18%
Stichprobe
:
Anzahl = 15
Mittelwert = 21,03%
Standardabweichung der Stichprobe = 0,112
->  Z = -0,37
->  p < 0,355

Prozentsatz aller Worte mit mehr als 6 Buchstaben
Gesamtmittelwert = 35,36%
Stichprobe
:
Anzahl = 15
Mittelwert = 34,92%
Standardabweichung der Stichprobe = 0,1234
->  Z = -0,0356
->  p < 0,485

Prozentsatz aller Worte mit 7-9 Buchstaben
Gesamtmittelwert = 16,67%
Stichprobe:

Anzahl = 15
Mittelwert = 17,46%
Standardabweichung der Stichprobe = 0,096
->  Z = 0,0823
->  p < 0,47

In der Statistik würden nie Stichproben bzw. Mittelwerte mit einem Signifikanzwert, der über 0,01 liegt, genommen werden, normalerweise liegt man weit darunter. Alle Signifikanzwerte bzgl. Ihrer Stichprobe und Ihrer Mittelwerte liegen aber weit darüber, weil ein Signifikanzwert von p=0,5 das Maximum darstellt. Dann ist nämlich die Wahrscheinlichkeit, dass eine Stichprobe den richtigen Wert liefert, genauso groß, wie die Wahrscheinlichkeit, dass sie den falschen Wert liefert.

Schlussfolgerung: Damit ist mathematisch bewiesen, dass die von Ihnen angegebenen statistischen Indizien bei einem Text mit 252 Worten als Indizien für einen Autor völlig unbrauchbar sind, weil der Text viel zu kurz ist. Deshalb spricht Prof. Kienpointner davon, dass ein Text mindestens 1000 Worte haben muss, damit man überhaupt eine Aussage treffen kann.

Standardabweichung

 

Jede mathematische Statistik, wie die Ihre, hat eine Standardabweichung. Sie gibt die Variation der Parameter an, aus denen der Mittelwert gebildet wurde. Sie ist daher ein Maß dafür, wie groß die „natürliche Variation“ (Ihre Worte) ist. Statistisch gesprochen ist eine Variation des jeweiligen Parameters um den Mittelwert in der Größenordnung dieser Abweichung zu erwarten. Die Standardabweichung gibt also an, mit welcher Ungenauigkeit der Mittelwert aufzufassen ist. Für Ihren Parameter „Worte pro Satz“ ergibt sich in den Bekennerschreiben eine Standardabweichung von über 7 Worten pro Satz, für Ihren Parameter „Buchstaben pro Wort“ eine Standardabweichung von etwa 3,5 Buchstaben pro Wort. D.h. wenn sich zwei Texte um weniger als 7 Worte pro Satz unterscheiden, dann müssen sie im Parameter „Worte pro Satz“ als gleich aufgefasst werden.

Schlussfolgerung: Die von Ihnen angegebenen Parameter variieren so stark um die Mittelwerte, dass sie unbrauchbare Indizien für die Zuschreibung eines Autors sind.

Vergleich mit anderen AutorInnen

 

Ihre Aufgabe war es nicht nur, die Texte von mir und einem Bekennerschreiben zu vergleichen. Für die Zuschreibung einer Autorenschaft müssen sie auch alle anderen potentiellen AutorInnen ausschließen. Dazu müssen ihre statistischen Parameter nicht nur signifikant sein und ihre Mittelwerte eine geringe Standardabweichung zeigen, die Mittelwerte müssen sich auch von den Mittelwerten anderer AutorInnen und anderer Texte unterscheiden. Ich habe dazu ihre statistischen Parameter für verschiedene deutschsprachige Tierschutzbücher errechnet und mit ihren Ergebnissen verglichen. Dabei ergibt sich eine Variation, wie Sie hier (als Beispiel der Prozentsatz der 7-9 Buchstaben langen Worte von allen Worten) sehen, die keine Zuschreibung eines Autors erlaubt.

Schlussfolgerung: Die von Ihnen angegebenen statistischen Indizien sind unbrauchbar für die Zuschreibung der Autorenschaft, weil sie innerhalb der Texte individueller AutorInnen so stark variieren, wie zwischen verschiedenen AutorInnen.

Hochachtungsvoll,

DDr. Martin Balluch

4 Gedanken zu “Die Statistik bei Linguist Schweiger ist ohne Aussage

  1. Kann man eigentlich das Gutachten irgendwo als PDF downloaden (gescannt ;), oder ist das urheberrechtlich ein Problem (sollte ja eigentlich nicht, oder)?

    Mal abgeshen von der Relevanz für den Prozeß, hätte es bestimmt einiges an Unterhaltungswert.

  2. Lieber Herr Balluch! Sie machen hier die Arbeit für das Gericht! Wie ich schon einmal schrieb, macht Ihre Intelligenz Angst!
    Dieser ganze Tierschützerprozess ist so was von peinlich für die österr. Justiz und man denkt in Wiener Neustadt aber auch im Justizministerium und Innenministerium sicher Tag und Nacht darüber nach, wie man sich aus der Affäre ziehen kann!
    Es gibt aber auch Ansätze, Justiz- und andere Opfer der österr. Staatswillkür zu helfen!
    Hier die links:
    http://www.alpenparlament.tv/playlist/391-die-staatsgeschaedigten-der-zwetschenrepublik

    Hier können sie etwas über meine Geschichte lesen. Ein Kollege aus dem Bundesrechenzentrum sagt: In Russland wäre ich tot. In Österreich wurde ich nur entmündigt und all meiner Bürgerrechte beraubt!
    Wie sagte doch schon Ron Hubbard: Wirf sie in den Knast oder in die Klapsmühle! (Policy Number 666)
    Sie sind in den Knast geworfen worden, ich bin psychiatrisiert worden!
    Es gibt aber Hilfe!
    http://www.saubere-haende.org/typo3/index.php?id=6

  3. Gut so! Es ist ein riesen Glück, dass bei diesem Prozess gebildete und intelligente Angeklagte die Möglichkeit haben sich zu wehren. Andere hätten es vermutlich viel schwerer sich zu verteidigen und würden womöglich einer ungerechtfertigten Verurteilung entgegensehen.

    lg

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert