Die in den Akten vermerkten Lebensumstände von Delinquenten werden statistisch (26)
untersucht. Die Häftlingsverzeichnisse sind in eine Datenbank übertragen und kodiert worden
(27). Prinzip bei der Erstellung der Datenbank war die Angleichung der Datenbank an die
Quelle und soweit irgend möglich nicht an die Erfordernisse der Maschine. Als
Ordnungsprinzip für die Daten ist die durchgängige Numerierung der Häftlinge übernommen
worden. Orthographische Abweichungen von dem heute Üblichen wurden belassen. Die
Datenbank liegt im dBase IV-Format vor (28).
Die vorhandenen Quellenangaben mußten zum Teil ergänzt werden, um eine statistische
Auswertung möglich zu machen. Ergänzungen erfolgten nur im Rahmen der Informationen,
die in der Quelle bereits an anderer Stelle enthalten waren. Beispielsweise sind in der Quelle
teilweise nur Alter oder Geburtsjahr genannt, diese Angaben ließen sich unter Zuhilfenahme
des Einlieferungsjahres rechnerisch ergänzen, ohne den Inhalt der Quelle zu verfälschen.
Durch solche rechnerischen Ergänzungen wurde es beispielsweise möglich, Aussagen über die
Altersstruktur der Häftlinge zu machen.
Bei der Übertragung der Häftlinge aus den handschriftlichen Journalen in die Datenbank
wurden zusätzliche Spalten für die Kodierungen eingefügt, z.B. für Lese-, Schreib- und
Religionskenntnisse (29) oder den sich aus dem Stand des Häftlings ergebenden
Ausbildungsgrad und Gewerbezweig. Die Kodierungen wurden möglichst detailgetreu
gewählt, denn nur Zusammenfassungen sind in der Auswertungsphase problemlos möglich. In
der Kodierungsliste sind hinter den jeweiligen Kodierungen nähere Definitionen vermerkt bzw.
sämtliche in der Quelle verwendeten Synonyme. Am Ende der Kodierungsliste sind alle
unbekannten bzw. nicht eindeutig zu kodierenden Begriffe mit der entsprechenden
Häftlingsnummer aufgeführt.
Ein Beispiel der Anpassung der Quelle an die Erfordernisse der Datenbank und der
Auswertung mit SPSS ist die Sammelkodierung Staatsgefangene des Anstaltstypes. Während
des Entwurfes der Datenbankstruktur war es nicht absehbar, daß mehr als zehn verschiedene
Anstaltstypen auf der Leuchtenburg existierten (30). Zehn Häftlinge zählt die heterogene
Gruppe der Staatsgefangenen. Die geringe Anzahl der Staatsgefangenen erlaubt die
Zusammenfassung, ohne daß ein Informationsverlust hiermit verbunden ist (31). Die
Rückverfolgung der Einzelnen in der Datenbank ist unproblematisch. Der Aufwand einer
nachträglichen Veränderung der Spaltenbreite (auf zweizeilig) in der Datenbank und der sich
hieraus ergebenden notwendigen Abänderungen für die Datenliste (SPSS Anweisungen)
überstieg den zu erwartenden Erkenntniswert weit.
Offensichtliche Fehler in den Akten korrigierte ich beim Abschreiben zuweilen (32), um die Möglichkeiten der Datenbank und der beabsichtigten statistischen Auswertung besser nutzen zu können. Die Berichtigung der Akten widerspricht der Arbeitsweise des Historikers, schien mir jedoch in einzelnen Ausnahmefällen geboten, um die maschinelle Verarbeitung zu ermöglichen bzw. zu vereinfachen und den Aussagewert der statistischen Untersuchung zu erhöhen.
Ergänzt wurde beispielsweise folgende Quellenangabe "entl. den 30. April" mit der sich aus dem Kontext zwingend ergebenden Jahreszahl. Falls kein wahrscheinliches Jahr in der Quelle ersichtlich ist, verwende ich das Jahr 1000, denn das Computerprogramm verlangt zwingend eine vollständige Dateneingabe.
Ist nur das Jahr in der Quelle angegeben, dann wurde Tag und Monat auf 01.01.... festgesetzt.
Falls der Monat und das Jahr in der Quelle enthalten sind, wird nur der Tag mit 01....
bestimmt.
Schwierig war die Kodierung der Schul- und Religionsnoten. In der Spalte Charakter beurteilt
der Pastor Leschke verbal die schulischen Fähigkeiten der Häftlinge. Eine gewisse Stetigkeit in
der Wortwahl schien gegeben und wurde Grundlage der Vergabe von entsprechenden
"Schulnoten". Einzelne offensichtliche Abweichungen der Quelle von dem entwickelten
Notenschema sind durch eine kontextbezogene abweichende Kodierung ausgeglichen worden
(33). Eine derartige Kodierung von Texten birgt die Gefahr der subjektiven Veränderung der
Quelle. Ein Autor, Pastor Leschke, verwendet kontinuierlich eine begrenzte Anzahl von
hierarchisch strukturierten Beurteilungen, dies scheint ein solches Kodierungsverfahren zu
rechtfertigen. Durch mehrmaliges Durchgehen der Kodierungen zur Prüfung des gewählten
Schemas versuchte ich, den subjektiven Faktor weiter zu minimieren. Dabei war die große
Anzahl der Fälle sogar hilfreich. Das Kodierungsschema im Kopf, wurde die Datenbank
förmlich mechanisch durchgesehen und nur im Falle von Abweichungen gestoppt.
Tätlichkeiten gegen den Förster werden mit 908"Förster" und 502"Körperverletzung" kodiert, Wilddiebe und Holzdiebe sind in dieser Kategorie nur im Falle geleisteten Widerstandes gegen die Verhaftung aufgenommen.
Polizeiliche Vorstrafen werden als Vorstrafen gezählt. Nicht als Vorstrafe gewertet wird, wenn der Delinquent in Untersuchung war, aber freigesprochen wurde.
Der Stand (34) der Delinquenten wurde weitgehend durchgängig in der Quelle angegeben.
Hieraus sind der Ausbildungsgrad sowie der Produktionszweig, in dem der Häftling tätig war,
ablesbar. Die Wahl einer den Akten und den Lebensumständen der Betroffenen gerecht
werdenden Kodierung war in diesem Fall besonders problematisch. In dem großen
Untersuchungszeitraum änderte sich die wirtschaftliche Struktur Deutschlands wesentlich.
Damit sind neue Berufsbezeichnungen verbunden (35) und traditionelle Berufe wandeln sich
teilweise grundlegend. Die veränderte soziale Wirklichkeit einzelner Berufsgruppen ist durch
die Kodierungen nicht zu erfassen (36).
Unbefriedigend ist sicher die Kodierung der Handarbeiter. Erst ab 1795 tauchen Handarbeiter
als Berufsbezeichnung in den Quellen regelmäßig auf (37). Diese große Personengruppe (14,7%
der Häftlinge) war sicher nicht ausschließlich gewerblich tätig (38), bezog wohl jedoch den
überwiegenden Teil ihrer Einkünfte aus gewerblicher Arbeit. Tagelöhner werden sicher auch
teilweise ihren Unterhalt mit gewerblichen Hilfsarbeiten verdient haben.
Value Label | Value | Frequency | Percent | Valid Percent |
Cum Percent |
Handarbeiter | 1,00 | 762 | 14,7 | 86,9 | 86,9 |
Tagelöhner | 2,00 | 115 | 2,2 | 13,1 | 100,0 |
,00 | 4319 | 83,1 | Missing | ||
Total | 5196 | 100,0 | 100,0 |
Valid cases | 877 | Missing cases | 4319 |
Handarbeiter nehme ich mit 2"Ungelernt"/400"Gewerbeind" und Tagelöhner mit
2"Ungelernt"/500"Landwirt" auf. Fabrikarbeiter werden mit 3"Gelernt"/400"Gewerbeind"
kodiert, da Fabrikarbeiter in dieser frühen Zeit (wahrscheinlich) qualifizierte Arbeiter waren.
Die Kodierung der großen Gruppe der Dienstmägde und Dienstknechte birgt ebenfalls
"willkürliche" (39) Elemente. Auf dem Bauernhof nehmen Mägde und Knechte an dem
landwirtschaftlichen Produktionsprozeß teil 1"Ungelerntst"/500"Landwirt". In größeren
Städten sind Mägde und Knechte eher als Dienstboten beschäftigt 1"Ungelerntst"/
100"Dienstleistung". Letztere Kodierung ist nur in möglichst wahrscheinlichen
Ausnahmefällen vergeben worden, denn in der Quelle kam auch die direkte Berufsbezeichnung
Dienstbote vor. Hausknechte erhalten die Chiffre 1"Ungelerntst"/ 100"Dienstleistung". Der
Ausbildungsgrad 1"Ungelerntst" wird einem großen Teil dieser Arbeitskräfte nicht gerecht.
Die Dienstmagd hatte eine Berufserfahrung, heute sind Koch, Bäcker, Hotelfachfrau oder
Hauswirtschaftlerin Ausbildungsberufe. Das Gleiche trifft auf einen Teil der Knechte zu, die
während ihrer Dienstzeit die Fertigkeiten erlernten, um später einen eigenen Hof führen zu
können. Die Kodierung spiegelt den geringeren Ausbildungsgrad der Dienstknechte gegenüber
den Bauern wider. Die Kategorie 1"Ungelernst" ist gewählt worden, um den ständisch
verwurzelten Anteil der Häftlinge besser herausschälen zu können. An diesem Beispiel zeigen
sich die Probleme einer Kodierung von Quellen deutlich, menschliches Leben ist in seiner
Vielfalt nicht durch Kodierungen zu beschreiben. Sobald man aber Aussagen über Gruppen
oder Schichten der Gesellschaft und nicht über einzelne Individuen machen will, muß man auf
derartige immer mehr oder weniger unzulängliche Konstrukte zurückgreifen.
Die Berufsbezeichnung "Ehefrau des ..." wird mit der Kodierung 1"Ungelernst", entsprechend
der Tätigkeit des Mannes mit der jeweiligen Produktionszweigchiffre, aufgenommen.
"Ehefrauen" werden mit 1"Ungelerntst"/100"Dienstleistung" verschlüsselt. "Bauersfrau" wird
demgegenüber mit 3"Gelernt"/500"Landwirt" kodiert, da in dieser Bezeichnung ein Beruf
erkennbar wird. Vagabund, Landstreicher, Bettler, Trinkerin, Armer u.a. werden mit
2"Ungelernt"/600"Unklar" verschlüsselt. Der höchste aus der Quelle ersichtliche Ausbildungsgrad und der eindeutigste Produktionszweig sind die Grundlage der Kodierung (Bsp.:
Zeugmachergeselle und Handarbeiter 5"Geselle"/316"Zeugmacher", Webermeister und
Handarbeiter 6"Meister"/310"Weber"). Die Aufgliederung des Produktionszweiges in
Mehrfachantworten, wie das im Falle der Straftaten für notwendig erachtet wurde, schien hier
nicht geboten. Mehrfachantworten lassen sich statistisch nur sehr begrenzt auswerten. Der
Verlust, der sich aus der Einschränkung der Person auf einen Produktionszweig ergibt, wird in
diesem Fall durch die besseren statistischen Bearbeitungsmöglichkeiten aufgewogen. In einer
weiteren Auswertung der Quellen kann der soziale Auf- bzw. Abstieg mit Hilfe der Auswertung der Mehrfachantworten der Produktionszweige sichtbar gemacht werden.
Prostituierte wurden häufig auf Grund anderer Delikte in die Leuchtenburger Anstalten
eingewiesen. Beispielsweise fanden sich in der Berufsbezeichnung (40) oder in der Beschreibung
ihres Lebensweges (41) Bezeichnungen, die diese Frauen stigmatisierten. Damit alle diese
Frauen erfaßt werden können, wählte ich innerhalb der Berufe die Kodierung 9"Prostituierte".
Ein vermuteter sozialdisziplinierender Charakter der Leuchtenburger Anstalten ist mit Hilfe
einer solchen Kodierung zu überprüfen.
Die Conduitenlisten wurden zunächst nur in Ermangelung weiterer Kopien der Journale
eingegeben. In den Conduitenlisten sind die wiederkehrenden Häftlingsdaten aufgeführt, so
daß mit der Dateneingabe fortgefahren werden konnte. Eine Abgleichung mit den Kopien des
entsprechenden Journals erfolgte nachträglich, die Personen stimmten durchweg überein,
Details variierten unwesentlich (42). Die zusätzlichen Angaben der Conduitenlisten, die
Bestrafungen für Vergehen gegen die Anstaltsordnung sind für einige Personen unvollständig.
Die maximal mögliche Feldgröße der Datenbank war in einzelnen Fällen nicht ausreichend (!),
um alle verhängten Strafen aufzuzeichnen. Die Kodierung der verhängten Strafen erfolgte in
diesen Fällen an Hand der Akten, so daß die Kodierungen vollständig sind. Der statistische
Erkenntniswert ist jedoch hierfür sehr gering. Bereits durch das Durchblättern der Akten ist zu
ersehen, daß man für "Bagatellen" mit schweren körperlichen Züchtigungen zu rechnen hatte,
deren äußerst große Anzahl in kurzen Zeiträumen den heutigen Leser schockiert. Eine
wesentlich höhere Anzahl von Todesfällen in den Leuchtenburger Anstalten wäre auf Grund
der brutalen Behandlung zu erwarten. Andere Strafen, wie Einzelhaft, Wasser und Brot etc.,
kamen kaum zur Anwendung.
Fehler bei der Übertragung der Daten aus den Akten in die Datenbank sind durch den abschließenden nochmaligen Vergleich der Akten mit der Datenbank möglichst gering gehalten worden. Auf Grund des sehr großen Umfanges des Datenbestandes sind eventuell nicht alle Fehler eliminiert (43).
Logische Kontrollen der Datenliste mit SPSS für Windows 6.0 (44) dienten der weiteren
Verringerung von Tipfehlern. Die sehr umfangreiche Datenmenge erschwerte deren
Handhabung erheblich (45).
Eine möglichst hohe Transparenz und weitgehende Nachprüfbarkeit der Resultate der Untersuchung ist anzustreben. Die Gewichtung der Ergebnisse hängt von der jeweils verwendeten statistischen Prozedur ab. Auf Grund dessen erläutere ich kurz die wesentlichsten verwendeten SPSS-Befehle:
Mit Hilfe der SPSS-Befehle FREQUENCIES oder CROSSTABS führe ich die Berechnungen auf der Grundlage der Anzahl der Häftlinge durch. Mit FREQUENCIES werden Variablen gezählt, die Missing cases entsprechen den tatsächlich fehlenden Angaben. Mit CROSSTABS können zwei oder mehr Variablen verknüpft werden, die Number of Missing Observations ist eine Verknüpfung der fehlenden Werte der ausgewerteten Variablen. Die Funktion ASRESID berechnet die standardisierten Residuen. Residuen werden berechnet aus der Anzahl minus die erwartete Anzahl, dividiert durch die Quadratwurzel der erwarteten Anzahl. Positive Residuen zeigen an, daß die Zelle der Tabelle mehr Fälle enthält, als dies der Fall wäre, wenn Zeilen und Spaltenvariablen unabhängig wären. Diese Befehle sind nicht für die Auswertung von Mehrfachantworten geeignet.
Ein wesentliches Problem der Auswertung ist die Erfassung der Mehrfachantworten. Ein
Häftling ist wegen "Lüderlichkeit" und "Trunksucht" (46) inhaftiert. Mit TABLES sind
Mehrfachantworten zu erfassen. Die Berechnungsgrundlage von TABLES ist jedoch die Anzahl der Antworten und nicht die Anzahl der Häftlinge. Das bedeutet beispielsweise, wenn
man Straftaten (Mehrfachantworten) einzelnen Anstalten zu einem bestimmten Zeitraum
zuordnet, erhält man nicht die Anzahl der Häftlinge der Anstalt in diesem Zeitraum, sondern
die Anzahl der Straftaten, die zur Einweisung in die Anstalt in dem entsprechenden Zeitraum
führten (47).
Damit der Text der Arbeit besser lesbar ist, sind die statistischen Belege (Tabellen mit SPSS-Syntax) im Anhang (48) geordnet. In den Fußnoten wird auf die entsprechende Tabelle mit der
Seitenzahl verwiesen. Zur Eingrenzung der Anzahl der Tabellen in der Anlage wird in
einzelnen Fällen in der Fußnote der SPSS-Syntax einer Tabelle mit einem Auszug einiger
wesentlicher Zahlen aus der Tabelle aufgeführt. Diese Tabellen sind nicht Bestandteil der
Anlage.
![]() |
![]() |
![]() |
![]() |