3 Arbeitsschritte zur Erschließung des Datenmaterials



Die in den Akten vermerkten Lebensumstände von Delinquenten werden statistisch (26) untersucht. Die Häftlingsverzeichnisse sind in eine Datenbank übertragen und kodiert worden (27). Prinzip bei der Erstellung der Datenbank war die Angleichung der Datenbank an die Quelle und soweit irgend möglich nicht an die Erfordernisse der Maschine. Als Ordnungsprinzip für die Daten ist die durchgängige Numerierung der Häftlinge übernommen worden. Orthographische Abweichungen von dem heute Üblichen wurden belassen. Die Datenbank liegt im dBase IV-Format vor (28).

Die vorhandenen Quellenangaben mußten zum Teil ergänzt werden, um eine statistische Auswertung möglich zu machen. Ergänzungen erfolgten nur im Rahmen der Informationen, die in der Quelle bereits an anderer Stelle enthalten waren. Beispielsweise sind in der Quelle teilweise nur Alter oder Geburtsjahr genannt, diese Angaben ließen sich unter Zuhilfenahme des Einlieferungsjahres rechnerisch ergänzen, ohne den Inhalt der Quelle zu verfälschen. Durch solche rechnerischen Ergänzungen wurde es beispielsweise möglich, Aussagen über die Altersstruktur der Häftlinge zu machen.

Bei der Übertragung der Häftlinge aus den handschriftlichen Journalen in die Datenbank wurden zusätzliche Spalten für die Kodierungen eingefügt, z.B. für Lese-, Schreib- und Religionskenntnisse (29) oder den sich aus dem Stand des Häftlings ergebenden Ausbildungsgrad und Gewerbezweig. Die Kodierungen wurden möglichst detailgetreu gewählt, denn nur Zusammenfassungen sind in der Auswertungsphase problemlos möglich. In der Kodierungsliste sind hinter den jeweiligen Kodierungen nähere Definitionen vermerkt bzw. sämtliche in der Quelle verwendeten Synonyme. Am Ende der Kodierungsliste sind alle unbekannten bzw. nicht eindeutig zu kodierenden Begriffe mit der entsprechenden Häftlingsnummer aufgeführt.

Ein Beispiel der Anpassung der Quelle an die Erfordernisse der Datenbank und der Auswertung mit SPSS ist die Sammelkodierung Staatsgefangene des Anstaltstypes. Während des Entwurfes der Datenbankstruktur war es nicht absehbar, daß mehr als zehn verschiedene Anstaltstypen auf der Leuchtenburg existierten (30). Zehn Häftlinge zählt die heterogene Gruppe der Staatsgefangenen. Die geringe Anzahl der Staatsgefangenen erlaubt die Zusammenfassung, ohne daß ein Informationsverlust hiermit verbunden ist (31). Die Rückverfolgung der Einzelnen in der Datenbank ist unproblematisch. Der Aufwand einer nachträglichen Veränderung der Spaltenbreite (auf zweizeilig) in der Datenbank und der sich hieraus ergebenden notwendigen Abänderungen für die Datenliste (SPSS Anweisungen) überstieg den zu erwartenden Erkenntniswert weit.

Offensichtliche Fehler in den Akten korrigierte ich beim Abschreiben zuweilen (32), um die Möglichkeiten der Datenbank und der beabsichtigten statistischen Auswertung besser nutzen zu können. Die Berichtigung der Akten widerspricht der Arbeitsweise des Historikers, schien mir jedoch in einzelnen Ausnahmefällen geboten, um die maschinelle Verarbeitung zu ermöglichen bzw. zu vereinfachen und den Aussagewert der statistischen Untersuchung zu erhöhen.

Ergänzt wurde beispielsweise folgende Quellenangabe "entl. den 30. April" mit der sich aus dem Kontext zwingend ergebenden Jahreszahl. Falls kein wahrscheinliches Jahr in der Quelle ersichtlich ist, verwende ich das Jahr 1000, denn das Computerprogramm verlangt zwingend eine vollständige Dateneingabe.

Ist nur das Jahr in der Quelle angegeben, dann wurde Tag und Monat auf 01.01.... festgesetzt. Falls der Monat und das Jahr in der Quelle enthalten sind, wird nur der Tag mit 01.... bestimmt.

Schwierig war die Kodierung der Schul- und Religionsnoten. In der Spalte Charakter beurteilt der Pastor Leschke verbal die schulischen Fähigkeiten der Häftlinge. Eine gewisse Stetigkeit in der Wortwahl schien gegeben und wurde Grundlage der Vergabe von entsprechenden "Schulnoten". Einzelne offensichtliche Abweichungen der Quelle von dem entwickelten Notenschema sind durch eine kontextbezogene abweichende Kodierung ausgeglichen worden (33). Eine derartige Kodierung von Texten birgt die Gefahr der subjektiven Veränderung der Quelle. Ein Autor, Pastor Leschke, verwendet kontinuierlich eine begrenzte Anzahl von hierarchisch strukturierten Beurteilungen, dies scheint ein solches Kodierungsverfahren zu rechtfertigen. Durch mehrmaliges Durchgehen der Kodierungen zur Prüfung des gewählten Schemas versuchte ich, den subjektiven Faktor weiter zu minimieren. Dabei war die große Anzahl der Fälle sogar hilfreich. Das Kodierungsschema im Kopf, wurde die Datenbank förmlich mechanisch durchgesehen und nur im Falle von Abweichungen gestoppt.

Tätlichkeiten gegen den Förster werden mit 908"Förster" und 502"Körperverletzung" kodiert, Wilddiebe und Holzdiebe sind in dieser Kategorie nur im Falle geleisteten Widerstandes gegen die Verhaftung aufgenommen.

Polizeiliche Vorstrafen werden als Vorstrafen gezählt. Nicht als Vorstrafe gewertet wird, wenn der Delinquent in Untersuchung war, aber freigesprochen wurde.

Der Stand (34) der Delinquenten wurde weitgehend durchgängig in der Quelle angegeben. Hieraus sind der Ausbildungsgrad sowie der Produktionszweig, in dem der Häftling tätig war, ablesbar. Die Wahl einer den Akten und den Lebensumständen der Betroffenen gerecht werdenden Kodierung war in diesem Fall besonders problematisch. In dem großen Untersuchungszeitraum änderte sich die wirtschaftliche Struktur Deutschlands wesentlich. Damit sind neue Berufsbezeichnungen verbunden (35) und traditionelle Berufe wandeln sich teilweise grundlegend. Die veränderte soziale Wirklichkeit einzelner Berufsgruppen ist durch die Kodierungen nicht zu erfassen (36).

Unbefriedigend ist sicher die Kodierung der Handarbeiter. Erst ab 1795 tauchen Handarbeiter als Berufsbezeichnung in den Quellen regelmäßig auf (37). Diese große Personengruppe (14,7% der Häftlinge) war sicher nicht ausschließlich gewerblich tätig (38), bezog wohl jedoch den überwiegenden Teil ihrer Einkünfte aus gewerblicher Arbeit. Tagelöhner werden sicher auch teilweise ihren Unterhalt mit gewerblichen Hilfsarbeiten verdient haben.
Value Label Value Frequency Percent Valid
Percent
Cum
Percent
Handarbeiter 1,00 762 14,7 86,9 86,9
Tagelöhner 2,00 115 2,2 13,1 100,0
,00 4319 83,1 Missing
Total 5196 100,0 100,0


Valid cases 877 Missing cases 4319



Handarbeiter nehme ich mit 2"Ungelernt"/400"Gewerbeind" und Tagelöhner mit 2"Ungelernt"/500"Landwirt" auf. Fabrikarbeiter werden mit 3"Gelernt"/400"Gewerbeind" kodiert, da Fabrikarbeiter in dieser frühen Zeit (wahrscheinlich) qualifizierte Arbeiter waren.

Die Kodierung der großen Gruppe der Dienstmägde und Dienstknechte birgt ebenfalls "willkürliche" (39) Elemente. Auf dem Bauernhof nehmen Mägde und Knechte an dem landwirtschaftlichen Produktionsprozeß teil 1"Ungelerntst"/500"Landwirt". In größeren Städten sind Mägde und Knechte eher als Dienstboten beschäftigt 1"Ungelerntst"/ 100"Dienstleistung". Letztere Kodierung ist nur in möglichst wahrscheinlichen Ausnahmefällen vergeben worden, denn in der Quelle kam auch die direkte Berufsbezeichnung Dienstbote vor. Hausknechte erhalten die Chiffre 1"Ungelerntst"/ 100"Dienstleistung". Der Ausbildungsgrad 1"Ungelerntst" wird einem großen Teil dieser Arbeitskräfte nicht gerecht. Die Dienstmagd hatte eine Berufserfahrung, heute sind Koch, Bäcker, Hotelfachfrau oder Hauswirtschaftlerin Ausbildungsberufe. Das Gleiche trifft auf einen Teil der Knechte zu, die während ihrer Dienstzeit die Fertigkeiten erlernten, um später einen eigenen Hof führen zu können. Die Kodierung spiegelt den geringeren Ausbildungsgrad der Dienstknechte gegenüber den Bauern wider. Die Kategorie 1"Ungelernst" ist gewählt worden, um den ständisch verwurzelten Anteil der Häftlinge besser herausschälen zu können. An diesem Beispiel zeigen sich die Probleme einer Kodierung von Quellen deutlich, menschliches Leben ist in seiner Vielfalt nicht durch Kodierungen zu beschreiben. Sobald man aber Aussagen über Gruppen oder Schichten der Gesellschaft und nicht über einzelne Individuen machen will, muß man auf derartige immer mehr oder weniger unzulängliche Konstrukte zurückgreifen.

Die Berufsbezeichnung "Ehefrau des ..." wird mit der Kodierung 1"Ungelernst", entsprechend der Tätigkeit des Mannes mit der jeweiligen Produktionszweigchiffre, aufgenommen. "Ehefrauen" werden mit 1"Ungelerntst"/100"Dienstleistung" verschlüsselt. "Bauersfrau" wird demgegenüber mit 3"Gelernt"/500"Landwirt" kodiert, da in dieser Bezeichnung ein Beruf erkennbar wird. Vagabund, Landstreicher, Bettler, Trinkerin, Armer u.a. werden mit 2"Ungelernt"/600"Unklar" verschlüsselt. Der höchste aus der Quelle ersichtliche Ausbildungsgrad und der eindeutigste Produktionszweig sind die Grundlage der Kodierung (Bsp.: Zeugmachergeselle und Handarbeiter 5"Geselle"/316"Zeugmacher", Webermeister und Handarbeiter 6"Meister"/310"Weber"). Die Aufgliederung des Produktionszweiges in Mehrfachantworten, wie das im Falle der Straftaten für notwendig erachtet wurde, schien hier nicht geboten. Mehrfachantworten lassen sich statistisch nur sehr begrenzt auswerten. Der Verlust, der sich aus der Einschränkung der Person auf einen Produktionszweig ergibt, wird in diesem Fall durch die besseren statistischen Bearbeitungsmöglichkeiten aufgewogen. In einer weiteren Auswertung der Quellen kann der soziale Auf- bzw. Abstieg mit Hilfe der Auswertung der Mehrfachantworten der Produktionszweige sichtbar gemacht werden.

Prostituierte wurden häufig auf Grund anderer Delikte in die Leuchtenburger Anstalten eingewiesen. Beispielsweise fanden sich in der Berufsbezeichnung (40) oder in der Beschreibung ihres Lebensweges (41) Bezeichnungen, die diese Frauen stigmatisierten. Damit alle diese Frauen erfaßt werden können, wählte ich innerhalb der Berufe die Kodierung 9"Prostituierte". Ein vermuteter sozialdisziplinierender Charakter der Leuchtenburger Anstalten ist mit Hilfe einer solchen Kodierung zu überprüfen.

Die Conduitenlisten wurden zunächst nur in Ermangelung weiterer Kopien der Journale eingegeben. In den Conduitenlisten sind die wiederkehrenden Häftlingsdaten aufgeführt, so daß mit der Dateneingabe fortgefahren werden konnte. Eine Abgleichung mit den Kopien des entsprechenden Journals erfolgte nachträglich, die Personen stimmten durchweg überein, Details variierten unwesentlich (42). Die zusätzlichen Angaben der Conduitenlisten, die Bestrafungen für Vergehen gegen die Anstaltsordnung sind für einige Personen unvollständig. Die maximal mögliche Feldgröße der Datenbank war in einzelnen Fällen nicht ausreichend (!), um alle verhängten Strafen aufzuzeichnen. Die Kodierung der verhängten Strafen erfolgte in diesen Fällen an Hand der Akten, so daß die Kodierungen vollständig sind. Der statistische Erkenntniswert ist jedoch hierfür sehr gering. Bereits durch das Durchblättern der Akten ist zu ersehen, daß man für "Bagatellen" mit schweren körperlichen Züchtigungen zu rechnen hatte, deren äußerst große Anzahl in kurzen Zeiträumen den heutigen Leser schockiert. Eine wesentlich höhere Anzahl von Todesfällen in den Leuchtenburger Anstalten wäre auf Grund der brutalen Behandlung zu erwarten. Andere Strafen, wie Einzelhaft, Wasser und Brot etc., kamen kaum zur Anwendung.

Fehler bei der Übertragung der Daten aus den Akten in die Datenbank sind durch den abschließenden nochmaligen Vergleich der Akten mit der Datenbank möglichst gering gehalten worden. Auf Grund des sehr großen Umfanges des Datenbestandes sind eventuell nicht alle Fehler eliminiert (43).

Logische Kontrollen der Datenliste mit SPSS für Windows 6.0 (44) dienten der weiteren Verringerung von Tipfehlern. Die sehr umfangreiche Datenmenge erschwerte deren Handhabung erheblich (45).

Eine möglichst hohe Transparenz und weitgehende Nachprüfbarkeit der Resultate der Untersuchung ist anzustreben. Die Gewichtung der Ergebnisse hängt von der jeweils verwendeten statistischen Prozedur ab. Auf Grund dessen erläutere ich kurz die wesentlichsten verwendeten SPSS-Befehle:

Mit Hilfe der SPSS-Befehle FREQUENCIES oder CROSSTABS führe ich die Berechnungen auf der Grundlage der Anzahl der Häftlinge durch. Mit FREQUENCIES werden Variablen gezählt, die Missing cases entsprechen den tatsächlich fehlenden Angaben. Mit CROSSTABS können zwei oder mehr Variablen verknüpft werden, die Number of Missing Observations ist eine Verknüpfung der fehlenden Werte der ausgewerteten Variablen. Die Funktion ASRESID berechnet die standardisierten Residuen. Residuen werden berechnet aus der Anzahl minus die erwartete Anzahl, dividiert durch die Quadratwurzel der erwarteten Anzahl. Positive Residuen zeigen an, daß die Zelle der Tabelle mehr Fälle enthält, als dies der Fall wäre, wenn Zeilen und Spaltenvariablen unabhängig wären. Diese Befehle sind nicht für die Auswertung von Mehrfachantworten geeignet.

Ein wesentliches Problem der Auswertung ist die Erfassung der Mehrfachantworten. Ein Häftling ist wegen "Lüderlichkeit" und "Trunksucht" (46) inhaftiert. Mit TABLES sind Mehrfachantworten zu erfassen. Die Berechnungsgrundlage von TABLES ist jedoch die Anzahl der Antworten und nicht die Anzahl der Häftlinge. Das bedeutet beispielsweise, wenn man Straftaten (Mehrfachantworten) einzelnen Anstalten zu einem bestimmten Zeitraum zuordnet, erhält man nicht die Anzahl der Häftlinge der Anstalt in diesem Zeitraum, sondern die Anzahl der Straftaten, die zur Einweisung in die Anstalt in dem entsprechenden Zeitraum führten (47).

Damit der Text der Arbeit besser lesbar ist, sind die statistischen Belege (Tabellen mit SPSS-Syntax) im Anhang (48) geordnet. In den Fußnoten wird auf die entsprechende Tabelle mit der Seitenzahl verwiesen. Zur Eingrenzung der Anzahl der Tabellen in der Anlage wird in einzelnen Fällen in der Fußnote der SPSS-Syntax einer Tabelle mit einem Auszug einiger wesentlicher Zahlen aus der Tabelle aufgeführt. Diese Tabellen sind nicht Bestandteil der Anlage.




zurück Magisterarbeit Index mailto: weiter