[Werkzeug] Burnouts bei Cosmas II

Ein Freund hat mich gefragt, ob die Verwendung des Begriffs Burnout seit den 1990ern in Zeitungstexten zugenommen habe und wie er das herausfinden könne. Für eine medizinische Doktorarbeit. Juhu, konkreter Nutzen für die Menschheit involviert!

Nun gibt es elektronische Textsammlungen, mit denen sich solche Abfragen machen lassen, aber oft sind sie für Laien schwer zu durchschauen. (Und ich will nicht behaupten, dass ich da den vollen Durchblick hätte.) Eine davon ist das Deutsche Referenzkorpus, das man über Cosmas II nutzen kann. Bei Beiträgen zum Anglizismus des Jahres 2010 kamen schon öfter Recherchen dazu vor, jetzt will ich einmal exemplarisch zeigen, wie man an solche Fragestellungen herangehen kann.

Ich benutze hier die Weboberfläche, aber man kann sich die Software auch installieren. Zuerst braucht man aber (aus rechtlichen Gründen) auf jeden Fall ein Nutzerkonto. Leider ist die Navigation der Oberfläche suboptimal, man muss ständig zwischen der horizontalen Leiste und der linken Spalte hin- und herspringen. Zunächst einmal oben auf “Anmeldung”, dann links auf “Login” und dann oben wieder auf “Recherche”. Und wieder links auf “Archiv”. Hier kann man jetzt unter den folgenden Archiven auswählen:

  • W – Archiv der geschriebenen Sprache
  • W-ÜBRIG – Archiv der aussortierten geschriebenen Korpora
  • HIST – Archiv der historischen Korpora
  • GFDS – Kartei der Gesellschaft für deutsche Sprache
  • TAGGED – Archiv der morphosyntaktisch annotierten Korpora
  • WK-PH – Archiv der phasengegliederten Wendekorpora
  • W-TAGGED – Auswahl mit CONNEXOR getaggter Korpora

Für unsere Zwecke brauchen wir das W-Archiv, die anderen sind entweder zeitlich nicht relevant oder zu klein oder beides. Nach dem Klick darauf erscheint eine Übersicht über alle “virtuellen Korpora”, die darin enthalten sind. Das sind hauptsächlich Zeitungstexte aus ganz verschiedenen Jahren und ganz verschiedenen Umfangs. Damit wir sicher sagen können, dass es eine relative Zunahme von Burnout gibt, müssen wir sicherstellen, dass wir für alle untersuchten Jahre ungefähr gleiche Textmengen haben – wir brauchen also Zeitungen, die die gleichen Jahrgänge abdecken.

Damit wirklich nur die gewünschten Texte durchsucht werden, muss man sich ein eigenes Korpus definieren. Das geht in der linken Spalte unter “Korpus – Korpusverwaltung” und dann im mittleren Feld unter “Benutzerdefinierte Korpora” über “Definieren”. Es erscheint nun ein Auswahlmenü:

Links stehen die einzelnen Texte, die man auswählen und dann nach rechts, in das eigene Korpus, verschieben kann. Um alle Jahrgänge einer Zeitung zu erwischen, sollte man im Suchfeld in der Mitte nach dem Zeitungsnamen suchen, da sie nicht unbedingt nacheinander aufgelistet sind. Sobald alle gewünschten Texte ausgewählt sind, gibt man unten noch einen Namen für das Korpus ein und klickt auf “übernehmen” und dann auf “speichern”.

Für die Burnout-Suche brauchen wir Zeitungen, die möglichst weit zurückreichen. Bis 1990 gehen nur die Nürnberger Nachrichten, also nehmen wir erstmal die. Den aktuellsten Monat, Juli 2010, habe ich rausgeworfen, damit man die Zahlen nachher in Halbjahresschritten untersuchen kann. Dann geht’s weiter in der linken Spalte, mit “Suchanfrage”.

Diese Suchanfrage muss so gestellt werden, dass alle Schreibweisen und Flexionsformen von Burnout erfasst werden. Meine Eingabe ist daher:

burnout OR burnouts OR (burn /+w1 out) OR (burn /+w1 outs) OR burn-out OR burn-outs

Die Groß- und Kleinschreibung ist egal, das OR zeigt an, dass ich alle Stellen will, bei denen eine der drei Formen vorkommt, und (burn /+w1 out) bedeutet, dass ich alle Stellen will, bei denen burn und out direkt nebeneinander stehen. Durch die Alternativen ist sichergestellt, dass auch Plural- oder Genitivformen auf –s auftauchen werden.

Ein Klick auf “suchen” liefern zunächst einmal die Wortformlisten. Da kann man dann die genauen Schreibungen sehen, nach denen gesucht wird, und sie, wenn etwas Falsches dabei ist, einfach deaktivieren. Sobald das erledigt ist (ich habe nichts deaktiviert), geht es über “Ergebnisse” endlich ans Ziel: In den Nürnberger Nachrichten gab es in den letzten 20 Jahren grade mal 120 Verwendungen von Burnout in 66 verschiedenen Texten. Hier die Zahlen, von mir schon nach Halbjahren zusammengefasst:

Halbjahr Treffer
1990-1 3
1990-2 5
1991-1 0
1991-2 0
1992-1 0
1992-2 0
1993-1 3
1993-2 1
1994-1 0
1994-2 2
1995-1 0
1995-2 0
1996-1 0
1996-2 1
1997-1 0
1997-2 2
1998-1 0
1998-2 0
1999-1 0
1999-2 0
2000-1 0
2000-2 0
2001-1 0
2001-2 1
2002-1 0
2002-2 5
2003-1 2
2003-2 4
2004-1 3
2004-2 2
2005-1 0
2005-2 0
2006-1 1
2006-2 2
2007-1 7
2007-2 5
2008-1 3
2008-2 5
2009-1 32
2009-2 15
2010-1 8

Über “Export” kann man die Daten speichern. In der Datei steht dann auch, wie viele Wörter es pro Monat gab (“Zusammensetzung des aktiven Korpus”). Das schwankt von 1.045.194 bis runter zu 500.214, scheint aber insgesamt keine so große Bedeutung zu haben. Die Treffer stellen sich, geteilt durch die Gesamtwortzahl des jeweiligen Halbjahrs, folgendermaßen dar:


Da scheint schon was zu passieren, allerdings sind die Zahlen wirklich, wirklich klein.

Glücklicherweise gibt es für die Nullerjahre mehr Texte bei Cosmas II, sodass ich ein größeres Korpus aus sechs Zeitungen für 2006-2010 definiert habe. (Das sind: Mannheimer Morgen, Nürnberger Zeitung, Nürnberger Nachrichten, Hamburger Morgenpost, Rhein-Zeitung und Braunschweiger Zeitung.) In diesem viel kürzeren Zeitraum finden sich dann auch 611 Treffer:

Halbjahr Treffer
2006-1 27
2006-2 25
2007-1 45
2007-2 97
2008-1 80
2008-2 48
2009-1 102
2009-2 111
2010-1 76

Für die Halbjahre zusammengerechnet und durch die Textwortzahl geteilt:


Schade, dass für das zweite Halbjahr 2010 noch keine Daten vorliegen, mich würde interessieren, was da passiert ist. Aber auch hier sind die Zahlen zu klein, um der Kurve große Aussagekraft beizumessen.

Und dann habe ich noch eine ganz dreckige Abfrage gemacht: Ich habe alle Zeitungs- und Zeitschriftentexte (auch aus Österreich und der Schweiz) aus den Jahren 1989, 1999 und 2009 durchsucht. 1999 und 2009 kommen auf eine vergleichbare Textwortzahl – und auf einen starken Trefferanstieg: von 78 auf 544. (1989 ist weit abgeschlagen und liefert vielleicht deswegen keinen einzigen Treffer.)

*puh* Ganz schön frustrierend, diese Korpusgeschichten: Sooo viel Text, so kleine Zahlen. Ich habe auch einen Test mit dem Ngram Viewer gemacht, der Bücher durchsucht. Da finden sich zu frühereren Zeitpunkten hohe Zahlen:


Insgesamt würde ich festhalten, dass in den letzten Jahren vermehrt über Burnout berichtet wurde. Es ist allerdings nicht klar, ob der Trend momentan wieder abklingt (glaube ich nicht) oder ob das Phänomen nur grade in den untersuchten Zeitungen keine “Saison” hat, sich aber bald wieder stärker niederschlägt. Außerdem sind die Belegzahlen insgesamt einfach sehr klein, was auch logisch ist, denn so eine Zeitung hat ein breites Themenspektrum und nur ein Bruchteil davon lädt zur Burnoutberichterstattung ein. (Zu Hoch-Zeiten gab es in meinem Sechszeitungenkorpus in einem Halbjahr, nämlich 2/2009, 77 Artikel, die das Wort enthielten – bei 1.229.504 Artikeln insgesamt.)

Man könnte, wenn man wollte, noch mehr mit der Korpusdefinition herumbastelt und z.B. Zeitungen, die es nur in den früheren Jahren gibt, mit Zeitungen, die es nur in späteren Jahren gibt, fortsetzen, um insgesamt eine größere Textmenge zu kriegen. Dazu hatte ich aber keine Lust mehr. Ich hoffe, dem zukünftigen Dr. med. trotzdem wenigstens ein bißchen geholfen zu haben.

Und für alle, die von diesen ganzen Einzelwortuntersuchungen schon total angenervt sind: Es wird bald wieder was anderes kommen. Bin schon am Schreiben!

Kommentare sind geschlossen.