[Spieltipp] Hör mal, wo der spricht

30. Mai 2012

Dieser Artikel ist ins neue Sprachlog umgezogen und ab sofort hier zu finden!


Was macht eigentlich … leaken?

19. Dezember 2011

Die Nominierungsphase für den Anglizismus des Jahres 2011 läuft (noch bis zum 31.12.!) – eine schöne Gelegenheit, mal besinnlich zu werden und nachzuschauen, wie es dem Gewinner von letztem Jahr ergangen ist: leaken. Es gab damals zwei recht ausführliche Analysen von suz und mir, denen aber für 2010 die Daten fehlten: Das Wort trat ja erst im Herbst so richtig ans Licht der breiten Öffentlichkeit, und das DeReKo (eine enorm große Sammlung von Zeitungstexten, zugänglich via Cosmas II) umfasste damals nur die erste Jahreshälfte. Mittlerweile sind die Daten da und ich hab mal reingeschaut, allerdings mit ernüchterndem Ergebnis: Das Verb leaken tritt 2010 grade mal zweimal auf, inklusive einer scherzhaften Verwendung:

  • Ulmen schlüpft in die Rolle seiner Kunstfigur Uwe Wöllner und erklärt aktuelle Begriffe wie „Leaking“ („Wenn ich niese, zum Beispiel, leake ich meine Erkältung“). (Mannheimer Morgen, 13.12.2010, S. 28)
  • Wiki leakt weiter. Die «Rundschau» reist nach Island zu Mitstreitern von Julian Assange. (St. Galler Tagblatt, 15.12.2010, S. 12)

Im Jahr 2011 (erste Jahreshälfte) dann bisher drei Treffer, einer scherzhaft:

  • Leaken, das heisst etwas vor der Veröffentlichung verbreiten, sei «grundsätzlich ein anarchistischer Akt». (St. Galler Tagblatt, 28.01.2011, S. 9)
  • Merke: „Ein kleiner Wiki leakt in jedem von uns!“ (Nürnberger Nachrichten, 03.03.2011, S. 8)
  • Wohin der Weg eines transparenteren Staates führen könnte, zeigte eine Äußerung des Bundesdatenschutzbeauftragten Peter Schaar: „Wenn Möglichkeiten zur Freigabe von Daten erleichtert werden, mindert das den Druck, Daten zu leaken.“ (Rhein-Zeitung, 18.04.2011, S. 32)

Für die Vorjahre sieht das immerhin noch schlechter aus, wie ich in meinem letztjährigen Artikel schon erwähnt habe (2005 gibt es drei Verwendungen für Computerspiele/Musik, die aus der Wikipedia stammen, das war’s), aber Tendenzen kann man daraus nun wirklich keine ableiten.

In meiner Datennot habe ich auf GoogleNews zurückgegriffen. Das ist aus mehreren Gründen keine besonders gute Idee, darunter z.B.:

  •  Man hat keine Ahnung, wieviele Textwörter insgesamt durchsucht werden. Da das von Jahr zu Jahr variieren kann, könnte die relative Vorkommenshäufigkeit eine ganz andere sein, als die absolute nahelegt. Wenn man davon ausgeht, dass die Textzahl jedes Jahr steigt, dann ist auch der Anstieg von leaken nicht mehr so ungewöhnlich.
  • Die Datierung ist unzuverlässig. Der Treffer, den ich für 2002 hatte, bezieht sich z.B. anachronistischerweise auf Wikileaks und stammt dann auch in Wirklichkeit von 2010. Wer weiß, wie viel da sonst noch im Argen liegt.

Nichtsdestotrotz habe ich die Suche unternommen, und zwar mit der Suchanfrage

„leaken“ OR „leake“ OR „leakst“ OR „leakt“ OR „leakte“ OR „leaktest“ OR „leaktet“ OR „leakten“ OR „geleakt“ OR „geleakte“ OR „geleakten“ OR „geleakter“ OR „geleaktes“ OR „geleaktem“

Die sollte so ziemlich alle erwartbaren verbalen und adjektivischen Vorkommen abdecken. Für die letzten zehn Jahre findet man dann die folgenden Ergebnisse in absoluten Zahlen (von mir bereinigt):


Einen Anstieg kann man daraus, wie bereits bemerkt, nicht ableiten, aber man kann sich das Verhältnis der verschiedenen Anwendungsbereiche zueinander anschauen. Die Einteilung ist recht grob, weil ich bei Filmen, Musik und Technik nicht sauber aussortiert habe, wann es sich um ein geleaktes Produkt handelte und wann um Informationen dazu (sind auch teilweise im roten Balken gelandet, aber nicht so furchtbar systematisch) – wenn jemand Zeit hat … Momentan sieht es so aus, als sei prozentual nur die Film-Musik-Technik-Bedeutung etwas gestiegen (2010 56%, 2011 65%) und die Übertragung auf die Informationsbedeutung ließe noch auf sich warten (falls sie jemals so richtig kommt; 2010 25%, 2011 24%). Vielleicht tut sich aber, wie gesagt, etwas im Überschneidungsbereich „Informationen zu Filmen, Musik, Technik“.

Ich fürchte, wir müssen in einem Jahr wieder nachschauen, wie es dem Leaken so geht.

Werbung

[Werkzeug] Burnouts bei Cosmas II

25. Januar 2011

Ein Freund hat mich gefragt, ob die Verwendung des Begriffs Burnout seit den 1990ern in Zeitungstexten zugenommen habe und wie er das herausfinden könne. Für eine medizinische Doktorarbeit. Juhu, konkreter Nutzen für die Menschheit involviert!

Nun gibt es elektronische Textsammlungen, mit denen sich solche Abfragen machen lassen, aber oft sind sie für Laien schwer zu durchschauen. (Und ich will nicht behaupten, dass ich da den vollen Durchblick hätte.) Eine davon ist das Deutsche Referenzkorpus, das man über Cosmas II nutzen kann. Bei Beiträgen zum Anglizismus des Jahres 2010 kamen schon öfter Recherchen dazu vor, jetzt will ich einmal exemplarisch zeigen, wie man an solche Fragestellungen herangehen kann.

Ich benutze hier die Weboberfläche, aber man kann sich die Software auch installieren. Zuerst braucht man aber (aus rechtlichen Gründen) auf jeden Fall ein Nutzerkonto. Leider ist die Navigation der Oberfläche suboptimal, man muss ständig zwischen der horizontalen Leiste und der linken Spalte hin- und herspringen. Zunächst einmal oben auf “Anmeldung”, dann links auf “Login” und dann oben wieder auf “Recherche”. Und wieder links auf “Archiv”. Hier kann man jetzt unter den folgenden Archiven auswählen:

  • W – Archiv der geschriebenen Sprache
  • W-ÜBRIG – Archiv der aussortierten geschriebenen Korpora
  • HIST – Archiv der historischen Korpora
  • GFDS – Kartei der Gesellschaft für deutsche Sprache
  • TAGGED – Archiv der morphosyntaktisch annotierten Korpora
  • WK-PH – Archiv der phasengegliederten Wendekorpora
  • W-TAGGED – Auswahl mit CONNEXOR getaggter Korpora

Für unsere Zwecke brauchen wir das W-Archiv, die anderen sind entweder zeitlich nicht relevant oder zu klein oder beides. Nach dem Klick darauf erscheint eine Übersicht über alle “virtuellen Korpora”, die darin enthalten sind. Das sind hauptsächlich Zeitungstexte aus ganz verschiedenen Jahren und ganz verschiedenen Umfangs. Damit wir sicher sagen können, dass es eine relative Zunahme von Burnout gibt, müssen wir sicherstellen, dass wir für alle untersuchten Jahre ungefähr gleiche Textmengen haben – wir brauchen also Zeitungen, die die gleichen Jahrgänge abdecken.

Den Rest des Beitrags lesen »


1642: Das Jahr, da die teusch Sprach verderbt war

8. Dezember 2010

Wusstet Ihr, dass das Deutsche schon kaputt ist? Ich bin mir auch nicht sicher, wie es der wachsamen Öffentlichkeit entgehen konnte, aber im Jahr 1642 spätestens war alles verdorben. Warum und wie? Aber ja, die leidigen Fremdwörter haben die Sprache versaut und dafür gesorgt, dass man sich nicht mehr verständigen konnte. So zu lesen in diesem wunderbaren Gedicht auf Wikisource. Es richtet sich

Wider alle Sprachverderber / Cortisanen / Concipisten vnd Concellisten / welche die alte teuotsche Muttersprach mit allerley frembden / Lateinischen / Welschen / Spannischen vnd Frantzösischen Wörtern so vielfältig vermischen / verkehren vnd zerstehren / daß Sie jhr selber nicht mehr gleich sihet / vnd kaum halber kan erkant werden.

Schlümm, schlümm.

Was haben wir noch?

Nach diversen Beschimpfungen geht es dann in Strophe 6 los mit einem Fremdwort-ABC. Ich habe mir mal den Spaß gemacht, die verhassten Wörter zu extrahieren und zu schauen, wie es heute um sie steht. Von 294 Fremdwörtern und -wendungen haben wir (je nach zugrundegelegter Wortliste1) etwas mehr als ein Drittel behalten (116 bzw. 111).

Welche Rolle spielen sie?

Die Überlebenden sind zwar meist noch als Fremdwörter zu erkennen, haben sich aber heute super integriert. (Teilweise auch mit drastischen Bedeutungsveränderungen.) Viele gehören in spezifische Bereiche, wie z.B. zum Militär: Den Rest des Beitrags lesen »


Chaos mit „Zucchini“

31. Oktober 2010

Kürbisse vor Kürbissuppe

Ich habe mich diese Woche jahreszeitbedingt eine Menge mit Kürbissen beschäftigt.1 Siehe rechts. Dabei spukte mir immer wieder im Kopf herum, dass ja auch Zucchini Kürbisse sind. Das ursprünglich italienische Wort bedeutet in seiner Herkunftssprache sogar ‘kleiner Kürbis’, es ist von zucca ‘Kürbis’ abgeleitet.

Kurioserweise kann das Wort sowohl im Italienischen als auch im Deutschen maskulin und feminin sein. Den Rest des Beitrags lesen »