Mehr Spaß mit Ngrams

28. Januar 2011

Heute gibt es ein buntes Sammelsurium von Abfragen mit dem Ngram Viewer. Ich finde sie alle aus dem einen oder anderen Grund ganz erhellend. Vielleicht ja sonst noch wer?

Ab wann ist das Korpus brauchbar?

Meine “schönste” Abfrage ist sicher die folgende, die ich kürzlich (in einer minimal abweichenden Version) auch in den Sprachlog-Kommentaren gepostet habe:

Wie man sieht, wenn man draufklickt, habe ich Allerweltswörter abgefragt: der, die, und, in, … Das sind Wörter, die so häufig sind, dass man in einem ausgewogenen Korpus eigentlich keine großen Schwankungen erwarten würde. Man braucht sie einfach immer, für jeden Text. Klar, das geht nicht unbegrenzt weit zurück, irgendwann sind die Artikel ja auch entstanden, und Personalpronomen waren z.B. im Althochdeutschen noch lange nicht so gebräuchlich wie heute. Aber für die späte frühneuhochdeutsche und neuhochdeutsche Zeit, die der Ngram Viewer abdeckt, sollte es doch einigermaßen passen. Den Rest des Beitrags lesen »

Werbung

[Werkzeug] Burnouts bei Cosmas II

25. Januar 2011

Ein Freund hat mich gefragt, ob die Verwendung des Begriffs Burnout seit den 1990ern in Zeitungstexten zugenommen habe und wie er das herausfinden könne. Für eine medizinische Doktorarbeit. Juhu, konkreter Nutzen für die Menschheit involviert!

Nun gibt es elektronische Textsammlungen, mit denen sich solche Abfragen machen lassen, aber oft sind sie für Laien schwer zu durchschauen. (Und ich will nicht behaupten, dass ich da den vollen Durchblick hätte.) Eine davon ist das Deutsche Referenzkorpus, das man über Cosmas II nutzen kann. Bei Beiträgen zum Anglizismus des Jahres 2010 kamen schon öfter Recherchen dazu vor, jetzt will ich einmal exemplarisch zeigen, wie man an solche Fragestellungen herangehen kann.

Ich benutze hier die Weboberfläche, aber man kann sich die Software auch installieren. Zuerst braucht man aber (aus rechtlichen Gründen) auf jeden Fall ein Nutzerkonto. Leider ist die Navigation der Oberfläche suboptimal, man muss ständig zwischen der horizontalen Leiste und der linken Spalte hin- und herspringen. Zunächst einmal oben auf “Anmeldung”, dann links auf “Login” und dann oben wieder auf “Recherche”. Und wieder links auf “Archiv”. Hier kann man jetzt unter den folgenden Archiven auswählen:

  • W – Archiv der geschriebenen Sprache
  • W-ÜBRIG – Archiv der aussortierten geschriebenen Korpora
  • HIST – Archiv der historischen Korpora
  • GFDS – Kartei der Gesellschaft für deutsche Sprache
  • TAGGED – Archiv der morphosyntaktisch annotierten Korpora
  • WK-PH – Archiv der phasengegliederten Wendekorpora
  • W-TAGGED – Auswahl mit CONNEXOR getaggter Korpora

Für unsere Zwecke brauchen wir das W-Archiv, die anderen sind entweder zeitlich nicht relevant oder zu klein oder beides. Nach dem Klick darauf erscheint eine Übersicht über alle “virtuellen Korpora”, die darin enthalten sind. Das sind hauptsächlich Zeitungstexte aus ganz verschiedenen Jahren und ganz verschiedenen Umfangs. Damit wir sicher sagen können, dass es eine relative Zunahme von Burnout gibt, müssen wir sicherstellen, dass wir für alle untersuchten Jahre ungefähr gleiche Textmengen haben – wir brauchen also Zeitungen, die die gleichen Jahrgänge abdecken.

Den Rest des Beitrags lesen »


[Linktipp] Keine Aufnahme der deutschen Sprache ins Grundgesetz

21. Januar 2011

Ich war mir erst nicht sicher, ob ich Anatol Stefanowitschs Petition gegen die Aufnahme der deutschen Sprache ins Grundgesetz mitzeichnen sollte. Ich fand die ganze Kampagne von BILD und VDS so albern, dass es mir unnötig erschien, denen noch weitere Aufmerksamkeit in Form von Gegenaktionen zukommen zu lassen.

Dann habe ich die Kommentare gelesen. Und eine Nacht drüber geschlafen. Heute morgen habe ich gleich als erstes unterschrieben.

Es ist skurril, krass, abartig und leider überhaupt nicht überraschend, wie sich die Befürworter der Deutsch-ins-GG-Aktion gebärden. Da haben wir, ganz typisch, den Verweis darauf, dass Anatol Stefanowitsch keinen deutschen Namen habe – was schon mal überhaupt keine Relevanz hat –, daraus resultierend dann der Schluss, dass er kein Deutscher sei, und daraus wird dann abgeleitet, dass er eh nichts zum Thema zu melden habe bzw. dass er ja dann inhärent “gegen” das Deutsche sei. Das kennt man. Bei der StuTS hat Prof. Wiese, die ja Untersuchungen zu Kiezdeutsch macht, von Drohmails erzählt, die sie bekommt. Ein Beispiel waren Aussagen wie “Sie haben zwar einen deutschen Namen, aber wahrscheinlich sind Sie …” und ähnliches. Ein deutscher Name scheint für solche Leute un-glaub-lich wichtig zu sein.

Dann gibt es die Leute, die die Verankerung im Grundgesetz nicht für eine rein symbolische Handlung halten, sondern für eine konkrete Handhabe, z.B. gegen Anglizismen, dagegen, dass Geschäfte ihre Produkte ausschließlich in einer Fremdsprache beschriften (was zumindest für Lebensmittel Unsinn ist), gegen die “Kreolisierung” des Deutschen, oder gar gegen den Sprachtod. Wie A.S. schon gründlich ausgeführt hat, ist das alles entweder absurd oder irrelevant.

Eine Verankerung des Deutschen im Grundgesetz definiert zudem noch lange nicht, was Deutsch eigentlich ist. Wie jede natürliche (und auch die meisten künstlichen) Sprache(n) verändert sich das Deutsche permanent. Meist sind dabei die Dinge, die in der Öffentlichkeit als sehr große Veränderungen wahrgenommen werden, eher irrelevant für das Sprachsystem (z.B. Rechtschreibreform). Aber egal welche Rolle sie für den Sprachwandel spielen: Er ist unaufhaltbar. Und warum sollte man ihn auch aufhalten wollen? Was ist denn so schlimm daran, dass sich eine Sprache verändert? Eine Sprache, die sich nicht mehr verändert, ist tot.

Und: Eine Sprache kann man nicht auf ihren Ausgangszustand zurückführen. Was wäre das denn? Für die Leute, die sich da ereifern, ist in der Regel das Deutsch ihrer Schulzeit das Maß aller Dinge. Bedenkt man aber, dass die alle ganz unterschiedlichen Alters sind, und dass sich auch schon vor langer Zeit Leute derart ereifert haben, wird langsam klar, dass man immer weiter zurückgehen müsste … ins Frühneuhochdeutsche, wo es noch gar keine Standardsprache gab, ins Mittelhochdeutsche, wo die Situation noch uneinheitlicher war, ins Althochdeutsche und dann … dann kommen die Sprachstufen, für die wir keine schriftlichen Quellen haben. Wird schwer, das zu sprechen. (Zumal, komm, schriftliche Quellen als Vorbild für gesprochene Sprache? Haha.)

Ich könnte mich noch weiter ereifern, aber das spare ich mir lieber. Meine Bitte: Schaut euch die Links an, bildet euch eine Meinung und entscheidet euch ganz bewusst, ob ihr die Petition mitzeichen wollt oder nicht. Ich habe es getan, unter anderen als bewusstes Statement gegen diesen ganzen Kommentarmüll.

[Update 25.1.2011: Suz hat einen sehr klugen Beitrag geschrieben, in dem sie die Argumente der Befürworter und Gegner von allen Seiten beleuchtet.]


[Anglizismus des Jahres] ausrollen?

18. Januar 2011

Dieser Artikel ist ins neue Sprachlog umgezogen und ab sofort hier zu finden!


[Anglizismus des Jahres] entfrienden/entfreunden?

17. Januar 2011

Heute beschäftige ich mich mit einem der Kandidaten, bei denen nicht das komplette Material entlehnt wurde, nämlich dem Doppelkandidaten entfrienden/entfreunden. Hier haben wir es mit einer Ableitung zu tun. Ihre Bedeutung würde ich ungefähr fassen als: ‘eine bei einem sozialen Netzwerk/Computerspiel/… bestehende Verknüpfung (“Freundschaft”) wieder auflösen’.

Vor man entfrienden kann, muss man frienden!

Will man diese Bildung untersuchen, dann muss man sich zunächst einmal anschauen, wie ihre Basis, also frienden/freunden, zustande kam, wie man sie in den folgenden Beispielen findet:

Noch mehr Leute hier, die ihre Eltern bei Facebook nicht gefriendet haben? (Quelle)

Ich hab so viele Leute gefriendet, wenn ich nicht mehrmals täglich die Frienslist lesen würde, käme ich gar nicht mehr hinterher! (Quelle)

Ella Lingens Gymnasium kann man nicht „frienden“ nur „liken“, oder? (Quelle)

Hab ein paar von euch gefreundet ,hoffe das ist ok! (Quelle)

Auffällig ist, dass hier meist das Partizip vorkommt, d.h. über die Handlung öfter in der Vergangenheit gesprochen wird. Mir selbst kommt der Infinitiv schon fast ungrammatisch vor. Den Rest des Beitrags lesen »