[Weihnachten] Weihnachts- vs. Christbaum

25. Dezember 2010

Vielleicht hat ja jemand hier Lust auf Weihnachten?

Ich habe mal einen Ngram-Kampf zwischen Weihnachts- und Christbaum angezettelt, den der Weihnachtsbaum gewonnen hat:

Der Christbaum ist ganz gut ins Rennen gestartet, konnte sein Wachstum dann aber tragischerweise nicht halten.

Den Rest des Beitrags lesen »


Wort-Wahl: Anglizismus des Jahres

24. Dezember 2010

Anatol Stefanowitsch vom Sprachlog veranstaltet auch eine Wortwahl – und diesmal vielleicht eine, in der es wirklich um das Wort geht, und nicht um den gesellschaftspolitischen Zusammenhang, in dem es entstanden ist … Gesucht ist der Anglizismus des Jahres 2010, zu gewinnen gibt’s auch was und ich sitze mit in der Jury. (*hmpf* Wenn ich das mit dem Gewinnen vorher gewusst hätte …) Die Kriterien:

Nominierte Wörter sollten (ganz oder in Teilen) aus dem Englischen stammen, sie sollten neu sein, d.h. im Jahr 2010 zum ersten Mal verwendet worden oder wenigstens zum ersten Mal in das Bewusstsein einer breiten Öffentlichkeit gelangt sein. Sie sollten eine interessante Lücke im deutschen Wortschatz füllen, entweder, indem sie eine vorhandene Wortbedeutung weiter ausdifferenzieren oder, indem sie ein Wort für etwas bereitstellen, was es vorher nicht gab oder was vorher nur mühsam umschrieben werden konnte.

Meldungen bis zum 7. Januar in den Kommentaren des Sprachlogs unter Angabe von Wort, Quelle und Grund. Bin mal gespannt, ob Blogleser gute Seismografen für Wortschatzerweiterung sind. Und bei allem Trara nicht vergessen: Wörter sind zwar drollige kleine Kerlchen, aber niemalsnicht die Essenz, die unsere Sprache im Innersten zusammenhält.


[Werkzeug] Ngram Viewer

20. Dezember 2010

Beim Language Log wurde ja schon ausführlich über das neuste Google-Spielzeug berichtet – man kann damit in einem Korpus, das einen Auszug aus GoogleBooks darstellt, nach Wörtern oder Wortketten suchen und sich ihren Häufigkeitsverlauf anzeigen lassen. Dabei wird die Gebrauchsfrequenz errechnet, indem das Gesuchte (das n-gram, wobei n für die Zahl der Wörter im Suchbefehl steht) durch die Gesamtwortzahl des entsprechenden Jahres geteilt wird.

Die Sache ist für uns aus vielen tausend Gründen problematisch: wilde Textsortenzusammensetzung des Korpus – aber für Englisch gibt es immerhin Unterkorpora wie Fiction, American English und British English –, die Korpusgröße variiert stark, d.h. Funde zu einem relativ frühen Zeitpunkt (z.B. 1800) schlagen stärker zu Buche als später (z.B. 2000), auch wenn normalisiert wurde, …

Messer, Gabel, …

Ein paar mögliche Probleme habe ich mal mit der Suche nach “Messer,Gabel,Löffel” für 1900 bis 2000 durchgespielt. Man könnte hier den Eindruck erhalten, die Gabel trete am seltensten auf und das Messer sei enorm viel häufiger (alle Diagramme führen direkt zur entsprechenden Suchanfrage mit größeren Darstellungen):

Den Rest des Beitrags lesen »


Von r, Nasalstrichen und Häkchen

17. Dezember 2010

Ich trage seit Urzeiten die Kindheitserinnerung mit mir herum, dass ich lange Zeit dachte, die Goten bei Asterix und die Goten hätten einen Sprachfehler, weil sie immer f statt s sagten. Wer’s nicht kennt: Die Goten “sprechen” in Frakturschrift. Das ist eine sogenannte “gebrochene Schrift”, die neben dem runden <s> auch das lange <ſ> besitzt. (Die Verteilung ist ganz grob: Silbenanfang und -mitte <ſ>, Silbenende <s>.) Nun habe ich eben einmal nach einem Beispiel gegooglet und entdeckt, dass die Erinnerung wohl falsch ist: In den Comics wird immer das <s> benutzt. Hier z.B. müsste das <ſ> in <marschieren>, <ist> und <Lust> stehen und auch hier ist es nirgends zu finden. Eine vom heutigen Standpunkt aus leserfreundliche Entscheidung.

Dass <ſ> und <f> sich in gebrochenen Schriften sehr ähnlich sehen, ist ja recht weit verbreitetes Wissen:

nit vstopffē lassē

r gegen r!

Aber wusstet Ihr, dass es zwei Schreibungen von <r> gab? Schaut mal:

.../deßhalben sol man sich daruor hüten/vnd sonderlich/vor grossem zoren/Vnmuot/Sorgfeltigkayt/vnnd forchte des todts

Den Rest des Beitrags lesen »


1642: Das Jahr, da die teusch Sprach verderbt war

8. Dezember 2010

Wusstet Ihr, dass das Deutsche schon kaputt ist? Ich bin mir auch nicht sicher, wie es der wachsamen Öffentlichkeit entgehen konnte, aber im Jahr 1642 spätestens war alles verdorben. Warum und wie? Aber ja, die leidigen Fremdwörter haben die Sprache versaut und dafür gesorgt, dass man sich nicht mehr verständigen konnte. So zu lesen in diesem wunderbaren Gedicht auf Wikisource. Es richtet sich

Wider alle Sprachverderber / Cortisanen / Concipisten vnd Concellisten / welche die alte teuotsche Muttersprach mit allerley frembden / Lateinischen / Welschen / Spannischen vnd Frantzösischen Wörtern so vielfältig vermischen / verkehren vnd zerstehren / daß Sie jhr selber nicht mehr gleich sihet / vnd kaum halber kan erkant werden.

Schlümm, schlümm.

Was haben wir noch?

Nach diversen Beschimpfungen geht es dann in Strophe 6 los mit einem Fremdwort-ABC. Ich habe mir mal den Spaß gemacht, die verhassten Wörter zu extrahieren und zu schauen, wie es heute um sie steht. Von 294 Fremdwörtern und -wendungen haben wir (je nach zugrundegelegter Wortliste1) etwas mehr als ein Drittel behalten (116 bzw. 111).

Welche Rolle spielen sie?

Die Überlebenden sind zwar meist noch als Fremdwörter zu erkennen, haben sich aber heute super integriert. (Teilweise auch mit drastischen Bedeutungsveränderungen.) Viele gehören in spezifische Bereiche, wie z.B. zum Militär: Den Rest des Beitrags lesen »


Wie man ein Korpus zusammenstückelt und einen Teufelspakt schließt

3. Dezember 2010

Ich bin momentan dabei, eine Sammlung frühneuhochdeutscher Texte (ein “Korpus”), aus denen man idealerweise Aussagen über das Deutsch der damaligen Zeit ableiten kann, für mein Dissertationsvorhaben anzupassen. Das Korpus wurde ursprünglich zusammengestellt, um die Entstehung der Substantivgroßschreibung zu untersuchen, deshalb machte es z.B. nichts aus, dass auch übersetzte Texte darin enthalten waren. Bei meiner Fragestellung habe ich aber ein bißchen Angst, dass die Wort- und Satzstruktur durch direkte lateinische Vorlagen beeinflusst sein könnte. Deshalb werfe ich übersetzte Texte raus und nehme andere rein.

Ich war also in der letzten Zeit viel auf der Suche nach passenden Texten – sie müssen aus bestimmten Zeitspannen sein, als Drucke vorliegen und von bestimmten Druckorten (oder wenigstens aus deren Dialektgebiet) stammen. Ach ja, Gereimtes darf auch nicht. Und mindestens 4000 Wörter lang. Und sie müssen Originale oder Faksimiles als Vorlage haben.

Perfekt sind Texte, die elektronisch vorliegen, wie z.B. die Texte des Bonner Frühneuhochdeutschkorpus. Auch bei Wikisource findet sich für vergangene Jahrhunderte einiges, was sorgfältig von den Originalen abgetippt und korrekturgelesen wurde und sich damit auch bei Unsicherheiten immer vergleichen lässt. Weniger perfekt, aber als Lückenfüller geeignet ist auch GoogleBooks – die Texterkennung, die man über die alten Drucke gejagt hat, taugt zwar für Fraktur nichts, aber man kann sich viele alte Bücher als Pdf runterladen und dann per Auge durchsuchen. Ansonsten gibt es auch noch eine ganze Reihe von Unibibliotheken, die ihre alten Drucke und Manuskripte als Bilder digitalisieren, z.B. Heidelberg und Göttingen. (Heidelberg hat auch eine enorm ausführliche Linkliste zum Thema.)

Auf meiner Suche habe ich viele Texte angelesen – auch welche, die gar nicht geeignet, aber dafür sehr kurios sind. Zum Beispiel diesen (Foto von Historiograf):

Den Rest des Beitrags lesen »


Folgen

Erhalte jeden neuen Beitrag in deinen Posteingang.

Schließe dich 32 Followern an