Die Seite für Wortspiele und Wortspielereien

Was ist das häufigste Substantiv - Jahr versus Prozent?

Was ist das häufigste Substantiv - Jahr versus Prozent?

erstellt am von  in  Wortwissen 

„Was ist das häufigste Substantiv im Deutschen?“ – Gut, dass das noch keine Frage in einem Kreuzworträtsel war, denn über die Antwort scheiden sich die Geister. Der Grund: Die Grundlagen, in der Linguistik auch Korpora genannt, woraus die Häufigkeit von Wörtern gezählt wird, können variieren.

 JAHR ist laut Duden das häufigste Substantiv

So ist laut Duden das häufigste Substantiv im Deutschen derzeit das Wort JAHR. Die Dudenredaktion greift zur Ermittlung auf ein elektronisches System zurück, welches automatisch Texte durchsucht. Die Textbasis wird vornehmlich aus Zeitungstexten, Zeitschriftenartikel, Romane, Reden, Reparatur- und Bastelanleitungen generiert. Der so entstehende Korpus enthält derzeit zwei Milliarden Wortformen. Die Wörter des Korpus stehen jedoch nicht nur einfach so da. Sie sind zusätzlich mit besonderen sprachlichen Informationen angereichert, was als annotiert benannt wird. So kann sich die Dudenredaktion im elektronischen System zum Beispiel mit einem Klick alle männlichen Substantive im Plural anzeigen lassen.

 25 Millionen Wörter im Deutschen Referenzkorpus

Auch das Institut für Deutsche Sprache (IDS) hat eine Methode zur Korpus-Analyse und -Erschließung entwickelt, mit dessen Hilfe das Deutsche Referenzkorpus (DeReKo) analysiert werden kann. Das DeReKo ist laut IDS die weltweit größte Sammlung deutschsprachiger Korpora und dient zur empirischen Erforschung der deutschen Sprache.

Aktuell enthält diese Grundlage 25 Milliarden Wörter (Stand: September 2014) aus geschriebenen deutschsprachigen Texten. Auch das DeReKo greift auf belletristische, wissenschaftliche und populärwissenschaftliche Texte zurück und enthält eine große Zahl von Zeitungstexten sowie eine breite Palette weiterer Textarten.

Privat kann das DeReKo auch mit Hilfe einer kostenlosen Software durchsucht werden. Wichtig dabei ist die nicht-kommerzielle Nutzung der Ergebnisse, denn die Datenbank enthält urheberrechtlich geschützte Texte: „Das IDS kann diese Datenbank anbieten, weil Verlage, Zeitschriften und sonstige Personen bereit sind, dem IDS urheberrechtlich geschützte Texte zur Aufbereitung für linguistische Bedürfnisse zur Verfügung zu stellen und sie anschließend für wissenschaftliche, nicht-kommerzielle Zwecke zugänglich zu machen.“

Weitere Informationen findet Ihr hier: http://www.ids-mannheim.de/cosmas2/uebersicht.html

PROZENT ist in Wortliste der Uni Leipzig häufigstes Substantiv

Auch die Universität Leipzig bietet ein deutsches Textkorpora an, dass sogar im Netz frei durchsucht werden kann.

Grundlage des Wortschatz-Projektes, welches seit 1995 läuft, der Universität Leipzig sind laut eigenen Angaben öffentlich zugängliche Quellen. Welche das genau sind, ist leider nicht ersichtlich. In der dort vorliegenden Wortliste ist aber PROZENT das häufigste Substantiv im Deutschen.

 Werk von 1891, um das häufigste Substantiv zu finden?

PROZENT war auch das häufigste Substantiv in dem ersten und letzten empirisch erarbeiteten Häufigkeitswörterbuch der gesamten deutschen Sprache von Friedrich Wilhelm Kaeding, was 1891 veröffentlicht wurde. Kaedings Werk enthält einen Korpus von zehn Millionen Wortformen. Sein Ziel war es ein Stenografie-System fürs Deutsche zu entwickeln. Die Grundlage für den Korpus bildeten schriftliche Texte aus literarischen Werken, Zeitungstexten, amtlichen Bekanntmachungen, Verordnungen, Geschäftsbriefen und Fachliteratur.

 Das häufigste Substantiv im Deutschen ist schwer feststellbar

In fast allen Korpora, mit denen Sprachwissenschaftler, Fremdsprachenerwerbsforscher und Fremdsprachendidaktiker herausfinden könnten, welches nun das häufigste Substantiv im Deutschen ist, wird jedoch die gesprochene Sprache nicht berücksichtigt. Eine Ausnahme bildet das Häufigkeitswörterbuch von Randall L. Jones und Erwin Tschirner von 2005. Als Textkorpus für dieses diente neben Zeitungsartikeln, Sach- und Fachtexte, literarische Texte und Gebrauchstexte auch die gesprochene Sprache. Das Wort JAHR ist übrigens auch bei Erwin Tschirner das häufigste Substantiv auf Platz 51 des Häufigkeitswörterbuches, was für Deutsch als Fremdsprache entwickelt wurde.

Dennoch können wir nicht eindeutig festlegen, ob das Wort JAHR oder das Wort PROZENT nun das häufigste Substantiv im Deutschen ist. Spannend bleibt die Forschung dennoch!

Bildquellen

  • haeufigstes substantiv: Bildrechte bei der 1337 UGC GmbH