Show Less
Restricted access

Sprache(n) für Europa. Mehrsprachigkeit als Chance / Language(s) for Europe. Multilingualism as a Chance

Auswahl an Beiträgen des 52. Linguistischen Kolloquiums in Erlangen (2017) / Selected Papers of the 52nd Linguistics Colloquium in Erlangen (2017)

Series:

Edited By Jürg Strässler

Dieses Buch präsentiert eine Auswahl an Beiträgen des 52. Linguistischen Kolloquiums 2017 in Erlangen. Unter dem Konferenzthema «Sprache(n) für Europa – Mehrsprachigkeit als Chance» behandeln die 25 Beiträge in deutscher und englischer Sprache vor allem Erst- und Zweitspracherwerb, sprachdidaktische Aspekte sowie Mehrsprachigkeit in interkultureller Kommunikation. Darüber hinaus werden neben Experimenteller Linguistik, Corpus Linguistik und Medienlinguistik auch sprachhistorische, sprachpolitische und pragmatische Aspekte beleuchtet.

Show Summary Details
Restricted access

Korpusbasierte Konstruktion lexikalischer Datenbanken (Reinhard Rapp)

Extract

Reinhard Rapp

Korpusbasierte Konstruktion lexikalischer Datenbanken

1 Einführung

WordNet (Fellbaum 1998) ist eine umfangreiche lexikalische Datenbank der englischen Sprache, in der Substantive, Verben, Adjektive und Adverbien in Gruppen von Synonymen (Synsets) zusammengefasst sind, die jeweils einen Begriff beschreiben (siehe Abb. 1 für einen Beispieleintrag zum Wort palm). Synsets werden durch semantische und lexikalische Relationen miteinander verknüpft. WordNet hat sich zu einer wichtigen Ressource für die Verarbeitung semantischer Aspekte der Sprache entwickelt und diente als Modell für ähnliche lexikalische Datenbanken, die für viele andere Sprachen entwickelt wurden.

Die Erstellung eines WordNet für eine neue Sprache erfordert jedoch mehrere Jahre Arbeit und ist sehr kostspielig, wenn sie in der vom englischen WordNet bekannten Weise angegangen wird. Weiterhin sind hierbei unzählige subjektive Entscheidungen erforderlich, die mitunter kontrovers sein können. Andererseits haben Methoden zur Berechnung bedeutungsähnlicher Wörter auf der Basis großer Textkorpora, mit denen Synsets automatisch identifiziert werden können, eine beachtliche Leistungsfähigkeit erreicht, und die Ergebnisse kommen den Einschätzungen von Muttersprachlern nahe (Rapp 2009). Turney/Pantel (2010) sprechen davon, dass die meist mit Vector-Space-Modellen (VSM) erzielten Resultate sehr beeindruckend seien. Sie erwähnen, dass bei der Beantwortung von Fragen zur Synonymie von Wörtern, die einem Test of English as a Foreign Language (TOEFL) entnommen wurden, ein maschinelles System (Rapp 2003) eine Korrektheitsquote von 92,5 % erreichte, während Versuchspersonen, bei denen es sich allerdings nicht um Muttersprachler handelte, nur 64,...

You are not authenticated to view the full text of this chapter or article.

This site requires a subscription or purchase to access the full text of books or journals.

Do you have any questions? Contact us.

Or login to access all content.