Show Less

Syntaktisch-semantisches Parsing des Italienischen

Implementierung unter Berücksichtigung von Korpusdaten

Carsten Weber

Die Computerlinguistik als interdisziplinäres Forschungsgebiet zwischen Sprachwissenschaft und Informatik legt sowohl Wert auf eine fundierte sprachwissenschaftliche Theorie als auch auf eine effiziente Implementierung. Das Programm LA-it hat zum Ziel, beiden Teilgebieten im Rahmen eines automatischen Syntaxparsers gerecht zu werden, indem es sprachliche Phänomene des Italienischen maschinell verarbeitet. Im theoretischen Teil der Arbeit werden computerlinguistische Grundlagen und der Stand der Forschung näher betrachtet. Die praktische Komponente befasst sich mit morphologischen, syntaktischen und semantischen Konstruktionen, die innerhalb des Syntaxparsers implementiert sind. In einem Evaluationsteil werden sowohl quantitative als auch qualitative Analysen vollzogen.

Prices

Show Summary Details
Restricted access

6 Semantisches Lexikon

Extract

Die Aufgabe eines semantischen Lexikons im Rahmen der LAG besteht nach Hausser (2000, S. 293f.)1 in der Vermeidung von Ambiguita¨ten, die aufgrund von regelbasierten Wortbildungen und von im Lexikon stehenden Simplizia mit ei- gensta¨ndiger Bedeutung entstehen ko¨nnen. Das semantische Lexikon besteht dort hauptsa¨chlich aus etablierten Komposita und Derivaten, Simplizia stehen hingegen im Elementarlexikon. Fu¨r eine Verwendung des semantischen Lexikons in LA-it ist es jedoch wichtig, neben den Derivaten auch Simplizia der offenen Wortklassen in dieses aufzunehmen. Grund hierfu¨r ist, dass sowohl Derivate als auch Simplizia mit Valenzrahmen oder semantischen Informationen auszustatten sind. Alle Infor- mationen, die im semantischen Lexikon stehen, gehen u¨ber die regelbasierte mor- phologische Analyse hinaus, wie in Abbildung 6.1 auf Seite 86 zu sehen ist. Nach der morphologischen Analyse in LA-Morph wird das Analyseergebnis mit dem semantischen Lexikon verglichen, indem nach der regelbasierten Konkatenation der Allomorphe ein Abgleich mit diesem gemacht wird. Dies geschieht u¨ber einen Schlu¨ssel, der in LA-it das Attribut seg ist. In diesem steht, wie in Abschnitt 4.2 ero¨rtert, jeweils die korrekte Segmentierung der Grundform der Proplets.2 Somit ko¨nnen mit Hilfe dieses Attributs als Schlu¨ssel sowohl unkorrekte Segmentierun- gen im Analyseergebnis durch das semantische Lexikon ausgeschlossen werden als auch Zusatzinformationen, die wa¨hrend der regelbasierten Konkatenation nicht vorhanden sind, automatisch der Analyseausgabe hinzugefu¨gt werden. Dies ist fu¨r die syntaktisch-semantische Analyse von großer Bedeutung, wie in Abbildung 6.1 1Dort wird es urspru¨nglich als ” Grundformlexikon der Inhaltswo¨rter...

You are not authenticated to view the full text of this chapter or article.

This site requires a subscription or purchase to access the full text of books or journals.

Do you have any questions? Contact us.

Or login to access all content.