Show Less

Syntaktisch-semantisches Parsing des Italienischen

Implementierung unter Berücksichtigung von Korpusdaten

Carsten Weber

Die Computerlinguistik als interdisziplinäres Forschungsgebiet zwischen Sprachwissenschaft und Informatik legt sowohl Wert auf eine fundierte sprachwissenschaftliche Theorie als auch auf eine effiziente Implementierung. Das Programm LA-it hat zum Ziel, beiden Teilgebieten im Rahmen eines automatischen Syntaxparsers gerecht zu werden, indem es sprachliche Phänomene des Italienischen maschinell verarbeitet. Im theoretischen Teil der Arbeit werden computerlinguistische Grundlagen und der Stand der Forschung näher betrachtet. Die praktische Komponente befasst sich mit morphologischen, syntaktischen und semantischen Konstruktionen, die innerhalb des Syntaxparsers implementiert sind. In einem Evaluationsteil werden sowohl quantitative als auch qualitative Analysen vollzogen.

Prices

Show Summary Details
Restricted access

2 Theoretische Grundlagen

Extract

Die maschinelle Verarbeitung natu¨rlicher Sprache auf dem Computer setzt eine geeignete, auf computerlinguistische Fragestellungen zugeschnittene Sprachtheorie voraus. Der auf den Prinzipien der SLIM-Sprachtheorie beruhende Grammatik- formalismus der linksassoziativen Grammatik (im Folgenden LAG) erlaubt glei- chermaßen eine deskriptive Beschreibung und ein effizientes Parsen natu¨rlicher Sprache. Um LA-it, das syntaktisch-semantische Analysesystem des Italienischen, erfolgreich implementieren zu ko¨nnen, folgt diese Arbeit der SLIM-Sprachtheorie. Sie ist in Abschnitt 2.1 vorgestellt und erla¨utert. Der Grammatikformalismus der LAG wurde ab Hausser (1999) sukzessive fu¨r die Datenbanksemantik (im Folgen- den DBS) genutzt. Beide sind in Abschnitt 2.2 beschrieben. Der Parser, der auf Grundlage der SLIM-Sprachtheorie und LAG entwickelt wurde und auf dessen Basis auch die syntaktisch-semantische Analyse des Italienischen implementiert ist, heißt JSLIM. Abschnitt 2.3 befasst sich mit ihm. 2.1 SLIM-Sprachtheorie Ansa¨tze der SLIM-Sprachtheorie sind erstmals in Hausser (1989) skizziert. In Hausser (2000) beziehungsweise Hausser (2001) werden die Grundprinzipien der Theorie in einer deklarativen Spezifikation aufgestellt. SLIM ist hierbei ein Akro- nym fu¨r ” Surface compositional Linear Internal Matching“. Ziel ist es, die Analy- se natu¨rlichsprachlicher Kommunikation nach den ” allgemeinsten methodischen, empirischen, ontologischen und funktionalen Prinzipien“ (Hausser 2000, S. 8) zu strukturieren. Die Grundprinzipien lauten: • Surface compositional - auch methodisches Prinzip genannt: Es besagt, dass eine syntaktisch-semantische Komposition nur konkrete Wortformen 8verknu¨pfen darf. Null-Elemente, Identita¨tsabbildungen und Transformatio- nen sind ausgeschlossen.1 Fu¨r das Projekt LA-it bedeutet diese Definition, dass bei syntaktisch-semantischen Ableitungen keine zusa¨tzlichen Elemente in irgendeiner Form hinzugefu¨gt werden du...

You are not authenticated to view the full text of this chapter or article.

This site requires a subscription or purchase to access the full text of books or journals.

Do you have any questions? Contact us.

Or login to access all content.