Show Less

Syntaktisch-semantisches Parsing des Italienischen

Implementierung unter Berücksichtigung von Korpusdaten

Carsten Weber

Die Computerlinguistik als interdisziplinäres Forschungsgebiet zwischen Sprachwissenschaft und Informatik legt sowohl Wert auf eine fundierte sprachwissenschaftliche Theorie als auch auf eine effiziente Implementierung. Das Programm LA-it hat zum Ziel, beiden Teilgebieten im Rahmen eines automatischen Syntaxparsers gerecht zu werden, indem es sprachliche Phänomene des Italienischen maschinell verarbeitet. Im theoretischen Teil der Arbeit werden computerlinguistische Grundlagen und der Stand der Forschung näher betrachtet. Die praktische Komponente befasst sich mit morphologischen, syntaktischen und semantischen Konstruktionen, die innerhalb des Syntaxparsers implementiert sind. In einem Evaluationsteil werden sowohl quantitative als auch qualitative Analysen vollzogen.

Prices

Show Summary Details
Restricted access

3 Stand der Forschung

Extract

Inhalt dieses Kapitels ist die Vorstellung von drei verschiedenen Syntaxparsern fu¨r die italienische Sprache, die jeweils unterschiedliche Ansa¨tze der syntaktisch- semantischen Analyse realisieren. Alle haben gemeinsam, dass sie nicht den Gram- matikformalismus der LAG verwenden. Um die jeweiligen Sta¨rken und Schwa¨chen der Parser zu veranschaulichen, werden die Systeme jeweils dem Ansatz der LAG gegenu¨bergestellt. Der erstmals in Stock (1976) vorgestellte ” ATNSYS-Syntaxparser“ basiert auf dem Formalismus von Woods fu¨r ein ” Augmented Transition Network“ (dt. Erweiter- tes U¨bergangsnetzwerk 1, im Folgenden ATN) und hat zum Ziel, erza¨hlende und beschreibende Texte der italienischen Sprache zu analysieren. Die ” Turin University Treebank“ (im Folgenden TUT) ist ein von der Universita¨t Turin initiiertes Projekt zur Annotierung von Korpora. Ziele sind die Darstellung der Funktor-Argument-Struktur der italienischen Sprache und die Konvertierung des speziell fu¨r das Projekt entwickelten Annotierungssystems in das sogenannte ” Penn-Format“2, um Vergleiche mit Korpora anderer Sprachen zu gewa¨hrleisten. Das ” DANTE“-System wurde entwickelt, um kurze beschreibende Texte, in den meisten Fa¨llen Pressemitteilungen, automatisch zu parsen. 3.1 Der ATNSYS-Syntaxparser Nach der einfu¨hrenden Implementierung in Stock (1976) ist ein erster Ansatz zur Weiterentwicklung des ATNSYS-Syntaxparsers in Cappelli u. a. (1977) erla¨utert. Er basiert auf einem modifizierten Formalismus des ATN von Woods. Dieser ist in 1U¨bersetzung nach Hellwig (1989b). 2Eine Einfu¨hrung hierzu findet sich in Marcus u. a. (1993). 18 Abschnitt 3.1.1 vorgestellt. Abschnitt 3.1.2 erkla¨rt an einem Beispielsatz den Auf- bau und die Funktionsweise des ATNSYS-Syntaxparsers. Abschnitt 3.1.3...

You are not authenticated to view the full text of this chapter or article.

This site requires a subscription or purchase to access the full text of books or journals.

Do you have any questions? Contact us.

Or login to access all content.