Show Less

Syntaktisch-semantisches Parsing des Italienischen

Implementierung unter Berücksichtigung von Korpusdaten

Carsten Weber

Die Computerlinguistik als interdisziplinäres Forschungsgebiet zwischen Sprachwissenschaft und Informatik legt sowohl Wert auf eine fundierte sprachwissenschaftliche Theorie als auch auf eine effiziente Implementierung. Das Programm LA-it hat zum Ziel, beiden Teilgebieten im Rahmen eines automatischen Syntaxparsers gerecht zu werden, indem es sprachliche Phänomene des Italienischen maschinell verarbeitet. Im theoretischen Teil der Arbeit werden computerlinguistische Grundlagen und der Stand der Forschung näher betrachtet. Die praktische Komponente befasst sich mit morphologischen, syntaktischen und semantischen Konstruktionen, die innerhalb des Syntaxparsers implementiert sind. In einem Evaluationsteil werden sowohl quantitative als auch qualitative Analysen vollzogen.

Prices

Show Summary Details
Restricted access

4 LA-Morph

Extract

Das in der vorliegenden Arbeit als Grundlage verwendete morphologische Ana- lysesystem entstammt in seiner Urfassung der Magisterarbeit ” Implementierung eines automatischen Wortformerkennungssystems fu¨r das Italienische mit dem Programm JSLIM“.1 Im Laufe einiger Erweiterungen und Anpassungen wurde das System in Weber (2010) an die Version 2.1 von JSLIM angeglichen und um mehrere Merkmale erweitert. Es liegt der syntaktisch-semantischen Analyse des Italienischen in LA-Hear zugrunde. Abschnitt 4.1 stellt die grundlegenden Eigen- schaften und Leistungen des italienischen Morphologiesystems dar. Abschnitt 4.2 erla¨utert, welche Maßnahmen notwendig sind, um das System auf die syntaktisch- semantische Analyse vorzubereiten. In Abschnitt 4.3 sind die Kategorieverga- ben diskutiert, mit der sa¨mtliche Lexikoneintra¨ge annotiert sind. Abschnitt 4.4 erla¨utert den Prozess der Erweiterung des Elementarlexikons mit zusa¨tzlichen Eintra¨gen. Hierbei wird versta¨rkt Wert auf die einfachere Generierung von Al- lomorphen in der Version 2.1 von JSLIM gelegt. Ergebnisse zu Testanalysen von Korpora und Texten sind in Abschnitt 4.5 aufgelistet und ausgewertet. 4.1 Leistungen Hauptleistungsmerkmal des implementierten Morphologiesystems ist die regelba- sierte Behandlung der italienischen Flexion und Derivation.2 Eine regelbasierte Komposition ist nicht implementiert, jedoch stehen Komposita als Vollformein- 1Die Arbeit wurde im Wintersemester 2006/2007 an der Professur fu¨r Compu- terlinguistik der Friedrich-Alexander-Universita¨t Erlangen-Nu¨rnberg vom Autor verfasst. 2Na¨here Informationen zum verwendeten Lexikon finden sich in Weber (2007, S. 37ff.). 48 tra¨ge im vor der Laufzeit generierten Allomorphlexikon.3 Die Grammatik4 besteht aus drei Regeln fu¨r die Flexion und die Derivation (Pra¨figierung und Suffigierung). Durch die Verwendung...

You are not authenticated to view the full text of this chapter or article.

This site requires a subscription or purchase to access the full text of books or journals.

Do you have any questions? Contact us.

Or login to access all content.