Show Less
Open access

Multimodale Kommunikation im Social Web

Forschungsansätze und Analysen zu Text–Bild-Relationen

Series:

Christina Margrit Siever

Multimodalität ist ein typisches Merkmal der Kommunikation im Social Web. Der Fokus dieses Bandes liegt auf der Kommunikation in Foto-Communitys, insbesondere auf den beiden kommunikativen Praktiken des Social Taggings und des Verfassens von Notizen innerhalb von Bildern. Bei den Tags stehen semantische Text-Bild-Relationen im Vordergrund: Tags dienen der Wissensrepräsentation, eine adäquate Versprachlichung der Bilder ist folglich unabdingbar. Notizen-Bild-Relationen sind aus pragmatischer Perspektive von Interesse: Die Informationen eines Kommunikats werden komplementär auf Text und Bild verteilt, was sich in verschiedenen sprachlichen Phänomenen niederschlägt. Ein diachroner Vergleich mit der Postkartenkommunikation sowie ein Exkurs zur Kommunikation mit Emojis runden das Buch ab.
Show Summary Details
Open access

5 Social Tagging

5  Social Tagging

Im Fremdwörter-Duden findet sich das Lemma Tagging mit der Eintragsinformation »das Taggen, Strukturieren« (Duden 2010). Schlägt man das Verb taggen nach, so trifft man auf die folgende, hier interessierende Bedeutung: »(EDV) einen Text mithilfe von Tags (1) strukturieren« (ebd.).215 Unter dem Eintrag Tag wiederum ist zu lesen: »(EDV) Markierungselement von Beschreibungssprachen (z. B. HTML) zur Strukturierung der Dokumente« (ebd.). Diese Definition ist einerseits enger als diejenige von taggen, da sie explizit auf Beschreibungssprachen referiert, andererseits gleichzeitig auch weiter, da sich das Tagging nicht nur auf Texte, sondern allgemeiner auf Dokumente bezieht. Eine der bekanntesten Beschreibungssprachen ist die Hypertext Markup Language (HTML), welche im WWW verwendet wird. Mittels sogenannter HTML-Deskriptoren, d. h. Tags, werden beispielsweise Schriftgrößen und Auszeichnungen im Fließtext festgelegt (Rautenberg 2003: 265), weshalb HTML zuweilen auch als Auszeichnungssprache bezeichnet wird. Soll ein Text fett oder kursiv dargestellt werden, verwendet man folgende Tags: <b>fett</b> bzw. <i>kursiv<i>. Der Terminus Tag kommt aus dem Englischen und bedeutet Schild, Etikett oder Markierung (Duden 2005b).216

Der Ausdruck Tagging trägt darüber hinaus jedoch noch eine weitere Bedeutung, die noch nicht im Duden verzeichnet ist. Während die oben genannten Tags der Gestaltung und nicht – wie es im Duden steht – der Strukturierung von Inhalten dienen, wird das Verb taggen auch im Sinne von verschlagworten oder indexieren verwendet, und zwar insbesondere in den digitalen Medien bzw. im Social Web. Zumeist spricht man präziser auch von Social Tagging: »Während nach einem breiten Verständnis mit dem Begriff Tags alle Arten von Metadaten gemeint sein können, ist mit Social Tagging das gemeinschaftliche Indexieren von Inhalten« (Panke, Gaiser 2008: 23) gemeint. Schmidt (2009a: 157) definiert Tagging als »eine bestimmte Praxis des Informationsmanagements, ← 141 | 142 → die auf der freien Vergabe von individuell wählbaren Schlagworten, den ›tags‹ beruht.« Der Zweck des Social Taggings besteht darin, große Datenmengen so zu annotieren, dass sie später (wieder-)gefunden werden können. Das Social Tagging, gelegentlich auch »Collaborative Tagging« (Frohner 2010: 16), »social classification«, »distributed classification«, »ethnoclassification« (Matusiak 2006: 287), »user-generated classification« (Schmidt 2013a: 144) oder »social indexing« (Voß 2007b: 244) genannt, ist eine typische Praxis des Social Webs, an der »das webbasierte Informationsmanagement von Laien sowie das Entstehen kollektiver Wissensordnungen auf der Grundlage individueller Handlungen besonders deutlich wird« (Schmidt 2009a: 157). Bereits 1988 wurde das Tagging im Lotus-Magellan-Softwarepaket eingesetzt; mit dem Programm konnten Daten über eine Volltextsuche schnell wiedergefunden werden (vgl. Frohner 2010: 17). Bekannt geworden ist das Tagging aber vor allem im Zuge der Ausbreitung des Social Webs. Die ersten beiden Social-Web-Anwendungen, die Social Tagging anboten, waren der 2003 in Betrieb genommene Social-Bookmarking-Dienst Delicious sowie die 2004 entstandene Foto-Community Flickr (vgl. Panke, Gaiser 2008: 23). Seither hat die Anzahl der Webseiten mit Social-Tagging-Funktionen sowie die Anzahl der taggenden Nutzerinnen und Nutzer rapide zugenommen (vgl. P. Schmitz 2006a: 1). Kolbitsch (2007: 77) bezeichnete im Jahr 2007 Flickr als »one of the most popular tagging services currently available«, und noch immer ist Flickr die Nummer eins im Bereich der Foto-Communitys. Nach dem Alexa-Ranking217 belegt Flickr in der weltweiten Rangliste als erste Foto-Community Platz 50218 und auch im deutschsprachigen Raum ist Flickr die beliebteste Foto-Community (CH: 40, D: 49, A: 53).

Neben Foto-Communitys sind es vor allem Social-Bookmarking-Dienste sowie Blogs, in denen das Social Tagging angewendet wird. Solche Webseiten können durch Suchmaschinen automatisch indexiert werden, sodass die Tags im besten Fall einen Zusatznutzen erbringen, sofern darin additionale Information ← 142 | 143 → enthalten ist.219 Bei Bildern hingegen sind Tags für die Suche (noch) eine Conditio sine qua non (vgl. Kapitel 5.6).

Zunächst werden in Kapitel 5 die verschiedenen Arten von Tags und Tagging-Systemen sowie Kriterien zur Typologie der letztgenannten präsentiert. In Kapitel 5.2 stehen die Nutzerinnen und Nutzer von Tagging-Systemen im Zentrum der Betrachtung. Es wird erläutert, welche Typen von Userinnen und Usern es gibt und welche Rollen sie einnehmen sowie welche Motivation die Taggenden antreibt. Sodann wird in 5.3 eine Definition von Folksonomien anhand ihrer Eigenschaften sowie anhand einer Abgrenzung zu Taxonomien vorgenommen und ausgeführt, welche Vor- und Nachteile Folksonomien mit sich bringen. In Kapitel 5.4 werden Unterschiede in Systemen zur Wissensorganisation mit Fokus auf Folksonomien und Ontologien beleuchtet. Im Anschluss daran werden in Kapitel 5.5 Möglichkeiten der Visualisierung von Folksonomien sowie deren Funktionen in Tagging-Systemen aufgezeigt. Da in dieser Arbeit die Verschlagwortung von Bildern ein Untersuchungsgegenstand ist, wird in Kapitel 5.6 ausgeführt, dass sprachliche Informationen für das Retrieval220 eine unerlässliche Bedingung darstellen. Es wird dabei die komplexe Frage erörtert, auf welche Art und Weise eine adäquate Wissensrepräsentation erreicht werden kann. Wie Tag-Labels aufgrund von sprachlich-formalen und auch funktionalen Aspekten kategorisiert werden können, wird in Kapitel 5.7 dargelegt. Es wird dazu eine kritische Diskussion bereits bestehender Typologien aus der Informationswissenschaft vorgenommen. Eine aus linguistischer Sicht brauchbare Typologie wurde im Anschluss daran für die empirische Analyse der vorliegenden Arbeit erarbeitet. In die Typologie flossen zudem Aspekte ein, die in den Kapiteln 5.8 und 5.9 diskutiert werden. Das Social Tagging ist aus linguistischer Sicht deshalb interessant, weil sich mangels kontrollierter Vokabulare (vgl. Kapitel 5.3) in mancherlei Hinsicht sprachliche Herausforderungen ergeben (Kapitel 5.7). Die Schwierigkeiten bestehen sowohl auf der Tagging- als auch auf der Retrievalseite, und dies auf mehreren sprachlichen Ebenen: Mehrsprachigkeit, Morphologie, Graphie und Semantik. Verschiedene Arten von semantischen Relationen werden schließlich in Kapitel 5.9 thematisiert. Hier wird der Frage nachgegangen, welche paradigmatischen Relationen in Folksonomien versteckt vorhanden sind und zur Charakterisierung von Bildern verwendet werden (vgl. auch die Ergebnisse der empirischen Untersuchung in Kapitel 9.2.3). ← 143 | 144 →

5.1  Tags und Tagging-Systeme

Wie bereits erwähnt sind Tags von Nutzerinnen und Nutzern frei wählbare Schlagworte, die im Fall von Foto-Communitys Metadaten zu den Bildern (= Primärdaten) darstellen. Unter Metadaten versteht man die »Gesamtheit der semantischen, strukturellen, administrativen und technischen Daten, die bei der formalen und inhaltlichen Aufbereitung von Wissens- und Informationsobjekten jeder medialen221 Ausprägung erstellt werden, um ein syntaktisch und semantisch kontrolliertes Retrieval nach diesen Objekten zu ermöglichen« (Kuhlen 2004: 422). Müller-Prove (2008: 16) unterscheidet zwischen einem Tag, einem Tag-Label und einer Tag-Instanz. Unter einem Tag-Label versteht er frei wählbare Zeichenketten. Ein neues Label entsteht immer dann, wenn ein Nutzer oder eine Nutzerin damit ein Objekt taggt. In diesem Moment wird »auf der Systemebene [ein] Datenbankeintrag [erzeugt], der die Relation zwischen dem Objekt, dem Tag-Label und dem Anwender ausdrückt« (ebd.: 16); dies ist die sogenannte Tag-Instanz. Der Terminus Tag schließlich kann formal folgendermaßen definiert werden: »Ein Tag ist […] ein Paar aus Tag-Label und der Menge aller Objekte, für die es Tag-Instanzen mit eben diesem Label gibt: (Labeli, {Objectj | Ǝ (Objectj, Labeli, Userx)})« (ebd.: 17). In der hier vorliegenden linguistischen Untersuchung spielen vor allem die Tag-Labels eine wichtige Rolle. Wenn also in dieser Arbeit von Tags die Rede ist, sind damit meistens die Tag-Labels gemeint, die jedoch gleichzeitig immer – selbst im Falle von unikalen Tags – eine Tag-Instanz besitzen und deshalb auch als Tags bezeichnet werden können. Unikale Tags definiere ich als Tags, bei denen das Tag-Label innerhalb eines Systems (z. B. auf Flickr) zu einem spezifischen Zeitpunkt nur ein einziges Mal vergeben wurde, die Menge aller zugehörigen Objekte ist folglich gleich eins.222 Unter exklusiven Tags versteht man laut Heckner (2009: 131) Tag-Labels, die zwar mehrmals genutzt wurden, jedoch ausschließlich von einem einzigen Nutzer oder einer einzigen Nutzerin. Als shared tags schließlich bezeichnet Heckner (2009: 131) Tag-Labels, die in einer bestimmten Gruppe von Nutzerinnen und Nutzern einer Community verwendet werden. Noch treffender deklariert Frohner (2010: 57) solche Tags als Identifizierungs-Tags, mit denen zum Beispiel in einem Projekt alle Teilnehmenden die ← 144 | 145 → relevanten Ressourcen markieren und auffinden können. Es handelt sich dabei oftmals um Buchstabenfolgen, die in keiner Sprache eine Bedeutung tragen, damit das verwendete Tag auch tatsächlich ein eindeutiges Identifizierungs-Tag bleibt. Auf Flickr beispielsweise findet man Gruppennamen-Tag-Labels wie »eyckata«.223 In der erwähnten Gruppe ist dies wichtig, da ein Wettbewerb stattfindet und alle Bilder daran teilnehmen, die mit dem Tag-Label »eyckata« versehen worden sind.

Die Menge aller Tags, die einem Objekt zugewiesen worden sind, bezeichne ich als Tag-Serie: Mit der Bezeichnung Serie, welche auf das lateinische Verb serere (= fügen, reihen, knüpfen) zurückgeht (Duden 2007c), soll zum Ausdruck gebracht werden, dass einerseits die Reihenfolge der Vergabe der Tags und andererseits auch die Relationen zwischen den einzelnen Tags relevant sind. In Tagging-Systemen, die eine Mehrfachzuweisung eines Tag-Labels zu einer Res-source erlauben, nennt man die Gesamtheit der Tag-Labels zu einer Ressource »Docsonomie« (Peters et al. 2011: 1).224 Wird von einem einzelnen Tag in einer Tag-Serie ausgegangen, dann können die übrigen Tags derselben Serie als Co-Tags bezeichnet werden (vgl. Peters, Stock 2008: 79, die darunter jedoch alle Tags innerhalb einer Untersuchung verstehen). Die Gesamtheit aller Tags innerhalb eines Systems schließlich wird Folksonomie genannt (vgl. Kapitel 5.3).

Anders als in hierarchischen Ordnungssystemen werden beim Social Tagging also einem Objekt üblicherweise mehrere Tag-Labels zugeordnet, d. h. ein Objekt kann mehreren Kategorien zugewiesen werden (vgl.

Müller-Prove 2008: 16). Folksonomien sind also nicht kriterien-, sondern ressourcen-zentriert (Peters 2009: 3). In einigen Tagging-Systemen wiederum können mehrere Nutzerinnen und Nutzer einem Objekt dasselbe Tag zuteilen – man spricht hier vom sogenannten Bag-Model. Bei Tagging-Systemen, bei denen jeder Ressource Tag-Labels nur einmal zugeordnet werden können, ist die Rede vom Set-Model (vgl. Voß 2008: 176). Beim Bag-Model wird die Anzahl der Vergabe der jeweiligen Tags erfasst, wodurch die Popularität einzelner Tag-Labels ersichtlich wird. Je nach System bzw. den Einstellungen innerhalb einzelner Systeme ist es allen Nutzerinnen und Nutzer oder nur den Urheberinnen und Urhebern der zu taggenden Ressource erlaubt, zu taggen. So zählen Golder und Hubermann (2005: 1) Flickr nicht zum »Collaborative Tagging«, während Vander Wal (2008: 8) zu Recht einräumt, dass in Flickr-Gruppen das kollaborative Taggen praktizierbar ist, da durch den Beitritt in eine Gruppe vom System her zwangsläufig allen an ← 145 | 146 → deren Gruppenmitgliedern ein Tagging-Recht eingeräumt wird. Darüber hinaus können alle Flickr-Userinnen und -User festlegen, welche Personengruppen das Tagging-Recht erhalten sollen.

Das Social Tagging stellt im Gegensatz zur automatischen Verschlagwortung eine manuelle Art der Verschlagwortung dar, die man auch intellektuelle Erschließung nennt (vgl. Frohner 2010: 20). Einige Social-Tagging-Systeme unterstützen die Nutzerinnen und Nutzer jedoch auch bei der Tag-Vergabe, sei dies durch die automatische Vervollständigung oder durch Vorschläge, beispielsweise bei Bag-Model-Systemen, bei denen die Objekte bereits von anderen Userinnen und Usern getaggt wurden oder bei Flickr mit Tags, die der Nutzer oder die Nutzerin bereits anderen Ressourcen zugeteilt hat, sogenannte Recommended Tags (vgl. Panke, Gaiser 2008: 24). Bei Vorschlägen durch das System wird mit Related Tags gearbeitet: Indem einem Objekt meist mehrere Tags zugewiesen werden, entstehen Verknüpfungen. Es wird analysiert, mit welcher Häufigkeit verschiedene Tags gemeinsam auftreten und ob demzufolge eine stärkere oder schwächere Relation vorliegt (vgl. Held, Cress 2008: 38). In linguistischer Terminologie gesprochen handelt es sich also gewissermaßen um Kookkurrenzen, d. h. »das gemeinsame Vorkommen zweier oder mehrerer Wörter in einem Kontext von fest definierter Größe […]. Das gemeinsame Vorkommen sollte höher sein, als bei einer Zufallsverteilung aller Wörter erwartbar wäre« (Lemnitzer, Zinsmeister 2006: 197). Solche Kookkurrenzen können auf Flickr angezeigt225 werden; gibt man beispielsweise das zweithäufigste Tag aus dem für diese Analyse erhobenen Kleinkorpus ein, nämlich Deutschland, so erhält man folgende Related Tags:

       <?xml version=»1.0« encoding=»utf-8« ?>

       <rsp stat=»ok«>

                   <tags source=»deutschland«>

                                      <tag>germany</tag>

                                      <tag>berlin</tag>

                                      <tag>sky</tag>

                                      <tag>wolken</tag>

                                      <tag>architecture</tag>

                                      <tag>himmel</tag>

                                      […]226

                   </tags>

       </rsp> ← 146 | 147 →

Über eine offene Programmierschnittstelle (API, Application Programming Interface)227 wurde ein Related-Tag-Browser erstellt, bei dem dieselben Daten visualisiert werden; in der Mitte der Grafik sind Bilder zu sehen, die mit diesen Tags versehen worden sind (vgl. Abbildung 18).

Abbildung 18:  Visualisierung von Related Tags228

image

Die automatische Vervollständigung bei der Tag-Vergabe und die Vorschläge des Systems haben zur Folge, dass bestimmte Tags häufiger benutzt werden als andere (vgl. Müller-Prove 2008: 18). Darüber hinaus können sich in der Praxis des Taggens in einer Tagging-Community bestimmte Muster herausbilden. Das bedeutet etwa bezüglich der Tag-Distribution, dass wenige Tags von vielen und viele Tags ← 147 | 148 → von wenigen verwendet werden. Man geht seit Mathes (2004) davon aus, dass die Tag-Distribution innerhalb eines Systems üblicherweise dem sogenannten Power Law folgt (vgl. Guy, Tonkin 2006). Diese Art der Distribution tritt v. a. bei sogenannten Broad Folksonomies (vgl. Kapitel 5.3) auf und kann mit folgender Gleichung angegeben werden: »f(x)= C / xa, bei der C eine Konstante, x der Rang des gegebenen Tags und a ein konstanter Wert (normalerweise zwischen 1 und 2) ist« (Peters, Stock 2008: 79). Die populären Tags können deutlich von den niederfrequenten Tags unterschieden werden; letztere bilden im Power-Law-Graphen den sogenannten Long Tail, dessen gelb eingefärbte Fläche gleich groß ist wie die grüne der populären Tags (vgl. Abbildung 19).229

Abbildung 19:  Power-Law-Graph mit Long Tail230

image

Während in Abbildung 19 die ideale Kurve angezeigt wird, sind in Abbildung 20 die im Social-Bookmarking-Dienst Delicious zur Website flickr.com vergebenen Tags zu sehen. Dieses zufällig herausgegriffene Beispiel zeigt, dass die Verteilung der Tags tatsächlich dem Power Law folgt: Die populären Tags sind photos, flickr, photography, photo, sharing, images und web2.0, gefolgt von einem Long Tail. ← 148 | 149 →

Abbildung 20:  Tags zur Website flickr.com auf Delicious231

image

Peters et al. (2011: 2) unterscheiden zwischen den sehr populären sogenannten Power-Tags, den sehr seltenen Long-Tail-Tags sowie den dazwischen liegenden Luhn-Tags. Sie konnten nachweisen, dass die Retrieval-Effektivität bei Ein-Wort-Abfragen erhöht wird, wenn bei der Suche in Bag-Model-Systemen ausschließlich Power-Tags berücksichtigt werden (vgl. ebd.: 2).

In den Tabellen 7 bis 10 wird ein Überblick geboten über die verschiedenen, teilweise bereits erwähnten Kriterien, die herangezogen werden können, um ein Tagging-System zu charakterisieren. Die Aufstellung in Tabelle 7 basiert auf Überlegungen von Marlow et al. (2006: 34–35), die als erste eine Typologie vorgeschlagen haben. ← 149 | 150 →

Tabelle 7:  Typologie von Tagging-Systemen nach Marlow et al. (2006: 34–35)

Kriterium

Erläuterung

Tagging Rights

In jedem System ist geregelt, wer Tags vergeben oder löschen darf. Es kann unterschieden werden zwischen Selftagging (nur die Urheberin oder der Urheber der Ressource kann taggen) und Free-for-all-Tagging (jeder kann taggen). In vielen Systemen gibt es dazwischen Abstufungen. Oftmals können die Nutzerinnen und Nutzer bestimmen, ob alle oder nur Freunde und Familie taggen dürfen. Dasselbe gilt für das Löschen von Tags, wo es die Abstufungen alle, niemand, Tag-Urheber und Ressourcen-Urheber gibt.

Tagging Support

Es können drei Systeme unterschieden werden, wobei 1) und 2) sich ausschließlich auf Bag-Model-Systeme beziehen: 1) Blind Tagging bedeutet, dass nicht sichtbar ist, welche Tags einer Ressource bereits zugewiesen wurden. 2) Beim Viewable Tagging sind die bereits vergebenen Tags sichtbar. 3) Suggestive Tagging, bei dem das System aufgrund verschiedener Faktoren den Nutzerinnen und Nutzern mögliche Tags (Recommended Tags) vorschlägt.

Aggregation

Unterscheidung von Systemen, welche die mehrfache Tag-Vergabe zu einer Ressource zulassen (Bag-Model) oder nicht (Set-Model).

Type of Object

Beliebte Ressourcen, die mit Tags versehen werden können, sind Websites in Social-Bookmarking-Diensten wie Delicious, wissenschaftliche Publikationen (z. B. auf CiteULike oder Connotea), Blogbeiträge, Fotos und Videos sowie Audio-Dateien wie Lieder oder Podcasts. Je nachdem, welcher Art die getaggte Ressource ist, fallen auch die Tags anders aus. So sind Tags mit der Funktion Aufgabenorganisation v. a. in Social-Bookmarking-Diensten zu erwarten und weniger in Social-Sharing-Communitys.

Source of Material

Hier geht es um die Frage, wer Ressourcen bereitstellen kann, beispielsweise Nutzerinnen und Nutzer einer Community oder die Plattformbetreiber (z. B. Amazon). Je nach System gibt es auch Einschränkungen, was die Types of Object betrifft. Auf Flickr konnten beispielsweise zunächst nur statische Bilder hochgeladen werden, erst später auch dynamische.

Resource Connectivity

Inhalte können über die Verbindungen durch identische Tag-Labels hinaus auf andere Art und Weise miteinander verbunden sein, beispielsweise über Hyperlinks oder Gruppierungen, auf Flickr in Alben, Gruppen oder Galerien.

Social Connectivity

Die meisten Systeme erlauben es den Nutzerinnen und Nutzern, sich mit anderen Userinnen und Usern zu verbinden. Es kann hier unterschieden werden zwischen einseitigen und gegenseitigen Verbindungen (follower vs. friend). Nutzer und Nutzerinnen können sich auch zu Interessensgemeinschaften zusammenschließen. Innerhalb solcher Gruppierungen können sich auch bestimmte Tags etablieren, die gemeinsam verwendet werden. ← 150 | 151 →

Heckner (2009: 68–69) hat die Typologie von Marlow et al. (2006: 34–35) als Basis für eine eigene Typologie verwendet, die er um die in Tabelle 8 aufgelisteten Kriterien erweitert hat:

Tabelle 8:  Weitere Kriterien zur Typologie von Tagging-Systemen nach Heckner (2009: 68–69)

Kriterium

Erläuterung

Tagging Mode

Tagging-Systeme unterscheiden sich darin, ob die Tag-Vergabe zu einzelnen Ressourcen obligatorisch oder fakultativ erfolgt.

Resource Visibility

Getaggte Objekte können für die Öffentlichkeit zugänglich oder nicht zugänglich gemacht werden.

Domain of Usage

Es kann zwischen Communitys privater Natur sowie Business-Communitys unterschieden werden.

Application Context

Tagging-Systeme können webbasiert sein, es existieren jedoch auch entsprechende Desktop-Anwendungen. Für viele webbasierte Communitys stehen Desktop-Anwendungen zur Verfügung, die eine einfachere Organisation der Daten erlauben.

Primary User Motivation

Die Systeme können auch nach den Motiven der Nutzerinnen und Nutzer eingeteilt werden. In einigen Systemen verwenden Userinnen und User die Tags hauptsächlich für das persönliche Informationsmanagement, in anderen steht das Social Sharing im Vordergrund (vgl. dazu auch Kapitel 5.2).

Schließlich hat Voß (2007a: 6) ebenfalls die Typologie von Marlow et al. (2006: 34–35) aufgegriffen und um eigene Kriterien ergänzt (vgl. Tabelle 9).

Tabelle 9:  Weitere Kriterien zur Typologie von Tagging-Systemen nach Voß (2007: 6)

Kriterium

Erläuterung

Vocabulary Control

In Tagging-Systemen können den Nutzerinnen und Nutzern Restriktionen bei der Vergabe von Tags auferlegt werden.232 ← 151 | 152 →

Vocabulary Connectivity

In Anlehnung an die Resource Connectivity geht es hier darum, welche Relationen zwischen den einzelnen Tags vorhanden sind (z. B. monohierarchisch vs. multihierarchisch). Meines Wissens gibt es jedoch kein Tagging-System, in dem Relationen angezeigt werden können. Vielmehr müssen die Nutzerinnen und Nutzer die einzelnen Tags rezipieren und in Relation zueinander setzen (vgl. Kapitel 5.9).

Automatic Tagging

Automatische Tags (auch: maschinelle Tags) können durch das System vergeben werden. So kann beispielsweise angegeben werden, um welche Art von Daten es sich handelt. Bei Fotos können auf Flickr über die Exif-Daten (Exif = Exchangeable Image File Format) aufgrund von GPS-Koordinaten Geo-Tags erstellt werden, außerdem enthalten diese Angaben wie das Datum und die Uhrzeit, die Orientierung (Hoch- oder Querformat), Brennwerte, Belichtungszeiten, ISO-Werte etc. Bei Flickr sehen maschinelle Tags beispielsweise wie folgt aus: exif:model=nikon d300s für das Kameramodell und exif:lens=50.0 mm f/1.4 für das verwendete Objektiv. Maschinelle Tags bestehen, wie man an den Beispielen erkennen kann, stets aus drei Teilen: dem Namensraum (engl. namespace), der Eigenschaft (engl. predicate) und dem dazugehörigen Wert: Namensraum:Eigenschaft=Wert (vgl. Weller 2010: 374). Maschinelle Tags können nicht nur von Maschinen, sondern auch manuell erstellt werden; diese können dann von Maschinen gelesen werden.

In Tabelle 10 sind zu den bereits genannten Kriterien ergänzend noch die Tag Visibility und der Tag Input/Output aufgeführt.

Tabelle 10:  Eigene weitere Kriterien zur Typologie von Tagging-Systemen

Kriterium

Erläuterung

Tag Visibility

Mit der Resource Visibility hängt auch die Tag Visibility zusammen: Ressourcen können zwar für alle sichtbar sein, jedoch kann bei jedem einzelnen Tag, das man vergibt, ausgewählt werden, ob es nur für die taggenden Nutzerinnen und Nutzer oder für alle sichtbar gemacht werden soll. Vor allem in Bibliothekskatalogen ist diese Unterscheidung möglich.

Tag Input/ Output

Je nach Tagging-System gibt es Restriktionen, was die Tag-Eingabe betrifft: Es gibt Systeme, in denen keine mehrteiligen Tags erlaubt sind, in anderen können durch Markierung auch Tag-Labels hinzugefügt werden, die aus mehreren Wortformen bestehen, beispielsweise mithilfe von Anführungszeichen. Auch der Umgang mit Nicht-ASCII-Zeichen wie Umlaute, Eszett etc. fällt unterschiedlich aus. Zudem gibt es bei der Tag-Ausgabe in einigen Tagging-Systemen Besonderheiten, die beachtet werden müssen wie beispielsweise die Case Sensitivity. ← 152 | 153 →

Es ist zu erwarten, dass die Tags bzw. die Folksonomien bezüglich Form und Funktion (vgl. Kapitel 5.7) unterschiedlich ausfallen, je nachdem, wie das jeweilige einzelne Tagging-System beschaffen ist. Heckner et al. (2008: 9) haben die Funktionen des Taggings in den Social-Sharing-Communitys Flickr und YouTube sowie den Social-Bookmarking-Diensten Delicious und Connotea analysiert. Sie stellten fest, dass bei Fotos oftmals der Inhalt, der Ort und die Bezeichnung des Kameratyps angegeben werden; außerdem sind Fotos im Vergleich zu anderen Ressourcen häufiger nicht mit Tags versehen (vgl. aber Kapitel 9.2.1). In Videos werden oft Personen markiert. Sowohl Fotos als auch Videos werden in extenso getaggt. Hier spricht man vom sogenannten Overtagging (vgl. ebd.: 8), welches zum Ziel hat, dass der Inhalt von möglichst vielen Nutzerinnen und Nutzern entdeckt und rezipiert wird. Wissenschaftliche Publikationen auf Connotea sind häufig mit Zeitangaben und zu erledigenden Aufgaben getaggt. Diese Ergebnisse sind wenig erstaunlich, zumal die Userinnen und User der verschiedenen Systeme unterschiedliche Ziele verfolgen: Wie der Terminus Social Sharing bereits sagt, wollen Nutzerinnen und Nutzer von YouTube und Flickr Ressourcen teilen, während in den Social-Bookmarking-Systemen und insbesondere bei Connotea das persönliche Informationsmanagement im Vordergrund steht (vgl. Heckner 2009: 156). In der vorliegenden Arbeit wird vom Tagging-System auf Flickr ausgegangen; in Kapitel 5.10 wird ausgeführt, wie die Ausprägungen der oben aufgeführten Kriterien auf Flickr konkret aussehen. Es wäre darüber hinaus lohnenswert, in weitergehenden linguistischen Analysen Folksonomien in verschiedenen Tagging-Systemen, die in einzelnen der genannten Parameter voneinander abweichen, miteinander zu vergleichen.

Die beiden von mir ergänzten Aspekte in Tabelle 10 sind für sprachwissenschaftliche Untersuchungen von besonderer Relevanz: Bei Analysen von Folksonomien können nur öffentlich zugängliche Tags verwendet werden. Es kann unterschieden werden zwischen nicht-öffentlichen Tags bei nicht-öffentlichen Ressourcen (Resource Visibility) sowie nicht-öffentlichen Tags bei öffentlichen Ressourcen (Tag Visibility). Es ist davon auszugehen, dass beide Arten von nichtöffentlichen Tags sich von öffentlichen unterscheiden, beispielsweise auf der Ebene des Inhalts. So könnte man aufgrund der Ausführungen in Kapitel 6 vermuten, dass nicht-öffentliche Tags eher privater Natur sind, dass also möglicherweise Personen- oder Ortsnamen sowie andere private Daten angegeben werden. Darüber hinaus ist es wahrscheinlich, dass bei nicht-öffentlichen Tags, die der persönlichen Datenorganisation dienen, viel mehr unikale Tags zu finden sind, die von anderen Nutzerinnen und Nutzern gar nicht verstanden würden und deshalb für sie nutzlos wären. ← 153 | 154 →

Auch der zweite wichtige Aspekt des Tag Inputs/Outputs sei an dieser Stelle ausgeführt: Von Relevanz für die Analyse von Folksonomien ist nicht nur, wie das System funktioniert, sondern auch, ob die Nutzerinnen und Nutzer des Systems die Regeln des Tag In- und Outputs kennen. Als Beispiel können mehrteilige Tags wie »rote rose« genannt werden. In Systemen wie Flickr, in denen mehrteilige Tags zugelassen sind, könnte eine Ressource also wie im genannten Beispiel mit Spatium getaggt werden, wobei mit Anführungszeichen markiert werden muss, welche Wörter zusammengehören. In Systemen, die dies nicht erlauben, müsste auf Varianten wie »roterose«, »roteRose«, »rote_rose« oder »rote.rose« ausgewichen werden. Hieran lassen sich verschiedene Schwierigkeiten aufzeigen. Wenn Nutzer oder Nutzerinnen nach Bildern suchen möchten, die eine rote Rose enthalten, so müssen sie sich entweder für einen der genannten Suchterme entscheiden und in Kauf nehmen, dass ihnen nur ein Teil der gesuchten Bilder angezeigt wird, oder aber sie geben die verschiedenen Suchterme nacheinander ein.233 Denn bei der Vergabe von mehrteiligen Tags herrscht weder Konsens unter den Userinnen und Usern eines einzelnen Systems noch zwischen verschiedenen Tagging-Systemen. Bezüglich des Tag Outputs auf Flickr kann als Beispiel das Eszett genannt werden: Klickt ein User oder eine Userin auf das Tag »ausreißen«, dann gibt Flickr sowohl Treffer für »ausreißen« als auch »ausreisen« an. Das Eszett wird automatisch in ein »s« umgewandelt, wodurch Homographe entstehen können wie z. B. »in Maßen« und »in Massen«.234 Nutzerinnen und Nutzer, die das wissen wissen, taggen ihre Bilder allenfalls zusätzlich mit Doppel-S. Ferner ist eine etwaige Case Insensitivity beim Tag Output zu nennen: Das System setzt Groß- oder Kleinbuchstaben in Tags gleich, weshalb folglich die Groß-/Kleinschreibung sowohl bei der Tag-Vergabe als auch der Suche außer Acht gelassen werden kann.

Die genannte Problematik des Tag Input/Output muss insbesondere vor dem Hintergrund gesehen werden, dass einzelne Nutzerinnen und Nutzer in unterschiedlichen Tagging-Systemen aktiv sind und entweder die Spezifika der einzelnen Systeme nicht genau kennen, oder aufgrund von Routinen beim Taggen ← 154 | 155 → in unterschiedlichen Systemen identisch agieren. Es bleibt abzuwarten, ob in Zukunft ein Tagging über einzelne Systeme hinweg möglich wird (vgl. Heckner 2009: 99).

5.2  Akteure in Tagging-Systemen

Der Zweck von Social-Tagging-Systemen ist ein doppelter: Daten, die herkömmlich auf dem eigenen Computer gespeichert und verwaltet wurden, werden nunmehr online archiviert. Unter diesem sogenannten Cloud-Computing wird »das Auslagern von Daten, Software und Programmierumgebungen ins Internet – in die metaphorische ›Datenwolke‹ – verstanden. Statt die Programme auf der Fest-platte des eigenen Computers zu installieren, bezieht sie der Anwender oder die Anwenderin aus dem Web. Die Dateien werden ebenfalls im Internet abgelegt; dadurch kann mit verschiedenen Endgeräten von überall her darauf zugegriffen werden« (Rey 2011: 4). Solche Daten in der Cloud kategorisieren zunächst die Nutzenden für sich selbst, sie machen sie aber oftmals auch der Community zugänglich. Die Motive für die Nutzung des Social Taggings – die aktive und die passive – beruhen demzufolge sowohl auf funktionalen als auch auf sozialen Faktoren; es geht dabei um Wissensorganisation (Retrieval, Datensicherung und -austausch) und Wissenskommunikation (Netzwerk aufbauen, Anerkennung in einer Community und Expertise darstellen) (vgl. Frohner 2010: 67–68). Marlow et al. (2006: 35–36) nennen sechs verschiedene Gründe, warum Nutzerinnen und Nutzer Social Tagging betreiben. Die Motivation eines einzelnen Nutzers oder einer Nutzerin beruht laut Marlow et al. wohl zumeist auf mehreren Motiven:

       1)  Zukünftiges Retrieval: Ressourcen werden archiviert und getaggt, beispielsweise Lieder auf dem Portal Last.fm, um eine Playlist zu erstellen, oder Webseiten im Social-Bookmarking-Dienst Delicious, die man in einer Arbeit zitieren möchte.

       2)  Mitwirkung und Social Sharing: Ressourcen werden für ein bekanntes oder unbekanntes Publikum getaggt und auffindbar gemacht.

       3)  Aufmerksamkeitsgenerierung: Community-Mitglieder sollen durch Tags auf eigene Ressourcen aufmerksam gemacht werden, allenfalls auch mittels Spam-Tags.

       4)  Spiel und Wettbewerb: Tags werden aufgrund von bestimmten Regeln beispielsweise in Spielen oder in Gruppen als Merkmal der Zugehörigkeit verwendet.

       5)  Selbstdarstellung: Durch die vergebenen Tags konstruieren Nutzerinnen und Nutzer eine Identität, ob der Realität entsprechend oder nicht.

       6)  Meinungsäußerung: Nutzerinnen und Nutzer geben ihre Werturteile zu einzelnen Ressourcen ab.

Die verschiedenen Motive, die die Userinnen und User zum Social Tagging bewegen, implizieren, dass die einzelnen Nutzenden auch unterschiedliche Rollen ← 155 | 156 → in Social-Tagging-Systemen wahrnehmen. Voß (2007a: 7) unterscheidet in Communitys, die eine Tagging-Funktion aufweisen, vier verschiedene Rollen, wobei eine Person mehrere Rollen einnehmen kann:

       1)  Ressourcenurheber: erstellt oder bearbeitet die zu taggenden Elemente

       2)  Ressourcensammler: fügt einem Tagging-System Ressourcen zu

       3)  Tagger: taggt die vorhandenen Ressourcen

       4)  Sucher: benutzt Tags, um Ressourcen zu suchen

In Communitys wie Flickr sind die Rollen 1 und 2 zwingend aneinander gekoppelt, wohingegen diese beiden Rollen in Social-Bookmarking-Diensten üblicherweise von zwei verschiedenen Personen eingenommen werden. Doch auch die Rolle des Taggenden selbst kann unterschiedlich ausfallen. Thom-Santelli et al. (2008: 1042–1043) haben Taggende interviewt und daraus fünf verschiedene Typen hergeleitet:

       1)  Community Seeker: Dieser Typus nutzt die Tagging-Systeme, um Nutzerinnen und Nutzer mit ähnlichen Interessen zu finden; er verwendet daraufhin dieselben Tags wie diese Userinnen und User, um in der Community eine Zusammenarbeit zu erwirken. Über diese Tags werden auch soziale Beziehungen und Zugehörigkeit zu der (Teil-)Community ausgedrückt.

       2)  Community Builder: Wenn noch keine Interessensgemeinschaft zu einem bestimmten Thema besteht, nutzt er Tags, um eine aufzubauen. Er versucht die Tags so zu vergeben, dass sie von potentiellen Mitgliedern der Community gefunden werden können. So können sich bestimmte Tags in einer Community etablieren, wodurch die Community-Mitglieder ihre Ressourcen jederzeit wieder auffinden können.

       3)  Evangelist: Die Rolle von Evangelisten und Evangelistinnen gleicht derjenigen der Community Builder, doch sind sie aktiver und ihre Strategien zur Bildung einer Community sind komplexer und ausgeklügelter. Der Evangelist oder die Evangelistin ist auch darauf bedacht, den Ruf der eigenen Community innerhalb einer Social-Web-Anwendung zu verbessern und beispielsweise die verwendeten Tags in der Tag-Cloud (vgl. Kapitel 5.5) zu platzieren.

       4)  Publisher: Personen, die diese Rolle einnehmen, publizieren vor allem äußerst viele Inhalte, die sie zwar auch taggen, aber ohne das Ziel, Teil einer Community zu sein oder eine aufzubauen. Das Ziel der Publisher ist es dennoch, Aufmerksamkeit von möglichst vielen anderen Nutzerinnen und Nutzern für ihre Ressourcen zu bekommen. Deshalb wird versucht, Tags so zu wählen, dass die Inhalte von möglichst vielen Menschen gefunden werden können.

       5)  Small Team Leader: Im Gegensatz zu den anderen Rollen ist der Small Team Leader weniger aktiv. Er agiert zumeist innerhalb einer kleinen Gruppe von Userinnen und Usern und die verwendeten Tags tragen nur für diesen Nutzerkreis eine Bedeutung.

Aufgrund der verschiedenen Rollen und Ziele der einzelnen Taggenden ist davon auszugehen, dass sie auch über unterschiedliche Strategien des Taggings verfügen. ← 156 | 157 → Wie Guy und Tonkin (2006) feststellen, ist noch wenig darüber bekannt, warum Nutzerinnen und Nutzer bestimmte Tags vergeben, was jedoch von Relevanz wäre, da man mit diesem Wissen den passiven Tagging-Nutzerinnen und -Nutzern Hinweise geben könnte, wie sie bei der Suche nach Ressourcen vorgehen sollten. Gleichzeitig müssten laut Guy und Tonkin (2006) auch den Taggenden Tipps gegeben werden, wie sie bessere Tags vergeben können – dies bezeichnen sie als Verbesserung der »Tag Literacy«.235 So schlagen sie vor, eine Best Practice zu etablieren, damit die Userinnen und User einheitlicher taggen. Die Empfehlungen lauten beispielsweise: einheitlich Pluralformen und Kleinschreibung verwenden, mehrteilige Tags durch Unterstrich trennen (z. B. chinas_wirtschaft), Synonyme hinzufügen und Tag-Konventionen anderer Nutzerinnen und Nutzer folgen. Gleichzeitig fordern die Autorinnen, zusätzlich die Tagging-Systeme in solcher Weise zu verbessern, dass den Nutzerinnen und Nutzern automatisch geholfen wird, sinnvollere Tags zu vergeben.

Unabhängig davon, welche Rollen die Nutzenden in Tagging-Systemen einnehmen, entstehen bei ihrer Tätigkeit Folksonomien, die im folgenden Kapitel näher beleuchtet werden.

5.3  Folksonomien

Die beim Social Tagging entstehenden kollektiven Wissensordnungen werden Folksonomien genannt. Hier wird deutlich, warum dem Tagging im Social Web die Eigenschaft Social attribuiert wird: Zwar taggen Userinnen und User oftmals – wie auch auf Flickr – meist nur ihre eigenen Daten, auch wenn das gemeinschaftliche Taggen möglich ist (vgl. Stuart 2013: 145 sowie Kapitel 9.2.1). Durch die Aggregation von Tags vieler Nutzerinnen und Nutzer ergeben sich jedoch Ordnungsmuster, die als Folksonomien bezeichnet werden (vgl. Schmidt 2009a: 157): »Eine Folksonomy ist also die Gesamtheit aller Tags eines Systems, welche durch Benutzer zur Beschreibung der Objekte dieses Systems vergeben wurden« (Frohner 2010: 19).236 Peters et al. (2011: 1) definieren den Terminus Folksonomie wie folgt: »The folksonomy of a Web service Fweb can be defined as a tuple Fweb := (U, T, R, Y) where U, T, R are finite sets of the elements user names U, ← 157 | 158 → tags T and resource identifiers R, and Y is a ternary relation between them.« Der Terminus Folksonomie, eine Entlehnung der englischsprachigen Portmanteau-Bildung aus folk und taxonomy, wurde von Thomas Vander Wal geprägt und erstmals von Gene Smith, der später auch ein populärwissenschaftliches Buch zum Thema Tagging publiziert hat (Smith 2008), in seinem Blog zitiert (vgl. Weller 2010: 70).

Im Allgemeinen wird eine Unterscheidung zwischen weiten und engen Folksonomien vorgenommen, sogenannten broad und narrow folksonomies.237 Weite Folksonomien entstehen, wenn verschiedene Nutzerinnen und Nutzer eine Ressource mit Tags versehen können. Peters und Stock (Peters, Stock 2008: 78) sprechen in diesem Zusammenhang auch von »multipler Verschlagwortung« und nennen den Social-Bookmarking-Dienst Delicious als prominentestes Beispiel. Bei engen Folksonomien ist im Normalfall der Produzent oder die Produzentin der zu taggenden Ressource identisch mit der oder dem Taggenden, wobei das Taggen je nach Einstellungen der einzelnen Nutzerinnen und Nutzern auch anderen Community-Mitgliedern erlaubt sein kann. Tags können also bei engen Folksonomien nur singulär vergeben werden, d. h. andere Nutzerinnen und Nutzer können lediglich Tag-Labels hinzufügen, die noch nicht vergeben worden sind. Typischerweise handelt es sich bei Tagging-Systemen mit nicht-textuellen Ressourcen wie Musik (z. B. Last.fm), Videos (z. B. YouTube) und Fotos (z. B. Flickr) um enge Folksonomien (Frohner 2010: 87).

Die Gemeinsamkeit von Folksonomien und Taxonomien liegt auf der bedeutungstragenden Ebene, die beide aufweisen, wobei die Bedeutung auf unterschiedliche Art und Weise erzeugt wird (vgl. Müller-Prove 2008: 21). Der Terminus Folksonomie bedeutet also, dass eine Gruppe von Menschen Wissensordnungen erstellt, die sich allerdings von herkömmlichen Taxonomien unterscheiden:

      »Taxonomien und Klassifikationen sind systematische Darstellungen von Klassen, Kategorien oder anderen Begrifflichkeiten, die nach bestimmten Kriterien und Ordnungsprinzipien hierarchisch geordnet sind. Sie werden meist zur Einteilung eines größeren Gebietes in thematische Bereiche verwendet. Die einzelnen Klassen werden in der Regel durch die Einteilungen von Objekten anhand bestimmter Merkmale gewonnen. Taxonomien und Klassifikationen werden in ganz unterschiedlichen Bereichen benötigt, etwas [sic!] zur Einteilung der Lebewesen in der Biologie, zur Ordnung von Büchern in einer Bibliothek oder zur Strukturierung von Waren und Dienstleistungen im elektronischen Handel.« (K.-D. Schmitz 2006: 135, Herv. entfernt) ← 158 | 159 →

Die Unterschiede zwischen Taxonomien und Folksonomien zeigen sich 1) in der Professionalität und 2) in der Hierarchie sowie dem damit verbundenen kontrollierten Vokabular.

Ad 1): Taxonomien sind von Expertinnen und Experten erstellt und werden auch von ihnen angewandt (im obigen Beispiel: Biologinnen und Biologen, Bibliothekarinnen und Bibliothekare, Online-Händlerinnen und -Händler).238 Während es für Nichtfachkundige in vielen Fällen zu komplex wäre, sich in eine Taxonomie einzuarbeiten, kann das Social Tagging von allen Userinnen und Usern ohne Vorkenntnisse betrieben werden. Dafür können die Inhalte nicht so exakt beschrieben werden wie mit kontrollierten Metadaten, das heißt, »dass Social Tags nicht an die Qualität expertengenerierter Metadaten heranreichen und dies wahrscheinlich auch nie tun werden« (Frohner 2010: 112–113). In Anbetracht der riesigen Datenmengen im Internet muss eine laienhafte Kategorisierung jedoch einer Nicht-Kategorisierung vorgezogen werden. Frohner (2010: 109) plädiert darüber hinaus dafür, dass sich Expertinnen und Experten an Folksonomien orientieren sollten, wenn sie kontrollierte Metadaten erzeugen, da das Vokabular bei Folksonomien demjenigen der Nutzerinnen und Nutzer entspreche. Im besten Fall können Kategorisierungen von Experten und Expertinnen und Laiinnen und Laien zusammengeführt werden, wie beispielsweise erstmals im Kölner Universitätsgesamtkatalog (KUG).239 Benutzerinnen und Benutzer des Katalogs können im KUG Buchtitel selbst verschlagworten und die Tags bei Bedarf gleich in den Social-Bookmarking-Dienst BibSonomy übertragen (vgl. ebd.: 50). Bei der Literaturrecherche kann folglich sowohl auf die von Bibliothekarinnen und Bibliothekaren professionell vorgenommene Verschlagwortung als auch auf diejenige von Bibliotheksnutzenden zurückgegriffen werden. Dass das Social Tagging bei der Bibliotheks-Recherche zukünftig von Relevanz sein wird, zeigt beispielsweise ein Abschnitt zu diesem Thema in einer Einführung zum Recherchieren, in der das Social Tagging als »moderne Funktion der OPAC-Recherche« (Gantert 2012: 7) präsentiert wird. Zusammen mit von Nutzerinnen und Nutzern erstellten ← 159 | 160 → Rezensionen und Bewertungen zu Titeln zählt das Social Tagging zum »Social Cataloging« (ebd.: 7).240

Ad 2): Anders als Taxonomien beruhen Folksonomien nicht auf kontrolliertem Vokabular und sind auch nicht hierarchisch aufgebaut, sondern sie basieren auf nicht hierarchisch organisiertem, unkontrolliertem Vokabular. Unter kontrolliertem Vokabular versteht man »eine Sammlung von Benennungen, die eindeutig Begriffen zugeordnet sind, so dass keine Homonyme und möglichst keine Synonyme auftreten. Kontrollierte Vokabulare können als Glossare realisiert sein, man nutzt sie aber vor allem zur Konstruktion von Thesauri« (K.-D. Schmitz 2006: 133). Den Ausdruck Thesaurus wiederum definiert K.-D. Schmitz (2006: 135, Herv. im Original) wie folgt:

      »Ein Thesaurus im Bereich von Information und Dokumentation ist eine geordnete Zusammenstellung von Begriffen und ihren (vorwiegend natürlichsprachigen) Bezeichnungen, die in einem Dokumentationsgebiet zum Indexieren, Speichern und Wiederauffinden dient. Der Thesaurus kann als Begriffssystem mit einem kontrollierten Vokabular angesehen werden, bei dem die einzelnen Thesauruseinträge über Relationen (Oberbegriff, Unterbegriff, verwandter Begriff) verbunden und als Vorzugsbenennungen (Deskriptoren) oder Synonyme (Non-Deskriptoren) gekennzeichnet sind.«

Frohner (2010: 19) behauptet, in Folksonomien würden zwischen einzelnen Tags im Gegensatz zu Thesauruseinträgen keinerlei Relationen oder Hierarchien existieren. Vom System her gesehen ist diese Feststellung richtig, da Relationen nicht erkannt oder abgebildet werden können. Dennoch können Nutzerinnen und Nutzer in Tag-Serien oder auch in Folksonomien Relationen ausmachen. Nun könnten die Userinnen und User ihre Tags von Hand mit einem Thesaurus abgleichen, doch bewertet Müller-Prove (2008: 19) diese Möglichkeit zu Recht mit kritischer Haltung als zeitlichen und kognitiven Mehraufwand, den die Nutzerinnen und Nutzer kaum aufwenden würden.

Kolbitsch (2007: 80) hat einen Vorschlag unterbreitet, wie sich Folksonomien und Thesauri miteinander kombinieren lassen, und zwar von der Retrieval-Seite her: Über eine Programmierschnittstelle kann ein Thesaurus in ein Tagging-System eingebunden werden, sodass bei der Suche beispielsweise auch Hyponyme gefunden werden. Zum Beispiel können bei der Suche nach »Schuh« auch Bilder gefunden werden, die mit »Stiefel« oder »Flipflops« getaggt sind. Umgekehrt ← 160 | 161 → wäre es aus meiner Sicht auch sinnvoll, einen Thesaurus in das Tagging-System einzubauen, etwa in Form von Auswahlmöglichkeiten aus einem Wörterbuch. Würde eine Userin oder ein User ein Bild mit »Ball« taggen, so könnte über eine Polysem-Kontrollfunktion die Mehrdeutigkeit des Wortes über einen Qualifikator, d. h. einen ergänzenden Zusatz, eliminiert werden: Ball<Tanzveranstaltung> vs. Ball<Spielzeug>.

Folksonomien zeichnen sich durch verschiedene Vor- und Nachteile aus, wie die auf Frohner (2010: 28; 2010: 114), Peters (2008: 83) und Wellers (2010: 73) basierende Zusammenstellung in Tabelle 11 zeigt:

Tabelle 11:  Vor- und Nachteile von Folksonomien

Vorteile von Folksonomien

Nachteile von Folksonomien

Repräsentation von authentischem Sprachgebrauch

Aussagekraft erst bei ausgiebiger Nutzung des Systems

Neologismen sind möglich, Aktualität

kein kontrolliertes Vokabular, mangelnde Präzision

günstige Methode des Indexierens

Relationen zwischen Tags bleiben ungenutzt

einzige Möglichkeit, das Social Web zu erschließen

Vermischung verschiedener Levels von Genauigkeitsstufen

Quellen für die Entwicklung von kontrollierten Vokabularien

keine Unterscheidung von formalen und inhaltlichen Tags

Sensibilisierung der Nutzerinnen und Nutzer für Problemstellungen des Indexierens

nicht für alle verständlich, z. B. Spam-Tags, user-spezifische Tags

Qualitätskontrolle liegt bei den Nutzerinnen und Nutzern

oft unvollständig

Möglichkeit des Suchens und des Browsings (Serendipity-Effekt)

basieren auf Einzelsprachen, bzw. Einzelsprachen werden in Folksonomien vermischt

Basis für Recommender-Systeme

Suchergebnisse oft ungenau und unvollständig

Förderung von Community-Bildung

Bedeutung von Tags häufig nur durch Kontext erschließbar

Viele der in der Tabelle 11 erwähnten Aspekte wurden bereits angesprochen, einige sind selbsterklärend, die übrigen seien hier noch kurz erläutert. Auf der Seite der Vorteile ist der durch das mögliche Browsing entstehende Serendipity-Effekt zu nennen. Tags sind stets als Hyperlinks angelegt, sodass ein Community- ← 161 | 162 → Mitglied sich sämtliche mit einem bestimmten Tag-Label versehene Bilder eines Nutzers bzw. einer Nutzerin oder auch der ganzen Community anzeigen lassen kann. Gerade auch die Tag-Clouds eignen sich dazu, beliebte Themen ausfindig zu machen (vgl. Kapitel 5.5). Im besten Fall stoßen die Nutzerinnen und Nutzer so auf neue und weitere Ressourcen, die sie interessieren. Auch durch sogenannte Recommender-Systeme sollen den Nutzerinnen und Nutzern Inhalte nähergebracht werden, die für sie von Interesse sein könnten. Empfehlungsdienste berechnen automatisch, welche Objekte eine Ähnlichkeit mit einem anderen Objekt aufweisen und empfehlen diese den Userinnen und Usern. Bekannt sind Recommender-Systeme vor allem aus Social-Networking-Communitys. Bei diesen berechnet das System anhand der Freundeslisten sowie der gemeinsamen Freunde, welche Personen man kennen könnte, und in Onlineshops wie beispielsweise bei Amazon werden beim Kauf eines Produkts weitere Artikel vorgeschlagen, die andere Kunden zusammen mit dem gewählten Produkt erstanden haben. Die beiden genannten Aspekte (Browsing/Recommender-Systeme) werden auch als »Social Navigation« (Klebl, Borst 2010: 244; Weller et al. 2010: 135) bezeichnet.

Bei den Nachteilen kann die sogenannte »basic level variation« (Golder, Huberman 2005: 2) genannt werden, ein Problem, das indirekt schon im Zusammenhang mit semantischen Relationen zwischen Tags angesprochen wurde. Tags beschreiben auf Bildern abgebildete Gegenstände auf einem Kontinuum der Genauigkeit, d. h. von sehr allgemein bis sehr spezifisch, zum Beispiel Pflanze, Blume, Fuchsia. Dieses Kontinuum bringt es mit sich, dass suchende Nutzerinnen und Nutzer Abfragen ebenfalls auf verschiedenen Ebenen durchführen müssen. Ein weiterer Nachteil von Folksonomien besteht darin, dass nicht zwischen einer formalen und einer inhaltlichen Erschließung getrennt wird, d. h. die verwendeten Tags können sowohl auf Inhalte eines Bildes als auch auf formale Aspekte (z. B. Urheber, Kameratyp, Genre) referieren (vgl. Kapitel 5.7).

Die Kritik, die an Folksonomien verschiedentlich geäußert wird, ist hauptsächlich darauf zurückzuführen, dass sie mit traditionellen professionellen Wissensorganisationssystemen wie Taxonomien oder Thesauri verglichen werden (vgl. Weller, Peters 2008: 110). Weller et al. (2010: 139) merken jedoch zu Recht an, dass die Folksonomie nicht als ein mit traditionellen Wissensorganisationssystemen konkurrierendes System, sondern als ein ergänzendes angesehen werden sollte.

5.4  Folksonomien versus Ontologien

Sowohl Folksonomien als auch Ontologien sind Systeme zur Wissensorganisation, sie unterscheiden sich allerdings erheblich bezüglich ihrer strukturellen Kom ← 162 | 163 → plexität sowie dem Umfang der Wissensdomäne, die sie abbilden können (vgl. Abbildung 21). Das Spektrum der drei klassischen Wissensorganisationssysteme wird an je einem Ende durch die Ontologie und die Folksonomie ergänzt – unterschiedlicher könnten die beiden also nicht sein (vgl. Weller 2010: 21).

Abbildung 21:  Komplexität und Domänenumfang von Wissensorganisationssystemen (nach Weller et al. 2010: 134)241

image

Folksonomien wurden bereits im vergangenen Kapitel ausführlich erörtert. Bevor näher auf Ontologien eingegangen wird, werden kurz die klassischen Systeme der Wissensorganisation vorgestellt. Bei einer Nomenklatur242 handelt es sich um ein Verzeichnis mit kontrolliertem Vokabular aus natürlichen Sprachen oder Fachsprachen, jedoch enthält eine Nomenklatur keine Hierarchie-Relationen. Klassifikationen hingegen verfügen über Hierarchie-Relationen sowie über Klassen aus nicht-natürlich-sprachigen Notationen (vgl. Stock, Stock 2008: 414–441); es werden in Klassifikationen jedoch nicht verschiedene Hierarchietypen unterschieden (vgl. Peters, Weller 2008: 101). Der Terminus Thesaurus schließlich trägt ← 163 | 164 → nicht nur die Bedeutung Wörterbuch sinn- und sachverwandter Wörter; im Bereich der Wissensorganisation versteht man unter einem Thesaurus ein komplexes kontrolliertes Vokabular in einem bestimmten Dokumentationsgebiet, das auf nationalen und internationalen Standardisierungen basiert (vgl. Weller 2010: 27). Die zentralen Elemente, durch die sich ein Thesaurus von einer Klassifikation unterscheidet, sind insbesondere Äquivalenzrelationen, die in Sammlungen von Synonymen – ausgedrückt durch Deskriptoren und Non-Deskriptoren – vorliegen, sowie Assoziationsrelationen (vgl. Peters, Weller 2008: 100).

Die Idee zum Einsatz von Ontologien entstand in den 1990er-Jahren im Bereich der Forschung zur künstlichen Intelligenz (vgl. Stock, Stock 2008: 13). Der Terminus Ontologie stammt ursprünglich aus der Philosophie, wurde dann aber in der Informatik verwendet, wo er zunächst ganz allgemein »die Repräsentation eines Wissensausschnitts in einer computerverarbeitbaren Form« (Kunze et al. 2007: 268) bezeichnet. Genauer versteht man unter einer Ontologie eine »Begriffsordnung, die in einer standardisierten Sprache vorliegt, automatisches Schlussfolgern gestattet, stets über Allgemein- und Individualbegriffe verfügt sowie neben den Hierarchierelationen mit weiteren spezifischen Relationen arbeitet« (Stock, Stock 2008: 415). Eine Ontologie basiert folglich auf einer Taxonomie (vgl. Guarino et al. 2009: 2), verfügt aber darüber hinaus über die zusätzliche Option logischer Schlüsse (vgl. Stock, Stock 2008: 15). Die Komplexität von Ontologien ist im Gegensatz zu derjenigen von Klassifikationen oder Thesauri deshalb höher, weil weitere spezifische Relationen definiert werden, beispielsweise die Relation der Urheberschaft zwischen Akademiker und wissenschaftlicher Text oder Schriftsteller und belletristisches Werk. Durch ihre hohe Komplexität haben Ontologien den Nachteil, dass sie nur für Wissensgebiete von geringer Größe eingesetzt werden können (vgl. ebd.: 13).

Ontologien stellen die zentrale Basis des Semantic Webs dar und sind deshalb in den letzten Jahren bekannter geworden. K.-D. Schmitz (2006: 136) hält fest, dass mit der durch das Semantic Web gesteigerten Popularität von Ontologien der falsche Gebrauch des Terminus zugenommen habe, dass also oftmals Nomenklaturen, Klassifikationen oder Thesauri als Ontologien bezeichnet würden. Auch Panyr (2006: 146) kritisiert, dass Ontologie zu einem Modebegriff geworden sei und deshalb oftmals inadäquat verwendet werde. Teilweise werde von Ontologien »im weiteren Sinne« gesprochen, der Terminus werde dann als Hyperonym für alle Systeme der Wissensorganisation verwendet, so auch für lexikalisch-semantische Ressourcen wie das WordNet oder das GermaNet (vgl. Carstensen 2010: 541).

Dass der Ausdruck Ontologie auf unterschiedliche Weise gebraucht wird, hängt auch damit zusammen, dass Ontologien im engeren Sinne für verschiedene Ziel ← 164 | 165 → setzungen eingesetzt werden. Dabei geht es einerseits um die Automatisierung von Prozessen durch die maschinelle Verarbeitung von Daten, was das substanzielle Anliegen des Semantic Webs ist, andererseits sollen Menschen im Wissensmanagement unterstützt werden (vgl. Blumauer, Pellegrini 2006: 12). Durch die Annotation mit Metadaten wird es Maschinen möglich, »zu ›verstehen‹ und zu ›entscheiden‹ […], um den Wissensarbeiter bei der Bewältigung komplexer, wissensintensiver Prozesse zu unterstützen« (vgl. ebd.: 21). Was für Menschen beim Retrieval das Kontext- und Weltwissen ist, sind für Maschinen folglich die Metadaten: »Data should be provided in such a way that not only humans can read it; computers should also be able to manipulate and recombine the information meaningfully« (Weller 2010: 53).

Zur Repräsentation von Ontologien im Semantic Web wird eine formale Sprache, die sogenannte Web Ontology Language (OWL), verwendet. Hierbei handelt es sich um einen XML-basierten Standard des World Wide Web Consortiums (W3C), der alle Techniken des WWWs standardisiert (vgl. Kunze et al. 2007: 267). OWL gibt es in drei Varianten: OWL Lite, OWL DL und OWL Full (vgl. Ngonga Ngomo 2012: 14). Die drei wichtigen Elemente in OWL-Ontologien sind Klassen, Propertys und Individuen, teilweise in der Literatur auch Konzepte, Relationen und Instanzen genannt (vgl. Kunze et al. 2007: 269). Eine Menge von Individuen, die über gemeinsame Merkmale verfügen, können zu Klassen zusammengefasst werden; eine Property wiederum ist eine binäre Relation zwischen zwei Klassen, beispielsweise gehört zwischen Spielzeug und Kind (vgl. ebd.: 269–271).

Abschließend kann man festhalten, dass sowohl Folksonomien im Social Web und Ontologien im Semantic Web als auch die genannten klassischen Systeme der Wissensorganisation dasselbe Ziel verfolgen: Objekte sollen mit Metadaten versehen werden mit dem Zweck, ein Retrieval zu ermöglichen (bei Bildern) oder die Retrieval-Effektivität zu steigern (bei Texten) (vgl. auch Weller 2010: 4). Ein gut funktionierendes Retrieval ist umso wichtiger, je mehr Informationen vorhanden sind. Gerade durch den Erfolg des Social Webs und die dadurch publizierten zahlreichen Inhalte kann es leicht zu einer Informationsflut (Information Overload) kommen. Durch die gesenkte Veröffentlichungsschwelle sowie steigende und pauschal vergütete Übertragungsraten wird einerseits der Umfang an verfügbaren Informationen erheblich vergrößert (vgl. Schmidt 2007: 24). Andererseits muss mit Blumauer und Pellegrini (2006: 20) festgestellt werden, dass nicht nur »die Menge der verfügbaren Information zu bemängeln wäre, sondern [auch] deren niedrige Qualität«. Neben der Annotation mit Metadaten helfen im Social Web auch Rating-Systeme, die Relevanz von Daten einzuschätzen (vgl. Heckner 2009: 114 sowie Kapitel 4.2). ← 165 | 166 →

Sowohl Ratingsysteme als auch Folksonomien »unterstützen eher das Online-Flanieren als die präzise Recherche« (Schneider 2008: 121). Ontologien zu erstellen, ist für Social-Web-Nutzerinnen und -Nutzer zu anspruchsvoll. Aus diesem Grund kann es sinnvoll sein, Ontologien mit Folksonomien zu kombinieren. Schneider (2008: 125) führt die These an, dass durch eine solche Kombination das Wissen vergrößert und die Mensch-Maschine-Kommunikation verbessert werden könnte. Nicht nur die Kombination von Folksonomien und Ontologien, sondern auch eine von Folksonomien mit einem klassischen System der Wissensorganisation wäre sinnvoll, sodass in Folksonomien paradigmatische Relationen aufgedeckt werden könnten.

5.5  Visualisierungen von Folksonomien: Tag-Clouds

Folksonomien wurden in Kapitel 5.3 als Aggregation von Tags innerhalb eines Systems bezeichnet. Als typische Darstellungsweise von Folksonomien hat sich die sogenannte Tag-Cloud243 durchgesetzt. Darunter versteht man »auf einer Fläche angezeigte, in einem lockeren Neben-, Unter- und Übereinander angeordnete Wörter, deren Gewichtung als Schlagwörter o. Ä. (z. B. durch unterschiedliche Schriftgröße) optisch verdeutlicht wird« (Duden 2012). Um eine solche Visualisierung zu erstellen, werden die Häufigkeiten der einzelnen Tags gezählt, auf Zeichensatzgrößen umgerechnet und angeordnet. »Anders als bei vielen anderen grafischen Darstellungsformen, wie beispielweise Linien- oder Säulendiagramme, werden bei Tag-Clouds keine zusätzlichen geometrischen Elemente wie Punkte oder Linien zur Darstellung der Verteilungen verwendet« (Frohner 2010: 32). Diese Art der typographischen Datenvisualisierung hat im Vergleich zu einer Tabelle oder Diagrammen den Vorteil, dass sie von Nutzerinnen und Nutzern leichter rezipiert werden kann, da sie platzsparend dargestellt und einfach überblickt werden kann (vgl. Müller-Prove 2008: 17). In Abbildung 22 ist eine Tag-Cloud zu sehen, die mit einem Tag-Cloud-Generator244 aus den Tags aus dem für diese Arbeit erhobenen Kleinkorpus zur Analyse der Bildtags (vgl. Kapitel 9.1) erstellt wurde. ← 166 | 167 →

Abbildung 22:  Tag-Cloud aus den Korpus-Tags, alphabetisch mit Frequenzangaben245

image

In Social-Web-Anwendungen sind Tag-Cloud-Generatoren bereits eingebaut, je nach System fällt die Darstellung aber anders aus. Allen Arten von Visualisierungen von Tags in Tag-Clouds ist gemeinsam, dass die Nutzungshäufigkeit eines Tags durch die Schriftgröße ausgedrückt wird. Weitere Faktoren sind das Schriftgewicht (z. B. Fettdruck), die Schriftfarben, die Intensität der jeweiligen Farben, die Tag-Area (Platz, den ein Tag einnehmen kann) sowie die Tag-Position (Stelle in der Tag-Cloud, an der sich das Tag befindet) (vgl. Frohner 2010: 34). Etwas ausgeklügeltere Tag-Clouds gruppieren – basierend auf Kookkurrenzen – ähnliche Tags oder zeigen Verbindungen zwischen den Tags an (vgl. Lohmann et al. 2009: 17). Typisch an Abbildung 22 ist zum Beispiel die alphabetische Anordnung, eher atypisch ist die in Klammern angegebene Frequenzangabe. Die Groß- und Kleinschreibung wurde bei der Erstellung der Tag-Cloud ignoriert, d. h. identische Zeichenfolgen wurden addiert (z. B. 55-mal »deutschland« plus 85-mal »Deutschland« gleich 140 Tokens), und die Tags werden in konsequenter Kleinschreibung angezeigt.

Abbildung 23:  Tag-Cloud aus den Korpus-Tags, horizontal gemischt, bunt246

image ← 167 | 168 →

An Abbildung 23 lässt sich Folgendes zeigen: Sehr prominent sind die beiden häufigsten im Kleinkorpus vertretenen Tags Germany und Deutschland, wobei im Gegensatz zur Abbildung 22 hier Case Sensitivity vorliegt und die Tags dementsprechend einmal in Groß- und einmal in Kleinschreibung auftreten. Auch die beiden Faktoren Tag-Area und Tag-Position lassen sich anhand dieser Tag Cloud erläutern: So sind beispielsweise die drei Tags hair, Macro und licht im Buchstaben C des Tags Canon platziert (Tag-Position), sie nehmen – aufgrund der niedrigeren Frequenz – im Vergleich zum Tag Canon nur wenig Platz in der Tag-Cloud ein (Tag-Area). Die Schrift wurde in Abbildung 23 horizontal ausgerichtet. In Abbildung 24 sind weitere Elemente zu sehen, so ist beispielsweise die Ausrichtung der Schrift variabel, die Schriftarten innerhalb der Tag-Cloud variieren und die Tags werden teils in konsequenter Großschreibung, teils in konsequenter Kleinschreibung angezeigt. Die Tag-Positionen sind so gewählt, dass die Form eines Elefanten entsteht.

Abbildung 24:  Tag-Cloud aus den Korpus-Tags, Form eines Elefanten247

image ← 168 | 169 →

Tag-Clouds haben in Social-Tagging-Systemen verschiedene Funktionen. Einerseits zeigt die Tag-Cloud den Nutzerinnen und Nutzern auf, welche Tags beliebt oder aktuell sind, andererseits ermöglichen die Tag-Clouds das sogenannte Tag-Browsing. Sämtliche Tags sind Hyperlinks, d. h. das jeweilige Tag-Label fungiert als Ankertext (vgl. Frohner 2010: 94); ein Klick auf ein Tag-Label zeigt alle Ressourcen an, die ebenfalls mit diesem Label versehen worden sind (wahlweise alle des gesamten Systems oder nur diejenigen von einzelnen Userinnen und Usern oder Gruppen). Damit kann ein Serendipity-Effekt einhergehen: Bei der angeklickten Ressource können wiederum andere, ähnliche Tags angeklickt werden – über Tag-Clouds können auf diese Weise interessante Nutzerinnen und Nutzer bzw. deren Ressourcen gefunden werden (vgl. Panke, Gaiser 2008: 25). Den Effekt, dass Userinnen und User Inhalte zufällig entdecken, nach denen sie nicht konkret gesucht hatten, machen sich inzwischen auch kommerzielle Anbieter zunutze, so etwa der Online-Shop Amazon. Dort können Userinnen und User Produkte taggen, und andere Nutzerinnen und Nutzer können daraufhin Produkte aufgrund der vergebenen Tags ausfindig machen.248

Abbildung 25:  Tag-Cloud bei Amazon249

image

An Abbildung 25 lässt sich zeigen, wie verschiedene Faktoren unterschiedlich visualisiert werden können. Amazon nimmt eine Unterscheidung in häufig und in kürzlich verwendet vor; die Visualisierung der Frequenz erfolgt durch die Schriftgröße, die der Erstellungszeitspanne durch die Intensität der Farbe, woran Userinnen und User erkennen können, welche Themen aktueller sind als andere (vgl. Müller-Prove 2008: 17). Bei Flickr können die beliebtesten Tags der letzten 24 Stunden, der vergangenen Woche oder aller Zeiten angezeigt werden. Neben Tag-Clouds für das gesamte System können auch Tag-Clouds einzelner Nutzerinnen und Nutzer ausgegeben werden. Solche individuellen Tag-Clouds dokumentieren, mit welchen Themen sich ein User oder eine Userin vorwie ← 169 | 170 → gend beschäftigt (vgl. Panke, Gaiser 2008: 26); neben dem Profil dient demnach auch die Tag-Cloud zur Präsentation der eigenen Person in einer bestimmten Community.

Zuletzt sei noch auf eine veränderte Nutzung von Tag-Clouds hingewiesen. Mit Tag-Cloud-Generatoren lassen sich selbstverständlich nicht nur die häufigsten Tags, sondern auch die häufigsten Wörter eines Fließtextes visualisieren. Beim Generator TagCrowd wird man gar explizit dazu aufgefordert: »Create your own tag cloud from any text to visualize word frequency.«250 Betrachten wir uns das Resultat einer solchen Nutzung:

Abbildung 26:  Tag-Cloud aus Fließtext251

image

Auf den ersten Blick wird klar, worum es in dem Text, welcher der Tag-Cloud zugrunde liegt, geht: um Medien, um das Schreiben, um Schüler252 und um Texte. Die Schlagworte chat, computer, e-mail und sms verweisen darauf, dass im Text digitale Kommunikation(-sformen) behandelt werden. Die Tags abb, kap, tab und vgl verraten, dass wir einen wissenschaftlichen Text mit Abbildungen, Tabellen und Verweisen vor uns haben. Analyse, Auswertung, Ergebnisse und Kodierungen deuten darauf hin, dass es sich um eine empirische Studie handelt. Die beiden Schlagworte lexik und orthographie signalisieren, auf welchen Ebenen die Analyse schwerpunktmäßig beruht. Da heutzutage viele Texte ohnehin digital vorliegen, lässt sich eine solche Tag-Cloud innerhalb weniger Sekunden erstellen. Solche Tag-Clouds sind sehr hilfreich, um einen Überblick über einen Text zu gewinnen.253 Die diesem Buch vorangestellte Tag-Cloud beruht analog zum obigen Beispiel auf dem vorliegenden Fließtext. ← 170 | 171 →

Tag-Clouds weisen als Visualisierungen von Folksonomien auch Nachteile auf: Da die Anordnung der Schlagworte in Tag-Clouds zufällig bzw. teilweise alphabetisch ist, können keine Kollokationen abgebildet werden. Zudem werden die Tags losgelöst von den getaggten Inhalten angezeigt: »Tag clouds are usually visualized separately from the contents in a specific area of the user interface« (Lohmann et al. 2009: 17). Nur wenige Anwendungen kombinieren Tags und die dazugehörigen Ressourcen, so beispielsweise die Yahoo-Tagline254, bei der zufällige Fotos von Flickr mit den jeweiligen Tags auf einer Zeitachse dargestellt werden, oder der TagGraph, bei dem man sich Bilder zu einem bestimmten Tag anzeigen lassen kann, wahlweise von allen Flickr-Nutzerinnen und -Nutzern oder von einzelnen (vgl. Abbildung 27). Während bei der Yahoo-Tagline der User oder die Userin lediglich auf die angezeigten Bilder, bzw. deren Thumbnails, klicken kann, bestehen beim TagGraphen verschiedene weitere Möglichkeiten: Man kann sich weitere Bilder zu einem Tag oder auch Related Tags anzeigen lassen, durch Klick auf ein Bild oder Tag werden andere Ressourcen und Tags in den Vordergrund gerückt.

Lohmann et al. (2009: 18) kritisieren an solchen Anwendungen, dass sie keine komplexe Suche nach mehreren Tags, sondern lediglich eine einfache Suche nach einem einzelnen Tag sowie das Browsing erlauben, also das Stöbern nach dem Serendipity-Prinzip. Darüber hinaus dürfte aus den Ausführungen ersichtlich geworden sein, dass in solchen Visualisierungen keine Folksonomien abgebildet werden können, sondern nur einzelne Ausschnitte daraus. ← 171 | 172 →

Abbildung 27:  Bilder zum Tag »roterose« mit Related Tags im TagGraphen255

image

Wenn man sich Bilder von roten Rosen anzeigen lassen möchte, so kann man zwar »rote rose« eingeben, doch tilgt der TagGraph automatisch das Spatium und so wird nach dem Tag-Label »roterose« gesucht, das für ein erfolgreiches Retrieval von den entsprechenden Nutzerinnen und Nutzern auch explizit so vergeben worden sein muss (vgl. Abbildung 27). Im TagGraphen wird zwar angezeigt, wenn zwei Bilder über ein gemeinsames Tag verfügen, doch ist keine Suche nach zwei verschiedenen Tags möglich, im Beispiel der Abbildung 27 beispielsweise »rote-rose« und »notenblatt«. Dieses Defizit wollten Lohmann et al. (2009: 18) in ihrer Anwendung namens ChainGraph beheben: Sucht jemand ein charakteristisches Bild von Paris über die Eingabe des Suchwortes »Paris«, so werden ihm bzw. ihr ← 172 | 173 → im ChainGraphen verschiedene Ergebnisse präsentiert. Entscheidet sich ein Nutzer oder eine Nutzerin für das Motiv des Eiffelturms, können die Suchergebnisse hierzu wiederum nachträglich eingegrenzt werden, indem er bzw. sie sowohl nach »eiffel tower« als auch gleichzeitig nach »black & white« sucht (vgl. Abbildung 28).

Abbildung 28:  ChainGraph: Ressourcen zum Tag »Paris«, präzisiert durch »eiffel tower« und »black and white«256

image

Der ChainGraph ermöglicht somit sowohl eine Kombination von gezielter Suche nach mehreren Tags als auch ein Browsing anhand von Related Tags. Der Nachteil, den der ChainGraph mit sich bringt, liegt auf der Hand: Die Darstellung braucht viel Platz, weshalb große Bildschirme benötigt werden257 (vgl. ebd.: 25). ← 173 | 174 →

5.6  Tagging von Bildern

Für das Retrieval von Bildern sind Metadaten wie Tags neben anderen textuellen Elementen wie Titel, Beschreibung, Kommentare oder Notizen in Foto-Communitys mit Milliarden von Fotos unerlässlich: »A growing information flood requires ever more sophisticated and efficient instruments of recognizing, structuring, filtering, and evaluating relevant information« (Debatin 2010: 323). Gerade mit dem Aufkommen von Kameras, die einen integrierten Internetzugang haben oder die die Internetverbindung anderer Geräte nutzen können, sowie von Smartphones mit integrierter Kamerafunktion, kann nochmals ein beachtlicher Anstieg von Fotos im Social Web erwartet werden (vgl. Kapitel 4).258 Durch die erwähnte technische Neuerung wird es möglich, von nahezu jedem Ort der Welt die Fotos und Videos direkt in Social-Sharing- oder Social-Networking-Communitys hochzuladen. Der Zwischenschritt der Übertragung der Fotos auf einen Computer entfällt und vereinfacht damit das Verfahren. Es sei allerdings angemerkt, dass beispielsweise bei Smartphones die Eingabe von Texten zu den Bildern umständlicher ist als auf einer physischen Tastatur, was zur Konsequenz haben könnte, dass entweder weniger Texte geschrieben werden oder die Zeit, die durch die technische Vereinfachung gespart wurde, für das umständlichere Beschriften der Fotos verwendet wird.

Während bei textuellen Daten eine automatische Erschließung durch Text-Mining-Verfahren oder eine Volltextsuche möglich ist, stellen sich diesbezüglich bei nichttextuellen Daten große Probleme. Noch muss von textuellen Deskriptoren Gebrauch gemacht werden, die manuell und folglich mit großem Aufwand erstellt werden müssen (vgl. Ebersbach et al. 2011: 122). Um dieses Problem zu lösen, wird in der Forschungsdisziplin der Bildverarbeitung daran gearbeitet, die Mustererkennung und somit das maschinelle »Sehen« weiterzuentwickeln. Objekterkennungssysteme sollen in statischen und dynamischen Bildern Objekte oder Gesichter möglichst präzise bestimmen können. Ziel ist es, dass Computer automatisch Informationen und Bedeutungen aus Bildern extrahieren.259 Insbesondere die Gesichtserkennung, die im Social Web bereits eingesetzt wird, ist aber aus Datenschutz-Gründen problematisch, weshalb beispielsweise Facebook die im Juni 2011 eingeführte Gesichtserkennung in Europa im September 2012 ← 174 | 175 → wieder deaktiviert hat.260 Im Gegensatz zur Objekterkennung funktioniert die Farberkennung bereits problemlos (vgl. Abbildung 29). Folglich können Bilder über Farb-Suchmaschinen261 gefunden werden, was Tags, welche Farben bezeichnen, überflüssig macht.

In Ansätzen sind hier die Suchmaschinen der Zukunft erkennbar: Die großen Suchmaschinen Google und Bing bieten bereits heute die Suche nach Bildgrößen und -formaten, spezifischen Farben, nach dem Erstelldatum (Google) und dem Bildtyp (Foto, Strichzeichnung, Clipart etc.) und erkennen Gesichter – bei Bing sogar spezifizierend durch eine Einschränkung der Ergebnisse auf »Nahaufnahmen« oder Portraits (»Kopf und Schultern«). Der nächste Schritt dürfte in der weiteren Identifizierung von Objekten sowie ihrer Größe im Bild sowie dem Ort der Erstellung (Geo-Tags) liegen. Dass die Suche nach Objekten jedoch weitaus relevanter und komplexer ist als die Suche nach Farben, versteht sich von selbst.

Abbildung 29:  Farberkennung in einem Bild262

image

Da Objekterkennungssysteme derzeit noch nicht weit genug entwickelt sind, setzt ein erfolgreiches Retrieval von Bildern in Social-Sharing-Communitys ← 175 | 176 → noch das Taggen der Nutzerinnen und Nutzer voraus, die ein Interesse an der (Wieder-)Auffindbarkeit ihrer Fotos haben.263 Bei der Verschlagwortung von Bildern handelt es sich um eine Form der Wissensrepräsentation, die nach Stock und Stock (2008: 418) folgendermaßen definiert werden kann: »Wissenschaft, Technik und Anwendung von Methoden und Werkzeugen für die Abbildung des Wissens zum Zweck des optimalen Suchens und Findens von Informationen. Es geht um die Vertretung (Surrogat) des in Dokumenten vorgefundenen Wissens in Informationssystemen.« Die Tags dienen demzufolge der Wissensorganisation, das heißt, über die Wissensrepräsentation wird sichergestellt, dass ein Retrieval des in den betreffenden Ressourcen vorhandenen Wissens möglich wird (vgl. ebd.: 418).

Wenn Bilder mit Sprache beschrieben werden sollen, stellt sich die Frage: »Kann alles Bildliche versprachlicht werden?« (Holly 2005: 337). Damit verbunden ist die Aufgabe, auf eine bestimmte Art und Weise eine adäquate Wissensrepräsentation zu garantieren. Das Tagging von Bildern kann nach dem Untertitel eines Beitrags von Holly und Jäger (2011: 151) als »Anders-lesbar-Machen durch intermediale Bezugnahmepraktiken« bezeichnet werden, wobei angemerkt werden muss, dass hier ein kodebezogener Medienbegriff und somit Zeichensysteme gemeint sind.264 In Hollys Terminologie umfasst intermediale – in der hier verwendeten Terminologie intermodale – Kommunikation (vgl. Kapitel 7.5) verschiedene Kodalitäten wie auch Modalitäten, wobei multikodal »verschiedene Zeichenarten enthaltend« bzw. multimodal »mehrkanalig, verschiedene Sinne ansprechend« (Holly 2010b: 2203) bedeutet. Stöckl (2006: 27) wiederum fasst Hollys Kodalität und Modalität unter dem Terminus Modalität zusammen und spricht folglich nicht von intermedialen, sondern von intermodalen Bezügen. Bei intermodalen Verfahren wird ein zweites Zeichensystem »zur Kommentierung, Erläuterung, Explikation und Übersetzung (der Semantik) eines ersten Systems« ← 176 | 177 → (Jäger 2002: 29) herangezogen; an anderer Stelle spricht Jäger (2010: 304) von Resemantisierungen. Er argumentiert, dass es keine neutralen Informationen gebe, die von einem Zeichensystem265 ins andere übertragen werden könnten, »weil es nur mediale Varianten von Inhalten gibt, für die kein prämediales Original existiert. Jede Form der Übertragung eines Inhaltes aus einem in ein anderes Medium nimmt deshalb notwendig die Form der Transkription, d. h. der Neukonstitution unter medial veränderten Bedingungen an« (ebd.: 314, Herv. im Original). Wie zu Beginn dieses Teilkapitels angemerkt, sind solche Transkriptionen für das Retrieval in Social-Sharing-Communitys unentbehrlich: Die Bilder werden also aus der Perspektive des Retrievals nicht nur »anders lesbar« (Holly 2011c: 159), sondern für Maschinen »überhaupt lesbar« und somit über die Suchfunktion auffindbar gemacht.266

Bei der Transkription stellt sich nicht nur die oben zitierte Frage, ob alles Bildliche versprachlicht werden kann, sondern auch, ob alles versprachlicht werden soll. Wird ein Bild mit vielen Tags versehen, steigt die Chance, dass es in einem Suchergebnis angezeigt wird (vgl. Gödert et al. 2012: 76). Das Dokument ist somit potentiell eher auffindbar, doch tragen Tags, die das Bild nur nebensächlich beschreiben, auch dazu bei, dass die Relevanz der Suchresultate sinkt. Wenn also ein Objekt im Bild nicht von Bedeutung ist, muss abgewogen werden, ob man es indexieren sollte, da es anderswo vielleicht relevanter dargestellt ist. Es stellt sich somit die Frage, welche Tiefe des Indexierens sinnvoll ist. Üblicherweise sind der Extensität des Indexierens durch Mangel an Ressourcen wie Zeit oder Geld praktische Grenzen gesetzt. So muss gefragt werden, welche Aspekte eines Bildes überhaupt relevant sind, d. h. für einen potentiellen Suchenden interessant sein könnten. Darüber hinaus können Details unerwähnt bleiben, die natürlicher Bestandteil einer bestimmten Entität sind: Wird beispielsweise ein Bild mit dem Tag Elefant versehen, muss ein Tag wie Rüssel nicht zusätzlich vergeben werden, es sei denn, ihm käme eine besondere Funktion oder Bedeutung zu (vgl. Shatford 1986: 58).

In Bildern sind verschiedene Objekte von unterschiedlicher Relevanz abgebildet, die beispielsweise aus der Größe oder Position abgeleitet werden kann. Diese unterschiedliche Gewichtung kann jedoch nicht in den Tags abgebildet werden, da im Social-Sharing-Bereich Set-Model-Systeme verwendet werden, ← 177 | 178 → bei denen wichtige Schlagworte nicht hervorgehoben werden können.267 Einzig durch die Reihenfolge können Nutzerinnen und Nutzer die Bedeutsamkeit der zu Beginn einer Tag-Serie aufgelisteten Tags betonen. Doch ob dem tatsächlich so ist, müsste zunächst erforscht werden; wenn ja, so könnten Suchmaschinen dies berücksichtigen und diesen Nachteil aufheben.

Tags zu Bildern haben also unter anderem die Funktion, die Bildinhalte sprachlich möglichst exakt wiederzugeben. Aus diesem Grund wird auch als Qualitätsmerkmal für die sprachliche Beschreibung eines Bildes die Wiedergabetreue genannt. Die Wiedergabetreue ist umso größer, desto genauer die verwendete Sprache den Bildinhalt ausdrückt (vgl. Gödert et al. 2012: 53), doch die Autoren erläutern nicht, wie eine solche Wiedergabetreue ermittelt werden kann. Die Inhaltsanalyse ist generell komplex – eine eindeutige Deskription von Inhalten gestaltet sich auch bei Texten als schwierig (vgl. ebd.: 26). Bei Bildern wird die Problematik durch die genannte Komplexität der Transkription vom Bild zum Text noch erweitert. Wenn ein Bild – wie es im Sprichwort heißt – tatsächlich mehr als tausend Worte sagt, so stellt sich die Frage, mit welchen und wie vielen Wörtern der relevante Bildinhalt versprachlicht werden kann: »How can we communicate the essence of still images such as photographs in ways that enable potential users to discover the material and to decide whether it meets their needs?« (Orbach 1990: 163). Auf diese Frage ist bisher noch keine befriedigende Antwort gefunden worden; für die Inhaltsanalyse von Bildern gibt es bisher keine allgemein anerkannten Standards (vgl. Ortner 2011: 157).

Ein Forschungsansatz, der auf die Theorie zur Inhaltserschließung von Bildern großen Einfluss hatte, stammt vom Kunsthistoriker Erwin Panofsky. Sein Ansatz wurde später von Shatford (1986) für die Informationswissenschaft adaptiert (vgl. Markkula, Sormunen 2000: 261). Panofsky unterscheidet drei verschiedene Ebenen von Bildinhalten: 1) primäres oder natürliches Sujet, 2) sekundäres oder konventionales Sujet und 3) eigentliche Bedeutung oder Gehalt. Unter dem primären Sujet versteht er »Gegenstände wie menschliche Wesen, Tiere, Pflanzen, Häuser, Werkzeuge und so fort« (Panofsky 2006: 37). Diese Ebene nennt Panofsky »vorikonographisch« (Panofsky 2002: 43); zumeist wird in der gegenwärtigen Literatur der Informationswissenschaft der Terminus »prä-ikonographisch« (Peters, Stock 2008: 80; Stock, Stock 2008: 21) genutzt: »In der Informationswissenschaft nennt man das Ergebnis der prä-ikonographischen Interpretation die Ofness eines Dokuments« (Peters, Stock 2008: 80). Dass auf der prä-ikonographischen Ebene ← 178 | 179 → von Interpretation gesprochen wird, mag vielleicht verwundern, denn es geht auf dieser Ebene um die Beschreibung des Bildes, um eine »generic description of the objects and actions represented in the picture« (Shatford 1986: 43), für deren Erkennungs- und Benennenskompetenz die Vertrautheit mit den zu sehenden Objekten und Handlungen notwendig ist. Doch je weiter ein Objekt von einem Prototypen entfernt ist, desto mehr Interpretationsleistung muss von den Rezipierenden erbracht werden, um es als bestimmtes Objekt zu erkennen und zu benennen. Auf der sekundären, ikonographischen Ebene ist die Analyse der auf der primären Ebene identifizierten Objekte und Handlungen angesiedelt. Analyse bedeutet hier die »Nennung der Art der Wechselwirkung, die zwischen den Objekten besteht, die ein Thema bilden« (Gödert et al. 2012: 63). Panofsky (2002: 39) nennt als Beispiel eine bestimmte Gruppierung von Personen um einen Tisch, die das letzte Abendmahl darstellt. Das Beispiel macht einerseits deutlich, dass die ikonographische Ebene vor allem im Bereich der Kunst in Verbindung mit thematischen Motiven relevant ist. Andererseits ist anhand des Beispiels ersichtlich, dass auf dieser Ebene eine Vertrautheit mit einer spezifischen Kultur erforderlich ist (vgl. Shatford 1986: 44). In der informationswissenschaftlichen Literatur wird die ikonographische Ebene Aboutness genannt (vgl. Stock, Stock 2008: 36). Shatford (1986: 45) zählt zur Aboutness-Ebene auch Emotionen (z. B. Liebe, Trauer) oder abstrakte Konzepte (z. B. Wahrheit, Ehre). Auf der dritten, auch ikonologisch268 genannten Ebene, geht es um die prä-ikonologische und ikonographische Information, zusätzlich aber auch um Wissen zum künstlerischen, sozialen und kulturellen Hintergrund des Werkes, was schließlich eine Interpretation von symbolischen oder allegorischen Inhalten des Bildes ermöglicht (vgl. ebd.: 45).

Laut Shatford (1986: 45) ist es nicht sinnvoll, Bilder auf einer ikonologischen Ebene zu indexieren.269 Es reicht aus, die prä-ikonographische und die ikonographische Ebene für die Indexierung zu berücksichtigen, da die ikonologische Ebene auf einer präzisen Beschreibung auf der prä-ikonographischen und einer korrekten Analyse auf der ikonographischen Ebene beruht. Darüber hinaus ist es sowieso schwierig, eine exakte Unterscheidung zwischen der ikonographischen und der ikonologischen Ebene zu treffen. So sprechen Gödert et al. (2012: 18) von ← 179 | 180 → einer »Symbol- oder Metaphernebene«, die sie nicht weiter differenzieren. Wenn im weiteren Verlauf der Terminus der Aboutness verwendet wird, so ist in diesem weiten Sinne damit eine Symbol- und Metaphernebene gemeint.

Die bisherigen Erläuterungen haben gezeigt, dass insbesondere die Inhaltserschließung von Bildern auf der ikonographischen und der ikonologischen Ebene von Subjektivität geprägt ist. Doch auch die Beschreibung auf der prä-ikonographischen Ebene kann nicht als absolut objektiv bezeichnet werden, denn die Identifizierung der Objekte und Handlungen ist abhängig vom Hintergrund und dem Erfahrungswissen der Indizierenden (vgl. Shatford 1986: 57). Dennoch ist es insgesamt bedeutend einfacher, die Ofness korrekt anzugeben als die Aboutness (vgl. Stock, Stock 2008: 36).

Shatford (1986: 49) hat – wie bereits erwähnt – den Ansatz von Panofsky aufgegriffen und daraus für den Einsatz in der Informationswissenschaft eine Kreuzklassifikation erstellt. Von Panofsky übernommen hat sie die beiden Ebenen der Ofness und der Aboutness, wobei sie zusätzlich eine Unterscheidung in allgemeine und spezifische Ofness vorgenommen hat. Während sie die allgemeine Ofness zur prä-ikonographischen Ebene rechnet, gehört die spezifische Ofness der ikonographischen Ebene an (vgl. ebd.: 47). Die genannten drei Ebenen werden mit den Aspekten Wer?, Was?, Wann? und Wo? gekreuzt (vgl. ebd.: 48). Gödert et al. (2012: 66) haben die einzelnen Aspekte in der Kreuzklassifikation erläutert und jeweils anhand eines Beispiels illustriert (vgl. Tabelle 12).

Tabelle 12:  Kriterien zur Bildanalyse nach Shatford (Gödert et al. 2012: 66)

image

image

← 180 | 181 →

Gödert et al. (2012: 17) weisen darauf hin, dass zur inhaltlichen Erschließung von Bildern keine Informationen gezählt werden können, die über zusätzliche Quellen eruiert werden müssen. Als Beispiele nennen sie Informationen zur Entstehungsgeschichte eines bestimmten Gebäudes oder Fahrpläne von abgebildeten Verkehrsmitteln. Ebenfalls nicht zur Inhaltserschließung gehören formale Relationen, das heißt Metadaten, die »eine dokumentarische Bezugseinheit durch ihre Form« (Stock, Stock 2008: 124) erfassen. Formale Relationen werden in der Informationswissenschaft auch unter dem Terminus Isness gefasst (vgl. Peters, Stock 2008: 81; Stock, Stock 2008: 161). Shatford (1984: 16) nennt im Zusammenhang mit Bildern den Namen der Urheberin oder des Urhebers, den Titel des Werkes, Fakten zur Entstehung (Wo? und Wann?) sowie Informationen zur Technik und zum Material. An dieser Stelle ist es notwendig, nochmals auf Tabelle 12 zurückzukommen, denn auch dort ging es um die Aspekte Ort und Zeit. Zyklische Zeiten können zwar an bestimmten Merkmalen erkannt werden, sie müssen aber nicht zwingend identifiziert werden. Konkrete Daten müssen jedoch eindeutig über formale Relationen erschlossen werden. Dasselbe gilt auch für Orte: Städte und Flüsse sind zwar als solche erkennbar, konkrete Orte jedoch können nur benannt werden, wenn entsprechendes Hintergrundwissen vorhanden ist. Werden also bei Fotos der konkrete Aufnahmeort und der spezifische Aufnahmezeitpunkt angegeben, müssen diese Angaben den formalen Relationen zugerechnet werden.

Die auf der Ebene der Ofness liegenden Tags können zu den objektiven Metadaten gezählt werden, bei denjenigen auf der Ebene der Aboutness handelt es sich tendenziell um subjektive Metadaten: Dem Wolkenkratzer in Tabelle 12 beispielsweise wird die Eigenschaft der Modernität zugesprochen. Aus Sicht der Sprachwissenschaft ist es angebracht, für diese Unterscheidung die beiden aus der Sprachphilosophie stammenden Termini Nomination und Prädikation zu verwenden (vgl. Sachs-Hombach, Schirra 2011: 100). Unter Nomination versteht man den »Bezug auf einen Gegenstand«, unter Prädikation die »Zuweisung von ← 181 | 182 → Eigenschaften zu dem Gegenstand« (Stöckl 2011c: 54). Genauer geht es bei der Prädikation darum, dass »einer Person oder einem Gegenstand eine Eigenschaft oder Verhaltensweise zugeschrieben oder abgesprochen wird« (Attaviriyanupap 2010: 255), wobei eine solche Eigenschaftszuschreibung in unterschiedlichen sprachlichen Ausprägungen erfolgen kann. Bei der nominalen Prädikation wird die Zuschreibung durch ein Nomen ausgedrückt, bei der verbalen Prädikation durch ein Verb, bei der adjektivischen Prädikation durch ein Adjektiv (vgl. Ebert et al. 2010: 341–342): Fritz ist ein Faulenzer, Fritz faulenzt oder Fritz ist faul. Wetzchewald (2012: 298) macht darauf aufmerksam, dass Adjektive auf Eigenschaften der dargestellten Objekte verweisen, weshalb keine direkte, sondern eine indirekte Text-Bild-Relation vorliege.

In herkömmlichen Wissensorganisationssystemen sind im Gegensatz zu Folksonomien keine Prädikationen vorgesehen. Dies zeigt sich beispielsweise daran, dass zur Inhaltsbestimmung von Bildern vom Gebrauch von Adjektiven oder Verben abgeraten wird (vgl. Gödert et al. 2012: 54). Bei Social-Tagging-Systemen wird frei nach dem Motto anything goes indiziert, weshalb nicht nur Nominationen, sondern auch Prädikationen durchaus üblich sind. Dabei kann sich eine Prädikation sowohl auf einzelne Bildobjekte bzw. -ausschnitte als auch auf das ganze Bild beziehen. Es handelt sich hierbei um die kommunikative Grundaufgabe des Bewertens (vgl. Hausendorf 2006: 74 sowie Kapitel 8). Die Grundaufgabe des Deutens hingegen entspricht Panofskys Aboutness, die Grundaufgabe des Beschreibens ist der Ebene der Ofness gleichzusetzen, diejenige des Erläuterns der Isness sowie der Wissenskommunikation überhaupt.

Gödert et al. (2012: 54) beschreiben den Prozess der Inhaltserschließung von Bildern wie folgt: »Die zur inhaltlichen Erschließung der Bilder geeigneten Begriffe werden durch Analyse der abgebildeten Objekte und Kontexte ermittelt und durch geeignete Benennungen repräsentiert.« Daran schließt sich die Frage an, welche Ausdrücke dem Retrieval dienlich sind. Es stellt sich beispielsweise die Frage nach dem sprachlichen Benennungsniveau. Das Problem der »basic level variation« (Golder, Huberman 2005: 2) wurde bereits in Kapitel 5.3 kurz angesprochen und wird in Kapitel 5.9 noch ausführlicher diskutiert. Es geht darum, wie allgemein oder spezifisch Bildinhalte versprachlicht werden sollen. Shatford (Shatford 1986: 46) konstatiert für traditionelle Wissensorganisationssysteme, dass die Schlagworte so spezifisch wie möglich gewählt werden sollten. Wie in Kapitel 5.9 noch genauer ausgeführt wird, werden hingegen in der alltäglichen Kommunikation aus verschiedenen Gründen zumeist Basisbegriffe präferiert, welche einen mittleren Grad der Spezifizierung aufweisen. Ein simpler Grund für die Nicht-Verwendung von spezifischen Ausdrücken ist das fehlende Wissen ← 182 | 183 → der Indexierenden. Auf Flickr zeigt sich dies beispielsweise in Tags wie »Wie heißt diese Pflanze?» oder Titeln wie »Wie heißt die Blume?«. Eine weitere Möglichkeit ist es, Benennungen auf verschiedenen Niveaus zu wählen, sofern entsprechendes Wissen vorhanden ist. Im empirischen Kapitel dieser Arbeit wird analysiert, inwiefern solche Begriffsleitern (vgl. dazu Kapitel 5.9) zur Beschreibung von Bildern verwendet werden.

Die bisherigen Überlegungen bezogen sich zum einen auf die Verschlagwortung von Bildern in konventionellen Systemen zur Wissensorganisation, zum andern auf das Tagging von Bildern im Social Web. Mittlerweile wird das Social Tagging aber auch in anderen Bereichen angewendet, in denen eine Verschlagwortung oder Kommentierung von Bildern benötigt wird, so etwa in der bildenden Kunst. Als Beispiel sei an dieser Stelle das Projekt Artigo270 genannt, das zu Play4Science gehört. Wie der Name bereits verrät, handelt es sich hierbei um ein Spiel, durch das der Wissenschaft ein Nutzen entsteht. Genutzt wird dabei die sogenannte Weisheit der Masse (wisdom of the crowds), d. h. das Wissen von möglichst vielen verschiedenen Nutzerinnen und Nutzern wird für das Projekt verwendet (vgl. Schmidt et al. 2010: 264). Man spricht in diesem Zusammenhang auch von Crowdsourcing, dem »Trend zur Teilauslagerung, [dem] ›Outsourcing‹ von Unternehmensaufgaben an eine Menge von Menschen, die diese Aufgaben in ihrer Freizeit lösen, in der Regel kostenlos« (Ebersbach et al. 2011: 242). Das Prinzip des Social Taggings wird also für die Wissenschaft zur Verschlagwortung von Bilddatenbanken genutzt: Die 30.000 in Artigo zu verschlagwortenden Bilder werden bezüglich Form, Inhalt, Farben und anderen Aspekten kategorisiert. Anreiz bieten einerseits das Spiel sowie die in Aussicht gestellten Gewinne, andererseits aber auch das spielerische Lernen von kunstgeschichtlichem Wissen, das nach jedem Spiel zu den einzelnen Bildern präsentiert wird. Als eine Art Vorgänger kann ein Spiel gelten, das ebenfalls das Indexieren von Bildern zum Ziel hatte, allerdings im Web mit dem Ziel, das Retrieval zu ermöglichen: Das ESP Game ging im August 2003 online, das heißt noch vor den Zeiten des Social Taggings (Ahn, Dabbish 2004: 324).271 Als weiteres, ähnliches Beispiel sei das online zugänglich gemachte Bildarchiv des Klosters Einsiedeln genannt, in dem alle Besucherinnen und Besucher Kommentare zu den Fotos anbringen können: Die meisten der bisher hinterlassenen über 1 600 Kommentare waren für die historische Forschung überaus nützlich (vgl. Landwehr 2013: 50). ← 183 | 184 →

Wie zu Beginn des Kapitels angesprochen, sind es in Social-Sharing-Communitys nicht nur die Tags, die für das Retrieval relevant sind. Vielmehr wird in den meisten Systemen der Volltext analysiert, das heißt sämtliche textuellen Informationen einer Seite. Bei der Suche gibt es teilweise die Funktion, im Volltext oder ausschließlich in den Tags zu suchen, zumal Kommentare zu einem Bild sich nicht zwangsläufig auf dieses beziehen müssen, wohingegen Tags größtenteils die Ofness oder Aboutness eines Fotos abbilden. Die Bedeutsamkeit der Tags für das Retrieval hängt also damit zusammen, welche anderen Möglichkeiten der Beschriftung oder Kategorisierung in einem System technisch möglich sind. Für herkömmliche Fotoabzüge gilt das genauso: Man kann die Fotos auf der Rückseite beschriften, allenfalls sogar direkt ins Foto hineinschreiben.272 Darüber hinaus kann man sie in Alben einkleben, die wiederum zeitlich oder thematisch angelegt werden können; und in den Alben selbst ist eine Beschriftung der Fotos ebenfalls möglich. Auf Flickr existieren entsprechende Optionen: Zur Beschriftung können neben den Tags auch ein Titel, eine Beschreibung sowie Notizen und Kommentare vergeben werden. Zudem sind virtuelle Alben erstellbar und Fotos lassen sich in Gruppen und Galerien zusammenstellen. Im Unterschied zu Fotoabzügen können digitale Bilder in beliebig vielen Alben, Gruppen und Galerien abgelegt werden. Hecker (2009: 142–153) untersuchte 359 Fotoseiten und stellte einen Mittelwert von 2,79 Tags pro Foto fest (Standardabweichung: 4,02). Er vermutet, dass Flickr-Nutzerinnen und -Nutzer ihre Fotos vor allem auch über die URLs von Alben präsentieren, weshalb die Anzahl der Tags eher gering ausfällt (vgl. aber die Ergebnisse in Kapitel 9.3.1). Dies mag für Userinnen und User gelten, die Flickr hauptsächlich als Cloud-Speicher benutzen; für Nutzerinnen und Nutzer, die hingegen in der Flickr-Community aktiv sind, spielt dies weniger eine Rolle. Lerman und Jones (2007: 2) heben darüber hinaus hervor, dass neben den vielen Möglichkeiten, auf Flickr Fotos zu finden, auch und vor allem das Social Browsing, wie sie es nennen, verwendet wird, das heißt das Betrachten der Fotos von Kontakten in der Community. Wenn Userinnen und User allerdings ihr Netzwerk vergrößern möchten, kann es durchaus sinnvoll sein, Fotos ausgiebig zu verschlagworten, damit mehr Nutzerinnen und Nutzer auf ihre Fotos stoßen.

Die Bedeutung der Tags im Vergleich zum Volltext ist auch aus einer entwicklungsgeschichtlichen Perspektive relevant. So stellt Beaudoin (2007: 28) fest, dass in der Zeit, in der sie ihre Untersuchung zu Flickr-Tags durchführte, im System der Plattform einige Veränderungen vorgenommen wurden. ← 184 | 185 → So konnte fortan auf den Fotoseiten über automatisch erstellte Tags das Aufnahmedatum, die verwendete Kamera oder der Ortsname angezeigt werden. Solche maschinellen Tags betreffen zumeist die Isness von Bildern. Im Klein-korpus, das für die vorliegende Arbeit ausgewertet wurde, lassen sich acht Belege für maschinelle Tags finden, die alle der Isness zuzurechnen sind. In fünf Fällen handelt es sich um sogenannte Geo-Tags, die immer aus zwei zusammengehörigen Tags bestehen (Längen- und Breitengrad), so zum Beispiel geo:lat=51.02449922 und geo:lon=14.21022533. Zwei Bilder sind mit dem Tag photowalkingmunich:event=20 versehen; dies sind Identifizierungs-Tags einer Gruppe. In einem einzigen Fall wurden Exif- und Kameradaten in Form von acht maschinellen Tags ausgewiesen (exif:focal_length=50 mm, exif:make=nikon corporation, exif:lens=50.0 mm f/1.4, camera:model=nikon d300s, exif:aperture=ƒ/1.4, exif:iso_speed=200, exif:model=nikon d300s und camera:make=nikon corporation. Wenn Informationen zu Bildern wie die letztgenannten somit bereits automatisch angegeben werden, müssen sie nicht mehr manuell über Tags hinzugefügt werden.

Eine weitere technische Entwicklung ist die Implementierung von sogenannten Hashtags auf Flickr. Ein Hashtag (aus engl. hash = Rautezeichen und tag = Kennzeichnung) ist »ein ikonisch hervorgehobenes Schlag- oder Stichwort, das die Nachricht thematisch zuordnet und dadurch die Such-Orientierung und Archivierung von Themen, Personen Ereignissen etc. erleichtert« (Moraldo 2009b: 259–260). Rautezeichen wurden zunächst im Internet Relay Chat zur Kennzeichnung einzelner Kanäle verwendet (vgl. Runkehl et al. 1998: 73). Durch Microblogging-Dienste wie Twitter sind Hashtags populär geworden. Hashtags unterscheiden sich von den bisher besprochenen konventionellen Tags dadurch, dass sie in den Fließtext eingebettet werden können. Integrierte Hashtags sind durch ein Rautezeichen markiert sowie durch ein Leerzeichen abgeschlossen, jedoch nicht an separater Stelle aufgeführt (vgl. Peters 2013: 233). In Microblogging-Diensten hat das Hashtag eine ökonomische Funktion: Da eine Nachricht auf 140 Zeichen begrenzt ist, stellt das Rautezeichen eine platzsparende Möglichkeit dar, ausgewählte Worte der Nachricht als Tags auszuzeichnen (vgl. Siever 2012b: 81–82). Obwohl bei Twitter eine Volltext-Suche möglich ist, ist die Suchfunktion nach Hashtags eine sinnvolle Ergänzung: Die Relevanz der Retrieval-Ergebnisse ist bei der Hashtag-Suche höher, da die mit dem Rautezeichen versehenen Worte für bedeutsamer als der Rest des Textes gehalten werden (vgl. Jucker, Dürscheid 2012: 54). Inzwischen können auch in weiteren Anwendungen Hashtags verwendet werden, so beispielsweise in den Social-Networking-Communitys Facebook, Google+, Orkut, Vkontakte und LinkedIn oder der Social-Collecting-Community Pinterest. Flickr hat im März 2013 Hashtags in der iOS-App für das iPhone ein ← 185 | 186 → geführt, jedoch noch nicht auf der Weboberfläche. In Anwendungen, die sowohl konventionelle Tags als auch Hashtags anbieten, wird es in Zukunft spannend sein, zu untersuchen, ob sich in den Funktionen eine Ausdifferenzierung herausbildet.

Wichtig ist somit an dieser Stelle festzuhalten: Die Anwendungen des Social Webs sind ständigen Veränderungen und Verbesserungen unterworfen. Dies muss man sich insbesondere dann bewusst machen, wenn Resultate verschiedener Studien miteinander vergleichen werden sollen. Es ist also stets zu fragen, wann die Daten erhoben worden sind und wie die technischen Möglichkeiten des Systems zu diesem Zeitpunkt aussahen.

Zuletzt sei erwähnt, dass Tags, die zur Inhaltserschließung von Bildern verwendet werden, sich einerseits auf das gesamte Bild (holistisch), andererseits jedoch auch lediglich auf Ausschnitte desselben partiell beziehen können. Vermutlich aus diesem Grund wurde auf Flickr die Möglichkeit der Notizen geschaffen: Mithilfe von Notizen können beliebige Segmente eines Bildes markiert und kommentiert werden. Ein Teil der Notizen kann folglich funktional als Tags eingeordnet werden, die ein Bild nur partiell betreffen. Für Videos ist Ähnliches möglich, wobei dort noch die temporale Komponente hinzukommt, d. h. bestimmbaren Sequenzen eines Films können Schlagworte zugewiesen werden. Frohner (2010: 46–47) erwähnt die Plattform Viddler, auf der zwischen Global Tags (holistisch) sowie Time Tags (partiell) unterschieden wird. Auch bei YouTube können sogenannte Anmerkungen hinzugefügt werden, beispielsweise als Titel, Notizen oder Sprechblasen.

5.7  Tag-Typologien

In diesem Kapitel soll der Frage nachgegangen werden, welche Formen und Funktionen Tags zukommen und wie sie sich klassifizieren lassen. Wie bereits in Kapitel 5 angesprochen, differieren die verschiedenen Tagging-Systeme stark, sodass Typologien stets die Eigenheiten der einzelnen Systeme berücksichtigen müssen. Insbesondere der Aspekt Type of Object spielt in diesem Zusammenhang eine herausragende Rolle. Im Folgenden werden bereits bestehende Typologien diskutiert, wobei an dieser Stelle erwähnt werden muss, dass die einzigen existierenden und hier vorgestellten Typologien allesamt aus der Informationswissenschaft stammen. Zwar werden einzelne Aspekte für eine sprachliche Analyse genannt, doch bleiben die Einteilungen unpräzise und teilweise aus linguistischer Perspektive fragwürdig und lückenhaft. Deshalb wurde für die empirische Analyse der vorliegenden Arbeit eine eigene Typologie geschaffen (vgl. Kapitel 9.2.2). ← 186 | 187 →

Golder und Hubermann (2005) sowie Heckner (2009) haben aufgrund von Tags aus Social-Bookmarking-Systemen Typologien erstellt; Beaudoins (2007) Typologie basiert auf empirischen Analysen von Tags aus der Social-Sharing-Community Flickr und Stock und Stock (2008) gehen ebenfalls auf Charakteristika ein, die speziell für das Tagging in Foto-Communitys gelten, allerdings nicht auf empirischer Basis.

Golder und Hubermann (2005: 5) haben die Social-Bookmarking-Community Delicious analysiert und die Funktionen der dort verwendeten Tags in folgende sieben Hauptkategorien eingeteilt:

       1)  Identifying What (or Who) it is About: Zumeist werden Tags zur Themenbezeichnung der jeweiligen Ressource verwendet. Oft handelt es sich dabei um Nomen auf verschiedenen Genauigkeitsstufen, ebenfalls Eigennamen.

       2)  Identifying What it Is: Hier wird die Art der Ressource identifiziert. Golder und Hubermann gehen ausschließlich von Social Bookmarkings aus und nennen als Beispiele Artikel, Blogs und Bücher. Auf einer höheren Ebene kann man allgemeiner festlegen, um welche Art von Objekt es überhaupt geht (Text, Bild, Musik etc.), und erst danach Subtypen der einzelnen Arten bestimmen.

       3)  Identifying Who Owns It: Häufig werden auch die Urheberinnen und Urheber der getaggten Ressource genannt. Bei Social-Sharing-Communitys, wo jede Ressource sowieso bereits mit der Urheberin oder dem Urheber verknüpft ist, ist diese zusätzliche Information an sich nicht nötig, beim Social Bookmarking hingegen sind die taggenden Nutzerinnen und Nutzer für gewöhnlich nicht die Urheberinnen oder Urheber der getaggten Ressource.

       4)  Refining Categories: Die Tags, die dieser Kategorie angehören, haben alleine keine Bedeutung; sie dienen vielmehr dazu, andere Tags zu konkretisieren bzw. zu quantifizieren. Insbesondere Zahlen, die Maß- und Mengeneinheiten näher bestimmen, gehören in diese Kategorie. Frohner (2010: 14) bemerkt richtig, dass diese Tags, die vom System wie alle anderen Tags behandelt werden, ohne Zusammenhang keinen Sinn ergeben. Nutzerinnen und Nutzer können also beim Betrachten einer Tag-Serie den Sinn erkennen, nicht aber anhand solcher Tags Ressourcen ausfindig machen.

       5)  Identifying Qualities or Characteristics: In dieser Kategorie sind vorwiegend bewertende Adjektive zu finden, welche die subjektive Meinung der Taggenden zur Ressource aufzeigen.

       6)  Self Reference: Tags dieser Kategorie zeigen den Bezug zwischen der getaggten Ressource und der oder dem Taggenden an. Beispiele sind »myself« oder »Mein Garten«. 273 ← 187 | 188 →

       7)  Task Organizing: Werden Ressourcen mit dem Ziel gesammelt, mit ihrer Hilfe eine Aufgabe zu erledigen, können Tags verwendet werden, um Informationen zur Aufgabe zu speichern. In Social-Sharing-Communitys sind solche Tags im Gegensatz zu Social-Bookmarking-Diensten nicht zu erwarten.

In dieser Typologie wurde hauptsächlich die Funktion, aber teilweise auch die Form (z. B. Wortarten: Adjektive) berücksichtigt. Diese beiden Ebenen sollten jedoch strikt getrennt werden, denn selbst wenn durchaus bei einigen Funktionen bestimmte Formen eher zu erwarten sind als bei anderen, so ist es für eine präzise Analyse unerlässlich, die beiden Ebenen voneinander unabhängig zu betrachten und erst in einem zweiten Schritt zu evaluieren, inwiefern Form und Funktion in einem Zusammenhang stehen. Golder und Hubermann (2005: 5) konstatieren, dass bei den ersten vier Funktionen Informationen bereitgestellt werden, die überwiegend objektiv und für viele Nutzerinnen und Nutzer relevant sind, während die Informationen der letzten drei Funktionen zumeist nur für die taggende Person von Bedeutung ist. In ihrer Terminologie sind die ersten vier Kategorien extrinsische Tags, die letzten drei intrinsische (vgl. ebd.: 5; 7). Die in den extrinsischen Tags repräsentierten objektiven Informationen entsprechen klassischen Metadaten; die Art der Ressource und die Urheberin oder der Urheber zählen zu den »formalen Relationen«, der Inhalt und das Thema der Ressource zu den »Erschließungsrelationen« (Stock, Stock 2008: 124). Die Refining Category hingegen muss je nach Zugehörigkeit als Unterkategorie zu den formalen Relationen oder den Erschließungsrelationen angesehen werden.

Weitaus umfassender und differenzierter ist das Tag-Kategorisierungsmodell von Heckner (2009), welches auf Basis von Daten des Dienstes Connotea erstellt wurde. In seiner Typologie unterscheidet Heckner (2009: 124) drei verschiedene Hauptebenen, und zwar die sprachliche, die funktionale sowie die Tag-Text-Relation.

Die sprachliche Ebene besteht aus den folgenden vier gleichrangigen Ebenen: Sprache, Neologismen, Schreibung und Wortart. Meines Erachtens vermischt diese Kategorisierung die verschiedenen Ebenen miteinander: Die Bestimmung der verwendeten Einzelsprache müsste eine Ebene höher angesetzt werden; auch die Kategorie Neologismen wäre eher als Unterkategorie der Lexik anzusetzen. Zudem erläutert Heckner nicht, warum sein Modell auf der lexikalischen Ebene auf Neologismen begrenzt ist; dass die Möglichkeit, Neologismen als Tag-Labels zu verwenden, ein Vorteil von Folksonomien darstellt, wird nirgends erwähnt. Die beiden Kategorien Schreibung und Wortart sind noch genauer ausgeführt, Unterkategorien der erstgenannten Kategorie sind korrekte Schreibung, fehlerhafte Schreibung sowie Schreibvarianten (wie z. B. BinnenGroßschreibung). Auch hier ← 188 | 189 → wiederum macht der Autor nicht deutlich, welche hohe Relevanz die Schreibung für das Retrieval besitzt. Die Kategorie Wortart schließlich verfügt über die beiden Unterkategorien Einwort-Tag und Mehrwort-Tag. Bereits diese Einordnung unter Wortart ist fragwürdig; doch auch die Unterkategorien der Einwort- und Mehrwort-Tags sind kategorial unscharf getrennt. So zählen beispielsweise Komposita neben Phrasen zu den Mehrwort-Tags. Bei den Einwort-Tags wiederum lässt sich neben den klassischen Wortarten (Nomen, Verb, Adjektiv, Adverb), die übrigens auch für Komposita gelten sollten, die Kategorie Synsemantikum finden. Als Synsemantika jedoch werden normalerweise alle Wortarten bezeichnet, die in Sätzen nur eine grammatische Funktion und keine lexikalische Bedeutung haben. Entweder hätten auf dieser Ebene konkret Pronomen und Partikel genannt oder aber die anderen aufgeführten Wortarten unter Autosemantika gefasst werden müssen. Schließlich lassen sich bei den Einwort-Tags noch die Kategorien Ziffer und Akronym finden. Ziff ern sollten selbstverständlich analysiert werden, sind aber in der Kategorie Wortart falsch verortet. Akronyme auf derselben Ebene wie die Wortarten aufzuführen, ist absurd, denn Akronyme basieren »auf den ersten Graphemen der einzelnen Wörter der Wortgruppe […] (Europäische U nion > EU)« (Siever 2011c: 106). Akronyme jedoch sind selbst eigenständige Lexeme, denen ein Genus zugewiesen ist, im genannten Beispiel also handelt es sich um Nomen. Das Beispiel zeigt also, dass die Einordnung von Akronymen auf der Ebene der Wortarten inadäquat ist, da Akronyme als Wortarten klassifiziert werden können.

Abbildung 30:  Funktionales Tag-Kategorisierungsmodell von Heckner (2009: 127)

image

Auf der funktionalen Ebene unterscheidet Heckner (2009: 127) zunächst zwischen Subject-Related Tags und Non-Subject-Related Tags. Die Kategorie Tag Avoidance ← 189 | 190 → bei den Non-Subject-Related Tags umfasst sämtliche Tags, die Nutzerinnen und Nutzer, die die Ressource eigentlich nicht taggen wollen, in einem System vergeben haben, das zwingend Tags verlangt. Die Unterteilung in Resource-Related Tags und Content-Related Tags ist eine grundlegende und sinnvolle; sie ist kongruent mit der bei Golder und Hubermann (2005: 5; 7) vorgenommenen Unterscheidung in extrinsische versus intrinsische Tags, die wiederum den formalen Relationen und Erschließungsrelationen bei Stock und Stock (2008: 124) entsprechen. Im Bibliothekswesen unterscheidet man im Bereich der Informationserschließung zwischen der sogenannten Formalerschließung sowie der Inhalts- oder Sacherschließung (vgl. Gödert et al. 2012: 59).274 Die Content-Related Tags beschreiben also den Inhalt der getaggten Ressource, wobei Heckner (2009: 127) in seinem Modell, das ja auf dem Tagging von wissenschaftlichen Publikationen beruht, die Subkategorien Forschungsgebiet, Art der Publikation (z. B. Rezension) und Methodologie nennt, die nur für diese Art von Tagging-Systemen von Bedeutung sind. Zu den Resource-Related Tags gehören beispielsweise der Name der Urheberin oder des Urhebers, die Art der Ressource, der Dateityp, das Datum und das Gerät. Insbesondere in der Foto-Community Flickr treten Resource-Related Tags häufig auf (vgl. ebd.: 153). Dies ist einerseits nicht verwunderlich, da die Nutzerinnen und Nutzer dieser Community überwiegend (Hobby-)Fotografen und Fotografinnen sind, welche die Plattform nutzen, um sich unter anderem auch fachlich auszutauschen; dazu sind solche Angaben dringend notwendig. Andererseits werden per Standardeinstellung die Exif-Daten der digitalen Fotos auf Flickr hochgeladen, sodass den Userinnen und Usern diese Informationen bereits auf diesem Weg zugänglich sind und nicht zusätzlich per Hand angegeben werden müssen. Aus Sicht des Retrievals sind solche manuell vergebenen Tags jedoch sinnvoll, wenn man beispielsweise Fotos finden möchte, die mit einer bestimmten Belichtungszeit o. Ä. aufgenommen worden sind.

Bei den Non-Subject Related Tags steht nicht die Ressource, sondern die oder der Taggende im Vordergrund. Die Benennung der Kategorie ist etwas unglücklich gewählt, da sie suggeriert, die Tags hätten keinen Bezug zur getaggten Ressource, weshalb die Bezeichnung User Related Tags sinnvoller gewesen wäre. Denn gerade bei der Unterkategorie Affective, die nochmals in positiv und negativ unterteilt ist, geht es zwar um die Haltung des Nutzers bzw. der Nutzerin der Ressource gegen ← 190 | 191 → über, doch eine Relation zur Ressource zu negieren, ist paradox. Die Kategorien Time and Task Related, die sich auf Aufgaben bezüglich der Ressource beziehen, und Tag Avoidance können jedoch als Non-Subject Related angesehen werden.

In der dritten Kategorisierung geht es um die Tag-Text-Relation. Heckner (2009: 133) unterscheidet die Ebenen 1) identisch mit dem Volltext, 2) Variation des Volltextes sowie 3) nicht im Volltext auftretend. Beim erstgenannten Aspekt müssen die einzelnen Teiltexte der Ressource beachtet werden, bei wissenschaftlichen Publikationen also der Titel, das Abstract und der Volltext. Beim zweiten Aspekt werden einerseits Schreibvarianten wie Tippfehler, andererseits aber auch Varianten, die auf Flexion zurückzuführen sind, berücksichtigt. Schließlich ist es auch möglich, dass das vergebene Tag nirgends im Volltext zu finden ist. Heckner zählt neben Tags, die keine erkennbare Relation zum Volltext haben, auch Tags dazu, zu denen sich im Volltext Synonyme, Hyponyme oder Hyperonyme finden lassen.275

Ein Vergleich von Tags und Volltext ist aus der Perspektive des Retrievals von Relevanz: So kann in einigen Tagging-Systemen bei Abfragen angegeben werden, ob der Suchterm mit dem Volltext oder nur mit den Tags abgeglichen werden soll. Wenn also die Taggenden lediglich Lexeme aus dem Volltext für die Verschlagwortung verwenden, so ist der Nutzen beim Retrieval geringfügig, da keine zusätzlichen Metadaten hinzugefügt wurden. Dennoch haben Tags einen Mehrwert, da sie von den Nutzerinnen und Nutzern ausgewählt wurden, um die Ressource genauer zu beschreiben, sie wurden folglich als von besonderer Relevanz eingestuft (vgl. ebd.: 132).

Wenden wir uns nun dem Kategorisierungsmodell der Informationswissenschaftlerin Beaudoin zu, deren Kategorien auf einer Analyse von Flickr-Tags basieren. Im Gegensatz zu Heckners mehrstufigem Modell sind Beaudoins (2007: 26) Kategorien alle auf einer Ebene angelegt. Zwar wird erläutert, dass die Tags gleichzeitig verschiedenen Kategorien zugeordnet werden konnten. Trotzdem bleibt fraglich, was man mit einem Resultat anfangen kann, welches wie folgt lautet: Die häufigste Kategorie im Korpus stellen die Ortsnamen dar, gefolgt von mehrteiligen Tags, Gegenständen und Personen (vgl. ebd.: 27). Mit Tags, die bei Heckner als Content-Related bezeichnet wurden, werden also die mehrteiligen Tags verglichen, die der sprachlich-formalen Ebene zuzurechnen sind. ← 191 | 192 →

Tabelle 13:  Tag-Kategorien von Beaudoin (eigene Darstellung)

image

In Tabelle 13 habe ich die einzelnen Kategorien von Beaudoin aufgelistet und nach Form und Funktion gruppiert. Beaudoin führt noch drei weitere Kategorien an, und zwar die Einzelsprache, die Zahlen und die nicht bestimmbaren Tags, die aber beide über der von mir in Tabelle 13 angesetzten sprachlich-formalen und funktionalen Ebene angesiedelt werden sollten. Die Einzelsprache sollte meines Erachtens bestimmt werden, bevor eine Kategorisierung auf der formalen und funktionalen Ebene vorgenommen wird, weshalb dieses Kriterium in Tabelle 13 nicht aufgeführt ist. Gleiches gilt für die Zahlen: Bei dieser Kategorie ist eine sprachlich-formale Bestimmung nicht möglich, jedoch eine auf der funktionalen Ebene, da Zahlen verschiedene Funktionen einnehmen können (z. B. Datumsangaben, Fachausdrücke der Fotografie276 oder Bewertung). Auch die nicht bestimmbaren Tags sollten aus dem Sample eliminiert werden, bevor die übrig gebliebenen Tags formal und funktional bestimmt werden.

Eine weitere Einteilung von Tags, die sich auf Bilder beziehen, ist in Stock und Stock (2008: 161) sowie Peters und Stock (2008: 80–81) zu finden. Sie basiert zwar nicht auf einer empirischen Analyse, wird aber an einem konkreten Beispiel von Flickr erörtert. Die Autoren unterscheiden in Anlehnung an Panofsky (2002; 2006) die Kategorien Ofness, Aboutness, ikonologische Tags sowie Isness (vgl. auch Kapitel 5.6). Die Ofness eines Bildes ist ihre prä-ikonographische Interpretation (vgl. Peters, Stock 2008: 80). Darunter versteht man die Beschreibung von Betrachterinnen und Betrachtern, die mit bestimmten Gegenständen oder Ereignissen vertraut sind. Es geht hier also schlicht um die Frage, was auf dem Bild zu sehen ist, ohne das Gesehene zu interpretieren oder Sinnzusammenhänge herzustellen (vgl. Stock, Stock 2008: 21). Als Beispiel nennen die Autoren verschiedene Farben im Bild (vgl. ebd.: 161). Die Aboutness bezieht sich auf die ikonographische277 Ebene: ← 192 | 193 → »Themen, die in einem Dokument abgehandelt werden und zur Repräsentation anstehen« (ebd.: 410). Die einzelnen Elemente, die in Ofness-Tags ausgedrückt sind, werden bei der Aboutness in einen Zusammenhang gebracht, sodass zwar das Thema des Bilds genannt werden kann, doch erfolgt dabei noch keine tiefergehende Interpretation. In einem von Peters und Stock verwendeten Beispiel sind Tags der Aboutness Mönch, Doktor und Dealer (vgl. Peters, Stock 2008: 81). Die ikonologischen Tags repräsentieren Interpretationen und symbolische Bedeutungen; so wird im Beispiel das Tag Kunst genannt, da es sich beim Foto um die Abbildung von Statuen einer Künstlerin handelt (vgl. Stock, Stock 2008: 161). Peters (2008: 81) weist darauf hin, dass Kunst nur schwach ikonologisch sei, ein stärkeres ikonologisches Tag könnte beim genannten Beispiel unheilige Dreifaltigkeit sein. Mit Isness-Tags schließlich werden Aspekte verschlagwortet, die keine Berührungspunkte mit dem Inhalt des Bildes haben; im zitierten Beispiel der Name der Künstlerin und des Museums (vgl. 2008: 161).

Wenn wir nun von der letztgenannten Typologie ausgehen und sie mit den anderen, zuvor präsentierten Typologien vergleichen, fällt auf, dass sich bei der Kategorisierung auf funktionaler Ebene278 inhaltliche Übereinstimmungen finden lassen, die terminologisch unterschiedlich gefasst wurden. Tabelle 14 gibt einen Überblick über die von den verschiedenen Autorinnen und Autoren verwendete Terminologie.279

Tabelle 14:  Terminologischer Vergleich in den verschiedenen Typologien (funktionale Ebene)

image ← 193 | 194 →

Sowohl Golder und Hubermann (2005) als auch Heckner (2009) nehmen eine Einteilung vor, die objektive und subjektive Metadaten getrennt aufführt; Peters und Stock (2008) sowie Stock und Stock (2008) hingegen blenden die subjektiven Metadaten aus, nehmen aber dafür beim Inhalt der Ressourcen Differenzierungen vor, die bei den anderen beiden Arbeiten fehlen.

In Folksonomien lassen sich folglich Tags in den unterschiedlichsten Formen und Funktionen antreffen; in Tagging-Systemen sind die Funktionen der Tags jedoch nicht als solche gekennzeichnet. Bei professionell erstellten Metadaten ist dies anders: Die Daten werden in verschiedene Felder wie Autor oder Dokumenttyp aufgegliedert, d. h. Inhalt und Isness werden strikt voneinander getrennt (vgl. Peters, Stock 2008: 83). Weller und Peters (2008: 115) schlagen diesbezüglich vor: »For each document different fields may be provided for tagging according to the different tag functionalities, e.g. one for content-descriptive tags, one for formal tags (or more specific one for the author, one for the document‘s file type etc.), and one for organizational tags (e.g. task organization, reference to projects).« Die Suche könnte somit auf einzelne Tag-Funktionen reduziert werden, was im besten Fall zu präziseren Suchergebnissen führt.

5.8  Sprachliche Herausforderungen beim Tagging

Wie in Kapitel 5.3 ausgeführt, wird beim Social Tagging kein kontrolliertes Vokabular verwendet, was einerseits ein Vorteil ist, da dadurch alle Arten von Daten ohne vorherige Standardisierung annotiert werden können. Zudem müssen sich die Nutzerinnen und Nutzer nicht in eine bestimmte Terminologie einarbeiten und die Bildung von Okkasionalismen sowie die Verwendung von Neologismen und persönlichen Annotationssystemen sind möglich: Es »ist (fast) alles als Label erlaubt, was sich über die Tastatur eingeben lässt« (Müller-Prove 2008: 19). Andererseits bringen diese Freiheiten und das fehlende kontrollierte Vokabular auch verschiedene sprachliche Herausforderungen mit sich, die im Folgenden diskutiert werden. Probleme ergeben sich auf verschiedenen sprachlichen Ebenen, es sind dies die Mehrsprachigkeit, die Morphologie, die Graphie und die Semantik.

Bei einer Durchsicht von Analysen von Tags wird deutlich, dass das Social Tagging auch Nachteile in sprachlicher Hinsicht in sich birgt. So weist Frohner (2010: 96) darauf hin, dass in Studien Folksonomien mit Wörterbüchern abgeglichen wurden, wobei bei Flickr 40 % der Tags und bei Delicious zwischen 28 % und 50 % nicht im Wörterbuch gefunden werden konnten. Leider wird nicht ausgeführt, welcher Art die Tags sind, die keine Übereinstimmung mit den Wörterbüchern aufwiesen. Es lassen sich deshalb nur Vermutungen anstellen, wie sich diese Tags charakterisieren ließen: Tags mit Tipp- oder Rechtschreibfehlern, Tags mit ← 194 | 195 → Lexemen aus anderen Sprachen, Tags mit Sonderzeichen sowie mehrteilige Tags. Darüber hinaus ist anzunehmen, dass viele Tags Eigennamen oder geographische Namen sind, die keinen Eingang in ein übliches Wörterbuch finden. Die oben genannten relativ hohen Prozentzahlen gilt es aus diesem Grund zu relativieren.

Betreffend der Sprachwahl beim Tagging kann festgestellt werden, dass viele Anwendungen des Social Webs von Anglozentrismus geprägt sind (vgl. Panke, Gaiser 2008: 27) und dementsprechend die englische Sprache eine zentrale Rolle einnimmt. Panke und Gaiser (2008: 30) kommen durch die Analyse qualitativer Interviews zu dem Schluss, dass die meisten der deutschsprachigen Befragten die Ressourcen auf Deutsch und Englisch taggen, wobei die Entscheidung der Sprachwahl sowohl von der getaggten Ressource als auch von den Recommended Tags abhängt. Beim Retrieval bereitet insbesondere die intersprachliche Homonymie Probleme, da dadurch falsche Suchresultate zustande kommen (vgl. Peters, Stock 2008: 83 oder Weller et al. 2010: 137). Intersprachliche Homonyme sind auch unter dem Namen falsche Freunde (engl. false friends/frz. faux amis) bekannt und können in einem engeren280 Sinn als »Wortpaare aus zwei verschiedenen Sprachen verstanden [werden], die bei gleicher bzw. ähnlicher phonologisch-orthographischer Form (völlig) verschiedene oder nur teilweise gleiche Bedeutungen haben« (Dretzke, Nester 2009: 5). Als Beispiele seien »burro« (span. Esel, ital. Butter) oder »gift« (engl. Geschenk, dt. Gift) genannt.281 Die intersprachliche Synonymie spielt für das Retrieval keine Rolle, jedoch für die sprachliche Analyse von Folksonomien: Wenn ein Foto mit den Tags »ball«, »sport« und »service« versehen wurde, so kann bei »ball« nicht entschieden werden, ob es dem Englischen oder dem Deutschen angehört, dasselbe gilt für »sport« und »service«, die darüber hinaus auch Wörter des Französischen sind (vgl. dazu auch Kapitel 9.2.2.1). Im Gegensatz zu Folksonomien ist bei Ontologien die einzelne Sprache nicht von Bedeutung, ← 195 | 196 → denn Ontologie kann als »explizite formale Spezifikation einer Verbegrifflichung« (Panyr 2006: 146, Herv. im Original) definiert werden, was bedeutet, dass für ein bestimmtes Konzept zwar ein Begriff vorhanden ist, doch dieser ist nicht an eine spezifische Einzelsprache gebunden.

Im Bereich der Morphologie ist die Flexion ein relevanter Teilbereich. In den meisten Fällen ist es sinnvoll, unflektierte Formen zu verwenden, wie dies auch mit Lemmata in Wörterbüchern oder Lexika geschieht (Nennform). Die Analyse von Guy und Tonkin (2006) hat gezeigt, dass immerhin 8 % der Tags bei Flickr sowie 11 % bei Delicious Pluralformen sind. Weller (2008: 112) weist diesbezüglich darauf hin, dass insbesondere in Foto-Communitys die Unterscheidung in Singular- und Pluralformen wichtig sein kann, je nachdem, ob ein oder mehrere Gegenstände abgebildet sind. Ein weiterer Aspekt innerhalb der Morphologie sind Kurzformen, insbesondere Akronyme. Ohne Kontext oder Kookkurrenzen kann bei homographen Akronymen nicht erschlossen werden, welche der möglichen Bedeutung sie aufweisen; das Problem liegt folglich auch auf der semantischen Ebene. Frohner (2010: 100) führt das Akronym »MS« an, welches die Kurzform zu Microsoft, Manuskript, Motorschiff oder Multiple Sklerose sein kann. Monoseme Akronyme hingegen – beispielsweise USA – sind sinnvolle Tag-Labels.

Die Graphie stellt eine der größten Herausforderungen in Folksonomien dar. Wird bei der Suche die exakte Buchstabenfolge berücksichtigt, können Ressourcen, deren Tags in Schreibvarianten vorliegen, nicht gefunden werden. Als fehlerhafte Schreibvarianten können Tipp- oder Orthographiefehler angesehen werden.282 Heckner (2009: 126) konnte in seiner Analyse von Daten der Plattform Connotea lediglich einen Anteil von 2 % an Tags finden, die einen Tippfehler enthielten. Er führt diese niedrige Zahl darauf zurück, dass das System über eine Autovervollständigung verfügt, die den Nutzerinnen und Nutzern während des Tippens Vorschläge zur Auswahl unterbreitet. Neben Rechtschreib- und Tippfehlern gibt es auch Schreibvarianten, die auf die Sprachvarietät zurückzuführen sind. Genannt seien Unterschiede zwischen dem amerikanischen und britischen Englisch (neighbor vs. neighbour, centre vs. center, defence vs. defense, realize vs. realise, analog vs. analogue).

Für das Deutsche gibt es ebenfalls einige, wenn auch wenige, varietätenspezifische Varianten. So wird bekanntlich die Eszett-Schreibung im Schweizer Stan ← 196 | 197 → darddeutschen nicht verwendet, beispielsweise Straße (D) vs. Strasse (CH) (vgl. Gallmann 1997: 135). Zu nennen sind zudem unterschiedliche Präferenzen bei Einzelschreibungen wie beispielsweise Marroni (CH) vs. Maroni (A) vs. Maronen (D) sowie Fremdwortschreibungen insbesondere aus dem Französischen und Italienischen wie Résumé283 (CH) vs. Resümee (A, D) oder Broccoli (A, CH) vs. Brokkoli (D) (vgl. Ammon 2004: LXI–LXII). Jacobs (2007: 52) bezeichnet solche varietätenspezifischen Varianten als »systembedingte Schreibvarianten«, das heißt, dass es für eine Sprache mehrere verschiedene Schriftsysteme gibt, die über unterschiedliche graphische Strukturen eines lautsprachlichen Ausdrucks verfügen. Im Zusammenhang mit Folksonomien von Relevanz sind darüber hinaus Schreibvarianten, die orthographisch zugelassen sind. In der Terminologie von Jacobs (2007: 50) sind dies »freie Schreibvarianten«, wenn also ein lautsprachlicher Ausdruck in zwei verschiedenen graphischen Strukturen realisiert werden kann. Als klassischen Fall von freien Schreibvarianten nennt Jacobs die Fremdwortschreibung, beispielsweise Grislibär vs. Grizzlybär oder Delfin vs. Delphin. Auch Varianten mit oder ohne Elision können zu den freien Schreibvarianten gezählt werden, z. B. runzlig vs. runzelig (vgl. Zimmermann 1992: 292). Die beiden genannten Schreibvarianten führen zu uneinheitlichen Schreibungen und weisen keine inhaltlichen Differenzierungen auf – im Gegensatz zu den disambiguierenden und konstruktionsbedingten Varianten. Die disambiguierende Schreibvariante spielt hier keine Rolle, da es sich um Schreibvarianten für Homophone handelt, z. B. Seite vs. Saite. Auch die konstruktionsbedingten Schreibvarianten sind bei Tags irrelevant, da diese nicht in grammatischen Konstruktionen auftreten; so wird etwa die Groß- und Kleinschreibung – von Jacobs (2007: 49) für konstruktionsbedingte Schreibvarianten als typisches Beispiel genannt – von Tagging-Systemen üblicherweise ignoriert.284 Was hingegen in vielen Tagging-Systemen wie zum Beispiel bei Flickr unterschieden wird, sind freie Schreibvarianten der Getrennt- und Zusammenschreibung wie aufgrund vs. auf Grund oder alleinerziehend vs. allein erziehend sowie Schreibungen mit oder ohne Bindestrich wie User-Treffen vs. Usertreffen.

Bisher stand bei den Überlegungen die Wortebene im Zentrum. Es muss aber bedacht werden, dass oftmals mehrteilige Tags verwendet werden, d. h. ein ← 197 | 198 → Tag-Label enthält mehrere Wortformen. Eine Möglichkeit der Verschriftung ist das Weglassen des Spatiums, allenfalls dann jedoch der Lesbarkeit halber mit BinnenGroßschreibung. Weitere Möglichkeiten zur Trennung von Wortformen sind Satzgliederungszeichen wie Punkt, Komma, Semikolon oder Binde- und Unterstriche. Bei einer Suche auf Flickr erhält man mit den genannten Zeichen dasselbe Ergebnis wie beim Setzen eines Spatiums. Ohne Spatium hingegen fällt das Suchresultat anders aus. Nochmals ändert sich das Ergebnis, wenn man – ohne Anführungszeichen zu benutzen – nach blaue Stunde sucht, denn so werden lediglich Ressourcen angezeigt, die mit den Tags blaue und Stunde versehen wurden. Eine solche Aufteilung in zwei Tag-Labels, die eigentlich eines darstellen sollten, resultiert aus dem Umstand, dass viele Tagging-Systeme Spatien als Grenze zwischen zwei Tag-Labels interpretieren, was nur durch Anführungszeichen o. Ä. umgangen werden kann (vgl. Müller-Prove 2008: 19). Insbesondere bei den Refining Tags, welche andere Tags näher bestimmen (vgl. Kapitel 5.7), ist eine solche Isolierung jedoch sinnlos.

Im Bereich der Semantik ist vor allem die Homonymie – genauer: die Homographie – bzw. Polysemie285 zu nennen, einerseits die innersprachliche, andererseits die bereits angesprochene intersprachliche, die beim Retrieval Schwierigkeiten bereitet. Zur innersprachlichen Polysemie kann für das Deutsche eine Studie angeführt werden, in der die Auswertung des Duden-Universalwörterbuches ergab, dass Verben durchschnittlich über 2,09, Substantive über 2,08 und Adjektive über 2,3 Bedeutungen verfügen (vgl. Levickij 2005: 460). Es sei angemerkt, dass bei einer vorliegenden Fotoseite Homonymie zumeist irrelevant ist, denn das Bild oder auch die Co-Tags lösen die Homonymie in den meisten Fällen auf, d. h. es kommt zu einer Lesartendisambiguierung.286 In Thesauri begegnet man dieser Problematik mit der bereits erwähnten Polysem-Kontrolle, die unter anderem darin besteht, dass Deskriptoren (= Vorzugsbenennungen) mit einem Qualifikator (= Ergänzung) versehen werden: Strauß<Vogel> vs. Strauß<Blumenstrauß>. Um ← 198 | 199 → diesem Problem beizukommen, hat beispielsweise Flickr die Cluster-Funktion eingeführt (vgl. Abbildung 31), in der die Cluster in Form von Thumbnails sowie entsprechenden Tags die Funktion von Qualifikatoren erfüllen.

Abbildung 31:  Cluster auf Flickr am Beispiel von Strauß287

image

In Abbildung 31 sind häufig verwendete Co-Tags aufgeführt, in denen sich Relationen spiegeln. Diese Relationen werden allerdings nicht explizit sichtbar gemacht; in Folksonomien wird nicht deutlich, dass Vogel ein Hyperonym zu Strauß und ein Hyponym zu Tier ist. In Folksonomien liegen also keine paradigmatischen, sondern lediglich syntagmatische Relationen vor (vgl. Kapitel 5.9). Die paradigmatischen Relationen existieren lediglich implizit in den Kookkurrenzen der Co-Tags (vgl. Peters, Weller 2008: 102) und so stellt sich die Forschungsfrage, wie sich solche semantischen Relationen aufdecken lassen (vgl. Peters, Stock 2008: 88 sowie Kapitel 5.9).

In diesem Bereich ist auch die Problematik der bereits erwähnten »basic level variation« (Golder, Huberman 2005: 2) anzusiedeln; Consten (2004: 114) spricht von verschiedenen Hierarchiestufen (global – spezifisch), die vom sprachlichen Benennungsniveau abhängig sind. In der Prototypensemantik wird davon ausgegangen, dass Benennungen hierarchisch drei verschiedenen Levels der Genauigkeit zugeordnet werden können: 1) der Hyperonymebene, 2) der Basisstufe288 (basic level) und 3) der Hyponymebene (vgl. Löbner 2003: 272); im oben genannten Beispiel also 1) Tier, 2) Vogel und 3) Strauß. Laut Peters (2009: 201) liegen die meisten vergebenen Tags auf der Basisstufe, denn diese Termini sind aussagekräftig, allerdings nicht zu spezifisch und nicht zu abstrakt. Dies ist nicht erstaunlich, da allgemein in der Kommunikation Basisbegriffe bevorzugt verwendet werden, denn sie sind kognitiv am leichtesten zu verarbeiten, sie werden ← 199 | 200 → im Spracherwerb als erstes erlernt und der Grundwortschatz besteht zudem größtenteils aus Basisbegriffen (vgl. Löbner 2003: 274–276). Dass Tags auf unterschiedlichen Abstraktionsebenen gewählt werden, ist durch unterschiedliche Expertise oder Intentionen der Nutzerinnen und Nutzer bedingt (vgl. Braun et al. 2008: 165). Je nachdem also, auf welchem Level ein Bild getaggt wurde, und je nachdem, ob die Suchenden auf demselben Level recherchieren, ist das Retrieval erfolgreich oder nicht. Um die Wahrscheinlichkeit zu erhöhen, dass das eigene Bild gefunden wird, taggen Userinnen und User ihre Bilder oftmals auf verschiedenen Levels und in unterschiedlichen Varianten; Beaudoin (2007: 29) nennt neben der Variation des Levels auch die Übersetzung in andere Sprachen sowie flektierte Formen.

Synonymie ist ein weiteres anzuführendes Problem: Beim Tagging wird nicht wie in kontrollierten Vokabularien eine Synonym-Kontrolle betrieben. Bei Synonym-Kontrollen werden Synonym-Ringe gebildet, bei denen Vorzugsbenennungen (Deskriptoren) gewählt und Synonyme (Non-Deskriptoren) hinzugefügt werden. Aufgrund der fehlenden Synonym-Kontrolle beim Tagging wird – wie bereits erwähnt – als Best Practice empfohlen, Synonyme beim Tagging aufzuführen, da dadurch die Wahrscheinlichkeit eines erfolgreichen Retrievals erhöht wird (vgl. Guy, Tonkin 2006). Im weitesten Sinne als Synonyme, definiert als zwei Ausdrücke, die (mehr oder minder) dieselbe Bedeutung haben, könnten Sprachvarianten (z. B. dt. Strauß – engl. ostrich) oder orthographische Varianten gefasst werden. In der vorliegenden Arbeit werden diese jedoch nicht als Synonyme im engeren Sinn verstanden. Totale Synonymie oder Bedeutungsgleichheit, die »sich auf alle eventuellen Bedeutungsvarianten und alle Bedeutungsanteile (deskriptive, soziale und expressive Bedeutung) erstrecken« (Löbner 2003: 117) muss, ist bekanntlich äußerst selten. Zur totalen Synonymie zählen auch Varianten durch Abkürzungen (z. B. = zum Beispiel) sowie durch Kurzwortbildung (Diss = Dissertation). Als partielle Synonyme (Bedeutungsähnlichkeit oder Homöonymie, auch Quasi-Synonymie genannt, vgl. Kunze et al. 2007: 285) werden Lexeme bezeichnet, die Bedeutungsvarianten teilen und deren Verwendungsmöglichkeiten sich unterscheiden (vgl. Löbner 2003: 117). Zu den partiellen Synonymen können regionale und stilistische Varianten, native Lexeme versus Fremdwörter sowie Fachtermini versus Laienbezeichnungen gezählt werden. Löbner (2003: 117) weist darauf hin, dass als Kriterium für echte Synonymie Bedeutungs- und nicht Denotationsgleichheit gilt, weshalb Euphemismen keine Synonyme darstellen.

Abschließend sind in Tabelle 15 nochmals alle Herausforderungen, die sich aus sprachlicher Sicht beim Tagging ergeben, zusammengefasst aufgeführt. ← 200 | 201 →

Tabelle 15:  Übersicht über sprachliche Herausforderungen beim Tagging

image

Diese sprachlichen Herausforderungen bringen es mit sich, dass Tag-Labels nicht eindeutig interpretiert werden können. Nun gibt es Ansätze, Folksonomien mithilfe kontrollierter Vokabulare zu bearbeiten und zu verbessern, damit diese produktiver und effektiver werden. Unter dem sogenannten Tag Gardening (vgl. Weller et al. 2010: 139) versteht man die nachträgliche Prozesse der Bearbeitung von Folksonomien (vgl. Weller, Peters 2008: 111). Die Metapher der Gartenarbeit wird im Tag Weeding fortgeführt: Analog zum Jäten von Unkraut sollen schlechte Tags in Folksonomien entfernt werden (vgl. ebd.: 111). Schlecht können Tags aus verschiedenen Gründen sein, etwa aufgrund von Tippfehlern oder flektierten Wortformen. Auch mehrteilige Tags, persönliche Tags ohne Bedeutung für andere Nutzerinnen und Nutzer sowie unikale, polyseme oder homonyme Tags sind nicht sinnvoll. Es können also zwei Arten von schlechten Tags ausgemacht werden: einerseits solche, die für andere Userinnen und User keinen oder nur einen geringen Informationsgehalt aufweisen, und andererseits Tags, die durch ihre Form fehlerhaft sind. Sowohl für die Verschlagwortung als auch für das Retrieval ist demnach von Bedeutung, dass die Nutzerinnen und Nutzer eines Tagging-Systems deren Charakteristika kennen und entsprechend handeln (vgl. Weller et al. 2010: 137). Je besser nämlich die Userinnen und User ihre Inhalte taggen, desto weniger wird Tag Gardening notwendig.

Ebenfalls zu den schlechten Tags gehören Spam-Tags289 und Tags zur Manipulation: »Konkurrierende Unternehmen können die Bewertung und Indexierung von Produkten, Räumen und Ressourcen, die mit einem anderen Unternehmen in Verbindung stehen, durch falsche Tags bewusst manipulieren« (Tschetschonig ← 201 | 202 → et al. 2008: 124). Insbesondere Firmen, die ein Tagging-System anbieten, sollten folglich aus diesem Grund Tag Gardening betreiben.

5.9  Semantische Relationen

In Systemen zur Wissensorganisation können zwei Arten von semantischen Relationen unterschieden werden: paradigmatische und syntagmatische Relationen. Unter einer paradigmatischen Relation versteht man eine feste, gleichbleibende Relation zwischen zwei Ausdrücken (z. B. die Hyperonymie Paarhufer–Nilpferd); sie ist folglich unabhängig von spezifischen Dokumenten. Syntagmatische Relationen sind nicht an Konzepte gebunden, sondern es handelt sich dabei um in konkreten Situationen entstehende Kookkurrenzen, also z. B. zwischen Tags einer Tag-Serie von einer Ressource (vgl. Peters, Weller 2008: 100).

In Folksonomien sind – wie bereits erwähnt – keine paradigmatischen Relationen vorhanden, sondern lediglich syntagmatische. Paradigmatische Relationen müssen über Kookkurrenzen intellektuell erschlossen werden (vgl. ebd.: 103–104). Die vorhandenen Relationen in Folksonomien sowie die vergebenen Tag-Labels zu untersuchen, ist deshalb sinnvoll, weil der Sprachgebrauch von Laiinnen und Laien im Zusammenhang mit der Wissensrepräsentation analysiert und im besten Fall für von Expertinnen und Experten erstellte Systeme der Wissensrepräsentation fruchtbar gemacht werden kann (vgl. ebd.: 102). Allgemeiner formuliert geht es um die Frage, was das Semantic Web vom Social Web lernen kann und inwiefern umgekehrt auch Technologien des Semantic Webs eingesetzt werden können, um den Wert von Daten im Social Web zu erhöhen (vgl. Weller 2010: 78).

Zunächst soll ganz allgemein bestimmt werden, was unter einer Relation verstanden wird. Zimmermann (1992: 291) schlägt folgende formale Bestimmung von Relationseinträgen in einem Relationswörterbuch vor:

<RELATIONSEINGANG (RE-ZUSATZ)> <RELATIONSTYP> <RELATIONSAUSGANG (RA-ZUSATZ)>

Eine Relationierung kann demnach folgendermaßen aussehen:

<NILPFERD> <IST VON DEUTSCH NACH RUSSISCH ZU ÜBERSETZEN MIT> <бегемот>

Im Teilkapitel 5.4 wurde erläutert, dass Relationen in Ontologien über die sogenannte Property ausgedrückt werden. Auch in lexikalisch-semantischen Netzen wie WordNet oder GermaNet wird mit Propertys gearbeitet. Propertys werden in solchen Wortnetzen in zwei Gruppen eingeteilt: einerseits in konzeptuelle ← 202 | 203 → Relationen wie Hyperonymie/Hyponymie und Holonymie/Meronymie, andererseits auch in lexikalisch-semantische Relationen wie Synonymie, Antonymie oder Pertonymie (vgl. Kunze et al. 2007: 278). Unter Pertonymie290 wird »eine Art semantischer Derivationsbeziehung wie z. B. zwischen finanziell und Finanzen« (Kunze 2010: 507) verstanden. Es handelt sich demnach um Relationen zwischen Lexemen einer Wortfamilie, die »über eine gemeinsame Wortwurzel bzw. über ein gemeinsames Grundmorphem etymologisch verwandt« (Heusinger 2004: 135) sind.

Sowohl die konzeptuellen als auch die lexikalisch-semantischen Relationen sind paradigmatische Relationen. Im Zusammenhang mit Thesauri wird terminologisch auch eine Unterteilung in Äquivalenz-, Assoziations- und Hierarchie-Relationen vorgenommen (vgl. Panyr 2006: 143).291

Unter einer Äquivalenzrelation versteht man eine »Beziehung zwischen bedeutungsgleichen oder bedeutungsähnlichen Benennungen sowie zwischen ähnlichen Begriffen, die zu einer Äquivalenzklasse vereinigt werden.292 Eine Äquivalenzklasse wird durch eine Vorzugsbenennung ausgedrückt« (Stock, Stock 2008: 410). Löbner (2003: 103) spricht von »logischer Äquivalenz«, die dann gegeben ist, wenn zwei Termini dieselbe Denotation haben; er weist jedoch darauf hin, dass Ausdrücke »logisch äquivalent sein [können], ohne dieselbe Bedeutung zu haben, weil sie in nicht-deskriptiven Bedeutungsanteilen differieren können« (ebd.: 108).

Um auf die eingangs erwähnte formale Bestimmung von Relationseinträgen in Relationswörterbüchern zurückzukommen: Mit Zimmermann (1992: 292) ist festzuhalten, dass totale Synonymie »durch die Invertierbarkeit gekennzeichnet [ist], d. h. Relationsausgang und Relationseingang können getauscht werden.« In eng gefassten Definitionen von Synonymie findet man das Kriterium der Substituierbarkeit von Synonymen in jedem Kontext; aufgrund unterschiedlicher Konnotationen von Lexemen kann dieses Kriterium jedoch kaum erfüllt werden (vgl. Busse 2009: 104). Aus den vorangehenden Ausführungen lässt sich ableiten, dass totale Synonymie sehr selten ist, sieht man einmal von Abkürzungen und Kurzwörtern ab. Diese können zur totalen Synonymie gezählt werden, wobei die ← 203 | 204 → Synonyme jeweils zu einem einzigen Lexem gehören (vgl. Löbner 2003: 117) wie beispielsweise Abk. zu Abkürzung.293 Abgesehen von solchen Fällen der totalen Synonymie, die auf von Abkürzungen und Kurzwörtern basieren, kann konstatiert werden, dass aufgrund des Ökonomieprinzips der Sprache Funktionsidentitäten von Lexemen eher nicht zu erwarten sind (vgl. Busse 2009: 104).294

Synonymie, verstanden also insbesondere als partielle Synonymie, spielt in Systemen zur Wissensorganisation eine bedeutende Rolle: »Die zentrale Organisationseinheit in Wortnetzen, das sogenannte Synset,295 fasst die Synonymenmenge zu einem gegebenen Konzept zusammen, z. B. {Streichholz, Zündholz}, {fleißig, eifrig, emsig, tüchtig} und {vergeben, verzeihen}«. Neben der totalen und der partiellen Synonymie wird auch die sogenannte Gen-Identität zu den Äquivalenzrelationen gezählt. Gen-Identität liegt dann vor, wenn zwei verschiedene Ausdrücke auf ein identisches Objekt verweisen, welches sich im Laufe der Zeit jedoch verändert hat. Stock und Stock (2008: 74) nennen beispielsweise den Menschen in verschiedenen Lebensaltern, d. h. eine bestimmte Person als Kind oder Erwachsener; Peters (2009: 124) führt Russland und die Sowjetunion als weiteres Beispiel an. Die Äquivalenzrelationen umfassenden Synsets werden durch konzeptuelle Relationen wie Antonymie, Meronymie, Hyperonymie oder Hyponymie miteinander verknüpft.

Hierarchische Relationen zeichnen sich durch ein Über- oder Unterordnungsverhältnis aus. Es wird unterschieden zwischen generischen (auch: Abstraktionsrelationen) sowie partitiven Relationen (auch: Bestandsrelationen). Die generische Relation »ist eine hierarchische Relation zwischen zwei Begriffen, von denen der untergeordnete Begriff die gleichen Merkmale wie der übergeordnete Begriff und mindestens ein weiteres aufweist (Beispiel: Die Begriffe LASTKRAFTWAGEN und PERSONENKRAFTWAGEN besitzen die gleichen Merkmale des Oberbegriffs KRAFTWAGEN, sind aber durch den Beförderungszweck spezifiziert)« (Strauch, Rehm 2007: 214). In der Sprachwissenschaft wird die generische Relation Hyperonymie bzw. Hyponymie genannt. Beispiele für Hyponymien sind Unter- und Oberbegriffe wie HamsterHaustier oder Paare aus einem Lexem sowie ← 204 | 205 → einem Kompositum, so beispielsweise SachbuchBuch (vgl. Löbner 2003: 118). Hierarchische Gliederungen von Verben werden zuweilen als Troponymie bezeichnet: »Ein Verb wird als Instantiierung einer spezifischen Art und Weise des übergeordneten Prädikats aufgefasst, z. B. schleichen als eine Art gehen« (Kunze 2005: 166, Herv. im Original). Meronymie296 ist der geläufige Terminus in der Linguistik für partitive Relationen. Es handelt sich dabei um eine Relation »zwischen zwei Begriffen, wobei die dem untergeordneten Begriff zugeordneten Gegenstände Bestandteile der dem übergeordneten Begriff zugeordneten Gegenstände sind (Beispiel: Die Teilbegriffe AUTOMOTOR und AUTOKAROSSERIE stehen zum Verbandsbegriff AUTO in einer partitiven Relation)« (Strauch, Rehm 2007: 214). Die konverse Relation zur Meronymie nennt man Holonymie. Stock und Stock (2008: 82–83) unterscheiden neun verschiedene Arten der Meronymie, wobei wiederum differenziert wird in Ganzheiten, die aufgrund einer bereits vorhandenen Struktur aufgegliedert werden, sowie in solche, die strukturunabhängig zerlegt werden. Zerlegungen anhand von Strukturen sind 1) geographische Untereinheit–Einheit (z. B. NiedersachsenDeutschland), 2) Element–Kollektion (z. B. BäumeWald), 3) Einheit–Organisation (z. B. UniversitätFakultät), 4) Komponente–Komplex (z. B. BadezimmerWohnung) sowie 5) Segment–Ereignis (z. B. TrapezaktZirkusvorstellung). Eine strukturunabhängige Zerlegung findet statt bei 6) Stück–Ganzheit (z. B. BrotscheibeBrotlaib), 7) Phase–Aktivität (z. B. bezahleneinkaufen), 8) Bestandteil–Objekt (z. B. HolzteileSchreibtisch) sowie 9) Portion–Masse (z. B. LiterDeziliter).

Schließlich gibt es noch die Instanzrelation, eine Hierarchierelation, bei der das Hyponym ein Individualbegriff wie etwa ein Eigenname sein muss, zum Beispiel HundBello. Die Instanzrelation kann als Spezialfall der Hyponymie bzw. Meronymie angesehen werden: »Ob diese Element-Klasse-Relation im Rahmen von Hyponymie oder von Meronymie betrachtet wird, ist für die Instanz irrelevant. Die Instanz kann sowohl durch ›ist ein‹ und durch ›ist Teil von‹ ausgedrückt werden« (ebd.: 84).

Hierarchien können monohierarchisch oder polyhierarchisch sein. Bei Monohierarchien kann ein Hyponym nur über ein einziges Hyperonym verfügen, was sich auch an der üblichen Darstellung einer Baumstruktur zeigt, bei Polyhierarchien hingegen über mehrere (vgl. Strauch, Rehm 2007: 214). Polyhierarchien lassen folglich Kreuzklassifikationen zu, d. h. Aubergine kann sowohl als Pflanze als auch als Nahrungsmittel klassifiziert werden (vgl. Kunze, Lemnitzer 2007: 145). Von ← 205 | 206 → einer Begriffsleiter ist die Rede, wenn mehrere hierarchische Relationen derart zusammenhängen, dass jeweils das Hyperonym wiederum ein Hyponym zu einem weiteren Lexem darstellt, während eine Begriffsreihe aus Geschwisterbegriffen (auch: Ko-Hyponyme, vgl. Busse2009: 105) besteht, die alle über ein gemeinsames Hyperonym verfügen (vgl. Stock, Stock 2008: 411).

Assoziationsrelationen schließlich sind »Relationen zwischen Begriffen, die weder hierarchisch noch äquivalent sind, worunter unterschiedlichste Beziehungstypen verstanden werden können« (Trunk 2005: 21). Die Definition erfolgt durch Ausschluss, was dazu führt, dass die verschiedenen Assoziationsrelationen unterschiedlich geartet sind, so beispielsweise instrumental, kausal, temporal, Vorgänger–Nachfolger, Rohstoff–Erzeugnis etc. (vgl. Strauch, Rehm 2007: 21). Es handelt sich also um eine Sammlung von wichtigen Relationen, wobei nach der DIN-Norm 1463(1) nur solche Relationen in Thesauri gekennzeichnet werden sollen, die für die Indexierung und das Retrieval relevant sind (vgl. Kiel, Rost 2002: 95).297 Die Relation wird auch mit see also/siehe auch umschrieben, im GermaNet mit also see; Beispiele sind die Verben sparen und haushalten oder die Nomen Bibel und Christentum oder Weltrangliste und Tennis (vgl. Kunze 2005: 167; 2010: 507). Stock und Stock (2008: 238) unterscheiden in Anlehnung an Dextre Clarke (2001) folgende Typen von Assoziationsrelationen:

1.

Bedeutungsüberlappung:

SchiffBoot,

2.

Disziplin–Phänomene:

SeismologieErdbeben,

3.

Prozess–Instrument:

MotorrennenRennwagen,

4.

Beschäftigung–Beschäftigter:

SozialarbeitSozialarbeiter,

5.

Handlung–Handlungsergebnis:

StraßenbauStraße,

6.

Handlung–Bezugsperson:

HochschullehreStudent,

7.

Begriff–Eigenschaft:

FrauWeiblichkeit,

8.

Begriff–Ursprung:

WasserWasserquelle,

9.

Begriff–kausale Abhängigkeit:

ErosionErdrutsch,

10.

Gegenstand/Aktion–Gegenteil:

GeburtEmpfängnisverhütung,

11.

Rohmaterial–Produkt:

BaumHolz,

12.

Handlung–assoziierte Eigenschaft:

PräzisionsmessungGenauigkeit,

13.

Begriff–Gegenteil:

KälteHitze.

image

Abbildung 32 zeigt noch einmal die erörterten semantischen – und ausschließlich paradigmatischen – Relationen auf, wobei die verschiedenen Subtypen der Meronymie sowie die der Assoziationsrelation der Übersichtlichkeit halber nicht aufgeführt worden sind. ← 206 | 207 →

Abbildung 32:  Übersicht über die verschiedenen Arten von semantischen paradigmatischen Relationen

image

Semantische Relationen sind Schlüsselfaktoren für das Semantic Web (vgl. Peters, Weller 2008: 106). Und auch im Social Web, insbesondere in Tagging-Systemen, spielt die von Voß (2007a: 6) erwähnte Vocabulary Connectivity (vgl. Kapitel 5) eine zentrale Rolle, etwa im Bereich des Retrievals.

5.10  Synopse

Das Social Tagging ist – wie auch das Kommentieren von Inhalten – eine charakteristische Praxis des Social Webs. Eine der ersten und populärsten Tagging-Anwendungen war Flickr. Die intellektuelle Erschließung erfolgt dabei nach dem Set-Model, wie das zumeist beim Tagging nicht-textueller Ressourcen der Fall ist, d. h. Tags können insgesamt nur einmal vergeben werden, eine Gewichtung durch Quantifizierung wie im Bag-Model ist demnach nicht möglich. Die Gesamtheit aller Tags in einem Social-Tagging-System wird Folksonomie genannt. In Folksonomien wiederum kann eine Quantifizierung der vergebenen Tags im ganzen System vorgenommen werden, wobei nach dem Power Law meist eine Kurve mit Long Tail entsteht (vgl. für Ergebnisse Kapitel 9.1).

Wenn Folksonomien untersucht werden, ist es unabdingbar, die Eigenschaft en des zugrunde liegenden Tagging-Systems zu kennen, denn diese können einen Einfluss auf die Form der Tag-Labels haben. Das Tagging-System auf Flickr kann wie folgt beschrieben werden: Wer auf Flickr Tags vergeben und löschen kann ← 207 | 208 → oder nicht, bestimmt stets der Urheber oder die Urheberin eines Bildes. Sobald jedoch ein Bild in einem Gruppenpool abgelegt wird, werden die vom Nutzer oder der Nutzerin festgelegten Restriktionen für Gruppenmitglieder aufgehoben. Tagging-Support wird auf Flickr nur beim Taggen der eigenen Bilder geboten. Zum Zeitpunkt der Datenerhebung gab es lediglich die Möglichkeit, auf das Feld »Aus Tags wählen« zu klicken, woraufhin zunächst die bisher am häufigsten vergebenen Tags angezeigt werden, auf Wunsch auch alle jemals verwendeten Tag-Labels. Bei einer großen Anzahl Tags verliert man jedoch hierbei schnell die Übersicht über die Tags. Inzwischen kann das Recommended Tagging zusätzlich über eine Autovervollständigung und Auswahl des Tags aus einer Drop-down-Liste erfolgen. Dabei basiert diese auf den bisher vergebenen Tags. Seit dem 7. Mai 2015 werden auf Flickr aufgrund automatischer Bilderkennung die Fotos außerdem automatisch verschlagwortet. Die Tag-Vergabe ist auf Flickr fakultativ, die Sichtbarkeit der Tags ist an die Zugänglichkeit der Bilder gekoppelt. Vocabulary Connectivity ist keine vorhanden, die Tags einer Tag-Serie stehen nicht-hierarchisch nebeneinander. Welche semantischen Relationen in den Tag-Serien ausgemacht werden können, wird in Kapitel 9.2.3 anhand einer empirischen Analyse erläutert. Neben den manuell erstellbaren Tags, deren Anzahl auf 75 beschränkt ist und deren maximale Zeichenlänge 255 beträgt, ist auf Flickr auch ein maschinelles Tagging möglich, das aber eher selten verwendet wird (vgl. Kapitel 5.6). Bei mehrteiligen Tags, die aus mehreren, durch Leerzeichen getrennten Wörtern bestehen, muss der Anfang und das Ende des Tags mit Anführungszeichen gekennzeichnet werden. Andernfalls werden Tags fälschlich in mehrere aufgeteilt oder es entstehen unsinnige mehrteilige Tags.

Das Social Tagging erfüllt einen doppelten Zweck: Zum einen dient das Taggen der Wissensorganisation und folglich dem Retrieval, zum andern ist das Tagging auch Teil der Wissenskommunikation in einer Community. Dies zeigte sich ebenfalls in einer Befragung von Flickr-Nutzenden: Als Hauptgründe für die Nutzung der Tagging-Funktion die Wissensorganisation und Wissenskommunikation angegeben (vgl. Angus, Thelwall 2010: 202). So können über Tags andere Nutzende mit ähnlichen Interessen gefunden werden, zudem können sich in einer Community bestimmte Tags oder Tag-Konventionen etablieren. An dieser Stelle sei erwähnt, dass darüber hinaus in einigen Fällen Tags auch zu anderen Zwecken verwendet werden, beispielsweise um Aufmerksamkeit zu erregen bzw. um Algorithmen zu manipulieren (sogenanntes Tagspamming). Zudem werden sowohl Tags als auch Notizen spielerisch eingesetzt, wie ich an anderer Stelle gezeigt habe (vgl. Müller 2010: 242–250; Müller 2012: 55). ← 208 | 209 →

Folksonomien werden im Gegensatz zu herkömmlichen Wissensorganisationssystemen von Nichtfachkundigen erstellt. In Anbetracht des Information und Communication Overloads sowie des Digital Image Overloads muss Kritikerinnen und Kritikern von Folksonomien entgegengehalten werden, dass eine nicht-hierarchische laienhafte Kategorisierung von Daten besser ist als gar keine. Folksonomien sollten überdies nicht mit herkömmlichen, professionell erzeugten Wissensorganisationssystemen verglichen werden. Im Gegensatz zu Ontologien verfügen Folksonomien über eine geringe Komplexität, doch können mit ihnen große Wissensdomänen abgebildet werden. Die verschiedenen Wissensorganisationssysteme sollten demnach nicht als sich konkurrierende, sondern ergänzende Systeme betrachtet werden. In Zukunft wird im (Social) Semantic Web wohl eine sinnvolle Kombination von Ontologien und Folksonomien das Retrieval vereinfachen.

Eine Besonderheit von Folksonomien stellt die Visualisierung in Form von Tag-Clouds dar. Dabei wird die Tag-Frequenz visuell ausgedrückt, üblicherweise durch die Schriftgröße. Optional wird mit weiteren Faktoren wie der Schriftfarbe, dem Schriftgewicht oder der Tag-Position gearbeitet. Tag-Clouds dienen dem Tag-Browsing, zudem können damit Interessen einzelner Nutzerinnen und Nutzer sowie aktuelle Themen in einer Community erschlossen werden.

Der Vorteil von Folksonomien liegt im Bereich der Social Navigation im Serendipity-Effekt, im Bereich des Sprachlichen in der Möglichkeit des Verwendens von Neologismen oder Okkasionalismen, durch die die Aktualität des Wissensorganisationssystems gegeben ist.298 Zudem repräsentieren Folksonomien authentischen Sprachgebrauch und stellen daher Termquellen für die Entwicklung von kontrolliertem Vokabular dar. Dies ist deshalb relevant, weil Expertinnen und Experten Systeme wie beispielsweise Rechercheportale von Bibliotheken entwickeln, die wiederum von Nichtfachkundigen benutzt werden.

Leider weisen Folksonomien jedoch auch einige Nachteile auf: Eine Unterscheidung in formale und inhaltliche Aspekte der Erschließung ist nicht möglich, oftmals sind Tag-Serien zu Ressourcen unvollständig oder ihre Präzision ist mangelhaft (vgl. Tabelle 16). Was die sprachliche Ebene betrifft, so kann als gewichtiger Nachteil die Einzelsprachabhängigkeit genannt werden, die zu Zeiten der multilingualen Kommunikation im Social Web besonders ungünstig ist. Auf der Ebene der Semantik sind das Problem mehrdeutiger Tags sowie die semantischen Relationen zu nennen, die in Folksonomien sowohl bei der Tag-Vergabe als ← 209 | 210 → auch beim Retrieval überwiegend ungenutzt bleiben. Das gravierendste Problem beim Retrieval ist das sprachliche Benennungsniveau: Ressourcen werden mit Bezeichnungen auf einem Kontinuum von äußerst spezifisch bis hin zu ausgesprochen allgemein versehen.

Beim Tagging von Bildern stellt sich die Frage, wie Bildliches versprachlicht werden kann und soll, sprich, welche Tiefe des Indexierens angemessen und sinnvoll ist. Diese Frage kann nicht allgemein beantwortet werden, vielmehr hängt die Inhaltsanalyse von Bildern jeweils von den unterschiedlichen Bedürfnissen und Interessen der Nutzenden ab (vgl. Voß 2007b: 246). Für die Inhaltsanalyse von Bildern gibt es bislang keine allgemein anerkannten Standards. In der Informationswissenschaft ist ein Forschungsansatz zur Inhaltserschließung aus der Kunstgeschichte aufgegriffen und weiterentwickelt worden. Die zwei zentralen Termini sind in diesem Ansatz die Ofness und die Aboutness. Unter Ofness versteht man die »Nennung aller ermittelten und für den Inhalt für wichtig erachteten dinglichen und abstrakten Objekte durch Begriffe und Eigennamen«, unter Aboutness die »Nennung der Art der Wechselwirkung, die zwischen den Objekten besteht, die ein Thema bilden« (Gödert et al. 2012: 63). Die Ofness entspricht also dem, was Objekterkennungssysteme leisten sollten, wohingegen unter der Aboutness abstrakte Konzepte wie etwa Emotionen gefasst werden. Demgemäß kann die Ofness einfacher eruiert werden als die Aboutness; dies bedeutet auch, dass die Ofness insgesamt eher objektiv, die Aboutness tendenziell subjektiv ist. In Tabelle 16 findet sich – in Anlehnung an Tabelle 12 – ein konkretes Beispiel zum Tagging eines Bildes. Die vom Fotografen vergebenen Tags sind kursiv markiert, das Bild wurde also nur in jeweils einem Teilbereich der allgemeinen und spezifischen Ofness getaggt. Die allgemeine Ofness kann problemlos von jeder-mann bestimmt werden, die Aboutness ebenfalls, wobei sich hier – aufgrund der Subjektivität – bei unterschiedlichen Taggenden größere Abweichungen finden lassen dürften. Die spezifische Ofness hingegen erfordert Hintergrundwissen; so mussten im vorliegenden Beispiel Variablen für einen weiblichen und einen männlichen Namen eingesetzt werden; ob es sich um eine Liebes- oder Zweckheirat handelt, ist unbekannt, und auch der Aufnahmeort und -zeitpunkt mussten der Flickr-Seite entnommen werden.299 Die spezifische Ofness ist folglich ein Grenzfall der Inhaltserschließung und zwischen der allgemeinen Ofness und der Isness anzusiedeln. ← 210 | 211 →

Tabelle 16:  Beispielsanalyse anhand der Kriterien zur Bildanalyse300

image

Mit Isness schließlich werden formale Relationen bezeichnet, die nicht zur Inhaltserschließung eines Bildes gehören, wie etwa im vorliegenden Beispiel der Name des Urhebers (Karl-Heinz Fischer) oder Informationen zur Herstellung des Bildes (Canon Digital IXUS 75).

Die Inhalts- sowie die Formalerschließung dienen der Wissensorganisation, doch wie bereits zu Beginn des Kapitels erwähnt, wird das Social Tagging auch zur Wissenskommunikation verwendet. Wissenskommunikation kann auf Flickr gleichzeitig Kunstkommunikation bedeuten (vgl. dazu ausführlich Kapitel 8), wie auch die Kunstkommunikation Aspekte der Wissensorganisation enthalten kann. Nach Hausendorf (2006: 74) können in der Kunstkommunikation vier zentrale kommunikative Grundaufgaben genannt werden, und zwar das Beschreiben, Deuten, Erläutern und Bewerten. Das Beschreiben entspricht der Ofness, das Deuten der Aboutness und das Erläutern der Isness. Diese drei Aufgaben können unter dem Terminus der Nomination gefasst werden; die aus der Lösung dieser Aufgaben entstehenden Kommunikate weisen jeweils einen direkten oder indirekten Bezug zum Abgebildeten auf. Die Aufgabe des Bewertens dagegen ist in herkömmlichen Wissensorganisationssystemen nicht vorgesehen; Prädikationen, also Zuschreibungen von Eigenschaften zu einem Bild oder zu auf einem Bild zu sehenden Objekten, kommen jedoch auf Flickr vor.

Peters und Stock (2008: 81) sowie Stock und Stock (2008: 161) haben eine Tag-Typologie vorgeschlagen, die auf den bereits genannten Kategorien Ofness, ← 211 | 212 → Aboutness und Isness beruht. Darüber hinaus bestehen verschiedene andere Typologien, die allesamt aus der Informationswissenschaft stammen. Aus diesem Grund stehen bei den bislang erstellten Typologien stets die Funktionen von Tags im Zentrum. Alle betrachteten Typologien zur Funktion von Tags enthalten die Inhalts- und Formalerschließung, die teilweise noch weiter differenziert werden. In der Typologie von Golder und Hubermann (2005: 7) sowie von Heckner (2009: 127) ist darüber hinaus eine weitere Ebene vorhanden, welche die intrinsischen bzw. Non-Subject Related Tags umfasst. Darunter werden Tags verstanden, die sich vor allem auf die Taggenden beziehen, beispielsweise Tags zur Aufgabenorganisation, Tags mit Selbstreferenz und insbesondere auch die Zuschreibung von Eigenschaften. Solche Tags können als subjektive Metadaten bezeichnet werden, im Gegensatz zu den tendenziell eher objektiven Metadaten der Inhalts- und Formalerschließung.

Sprachlich-formale Aspekte wurden in den Typologien zwar teilweise berücksichtigt, jedoch mit solchen der funktionalen Ebene vermischt. Die funktionale und formale Ebene müssen allerdings bei einer Analyse strikt getrennt werden, erst in einem weiteren Durchgang der Daten können Korrelationen zwischen den beiden Ebenen ermittelt werden. Aus linguistischer Sicht interessiert in erster Linie die formale Ebene, die einzig Heckner (2009: 124–126) in seiner Untersuchung eingehender analysiert hat. Dass er die sprachlich-formale Ebene als einziger überhaupt berücksichtigt hat, gilt es lobend zu erwähnen, doch wie er die Kategorisierung vorgenommen hat, ist (nicht nur) aus sprachwissenschaftlicher Perspektive fragwürdig, da verschiedene Ebenen miteinander vermischt werden. Aus diesem Grund kann diese Kategorisierung nicht verwendet werden und es wurde für die empirische Analyse eine eigene Typologie erstellt (siehe Kapitel 9.2.2).

Da Folksonomien im Gegensatz zu anderen Wissensorganisationssystemen ohne kontrolliertes Vokabular auskommen müssen, stellen sich beim Social Tagging sowie dem Retrieval auf verschiedenen Ebenen sprachliche Herausforderungen, und zwar in den Bereichen Mehrsprachigkeit, Morphologie, Graphie und Semantik. Weil Flickr eine multilinguale Community ist, werden Ressourcen in unterschiedlichen und oftmals in mehreren Sprachen getaggt, wodurch sich beim Retrieval das Problem der intersprachlichen Homonymie ergibt. Innersprachliche Synonymie hingegen ist sowohl für das Tagging als auch für das Retrieval von Vorteil; Probleme ergeben sich lediglich bei Analysen, wenn eine Sprachbestimmung vorgenommen werden soll (vgl. Kapitel 9.2.2.1). Auf der Ebene der Morphologie ist insbesondere die Flexion relevant. Üblicherweise ist es zweckmäßig, unflektierte Formen zu wählen, doch können Pluralformen sinnvoll sein, wenn ← 212 | 213 → auf einem zu taggenden Bild mehrere entsprechende Objekte abgebildet sind. Die Graphie stellt eine der größten Herausforderungen beim Tagging dar, weil Schreibvarianten beim Retrieval nicht berücksichtigt werden. Neben Tipp- und Orthographiefehlern sind in erster Linie systembedingte und freie Schreibvarianten von Bedeutung. Als systembedingt werden Schreibvarianten bezeichnet, die auf verschiedene Sprachvarietäten zurückzuführen sind, freie Schreibvarianten sind innerhalb einer orthographischen Norm zugelassen. Auch Varianten in der Getrennt- und Zusammenschreibung stellen aus Retrieval-Perspektive ein Problem dar. Im Bereich der Semantik schließlich bereitet die innersprachliche Homographie Schwierigkeiten beim Retrieval, auf konkreten Fotoseiten jedoch können solche Tags durch das Bild oder durch Co-Tags monosemiert werden. Da mangels eines kontrollierten Vokabulars keine Synonym-Ringe zur Anwendung kommen, müssen totale und partielle Synonyme von den Taggenden manuell vergeben werden. Insbesondere das sprachliche Benennungsniveau stellt – wie bereits erwähnt – beim Tagging von Bildern eine Herausforderung dar: Die Taggenden müssen entscheiden, ob ein Objekt auf der Basisstufe oder auf der Hyperonym- oder der Hyponymebene verschlagwortet werden soll, und auch bei der Suche müssen die verschiedenen Ebenen berücksichtigt werden. Aus diesem Grund taggen viele Nutzende ihre Ressourcen auf verschiedenen Benennungsniveaus, um die Auffindbarkeitswahrscheinlichkeit der Ressource zu erhöhen.

Damit sind wir bei den semantischen Relationen angelangt: Paradigmatische Relationen sind in Folksonomien nicht als solche gekennzeichnet, sie können lediglich von Nutzenden beim Rezipieren einer Tag-Serie aus den syntagmatischen Relationen, d. h. den Kookkurrenzen von Co-Tags, intellektuell erschlossen werden. Paradigmatische Relationen können in Äquivalenz-, Assoziations- und Hierarchie-Relationen unterteilt werden. Eine Äquivalenzrelation liegt bei bedeutungsgleichen oder -ähnlichen Lemmata vor; dazu zählen die totale und partielle Synonymie sowie die Gen-Identität. Hierarchierelationen bilden Über- oder Unterordnungsverhältnisse ab, die wiederum in generische (Hyperonymie bzw. Hyponymie) und partitive Relationen (Holonymie bzw. Meronymie) aufgegliedert werden können. Ein Spezialfall, der sowohl der Hyponymie als auch der Meronymie zugerechnet werden kann, ist die Instanzrelation. Dabei ist das Hyponym bzw. Meronym ein Individualbegriff, also beispielsweise Kreuzfahrtschiff – Costa Concordia. Diese Relation entspricht der Unterscheidung zwischen allgemeiner und spezifischer Ofness. Hierarchien können sowohl monohierarchisch als auch polyhierarchisch ausfallen, d. h. im zweiten Fall sind Kreuzklassifikationen möglich. Assoziationsrelationen schließlich umfassen alle Relationen, die weder äquivalent noch hierarchisch, für die Indexierung und das Retrieval jedoch von ← 213 | 214 → Relevanz sind. In der empirischen Analyse wird diesbezüglich untersucht, inwiefern die Taggenden in den einzelnen Tag-Serien Schlagworte verwenden, die in semantischen Relationen zueinander stehen (vgl. Kapitel 9.2.3).

Was die Literaturlage betrifft, so kann man feststellen, dass bislang noch keine linguistische Untersuchung zum Social Tagging durchgeführt wurde, einzig Barton und Lee (2013: 37) streifen das Thema kurz. Auf diese Forschungslücke hat bereits der Informationswissenschaftler Markus Heckner (2009: 113) hingewiesen, doch ist die von ihm erstellte Tag-Typologie zu sprachlichen Aspekten – wie in Kapitel 5.7 ausgeführt – aus linguistischer Sicht unbrauchbar. Auch an einem Workshop und dem daraus entstandenen Sammelband zum Social Tagging (Gaiser et al. 2008a) waren keine Forschende aus der Linguistik beteiligt, obwohl im Vorwort des Bandes betont wird, dass eine interdisziplinäre Herangehensweise unabdingbar sei (vgl. Gaiser et al. 2008b: 12). Die ersten Studien zum Social Tagging stammen von Golder und Hubermann (2005), von Guy und Tonkin (2006) sowie von Marlow et al. (2006). Sie können mit Peters (2009: 5) auch heute noch als höchst relevant und als wesentliche Literatur zum Thema bezeichnet werden. Als Einstieg in die Thematik sei besonders die Monographie von Frohner (2010) empfohlen, der das Thema des Social Taggings aus theoretischer Sicht umfassend darstellt. Für eine ausführliche empirische Studie aus der Informationswissenschaft sei auf die Dissertation von Heckner (2009) verwiesen. Wer einen allgemeinen Einblick in das Thema der Wissensrepräsentation wünscht, ist mit dem Buch von Stock und Stock (2008) gut bedient. Zur Inhaltserschließung von Bildern kann insbesondere das zweite Kapitel des Buches von Gödert et al. (2012: 13–101) empfohlen werden. ← 214 | 215 →


215   Die zweite angegebene Bedeutung lautet wie folgt: »ein Graffito mit einem Tag markieren«, wobei Tag wiederum das »[Geheim]zeichen eines Graffitikünstlers« bezeichnet (Duden 2010).

216   Auch in der (Korpus-)Linguistik ist von Tagging die Rede, sogenanntes »part-of-speech tagging« (Glück 2010: 698). Es bedeutet dort, dass den Tokens eines Korpus (Wortarten-)Labels (Tags) zugeordnet werden, zumeist automatisch mittels eines Computerprogramms (Tagger). Ein Tagset schließlich ist eine »Liste aller (morphosyntaktischen, grammatischen oder funktionalen) Label, die bei einer Annotation verwendet werden« (Lemnitzer, Zinsmeister 2006: 198).

217   http://www.alexa.com, Zahlen vom 29.06.12. Am 3. Juli 2013 war Flickr jedoch auf Rang 93 zurückgefallen (vgl. Fußnote 172 auf Seite 83), was allerdings nicht bedeutet, dass der Dienst an Popularität verloren haben muss, vielmehr sind vor allem andere Websites – insbesondere auch chinesische – beliebter geworden.

218   Der Dienst Pinterest liegt weltweit zwar vor Flickr, stellt aber keine Foto-Community im herkömmlichen Sinne dar: »Pinterest ist ein soziales Netzwerk, in dem Nutzer Bilder-Kollektionen mit Beschreibungen an virtuelle Pinnwände heften können. Andere Nutzer können dieses Bild ebenfalls teilen (repinnen), den Gefallen daran ausdrücken oder kommentieren« (http://de.wikipedia.org/wiki/Pinterest, 16.07.2013).

219   Ein gewisser Zusatznutzen ist auch darin zu sehen, dass Tags die wichtigsten Aspekte des Volltextes hervorheben.

220   Retrieval ist eine häufig verwendete Kurzform für Information Retrieval. Man versteht darunter das Suchen und Finden von Daten in einem bestimmten System.

221   In der in dieser Arbeit verwendeten Terminologie: »modal«.

222   Guy und Tonkin (2006) nutzen im Englischen den Ausdruck single-use tags. Als Beispiel aus meinem Korpus sei das Tag »Eigräfin« genannt; klickt man das Tag an, so erscheint auf Flickr die Meldung: »Eisgräfin (very busy) ist die einzige Person, die den Tag ›eigräfin‹ verwendet hat.« Es handelt sich somit um einen Nutzernamen, der mit einem Tippfehler behaftet ist und deshalb nur ein einziges Mal im System vorkommt.

223   http://www.flickr.com/groups/eyckata/ (15.07.2013).

224   Bei Tagging-Systemen mit singulärer Tagvergabe (Set-Model) entspricht dies einer Tag-Serie.

225   http://www.flickr.com/services/api/explore/flickr.tags.getRelated (21.07.2013).

226   Aus Platzgründen können hier die 97 weiteren Tags nicht angezeigt werden.

227   APIs sind ebenfalls ein typisches Merkmal des Social Webs; durch Kombination einzelner Module verschiedener Social-Web-Anwendungen können sogenannte Mashups erstellt werden (vgl. Schmidt 2008: 23).

228   http://www.airtightinteractive.com/projects/related_tag_browser/app/ (15.07.2013).

229   Neben dieser typischen Distribution tritt zuweilen auch die sogenannte »inverse logistic distribution« (Weller et al. 2010: 135) auf, die ebenfalls einen Long Tail aufweist, daneben aber auch links einen Long Trunk, der mehrere Power-Tags umfasst. Da sich beide Verteilungen durch einen Long Tail auszeichnen, sind sie schwierig zu unterscheiden und werden deshalb oftmals unter dem Terminus Power Law zusammengefasst.

230   http://en.wikipedia.org/w/index.php?title=File:Long_tail.svg&page=1 (16.08.2013).

231   https://delicious.com/ (07.12.2010). Inzwischen ist eine solche Ansicht nicht mehr verfügbar, es werden in einer Tag-Cloud lediglich die »Top Tags« dargestellt.

232   Als ein Beispiel hierfür sei die Tagging-Netiquette von Amazon angeführt, die Tags folgenden Inhalts verbietet:

         »Ordinäre oder obszöne Ausdrücke, aufhetzende oder böswillige Tags

         Tags, die diskriminierend, beleidigend oder bedrohend auf andere Nutzer wirken könnten

         Tags, die persönliche Informationen über Kinder unter 13 Jahren enthalten

         Tags, die zu illegalem oder unmoralischen Verhalten auffordern«

(http://www.amazon.de/gp/help/customer/display.html/ref=tag_cld_cl_ihlp_wt?ie=UTF8&nodeId=200261040&pop-up=1, 16.10.2012). Mittlerweile ist die Tagging-Funktion auf Amazon jedoch deaktiviert worden.

233   Praktisch sollte jedoch eine Suche derart programmiert sein, dass solche Varianten über einen Algorithmus abgefragt werden. Bei der Eingabe von »rote rose« sollte also sowohl nach den Wörtern »rote« und »rose« als auch nach »rote+rose«, »rote_rose« etc. gesucht werden. Dasselbe gilt für Wortformen: Bei einer Suche nach »rote rosen« müssten auch Inhalte gefunden werden, die mit »rote rose« getaggt worden sind. Alternativ lassen sich bereits bei der Speicherung Tags wie »rote_rose« in »rote« und »rose« aufteilen und als einen Spaltenwert speichern (»rote rose«).

234   Allerdings dürften solche Homographien eher selten vorkommen, weshalb die falsche Umwandlung des Eszett in ein »s« kein gravierendes Problem darstellt.

235   Hug (2011: 67) merkt zu Recht kritisch an: »Es ist seit einiger Zeit Mode geworden, neue Verständnisse von Literalität und Literacy zu generieren und auf verschiedenste Bereiche zu übertragen und in metaphorischer Weise anzuwenden.«

236   Von einer Personomy hingegen spricht man, wenn Nutzerinnen und Nutzer beispielsweise auf dem eigenen Computer ihre Daten taggen, denn hier fehlt die soziale Komponente, die in Folksonomy implizit mitgedacht ist (vgl. Weller et al. 2010: 137).

237   Die Systeme, in denen weite und enge Folksonomien entstehen können, nennt man Bag-Model und Set-Model, vgl. Kapitel 5.

238   Bekannte Beispiele sind die von Carl von Linné geschaffenen botanischen und zoologischen Taxonomien und die Dewey-Dezimalklassifikation, die auf einer Dezimalklassifikation von Gottfried Wilhelm Leibniz beruht und vom Bibliothekar Melvil Dewey für die Kategorisierung von Bibliotheksbeständen weiterentwickelt wurde (vgl. Golder, Huberman 2005: 1).

239   Mittlerweile steht diese Funktion auch in anderen Bibliothekskatalogen zur Verfügung, so seit April 2013 im Recherche-Portal der Universität und der Zentralbibliothek Zürich (http://www.recherche-portal.ch, 17.07.2013).

240   Im Gegensatz zu den aktiven Tätigkeiten des Social Cataloging basiert die Recommender-Funktion (Empfehlungen ähnlicher Titel) in Bibliothekskatalogen auf der »statistische[n] Analyse des Rechercheverhaltens der Bibliotheksbenutzer« (Gantert 2013: 6).

241   Blumauer und Pellegrini (2006: 12) führen eine ähnliche Grafik an, betitelt mit Semantische Treppe, bei der sich die Systeme der Wissensorganisation durch eine mehr oder minder reichhaltige Semantik unterscheiden.

242   Mitunter wird statt von Nomenklatur auch von der Schlagwortmethode gesprochen (vgl. Stock, Stock 2008: 42).

243   Im Fremdwörter-Duden (2010) ist das Lemma Tag-Cloud verzeichnet, im großen Wörterbuch der deutschen Sprache (2012) ist zusätzlich auch das deutschsprachige Pendant Schlagwortwolke zu finden. In der 26. Auflage des Rechtschreib-Dudens (Duden 2013) ist sowohl die englisch- als auch die deutschsprachige Variante enthalten.

244   Im WWW lassen sich verschiedene Tag-Cloud-Generatoren mit unterschiedlichen Einstellungsmöglichkeiten und Funktionen finden (vgl. die folgenden Beispiele).

245   http://tagcrowd.com/ (04.07.2012).

246   http://www.wordle.net/create (04.07.2012).

247   http://www.tagxedo.com/app.html (04.07.2012). Bei Tagxedo steht für Tag Clouds eine große Anzahl an wählbaren Formen zur Verfügung.

248   Die Tag-Cloud ist auf Amazon zwar noch vorhanden, aber die Tagging-Funktion auf den Produktseiten wurde inzwischen deaktiviert.

249   http://www.amazon.de/gp/tagging/cloud (03.07.2012).

250   http://tagcrowd.com/ (18.07.2013).

251   http://tagcrowd.com/ (04.07.2012).

252   Das Programm ist nicht in der Lage, Umlaute wiederzugeben.

253   Der neugierigen Leserschaft sei an dieser Stelle verraten, dass als Textgrundlage für die Tag-Cloud in Abbildung Abbildung 26 die 2010 erschienene Monographie »Wie Jugendliche schreiben. Schreibkompetenz und neue Medien« von Christa Dürscheid, Franc Wagner und Sarah Brommer diente.

254   http://research.yahoo.com/taglines/, umfasst nur Bilder vom 5. Juni 2004 bis zum 16. September 2005.

255   http://taggraph.com (10.07.2012).

256   http://interactivesystems.info/chaingraph (07.07.2013). Unter dem Link ist lediglich der in Abbildung 28 gezeigte ChainGraph als interaktive Demonstration zu sehen, da das Tool nicht frei verfügbar ist.

257   Auch in Abbildung 28 kann aus Platzgründen nur ein Ausschnitt des ChainGraphen gezeigt werden.

258   Mit den genannten Kameras mit integriertem Internetzugang können darüber hinaus Bilder in der sogenannten Cloud direkt online abgespeichert werden (vgl. Kapitel 5.2).

259   Vgl. http://idw-online.de/de/news493268 (17.07.2013).

260   http://www.zeit.de/digital/datenschutz/2012–09/facebook-gesichtserkennung-dpc (17.07.2013).

261   Als Beispiel sei die MulticolorEngine des Multicolr Search Labs genannt, mit der man 10 Millionen Creative-Commons-Bilder von Flickr durchsuchen kann: http://labs.tineye.com/multicolr (18.07.2013). In der Anwendung Retrievr können Bilder anhand der Farben von selbsterstellten Skizzen oder von einem hochgeladenen Bild gesucht werden: http://labs.systemone.at/retrievr/ (21.07.2013).

262   http://labs.tineye.com/color/ (18.07.2013). Das Urheberrecht des Bildes liegt bei der Verfasserin.

263   Der Vollständigkeit halber sei erwähnt, dass es zwei Arten des Bilderretrievals gibt. Neben der textuellen Abfrage gibt es auch die Möglichkeit, Bilder über Bilder zu suchen. Im betreffenden System werden dann aufgrund von Eigenschaften wie Farbe, Gestalt oder Textur ähnliche Bilder ausgegeben (vgl. Ménard 2007: 21; Stock 2007: 512–516). Dieses Prinzip wird beispielsweise in Diensten angewendet, mit denen man im WWW nach eigenen Fotos suchen kann (vgl. Kapitel 6.5).

264   Schneider und Stöckl (2011b: 16) weisen darauf hin, dass der »transkriptionstheoretische Ansatz […] auf einem weiten Medienkonzept [fußt], bei dem Zeichen und Medium sich begrifflich überlappen: Hier gibt es prinzipiell keine nicht mediale, d. h. unvermittelte, Kommunikation. Sprache und andere Zeichensysteme werden demnach auch als Medien gefasst« (Herv. im Original).

265   In Jägers Terminologie: Medium.

266   Audiodeskriptionen in Hörfilmen kommt eine ähnliche Funktion zu: Mit möglichst objektiven Beschreibungen werden die Bildinhalte rezipierbar gemacht (vgl. Fix 2011a: 316).

267   Bei Bag-Model-Systemen werden häufig vergebene und somit relevante Tags durch die Anzahl hervorgehoben.

268   Die Ikonologie kann von der Ikonographie nicht trennscharf unterschieden werden (vgl. Stöger 2011: 39). Laut dem Fremdwörter-Duden (2010) ist unter Ikonographie die »Beschreibung, Form- u. Inhaltsdeutung von (alten) Bildwerken« zu verstehen, unter Ikonologie die »Lehre vom Sinngehalt alter Bildwerke«. Die Ausdrücke »Inhaltsdeutung« und »Sinngehalt« verweisen auf eine gemeinsame Schnittmenge.

269   Wahrscheinlich aus diesem Grund wird die ikonologische Ebene bei Gödert et al. (2012) nicht einmal erwähnt.

270   http://www.artigo.org/ (17.07.2013).

271   Delicious und Flickr gelten als die ersten populären Anwendungen des Social Taggings: Delicious ist seit September 2003 online verfügbar, Flickr seit Februar 2004.

272   Die sogenannte Einbelichtung des Datums ist ein Beispiel für eine automatische Beschriftung innerhalb des Bildes.

273   Peters und Stock (2008: 83) sprechen von synkategorematischen Tags, und in der Tat tragen solche Tags keine eigenständige Bedeutung, insbesondere in Tagging-Systemen, bei denen die Urheberinnen oder Urheber der Tags nicht angegeben werden.

274   Eberhardt (2012: 393) stellt zu Recht fest, dass die beiden Arten der Erschließung nicht immer strikt voneinander getrennt werden können. Während eine ISBN eindeutig der Formalerschließung zugerechnet werden kann, wird ein Titel zwar ebenfalls als solcher erfasst, doch benennen Titel von Fach- und Sachbüchern üblicherweise zugleich auch die wichtigsten Inhalte.

275   Leider führt Heckner (2009: 132) nicht aus, was er unter »no discoverable relation at all« versteht. Er merkt jedoch an, dass »all these tags provide some kind of novel information which cannot be provided by full text analyses of the respective documents« (Heckner 2009: 134). Dies bedeutet, dass dennoch irgendeine Relation vorhanden sein muss, ansonsten wäre die neue Information nutzlos.

276   Beispielsweise die Brennweite von Objektiven, die ohne die Angabe der Einheit (Millimeter) als Tag verwendet werden.

277   Die Ikonographie ist ein Teilbereich der Kunstgeschichte, in dem man sich im Gegensatz zu formalen Aspekten mit dem Bildgegenstand oder dessen Bedeutung beschäftigt (vgl. Panofsky 2006: 36).

278   Auf die sprachlich-formale Ebene geht lediglich Heckner (2009) ausführlich ein, Golder und Hubermann (2005) nennen lediglich teilweise Wortarten, weshalb ein Vergleich auf dieser Ebene sich erübrigt.

279   Die Kategorisierung von Beaudoin (2007) wurde in der Tabelle 14 nicht berücksichtigt, da sie ja keine übergeordneten Aspekte, sondern nur einzelne Analysekriterien aufzählt.

280   Dretzke und Nester (2009: 5) definieren falsche Freunde im weiteren Sinne als interlinguale Wortpaare, die sich ähneln und deren Bedeutung identisch ist, z. B. engl. melancholy und dt. Melancholie. Solche Relationen spielen aus Sicht des Retrievals allerdings keine Rolle, werden jedoch in Kapitel 5.9 von Relevanz sein.

281   Während beim Beispiel aus den romanischen Sprachen Italienisch und Spanisch zwei unterschiedliche lateinische Ausdrücke zugrunde liegen (burricus = kleines Pferd, butyrum = Butter), handelt es sich beim Beispiel aus den germanischen Sprachen um eine Bedeutungsdifferenzierung, d. h. »dass die Extension, d. h. die Menge der möglichen Denotata des entsprechenden Wortes kleiner, seine Intension bzw. die Menge der essenziellen Merkmale der Denotata jedoch größer geworden ist« (Keller, Kirschbaum 2003: 15). Im Althochdeutschen trug gift neben der heutigen Bedeutung noch die allgemeinere Bedeutung die Gabe, wohingegen im heutigen Deutschen nur noch die Gabe einer Dosis Gift gemeint ist.

282   Wenn eine fehlerhaft geschriebene Wortform vorliegt, kann allerdings oftmals nicht eindeutig ermittelt werden, ob es sich um einen Tipp- oder einen Orthographiefehler handelt. Dies ist beispielsweise bei Doppelgraphemen der Fall, eine Taste kann mit Absicht (= Orthographiefehler) oder aus Versehen (= Tippfehler) doppelt gedrückt werden, z. B. Kommitee statt Komitee.

283   Auch hinsichtlich der Akzentschreibung kann es Varianten geben. Zum einen können Akzente korrekt oder falsch angewendet sein (Cafè statt Café), zum andern realisiert oder getilgt sein (Cafe statt Café).

284   Allerdings hat dieses Ignorieren zur Folge, dass engl. tag nicht von dt. Tag ›Zeitraum zwischen Sonnenauf- und Sonnenuntergang‹ bzw. ›Zeitraum von 24 Stunden‹ unterschieden wird – ein weiteres Beispiel also für eine intersprachliche Homonymie.

285   Homonymie und Polysemie werden zuweilen durch die Prämisse unterschieden, dass bei Homonymen kein semantischer Zusammenhang bestehe (vgl. Ebert et al. 2010: 380). Andernorts wird dieser Aspekt zwar als entscheidend, allerdings auch nicht als trennscharf bezeichnet (vgl. Glück 2010: 272). Auch Levickij (2005: 458) erläutert, dass aufgrund von psycholinguistischen Experimenten gezeigt werden konnte, »dass der Übergang von der Polysemie zur Homonymie gradueller Art ist.« Es sei darüber hinaus angemerkt, dass Polysemie laut Levickij (2005: 458) universellen Charakter besitze, also in allen natürlichen Sprachen vorkomme.

286   Und auch umgekehrt gilt: Polyseme Bilder können durch Sprache monosemiert werden (vgl. Holly 2011a: 242).

287   http://www.flickr.com/photos/tags/straus/clusters/ (25.09.2012).

288   In Constens (2004: 114) Terminologie: Basisniveau.

289   Die dazugehörige Aktivität wird Social Spamming genannt (vgl. Schneider 2008: 120). In Müller (2012a: 55) sind in einem Beispiel folgende Spam-Tags belegt: tagporn, hot, brazilian, girls, casino, sex und supersexy.

290   Der Ausdruck besteht aus dem englischen pertain (zu etwas gehören) und dem griechischen ónoma (Name).

291   Die Äquivalenzrelation ist in Wortnetzen in Synsets ausgedrückt, die konzeptuellen Relationen entsprechen den Hierarchie-Relationen.

292   Heusinger (2004: 124) weist darauf hin, dass es auch Äquivalenzrelationen in Texten gibt. Wenn zwei Lexeme auf das gleiche Denotat verweisen, handelt es sich um kontextuale Synonyme: Bei dieser Blume hier handelt es sich um ein Edelweiß.

293   Eine Abkürzung bzw. im Beispiel Abk. ist kein selbstständiges Wort, sondern nur die graphisch (nicht aber phonisch) reduzierte Variante.

294   Darüber hinaus können die bereits in Kapitel 5.7 angesprochenen systembedingten oder freien Schreibvarianten ebenfalls als eine Art von Synonymen betrachtet werden. Ebenfalls können Übersetzungen von Lexemen als Spezialfall einer Synonymie-Relation behandelt werden (vgl. Zimmermann 1992: 295).

295   Bei dem Terminus Synset handelt es sich um eine Portmanteau-Bildung aus Synonym set (vgl. Hirst 2009: 271).

296   Neben dem Ausdruck Meronymie wird teilweise auch der Terminus Partonymie verwendet (vgl. Lutzeier 2007: 76).

297   In Thesauri sind solche Relationen unter verwandter Begriff (engl. related term) bekannt (vgl. Strauch, Rehm 2007: 21).

298   Neologismen oder Okkasionalismen verwenden zu können, ist deshalb ein Vorteil, weil damit der Umfang der Wissensdomäne beliebig erweitert werden kann.

299   Tags sind nicht die einzige Möglichkeit zur Inhaltserschließung auf einer Flickr-Fotoseite, vielmehr können auch Titel, Beschreibungen, Notizen und Kommentare Informationen zum Bild enthalten.

300   http://www.flickr.com/photos/strelawind/3632461286/ (18.07.2013). Das Foto ist mit einer Creative-Commons-Lizenz (BY-ND, vgl. Kapitel 4.2) versehen, d. h. das Bild darf unter der Bedingung der Namensnennung (Urheber: Karl-Heinz Fischer) anderswo publiziert, jedoch nicht bearbeitet werden.