Doku Atelier :: Home Firma DOKU ATELIER AG Dienstleistungen Technische Kommunikation Sans-Serif
Mappe

Wir sind Technische Redaktoren...
und erzählen aus unserem Er-
fahrungsschatz. Hilfreiche Tipps
und Tricks rund um die
Technische Kommunikation.

Firma
Doku Atelier AG
Unsere
Dienstleistungen
Technische
Kommunikation
Kolumne
Sans-Serif

Sans-Serif Februar 2005

Doku Ateliers Kolumne zur technischen Kommunikation

Der Index – Mitdenken ist gefragt

Indizes können es Ihnen schwer machen: Oft ist der von Ihnen gerade gesuchte Begriff nicht indexiert. Oder der tatsächlich indexierte Begriff führt Sie zu - für den Begriff - irrelevanten Textpassagen. Einen durchwegs brauchbaren Index zu erstellen ist nicht so trivial, wie es auf den erstem Blick erscheinen mag. Es erfordert – ob manuell oder automatisch erstellt – vor allem eine intensive gedankliche Vorarbeit.

In einem Informationssystem kommt der Indexierung eine wichtige Bedeutung zu. Dabei werden Begriffe definiert, welche einen Datensatz thematisch auffindbar machen – im Gegensatz zur Volltextsuche, welche alle Fundstellen für einen Begriff unabhängig vom Kontext auflistet. Die Herausforderung besteht darin, die für die Informationserschliessung relevanten Begriffe und Begriffsgruppen zu erkennen. Es scheint offensichtlich, dass häufig verwendete Begriffe (Füllwörter, Verben, Adverben) von vorneweg in einer «Stoppliste» ausgeschlossen werden können.

Wie verhält es sich aber bei weniger offensichtlichen Begriffen wie beispielsweise «Benutzerschnittstelle»? Ist es sinnvoll, alle Textpassagen oder Dokumente anzugeben, in denen der Begriff «Benutzerschnittstelle» einen für den Leser entscheidenden Informationswert besitzen könnte? Oder ist es nicht besser, den Begriff grundsätzlich in einem Glossar zu definieren (wobei das Eine das Andere nicht ausschliesst)? Im Zweifelsfall empfiehlt sich: Indexieren Sie den Begriff, aber wirklich nur dort, wo er innerhalb des Kontexts einen klaren Informationswert besitzt. Innerhalb kleiner Informationsmengen (beispielsweise einem Dokument) erledigen Sie dies vorzugsweise manuell. Was aber, wenn Sie sehr grosse Datenmengen indexieren müssen? Kann eine Indexierung nicht gar automatisiert werden?

Manuelle oder automatische Indexierung?

Unter einer guten Indexierung verstehen wir nicht nur die Auswahl eines Begriffes, sondern auch die Berücksichtigung der Bedeutung eines Begriffes im Textzusammenhang1. Bei der manuellen (oder intellektuellen) Indexierung wird vorwiegend Kopf- und Handarbeit geleistet: Bei jedem Auftreten eines Begriffes entscheiden Sie, ob er an dieser Stelle indexiert wird. Eine weitere Herausforderung stellt die Subjektivität bei mehr als einem Indexierer dar: Jede Person gewichtet Themen und Inhalte anders und der Index wird daher immer persönlich gefärbt sein.

Zeit also für einen Indexierungsalgorithmus welcher uns das «lästige» Indexieren grosser Datenmengen abnimmt und erst noch schneller und objektiv arbeitet. Allerdings ist der Index nur so gut, wie der Algorithmus der dahinter steckt. Über die Relevanz eines indexierten Begriffes innerhalb eines bestimmten Kontextes wird uns auch ein Algorithmus in näherer Zukunft nur ungenügend Auskunft geben können. Ein automatisch erstellter Index muss daher immer manuell-intellektuell geprüft und korrigiert werden, was selbstredend sehr aufwändig ist. Und vorerst noch sind sich Fachleute einig: manuell erstellte Indizes bieten die bessere Qualität.

Dabei bewegen wir uns aber vorwiegend im Bereich der Theorie, da herkömmliche Programme (Word, OpenOffice, FrameMaker) und Dokumentenmanagement- und Redaktionssysteme keine automatische Indexierung von unstrukturierten Inhalten anbieten. Das bekannteste Beispiel einer automatischen Indexierung ist sicher die Suchmaschine Google2 mit seiner speziellen Rangbewertung. Durch eine Analyse der Verweisstrukturen aller indexierten Seiten auf eine bestimmte Seite wird auf deren Wichtigkeit geschlossen. Dabei ist aber folgendes zu bedenken: Die Popularität einer Seite lässt noch nicht auf deren wirkliche Aussagekraft schliessen. Folgende Tipps beziehen sich deshalb nur auf eine manuelle Indexierung.

Hilfreiche Tipps zur Indexierung

Fazit

Für die Technische Dokumentation im Bereich von KMUs ist momentan nur die manuelle Indexierung relevant. Der Index sollte theoretisch die schnellste Zugangsart für die themenorientierte Suche sein. Im Gegensatz zur Volltextsuche garantiert Sie eine höhere Präzision6. Die richtige Planung und Methodik der Indexerstellung und das Verstehen des Dokumenteninhaltes sind dabei unabdingbar. Ein guter Index erstellt sich nicht von selbst: In den USA beispielsweise existiert der Beruf des Indexierers! Und DIN 31623 «Indexierung zur inhaltlichen Erschließung von Dokumenten (Teil 1-3)»7 spricht hier im wahrsten Sinne des Wortes Bände.

Vorankündigung: In einem der nächsten Sans-Serifs widmen wir uns dem Thema «Wohldosierter Gebrauch von Fussnoten»...



1) Begrifforientiertes Verfahren: http://wwwai.wu-wien.ac.at/~koch/lehre/inf-sem-ws-00/zoechling/begriff.htm

2) http://www.google.ch

3) Der seltenere Fall sind Polyseme: Geschichte (Historie) und Geschichte (Erzählung) müssen in einem Index klar unterschieden werden

4) In Anlehnung an den Sans-Serif vom Juli 2004 und Januar 2005 sollten Sie aber grundsätzlich darauf achten, Synonyme soweit als möglich in einem Terminologieverzeichnis bzw. im Originaltext zu vereinheitlichen!

5) Ein Detail am Rande: Ein Index ist ein Stichwortverzeichnis und Stichworte müssen im Gegensatz zu Schlagworten in einem Text vorkommen. Bei Wortstämmen arbeiten Sie streng genommen an einem Schlagwortverzeichnis.

6) Precision: Ist ein Mass für die Genauigkeit einer Suche. Dabei wird die Zahl der gefundenen Daten mit Relevanz durch die Gesamtzahl der gefundenen Daten dividiert -->Mass für Treffgenauigkeit.

7) DIN 31623. Indexierung zur inhaltlichen Erschließung von Dokumenten. Berlin 11/78 Teil 1: Begriffe, Grundlagen (Sept. 88, 5 S.) Teil 2: Gleichordnende Indexierung mit Deskriptoren (Sept. 88, 16 S.) Teil 3: Syntaktische Indexierung mit Deskriptoren (Sept. 88, 4 S.) Berlin : Beuth, 1988