Das ganz normale Chaos, täglich frisch auf den Tisch. Direkt aus der hintersten Provinz in die Metropolen von Groß-Blogistan.


  1. Semantic Web, Microformats und Maschinenlesbarkeit
  1. Semantic Web, Microformats und Maschinenlesbarkeit

    Fri, 18 Jul 2008 15:16:56 +0200

    Mir ging da grade was durch den Kopf. Semantic Web und Microformats stehen ja i.d.R. in Zusammenhang mit der sogenannten "Maschinenlesbarkeit". Also dass Maschinen (Programe) in der Lage sind, den Inhalt zu verstehen. Oft wird dann dahingehend argumentiert, dass der Text auf Webseiten schließlich nicht für Maschinen gedacht ist, sondern für Menschen. Demnach währen Dinge wie Microformats Blödsinn.

    Wie sieht das nun eigentlich mit html-Seiten aus? Liest die eigentlich Irgendjemand im Quelltext (ausser Entwickler)? Eine Auszeichnung des Textes mit html-Elementen dient also nicht dazu, von Menschen gelesen zu werden, sondern von Maschinen. In diesem Fall ist die Mashchine i.d.R. ein Browser. Der Browser liest diese Informationen, die in dieser Form nur für den Browser gedacht sind, und präsentiert daraufhin den Text dem Menschen in einer vom Menschen verstehbaren Form. So gesehen dienen also sämtliche html-Elemente ausschließlich der Maschinenlesbarkeit. Wenn die Argumente, die gegen Microformats angeführt werden, tatsächlich stichhaltig wären, dürften Webinhalte nur Text oder Bilder enthalten. Wenn man konsequent Alles vermeiden würde, was nur die Maschine (den Browser) angeht, dann hätte html in Webseiten Nichts zu suchen.

    Da ist der Ansatz von Microformats (und RDFa) besser. Diese Ansätze sind ebenfalls konsequent, aber in die andere Richtung. Dateien, die an den menschlichen Leser geschickt werden, sind voll mit Metainformationen, die nur die Maschine (der Browser) lesen kann und soll. Diese Maschine ist nun dazu da, diese Metainformationen so auf den Inhalt anzuwenden, dass dieser Inhalt sich dem menschlichen Leser besser und leichter erschließt.

    Natürlich können die meisten Browser mit solchen Informationen noch Nichts anfangen. Der Firefox macht hier teilweise eine rühmliche Ausname, dank einiger Extensions. Doch die Informationen sind da. Informationen, die vorhanden sind, können, eventuell durch zukünftige Browsergenerationen, nutzbringend verwendet werden. Informationen, die nicht vorhanden sind, können auch durch den besten denkbaren Browser nicht herbeigezaubert werden.

    Die sogenannte Maschinenlesbarkeit dient nicht dem Vergnügen (?) einer Maschine, sondern soll dieser Maschine ermöglichen, einem Menschen diese Informationen optimal zu präsentieren. Darüberhinaus sollte es möglich sein, diese Informationen möglichst effektiv auch anderweitig zu verwenden.

    Ein Beispiel: Adressinformationen auf einer Webseite. Es macht einen Unterschied, ob ich, um diese Adresse in mein Adressbuch im Computer einzutragen, diese Informationen abschreiben muss, oder ob ein Knopfdruck reicht, mir diese Adresse tippfehlerfrei in das Adressbuch zu kopieren. Das Markup dazu, z.B. nach Microformats, dient der Maschinenlesbarkeit. Die Maschinenlesbarkeit wiederum dient der optimierten Verwendung durch Menschen. Diese ganze Argumentation rund um "wer braucht schon Maschinenlesbarkeit" geht am Thema vorbei. Maschinenlesbarkeit nutzt dem Menschen. Darum geht es.