von Thomas Salvador.
In diesem einführenden Teil wollen wir kurz besprechen, was HTML ist und wie es prinzipiell funktioniert. Details folgen später.
HTML ist eine Dokumentbeschreibungssprache, in der die logische Struktur des Dokumentes beschrieben wird. Zur logischen Struktur gehören etwa Überschriften, Listen u.ä. Dies geschieht in HTML plattformunabhängig, was erfordert, daß die Dokumente selbst plattformunabhängig sind. HTML baut auf dem Zeichensatz ISO-Latin-1 auf. Wie wir sehen werden, entsprechen die ersten 128 Zeichen des 256 Zeichen starken Satzes ISO-Latin-1 dem auf vielen Maschinen verbreiteten ASCII. Die eigentliche Struktur des Dokumentes wird mit Tags ausgedrückt. HTML steht, wie erwähnt, für HyperText Markup Language. Was heißt das?
Die Betonung des Titel dieser Artikelreihe liegt auf "Einsteiger". D.h., Sie werden zahlreiche Beispiele finden, ebenso wie Begründungen, warum etwas ist, wie es ist, und warum es so günstig ist. Auch werden Sie mit einigen Tips und Meinungen des Autors "konfrontiert". Dies wäre sicher nicht der Fall bei einer HTML-Referenz.
Als Voraussetzung muß der Leser dementsprechend eigentlich nur das notwendige Interesse mitbringen. D.h. nach Meinung des Autors sollte das Dokument selbst für völlige Neulinge geeignet sein.
Lesern, die schon einige Erfahrungen mit HTML haben, ist die Möglichkeit gegeben, das ein oder andere anders beschrieben und mit den erwähnten Bemerkungen versehen zu lesen, und hier und da ggfs. nützliche Erweiterungen kennenzulernen.
Da dieses Dokument selbst in HTML verfaßt wurde, benötigen Sie nur Ihren (bevorzugten) Browser, der nach Möglichkeit dem Standard gehorchen sollte, und Ihren Lieblings-Text-Editor. Es wird ausgesprochen sparsam mit Grafiken umgegangen. Es genügt daher auch ein nicht-grafischer Browser.
"Welchen Texteditor Sie nehmen sollen?" Ihren Lieblingseditor. Grafisch oder nicht, auf welcher Plattform auch immer (DOS, Windows, UNIX, ...), völlig egal. NotePad ist vielleicht nicht sehr komfortabel, genügt aber vollkommen.
HTML ist eine Dokumentbeschreibungssprache mit der die (logische) Struktur des Dokuments beschrieben wird. Sie ist dadurch plattformunabhängig, d.h. das Dokument kann auf den verschiedensten Rechnern und Betriebssystemen (na ja - zumindest theoretisch) dargestellt werden, auf denen ein HTML-Browser zur Verfügung steht.
Zur logischen Struktur gehören beispielsweise Überschriften, Absätze, Aufzählungen, usw. und im Falle von HTML freilich auch Referenzen auf andere Dokumente bzw. auf andere Stellen im selben Dokument (Querverweise).
Es wird nicht festgelegt, wie es dargestellt werden soll. Nur so kann garantiert werden, daß die Dokumente selbst plattformunabhängig sind, also auf Rechnern jeden Typs prinzipiell ohne Informationsverlust dargestellt werden können. Plattformabhängig sind trivialerweise die darstellenden Programme, die sogenannten HTML-Browser. Und genau daran muß ein HTML-Autor auch denken, wenn er sicherstellen will, daß seine Dokumente tatsächlich auch von jedem gelesen werden können.
Jeder Leser benutzt möglicherweise andere Zeichensätze, sei es, weil es nicht anders geht (z.B. bei Browser, die im Textmodus arbeiten) oder weil jeder seinen Browser mehr oder weniger nach seinen persönlichen Vorlieben konfiguriert hat.
Im Textmodus arbeitende Browser verwenden Ersatzdarstellungen für Grafiken, Links oder andere Gestaltungselemente, weshalb Gestaltungselemente nur nach ihrer logischen Bedeutung eingesetzt werden sollten. Bspw. steht es Browsern frei, wie sie Überschriften darstellen.
HTML ist nicht dafür vorgesehen, Informationen zur exakten Darstellungsweise zu transportieren. Sie können sich daher nicht auf punktgenaue Replikation ihrer Dokumente verlassen. Das fängt bei unterschiedlichen Auflösungen und unterschiedlichen Zeichensätzen an, geht über die unterschiedliche Hintergrundfarben oder der Unverfügbarkeit von Farben und hört bei der Nicht-Darstellbarkeit von Grafiken auf. Wer dies benötigt ist mit Postscript oder PDF (beides von Adobe) besser beraten.
Plattformunabhängige Dokumente erfordern nicht nur eine plattformunabhängige Beschreibung, sondern müssen selbst in Dateien geliefert werden, die plattformunabhängig sind. HTML-Dokumente werden daher in ISO-Latin-1-Dateien beschrieben und transportiert, einem 256 Zeichen umfassenden Satz, dessen erste 128 Zeichen dem ASCII-Zeichensatz entsprechen. Für deutsche Texte heißt dies insbesondere, daß Umlaute u.ä. sowie einige Sonderzeichen nicht direkt in HTML-Dateien verwendet werden können (da diese in der Erweiterung zum ASCII liegen).
Schließlich brauchen wir noch eine Möglichkeit, die Struktur selbst zu beschreiben. Dies geschieht in HTML mit sog. Tags und Attributen, deren Form und Verwendung wir nun besprechen wollen.
Teil 2 |