Zeilenumbruch und Leerzeilen ============================ Gelegentlich scheinen bei der email-Korrespondez Leerzeilen und Zeilenumbrüche verschwunden. Die Ursache dazu geht teils auf sehr alte Standarts zurück. Zunächst muß man beim Zeilenumbruch unterscheiden: a) Eine neue Zeile im Text machen = Zeilenvorschub. b) Das nächste Zeichen wieder ganz links schreiben = Zeilenrücklauf. Bei alten mechanischen Schreibmaschinen gab es einen Hebel, mit welchem schnell beides mit einem Ruck erfolgen konnte. a) und b) zusammen, aber auch besser nur b) wurde als Wagenrücklauf bezeichnet. Dann kamen elektrische Schreibmaschinen und Fernschreiber auf, die anstatt des Hebels eine Taste hatten, mit einem Symbol, welches heute noch auf jeder Tastatur zu finden ist. | <_______| Diese Taste wird auch als Eingabeabschlußtaste verwendet, dazu auch alternativ die "Enter"-Taste auf dem Zahlenblock von den Tischrechnern, dann Taschenrechnern her. Der nächste Schritt war nicht der Druck auf das Papier, sondern das Stanzen einer Lochkarte. Ein Lockkartenstapel kann fast beliebig oft ausgedruckt, kopiert und v.a. elektronisch weiterverarbeitet werden. Hier bedeutet die Eingabeabschlußtaste schlicht "neue Karte zum stanzen bereit machen". Für viele Anwendungszwecke war aber ein Lochstreifen viel preiswerter und zweckmäßiger. v.a. für Telex. Auf dem Lochstreifen, ein brauchbarer serieller Datenträger seinerzeit, war der Zeilenumbruch durch 2 besondere Zeichen festgehalten. Noch heute ist gebräuchlich für b) Zeilenrücklauf mit dem Kodesymbol = _M a) Zeilenvorschub mit dem Kodesymbol = _J "neue Lochkarte" = _M_J Bei beiden Kodes wird nichts ausgedruck, so wie ein "Leerschritt" natürlich auch nicht. Kodierte Zeichen, bei denen nichts ausge- druck wird, sondern die nur eine Funktion ausführen, nennt man auch "whitespace charakters". Übergangsweise wurde auch ein Lochstreifen für Fernschreiber (Telex) verwendet. Das ist alles Geschichte, weil dann der Lochstreifen durch Magnetband ersetzt wurde. Damit arbeiteten dann auch die ersten Rechner. Ein Magnetband ist auch unglaublich viel schneller und v.a. leichter als ein Lochkartenstapel. Der Fernschreiber, dann Konsole genannt, war die erste Schnitt- stelle zwischen Rechnern und dem Mensch, damals operator genannt. Heutzutage ist jeder "user" ein "operator" im alten Sinne! Ein Entwicklungsschritt war dann die Welt der Rechner mit Röhren und dann diskreten Halbleitern (Tranistoren und Dioden), dann in Hybridschaltungstechnik (ähnlich SMD), schließlich mit integrier- ten Schaltkreisen auf Siliziumkristallbasis. Jeder Speicherplatz war damals teuer und knapp, und so kam man auf die Idee sich die Kodierung "Zeilenrücklauf" zu sparen, weil ja normal vorgesetzt ist, dass bei _M_J "neue Lochkarte bitte" sowieso diese wieder ab Position 1 gestanzt oder gelesen wird. Bei einem Text von 1000 Zeilen immerhin 1000 Bytes, damals sehr relevant! also verkürzt Zeilenumbruch = _J Diese Vereinbarung ist bis dato der Standart bei Großrechnern, damit bei UNIX und somit auch bei Linux. Würde man einen gespeicherten Text dies unberücksichtend ausdrucken, dann entsteht ein etwa treppenförmiges Muster unter DOS und Windows. Und damit zu DOS bzw. Windows. Als dies aufkam, war der Speicher- platz erschwinglicher geworden und so hatte sich Bill Gates dazu entschlossen den Zeilenumbruch mit seinen ansich beiden Kodes korrekt und ohne Unterlassungsannahmen (defaults) abzuspeichern, also als Zeilenumbruch = _M_J Auch als quasi direkte Übernahme von Lochstreifen bzw. Magnet- bändern. So war die neue Welt der PCs, der kleinen Computer. In der Grafikwelt, v.a. bei dem heutzutage nicht mehr vorstell- baren Ausdruck von Grafiken auf einem Matrixdrucker, spielen Bewegungen des Druckkopfs und der Papierwalze auch rückwärts eine Rolle. Und also entstand die Firmennorm von Apple bzw. MacIntosh, bei einer Textkodierung sich zu "Rückkehr zum Zei- lenanfang" = zu _M auch den Zeilenvorschub (_J) hinzudenken. Und also verkürzt Zeilenumbruch = _M Die 3 Firmennormen waren ursprünglich getrennte "Welten", aber das älteste Internetprotokoll, der email-Standart, hat sie dann doch zusammengebracht. Und nun gibt es email-Progamme, die das bewältigen, zum Teil bewältigen oder eben gar nicht bewältigen. Dann war der Versuch auf den email-Standart den HTML- Standart aufzusetzen, damit auch alles schön bunt wird und Bildchen eingebaut werden können, was aber letztlich nur alles nochmal komplizierter und inkompatibler gemacht hat. Teilweise sind die email-Schreiber soweit versiert, dass sie das in Griff bekommen -- sofern es ihr email-Programm über seine Einstellmöglichkeiten überhaupt zuläßt! Viele sind weniger vertraut und verlassen sich auf die Unterlas- sungseinstellungen ab Werk. Und weil die "Werke" Konkurrenz sind, sind sie nur in seltenen Fällen und notgedrungen breit, sich irgendwie zu koordinieren. Dazu kommt, dass dies fast nur US-Firmen sind und in den USA die Normung nachrangig und oft als den Fortschritt behindernd angesehen wird. Diese Denkweise hat meiner Ansicht nach durchaus ihre Berechtigung, der Markterfolg unterstreicht dies, aber kein Vorteil ohne Nachteil. Ob man das nun als Vielfalt oder schlicht gewisses Chaos bezeichen will, sei dem Leser überlassen. Unterschied zwischen dem Text ansich und seiner Darstellung ----------------------------------------------------------- Der reine Text ansich wird auch Inhalt = "content" genannt. Doch jeder Text muß sich für die Darstellung = "layout" materialisieren. Das Layout kann aufwendig sein oder einfach, wie z.B. hier. Der Trend bei Webseiten geht zu immer aufwendigerer Darstel- lung. War in der Anfangszeit des Internets das Verhältnis zwischen Inhaltsdaten (content) und Darstellungsdaten (layout) grob etwa 80% content zu 20% layout, so ist es inwischen geradzu auf den Kopf gestellt, d.h. 20% Inhaltsdaten zu 80% Darstel- lungsdaten, was z.T. zu sinnlos großen Internetseiten und größerem "traffic" führt. Leider bezahlt man das auch direkt oder indirekt, abgesehen davon, dass der Spaß Ressourcen ver- braucht. Programmierer sprechen dann auch von einem "overhead", d.h. einer technisch notwendigen Datenverarbeitung, die ansich nicht direkt mit der ursprünglichen Intention verbunden ist. Hier ging es um die Formatierungschicht S1, welche ganz ein- fache schriftkulturspezifischen layout zum content hinzufügt. Mehr siehe Kapitel 1.3.0.1. in der Datei Zeichen. Thomas Birk 2023-03-22, rev. 2023-12-14