ReadMe für ...
... <t2h.Exe> & <x2h.Exe> & <z2h.Exe> & <tConv.Exe>
NEU: z2h hat ein Schwesterchen bekommen!
Herzlich willkommen, t2h!
NOCH neuer: Die beiden haben weiteren Zuwachs: tConv
Am ALLERneusten: Nun ist auch noch x2h dazugekommen!
Moin!
Hier mal wieder einige Tühlchen aus meiner Bastelkammer :-)
- => Hinweis 1: Obzwar in den letzten Wochen mit zig Nachrichten und Texten unter DV/X, Win-NT und Linux/Samba 'erfolgreich' getestet, ohne jegliche Garantie; d.h. Benutzung auf eigene Gefahr. Gelle?)
- => Hinweis 2: Eine "richtige" Dokumentation gibt's bislang noch nicht. Die hier vorgestellten Programme sind "work in progress", bei denen (bislang jedenfalls) etwa wöchentlich neue Fähigkeiten und Optionen hinzukommen, die ich einstweilen lediglich in diese ReadMe-Datei einarbeite.
Die vorgestellten Programme sind sozusagen "Publikations-Hilfen" für die Arbeit im WWW (WeltWeitWarten). Sie sollen das Erstellen formal korrekter HTML-Seiten ermöglichen - Ob der Inhalt dieser Seiten deren Publikation indes rechtfertigt, können sie nicht entscheiden.
=> "z2h" - der ZConnect nach HTML Konverter <=
Viehtschörs von z2h:
- ackert sich durch ZConnect-Puffer;
- ignoriert dabei BINär-Nachrichten;
- produziert aus den andern hübsche HTML-2 Dateien;
- komplette Zeichensatz-Wandlung nach ISO-8859-1;
- in Latin-1 nicht vorhandene Zeichen des IBM-Zeichensatzes werden durch ein umgekehrtes Fragezeichen ersetzt. Dieser Fall sollte jedoch eigentlich nicht vorkommen, da die betreffenden (Graphik-) Zeichen auch in ZConnect-Nachrichten nicht erlaubt sind ;-)
- im Nachrichten-Text enthaltene ftp-/http-/mailto-URLs werden in entsprechende HTML-Verknüpfungen verwandelt;
- im Nachrichten-Text enthaltene Hervorhebungen (mittels "_") werden in der HTML-Datei als <Strong> ausgezeichnet;
- im Nachrichten-Text enthaltene Zitate (Quotes) werden in der HTML-Datei als <BlockQuote> ausgezeichnet;
- BEZüge werden ausgewertet und als HTML-Verknüpfungen ausgezeichnet, =wenn= sich die betreffende Bezugs-Nachricht als HTML-Datei im gleichen (DOS-)Verzeichnis befindet.
- die jeweiligen ABSender können mittels mailto-URL direkt angeschrieben werden;
- die ZConnect-Felder "Abs", "Stichwort" und "Zusammenfassung" werden in HTTP-Äquivalente umgesetzt (vgl. http://www.w3.org/hypertext/WWW/Protocols/HTTP1.0/draft-ietf-http-spec.html);
- die Dateinamen der erzeugten HTML-Dateien ergeben sich aus der Msg-ID der jeweils aktuellen Nachricht; daher werden bei wiederholten Programm-Läufen ggf. schon vorhandene HTML-Seiten einer Nachricht einfach überschrieben;
- es werden automatisch Index-Seiten angelegt ("index.htm") von denen aus auf die einzelnen Seiten gesprungen werden kann, von wo aus dann hinwiederum auf die jeweilige Index-Seite zurückverwiesen wird;
- von & für doofe Software erzeugte KOPien-Empfänger bei Brett-Nachrichten werden in korrekte EMPfänger korrigiert, bevor die HTML-Umsetzung stattfindet;
- die Index-Datei(en) werden max. 10 Kb groß (dh. ca. 10 Sek. Ladezeit bei einer 9.6er-Verbindung), ggf. werden mehrere angelegt und selbständig miteinander verknüpft;
- beim Indizieren werden die in den HTML-Dateien enthaltenen Rück-Bezüge zur Index-Seite automagisch angepaßt;
- STATus-Nachrichten werden ebenso ignoriert wie BINär-Nachrichten und persönliche Post (EMails);
- mit Namen "verzierte" Zitat-Einleitungen sollten halbwegs verläßlich erkannt werden;
- das ZConnect Header-Feld CharSet wird - soweit vorhanden - ausgewertet und als Grundlage der Zeichensatz-Wandlung verwendet;
optionale Aufruf-Parameter für z2h:
- -i
- führt nur eine Indizierung der herumliegenden HTML-Dateien durch;
- -n
- läßt das Indizieren bleiben;
- -a
- fügt eine spezielle (naturgemäß nicht HTML-konforme!) NetScape-Auszeichnung ein;
- -v
- zeigt 'ne Menge auf'm Bildschirm (nur für Neugierige);
- -z
- erzeugt alphanumerische HTML Zeichen-Entitäten, also für den großen A-Umlaut (Ä) anstelle des vorgegegeben Ä die Zeichen Ä
- -fTEXT
- schreibt TEXT in die Fußzeile der erzeugten HTML-Seiten; Leerzeichen sind hier durch "_" zu ersetzen, also z.B:
-fein_Service_von_Tolle.Systeme@Do.Main.Com
Hinweise:
- Um die Verzeichnisse (und die Anzahl der Index-Dateien) nicht zu groß werden zu lassen, sollten die zu wandelnden Puffer vor der Konvertierung nach geeigneten Kritierien (z.B. EMPfänger) auseinandergenommen werden - etwa mit B.Moth's Programm MOVZ.EXE. (bonmon, äh...)
- Um die Wahrscheinlichkeit der Aufnahme von HTML-Verknüpfungen (aufgrund von ZConnect BEZügen) zu erhöhen, sollten die zu wandelnden Puffer vor der Konvertierung chronologisch sortiert werden - etwa mit M.Both's Programm "MOVZ" (nix bonmon, na ja... Adresse: M.Both@Oln.ComLink.APC.org).
- Die automagische Erkennung von Hervorhebungen im Text kann u.U. bspw. bei 'gemalten' Signaturen zu leeren Auszeichnungen führen.
- Solche Hervorhebungen finden nur für ganze Wörter (d.i. eine durch Leer- oder Interpunktions-Zeichen umschlossene Zeichenfolge) statt, d.h. eine Konstruktion wie "hier soll das "h" _h_ervorgehoben werden" funktioniert also nicht.
- Sollen 'in einem Rutsch' mehrere ZConnect-Puffer verhackstückt werden, so empfiehlt es sich, bei den ersten jeweils den optionalen Parameter "-n" zu verwenden, so daß der Indizierungs-Lauf nur nach Verarbeitung des letzten Puffers stattfindet.
- In der gegenwärtigen ß-Version ist der 'Anti-Netscape-Schalter' standardmäßig EINgeschaltet;
- Das optionale CharSet-Feld im ZConnect-Header wird (mit Ausnahme des dort auch möglichen 16-Bit "UniCode") auswertet, "as is", d.h. die Korrektheit dieses Feldes wird unterstellt. Das bedeutet zugleich, daß sich Fehler von Nachrichten-erzeugenden (z.B. sog. "Point-Programmen" oder "News-Readern") oder -routenden Programmen (z.B. sog. "Gateways") bei einer falschen Kennzeichnung des Zeichensatzes im Nachrichten-Kopf u.U. durch "seltsame" Zeichen in der erzeugten HTML-Seite bemerkbar machen. Bei nicht vorhandenem (oder ungültigem) "CharSet"-Feld im ZConnect-Header wird weiter von einer Kodierung nach der IBM Code-Seite 437 (unicode.org/pub/MappingTables/Microsoft/pc/CP437.X) ausgegangen.
=> "t2h", das Schwesterchen von "z2h" <=
Anders als z2h ist t2h als sog. "Filter" für Text-Dateien realisiert, d.h. es liest von der Standard-Eingabeeinheit und gibt die erzeugten Daten auf die Standard-Ausgabeeinheit. Der Aufruf sieht mithin typischerweise so aus:
t2h < datei.txt > seite.htm
Hier wird also die Text-Datei "datei.txt" eingelesen und nach HTML konvertiert in die Datei "seite.htm" geschrieben. Dabei wird die Text-Datei (StdIn) zeilenweise (mit bis zu 32 KB pro Zeile) gelesen und unterstellt, daß die einzelnen Elemente (Überschriften, Absätze usw.) jeweils durch (mindestens) eine Leerzeile voneinander abgetrennt sind.
Handelt es sich mithin um eine solche einfache Text-Datei, so erkennt und markiert t2h darinnen:
- die (aller-)erste Zeile als Dokumenten-Titel,
- Absätze,
- Aufzählungen, wenn ihre einzelnen Punkte mit einem "-" beginnen,
- Definitions-Listen, wenn ihre einzelnen Punkte mit einem "*" beginnen,
- geordnete Listen, wenn ihre einzelnen Punkte mit einem "+" beginnen,
- ftp-, http- und mailto-URLs,
- Hervorhebungen im lfd. Text.
Bei Definitions-Listen wird jeweils das erste Wort (d.i. eine durch Leerzeichen umschlossene Zeichenfolge) als Definitions-Ausdruck (definition term, DT) aufgefaßt und der Rest des Absatzes (d.i. Text bis zur nächsten Leerzeile) als Definition (data definition, DD).
Bei Aufzählungen (ungeordnete UL- und geordnete OL-Listen) wird jeweils der komplette Absatz (d.i. Text bis zur nächsten Leerzeile) als Listen-Eintrag (list item, LI) ausgezeichnet.
Sofern die Eingabe-Datei nicht im IBM-Zeichensatz (Code-Seite 437) vorliegt, kann der tatsächliche Zeichensatz mit einem für t2h optionalen Aufruf-Parameter angegeben werden:
- -eCode
- bezeichnet (in "Code") den Eingabe-Zeichensatz
Weitere Hinweise zu Zeichensätzen stehen unten, im Abschnitt zu tConv.
Um das Erscheinungsbild der erzeugten HTML-Datei noch zu verbessern, können in der Text-Datei zusätzlich einige simple Element-Kennzeichnungen vorgenommen werden (ohne dafür die HTML lernen zu brauchen - schließlich gibt's schon genug, die sie benutzen, ohne sie zu verstehen). Diese müssen jeweils am Anfang der Zeile stehen und setzen sich je aus einem Doppelpunkt, einem Großbuchstaben und einem weiteren Doppelpunkt zusammen (mithin eine Zeichenfolge, die in 'normalem Text' nicht vorkommt und daher eindeutig sein sollte).
Gegenwärtig erkennt t2h folgende Kennzeichnungen:
- :E: fügt eine andere Datei ein (s.u.)
- :H: hebt die Zeile hervor (EM);
- :I: bewirkt Ignorierung allen Textes bis zur nächsten Leerzeile;
- :L: erzeugt eine horizontale Linie (HR);
- :U: markiert die Zeile als eine Überschrift (H2);
- :V: zeichnet den Absatz (d.i. Text bis zur nächsten Leerzeile) als vor-formatierten Text (PRE) aus, beispielsweise für ASCII-Skizzen oder Tabellen sinnvoll;
- :Z: zeichnet den Absatz (Text bis zur nächsten Leerzeile) als Zitat (BLOCKQUOTE) aus.
Soll beim Konvertieren in die aktuelle Eingabe-Datei eine andere Text-Datei aufgenommen werden, so ist deren Name direkt nach der entsprechenden Kennung anzugeben, also bspw. so:
:E:sonstiges.txt
Hier wird dann die Datei "sonstiges.txt" - soweit sie vorhanden ist und geöffnet werden kann - eingelesen so bruchlos in die erzeugte HMTL-Datei eingefügt. Als praktische Demonstration folgt hier (in der HTML-Version dieses Textes) eine auch im Distributions-Archiv enthaltene Datei:
+++++++++++++++++++++++++++++++++++
+ z2h, x2h, t2h und tConv +
+ --------------------------- +
+ Tools zur Erstellung von +
+ HTML-Seiten und Zeichensatz- +
+ Konvertierung +
+ ----------------------------- +
+ (C) 1995,96 DFG/M.Watermann +
+++++++++++++++++++++++++++++++++++
- => Die "seltsamen" Zeichen hier (kopfstehende Fragezeichen) ersetzen in diesem Falle die in der Originaldatei vorkommenden IBM-Graphikzeichen, welche in den ISO-Zeichensätzen nicht enthalten sind.
Eine Verschachtelung derartiger Einfügungen ist nicht möglich, um womöglich unendlichen Schleifen vorzubeugen. Falls sich in einer einzufügenden Datei eine weitere Kennung :E:filename.ext befindet, so wird sie geflissentlich 'übersehen'.
Ob nun mit oder ohne 'manuelle Unterstützung' - auch t2h produziert nach RFC 1866 (ds.internic.net/rfc/rfc1866.txt) korrekten HTML-Code (mit Ausnahme der optionalen Netscape-Auszeichnung, die, wie die anderen sog. HTML-"Erweiterungen" durch diese obskure Firma, ein Verstoß gegen Intention und Definition von HTML ist; vgl. o. "-a"), weshalb diese Seiten mit der entsprechenden DTD-Kennzeichnung versehen sind. Falls die erzeugten HTML-Seiten indes nachbearbeitet werden, sollten sie anschließend mit einem SGML-Validator geprüft werden (vgl. beispielsweise http://www.halsoft.com/html-val-svc/).
Mögliche Aufruf-Parameter von t2h:
- -a
- AntiNetscape-Schalter (wie bei Z2h);
- -fTEXT
- schreibt TEXT in die Fußzeile der erzeugten HTML-Seiten;
- -eCode
- bezeichnet (in "Code") den Eingabe-Zeichensatz;
- -k
- kurze HTML-Zeilen erzeugen (s.u.);
- -n
- die oben erwähnten, optionalen Auszeichnungen (wie ":H:" z.B.) nicht auswerten (d.h. ignorieren);
- -v
- schreibt das Tagesdatum als Änderungs-Vermerk ans Ende der erzeugten HTML-Seite.
- -z
- erzeugt alphanumerische HTML Zeichen-Entitäten, also für den großen O-Umlaut (Ö) anstelle des vorgegegeben Ö die Zeichen Ö
Sonstiges
- => Standardmäßig erzeugt t2h für jedes Element der HTML-Seite eine (ggf. recht lange) Zeile. Sollen stattdessen die Zeilen in der HTML-Seite ebenso lang sein, wie in der Eingabe-Datei, so kann dies durch den optionalen Aufruf-Parameter -k bewirkt werden.
- => Die Datei README.HTM wurde als Beispiel für die Arbeitsweise von t2h unmittelbar aus dieser Text-Datei erzeugt.
- => Die Datei README.HT1 wurde als Beispiel für die Arbeitsweise des Parameters "-n" ebenfalls unmittelbar aus dieser Text-Datei erzeugt, d.h. sie repräsentiert das, was t2h ohne weitere Unterstützung aus einer sauberen Text-Datei generieren kann.
=> "x2h", ein anderer ZConnect nach HTML Konverter <=
STILL UNDER CONSTRUCTION ...
Mögliche Aufruf-Parameter von x2h:
- -a
- AntiNetscape-Schalter;
- -fTEXT
- schreibt TEXT in die Fußzeile der erzeugten HTML-Seiten;
- -i
- Verweis auf Index-Datei erzeugen;
- -h
- kurzen Hilfe-Bildschirm mit Parameter-Übersicht aufrufen;
- -k
- kurze HTML-Zeilen erzeugen;
- -v
- schreibt das Tagesdatum als Änderungs-Vermerk ans Ende der erzeugten HTML-Seite.
- -z
- erzeugt alphanumerische HTML Zeichen-Entitäten, also für den großen U-Umlaut (Ü) anstelle des vorgegegeben Ü die Zeichen Ü
=> "tConv", ein Programm zum Konvertieren von Zeichensätzen <=
Wie auch t2h ist tConv ein sog. "Filter, d.h. es liest von der Standard-Eingabe und schreibt auf die Standard-Ausgabe. Beide können durch Umleitungs- oder Filter-Zeichen ("<", ">", "|") auf Dateien (oder andere Filter) gelenkt werden. Der Programm-Aufruf sieht mithin typischerweise so aus:
tConv < datei.ein > datei.aus
Anders als bei t2h findet hier keine HTML-Auszeichnung statt, sondern "nur" eine Wandlung des in der Datei verwendeten Zeichensatzes. Gegenwärtig kennt tConv die folgenden Zeichensätze:
- ISO 8859-1 (aka Latin-1)
- ISO 8859-2 (aka Latin-2)
- ISO 8859-3 (aka Latin-3)
- ISO 8859-4 (aka Latin-4)
- ISO 8859-5 (aka Latin-5)
- ISO 8859-6 (aka Latin-6)
- ISO 8859-7 (aka Latin-7)
- ISO 8859-8 (aka Latin-8)
- ISO 8859-9 (aka Latin-9)
- IBM/MS Code-Seite 437 (aka IBM extended ASCII)
- IBM/MS Code-Seite 850 (aka MS Latin-1)
- IBM/MS Code-Seite 1250 (aka Weißichnich)
Mithilfe von tConv können der Zeichensätze beliebig in jeder Richtung konvertiert werden. Dafür kennt das Programm, das bewußt keine eigene Zeichensatz-Prüfung der Eingangsdaten vornimmt, zwei optionale Aufruf-Parameter:
- -eCode
- bezeichnet (in "Code") den Eingabe-Zeichensatz (Vorgabe: Code-Seite 437),
- -oCode
- bezeichnet (in "Code") den Ausgabe-Zeichensatz (Vorgabe: ISO 8859-1).
Anstelle der Zeichenfolge "Code" ist jeweils die Kennung des gewünschten Zeichensatzes anzugeben, d.h. bei den ISO-Codes eine der Ziffern 1 bis 9, bei den Code-Seiten deren Kennzahl. Um also beispielsweise die mit dem IBM-Zeichensatz 437 erzeugte Datei "meintext.txt" in die Datei "meintext.doc" im ISO-Zeichensatz Latin-1 (aka 8859-1) zu konvertieren, wäre folgender Aufruf zu verwenden:
tConv < meintext.txt > meintext.doc -e437 -o1
(Genaugenommen sind in diesem speziellen Falle die zusätzlichen Parameter optional, weil genau diese Werte - Code-Seite 437 für die Eingabe- und ISO 8859-1 für die Ausgabe-Datei - ja die programminternen Vorgaben sind, falls keine Parameter beim Aufruf angegeben werden.)
Nehmen wir ein anderes Beispiel. Mit einem WinDoz-Editor wurde die Datei "testtext.doc" als sog. ASCII-Text mit dem Zeichensatz der Code-Seite 850 (von MS fälschlich auch als "Latin-1" bezeichnet) gespeichert. Diese Datei soll nun automagisch als HTML-Datei ausgezeichnet werden. - Wie? - Nun, versuchen wir's so:
tConv -e850 -o1 < testtext.doc | t2h > testtext.htm -e1
Hier wird also "testtext.doc" zunächst von tConv in den ISO-Zeichensatz 8859-1 konvertiert, dann führt t2h die HTML-Auszeichnung (einschließlich der Konvertierung bestimmter Sonderzeichen) durch. - Es geht aber auch noch einfacher:
t2h < testtext.doc > testtext.htm -e850
In diesem Falle konvertiert t2h direkt aus dem Zeichensatz der Code-Seite 850 ins HTML-Format (und den darinnen verwendeten ISO-Zeichensatz 8859-1).
Klingt gut? - Freut mich!
Zu guter Letzt ..
- => Nur der Vollständigkeit halber der Hinweis, daß auch tConv (wie die anderen Programme) eine maximale Zeilenlänge von 32 KB unterstützt. Bei längeren Zeilen sind die Ergebnisse nicht exakt vorhersagbar.
- => Alle drei Programme geben einen knappen Hilfehinweis aus, wenn sie mit dem Parameter -h aufgerufen werden.
- => Da sich die verschiedenen Zeichensätze nicht nur in der Art der Zeichenkodierung unterscheiden, sondern v.a. auch in ihrem jeweiligen Zeichenvorrat, können beim Konvertieren u.U. auch einzelne Zeichen verlorengehen. Die Konsequenz: Anstelle des ursprünglichen Zeichens erscheint an der entsprechenden Textstelle der HTML-Seite ein anderes Zeichen oder (als "Ersatz" für alle nicht durchgehend verfügbaren Zeichen) ein "auf dem Kopf stehendes" Fragezeichen.
- => Da einige HTML-Browser offensichtliche Probleme mit der Auswertung des TAB-Zeichens ("	") haben, werden Tabulator-Zeichen in jeweils acht Leerzeichen umgesetzt.
- => Um weiteren Zeichensatz-Nachfragen vorzubeugen: -e1 benutzt den ISO-Zeichensatz 8859-1, während -e1250 die Code-Seite 1250 verwendet; -o8 benutzt 8859-8, -o850 die Code-Seite 850; -e4 verwendet 8859-4, -e437 die Code-Seite 437. (Intern arbeiten die Programme mit dem 16-Bit Unicode-Zeichensatz.) Alles klar?
- => Bisweilen wurde von "komischen Ergebnissen" berichtet, die t2h produziere, insbesondere erschienen mitten im Text plötzlich Listen-Auszeichnungen. Dies ist i.d.R. ein Effekt der automatischen Erkennung von Aufzählungen: Wann immer das erste (nicht Leer-) Zeichen einer Zeile ein "-", "+" oder "*" ist, setzt t2h die entsprechende Zeile in einen Listen-Eintrag um. Um diesen Effekt zu vermeiden, sollten im Ausgangs-Text die erwähnten drei Zeichen entweder (durch einen 'passenden' Zeilenumbruch) ans Ende der vorangehenden Zeile versetzt, oder aber durch andere Zeichen ersetzt werden.
- => Die beiden als Filter arbeitenden Programme t2h und tConv können unter Win-NT und auf (beispielsweise über Samba eingebundenen *nix-Laufwerken) auch mit sog. "langen Dateinamen" verwendet werden. (Ob dies auch unter den graphischen DOS-Oberflächen WinDoz-3.1x/95 funktioniert, weiß ich nicht, ist aber nicht auszuschließen.)
- => Und nochmal: Nein. Es ist keine separate WinDoz-Version der Programme geplant. (Und falls doch, dann nur als sog. NT-Service, der gleich nach dem Hochfahren des Systems die ganze NTFS-Partition in eine Folge von HTML-Seiten konvertiert, mit der vormaligen "Registratur" als Start-Seite der Web-Präsentation.)
- => Der Netscape-Cookie kann bei den BETA-Versionen der Programme nur durch den Kommandozeilen-Parameter BitteBitteNetscape! ausgeschaltet werden.
- => Bei Fehler-Berichten bitte ich um eine möglichst detaillierte Beschreibung, damit ich eine Chance habe, das Problem zu reproduzieren und zu lokalisieren. Bitte ggf. die betreffenden Dateien, bei denen der Fehler auftrat, mitschicken. Außerdem bitte die Angaben, welche die Programme mit dem Aufruf-Parameter "-C?" ausgeben, dazuschreiben, anhand derer ich erkennen kann, um welche Programm-Version es sich handelt.
- => Der Funktions- und Leistungs-Umfang dieser Test-Versionen entspricht im wesentlichen der endgültigen Shareware-Version, deren Preis noch nicht genau feststeht. Er dürfte sich aber unter einem Hunni (für den nicht-gewerblichen Einsatz) bewegen. Die Registrierung für eine kommerzielle Nutzung wird bei knapp fünfhundert Deutschmark (zzgl. MwSt.) liegen.
- => Lob, Schecks, Hinweise & Anregungen bitte an Matthias@Oln.ComLink.APC.org - Danke!
Was noch zu tun bleibt:
- hardcoded DTD durch konfigurierbaren DTD-Parser ersetzen;
- für z2h event. Möglichkeiten zum Auswählen von Nachrichten;
- bestimmt noch dies & das ...
- weitere Vorschläge?
Ciao
Matthias
=> Zur Entwicklungs-Geschichte <=
Die erste Programm-Version von z2h entstand im November 1995 im Zusammenhang mit einen anderen Projekt, bei dem über die BBS-Einwahl auch ein Internet-Zugang realisiert werden sollte. Ich wollte sehen, ob sich die (wenigstens ästhetisch) häßlichen Brett-Nachrichten nicht ein wenig ansprechender darstellen ließen. So entwarf ich zunächst eine Listenstruktur, die es ermöglichte, die einzelnen Nachrichten im Speicher zu verarbeiten.
Aus der einfachen HTML-Auszeichnung als vorformatierter Text wurde bald eine differenziertere Darstellung. Zitate wurden gesondert ausgezeichnet, URLs im Nachrichten-Text als Hypertext-Verknüpfungen gekennzeichnet. Schließlich kam eine Index-Datei hinzu, die später einer Verkettung von mehreren Index-Dateien wich. So entstanden in recht schneller Abfolge etwa drei Dutzend Versionen, von denen manche nur ein paar Stunden "überlebten", andere mehrere Tage.
Durch Hinweise einiger geduldiger Test-Opfer kam dabei manches Detail hinzu oder wurde anders implementiert. Parallel entstand im Dezmeber 1995 dann t2h, dem nach und nach ebenfalls etliche Details zuwuchsen. Als ich mich schließlich etwas intensiver mit den verschiedenen Zeichensätzen beschäftigte, um die zugehörige Kennzeichnung in ZConnect-Nachrichten korrekt auswerten und umsetzen zu können, entstand - im Januar 1996 zunächst als reines Test-Tuhl - dann noch tConv, das dann seinerseits eine rasante Evolution durchlief, bis ich schließlich den 16-Bit "UniCode" als Bezugsgröße für die vielfältigen Konvertierungs-Richtungen benutzte, die dann auch von t2h und z2h verwendet wurde.
Unterdessen hatte der Quell-Code ein beachtliches Maß an Umfang und Undurchschaubarkeit gewonnen. Daher beschloß ich, das gesamte Paket komplett neu zu entwerfen und zu schreiben. Im Ergebnis werden nun alle drei Programme aus denselben Quellcode-Dateien generiert und auch - beginnend mit Version 0.37 (die tatsächlich wohl v.98 oder so heißen müßte <g>) - einheitlich gezählt.
Also, watz njuh?
- v0.37
- einheitlicher Quell-Code für alle Programme;
- t2h hat die neuen Parameter -n und -v (s.o.);
- t2h kennt eine neue Text-Auszeichnung :I: (s.o.);
- tConv und t2h terminieren mit einem Hilfe-Hinweis, wenn sie ohne Eingabe-Umleitung aufgerufen wurden;
- v0.38
- z2h und t2h prüfen bzw. konvertieren jetzt auch die beim Aufruf ggf. übergebenen Zeichenfolgen (Parameter -fText), wobei die Programme unterstellen, daß der Parameter-Text im Zeichensatz der Code-Seite 437 angegeben wurde;
- alle Programme führen beim Aufruf einen automatischen Selbsttest durch, um Manipulationen (z.B. durch Viren) möglichst frühzeitig zu erkennen (anläßlich der gegenwärtig grassierenden Influenza ...);
- wer die Parameter-Einleitung mit dem "-"-Zeichen nicht mag, kann durch Setzen der DOS Umgebungs-Variablen SWITCH auch einen anderen Zeichen-Wert einstellen;
- v0.39
- keine Zeit-Angabe mehr im Änderungs-Vermerk;
- einige Schreibfehler in dieser Datei korrigiert (nun ja ...);
- ein paar 'unsaubere' Code-Teile bereinigt;
- in t2h neue Include-Option durch Kennung ":E:dateiname" (s.o.);
- t2h erzeugt nun auch geordnete Listen (s.o.).
- v0.40
- als neuster Sproß wächst x2h heran, er macht größere Umbauten im Familienstammbaum und bei der Auszeichnung der HTML-Seiten nötig;
- in den Index-Verweisen der erzeugten HTML-Seiten werden die Relationen (REL-/REV-Attribute) mit angegeben;
- Anker-Namen beginnen nun grundsätzlich mit einem Buchstaben, da es hier und da offensichtlich Probleme mit numerischen Ankernamen gibt;
- v0.41
- neuer Aufruf-Parameter '-z' für t2h, x2h und z2h, um alphanumerische Zeichen-Entitäten im HTML-Code zu erzeugen; man sagt, das sei besser lesbar ... (fragt sich nur, für wen?)
- v0.42
- Letzte Aktualisierung am 16. Sep. 1996
ß-Hinweis: automagisch generierte HTML-Seite - © 1995,96 DFG/M.Watermann, Hannover, FRG
- ein Service von DFG/M.Watermann, Hannover, FRG