Digitale Computer können nur die zwei Zustände Ein und Aus darstellen. Noch früher galt Analoges für die Übermittlung von Information über den Telegrafen. Um für Menschen verständliche Texte vom Computer verarbeiten und über Telegrafie übermitteln zu lassen, werden seit den Anfängen dieser Technologien entsprechenden Kodierungen eingesetzt. Eine der ersten war der ASCII.
Die Ursprünge des ASCII
Der ASCII oder American Standard Code for Information Interchange wird seit 1963 zur Kodierung von Zeichen verwendet. Er geht auf eine Idee zur Verwendung mit Fernschreibern zurück, was noch heute am Typ der Steuerzeichen im ASCII erkennbar ist. Die heutige Fassung des Codes geht auf das Jahr 1968 zurück.
Die Wahl einer Kodierung ist zu einem wesentlichen Teil eine Frage der willkürlichen Festsetzung. Ob sich eine Kodierung in der praktischen Verwendung durchsetzen kann, hängt deshalb oft von nichttechnischen Umständen ab. Im Fall des ASCII verhalf ihm die Entscheidung der US-Regierung zu seiner Verwendung zum Durchbruch.
Die technische Ausführung des ASCII
Jedes Symbol wird im ASCII mit 7 bits kodiert. Nachdem jedes bit zwei Zustände annehmen kann, ist mit diesen 7 bits eines von 128 Zeichen kodierbar.
Der Zeichenumfang des ASCII
Dieser umfasst natürlich die Groß- und Kleinbuchstaben der lateinischen Schrift. Darüber hinaus werden die arabischen Ziffern, Interpunktionszeichen wie Kommas, einige Sonderzeichen wie diejenigen für einen Prozentstatz und für den Dollar abgedeckt.
Für heutige Verhältnisse nicht mehr direkt nachvollziehbar sind die im ASCII enthaltenen Steuerzeichen. Dazu gehört nicht nur ein Kodewort für eine neue Zeile oder ein Leerzeichen, sondern auch zahlreiche Steuerbefehle für Fernschreiber.
Der sehr beschränkte Umfang von 128 Zeichen ermöglicht keine Darstellung von zusätzlichen Buchstaben über das lateinische Alphabet hinaus. Im Deutschen müssen im ASCII also beispielsweise die Umlaute mit einem hinzugefügten „e“ dargestellt werden.
Erweiterungen des ASCII
Eine Erweiterung auf 8 bit ist naheliegend, da ein Byte eben 8 bits umfasst. Die verschiedenen Erweiterungen bemühen sich in der Regel um Kompatibilität mit dem ASCII selbst. Die 128 Standardzeichen sind in diesen Erweiterungen also gleich.
Für das Deutsche ist eine Erweiterung mit den Umlauten verfügbar. Typische weitere Zeichen sind die griechischen Buchstaben, Pfeile und Grafiksymbole wie das Herzsymbol.
Der ASCII im Licht der heutigen Darstellung von Zeichen
Für die Darstellung der gesamten menschlichen Schriftkultur muss der ASCII klarerweise stark erweitert werden. Heute steht dafür der Unicode zur Verfügung, der 32 bit umfasst. Damit können alle bekannten Symbole dargestellt werden und es sind darüber hinaus sogar noch Codeteile für zukünftige Verwendung frei und verfügbar.