博多式電報機
博多式電報機是法國人埃米爾‧博多於1874年發明的「印字電報機」。主要特點是字符用5位元編碼,採用兩個字符集。
博多碼
博多於1872年[1][2]開發了他的第一台多路復用電報機,並在1874年申請專利[1][3]。1876年,他按照卡爾·弗里德里希·高斯和威廉·愛德華·韋伯的建議將6位編碼修改為5位編碼[1][2]。
博多發明的電報裝置,發報方通過一個類似於鋼琴鍵盤樣的裝置輸入報文。該裝置上面有5個鍵,發報者的左手控制2個鍵,右手控制另外3個鍵。5個鍵在某個時刻的各自的按下/復原狀態,可以表示2的5次方即32個狀態之一,因此該裝置可以直接輸入32個字符。能容下拉丁字母表的26個字母。但是,為了解決10個數字與十幾個標點符號的輸入問題,博多的解決辦法是使用兩套各自含31個元素的字符集,第一個字符集主要表示字母表,以及一個切換到第二個字符集的符號;第二個字符集表示10個阿拉伯數字及標點符號,以及一個切換到第一個字符集的符號;不共用切換符號。除了切換符號,又共用了兩個空白符號和兩個換行符號。這樣兩個字符集總共能表示58多個博多碼。收報方的機器自動解碼,直接在紙帶上印出可供人直接閱讀的報文內容。
博多碼也被稱作國際電報字母第1號(英語:International Telegraph Alphabet No. 1,ITA1),目前已不再使用。
電傳打字機
1899年,美國人Donald Murray發明了類似於標準打字機的電報輸入設備。這就是「電傳打字機」(teletype/teleprinter)。這使得只要是會用傳統打字機的普通人,就可以用接入電報網路的電傳打字機直接交流。Murray發明的電傳打字機的輸出是穿孔紙帶。穿孔紙帶可以由電報機自動發報。字符在穿孔紙帶上的編碼還是採取了博多提出的5位元、雙字符集的辦法。但根據字符出現頻率而改進了編碼方案,使得高頻率字符只需要儘可能少的紙帶打孔,而低頻率字符就需要在紙帶上打孔較多。例如,字母T僅需要打1個孔來表示;而字母Q需要打4個孔來表示。
ITA2碼
Murray的這套編碼於1930年代被CCITT標準化為國際電報字母表第2號(the International Telegraph Alphabet No. 2,ITA2),一直使用到1963年被7位元的ASCII碼取代。
Pattern of impulses 1=mark 0=space |
字母集 | 數字標點符號集 | |
---|---|---|---|
大端序 | 小端序 | ||
00000 | 00000 | Null | Null |
00100 | 00100 | Space | Space |
10111 | 11101 | Q | 1 |
10011 | 11001 | W | 2 |
00001 | 10000 | E | 3 |
01010 | 01010 | R | 4 |
10000 | 00001 | T | 5 |
10101 | 10101 | Y | 6 |
00111 | 11100 | U | 7 |
00110 | 01100 | I | 8 |
11000 | 00011 | O | 9 |
10110 | 01101 | P | 0 |
00011 | 11000 | A | – |
00101 | 10100 | S | Bell |
01001 | 10010 | D | $ |
01101 | 10110 | F | ! |
11010 | 01011 | G | & |
10100 | 00101 | H | # |
01011 | 11010 | J | ' |
01111 | 11110 | K | ( |
10010 | 01001 | L | ) |
10001 | 10001 | Z | " |
11101 | 10111 | X | / |
01110 | 01110 | C | : |
11110 | 01111 | V | ; |
11001 | 10011 | B | ? |
01100 | 00110 | N | , |
11100 | 00111 | M | . |
01000 | 00010 | Carriage return | Carriage return |
00010 | 01000 | Line feed | Line feed |
11011 | 11011 | Shift to figures | |
11111 | 11111 | Shift to letters |
ITA2是5位元編碼,包括字母集("letter shift",LTRS)與數字標點符號集兩個字符集("figure shift",FIGS)。在FIGS字符(碼位為1B)後的字符都在數字標點符號集中解讀,直到遇到LTRS字符(碼位為1F)。LTRS字符後的字符都在字母集中解讀,直到遇到FIGS字符為止。
俄語博多碼
由於西里爾字母表比較大,所以俄語的博多碼(MTK-2)使用3個5位元編碼的字符集,分別表示:
- 拉丁字母表
- 西里爾字母表的大部分
- 少量西里爾字母與阿拉伯數字
參考文獻
- ^ 1.0 1.1 1.2 Fischer, Eric N. The Evolution of Character Codes, 1874–1968. 2000-06-20 [2020-12-20]. ark:/13960/t07x23w8s.
[...] In 1872, [Baudot] started research toward a telegraph system that would allow multiple operators to transmit simultaneously over a single wire and, as the transmissions were received, would print them in ordinary alphabetic characters on a strip of paper. He received a patent for such a system on June 17, 1874. [...] Instead of a variable delay followed by a single-unit pulse, Baudot's system used a uniform six time units to transmit each character. [...] his early telegraph probably used the six-unit code [...] that he attributes to Davy in an 1877 article. [...] in 1876 Baudot redesigned his equipment to use a five-unit code. Punctuation and digits were still sometimes needed, though, so he adopted from Hughes the use of two special letter space and figure space characters that would cause the printer to shift between cases at the same time as it advanced the paper without printing. The five-unit code he began using at this time [...] was structured to suit his keyboard [...], which controlled two units of each character with switches operated by the left hand and the other three units with the right hand. [...]
[1][2] - ^ 2.0 2.1 H. A. Emmons. Printer Systems. Wire & Radio Communications. 1 May 1916, 34: 209 [2022-02-16]. (原始內容存檔於2022-02-16).
- ^ Baudot, Jean-Maurice-Émile. Système de télégraphie rapide. Archives Institut National de la Propriété Industrielle (INPI). June 1874. Patent Brevet 103,898. (原始內容存檔於2017-12-16) (法語).
- ^ dataIP Limited. The "Baudot" Code. [9 October 2010]. (原始內容存檔於2010年8月26日)