๐Ÿ’พ Archived View for plot47.space โ€บ ideas โ€บ latin-g-extended-ascii.gmi captured on 2023-01-29 at 02:17:50. Gemini links have been rewritten to link to archived content

View Raw

More Information

โฌ…๏ธ Previous capture (2022-07-16)

๐Ÿšง View Differences

-=-=-=-=-=-=-

Extended ASCII - Latin G (Latin Graphic)

Each column of the table shows the lower nibble (Hexadecimal x0-xF) of the character byte.

Each row of the table shows the upper nibble (Hexadecimal 0x-Fx) of the character byte.

Lower case "k", would therefore be represented by the byte 6B in hexadecimal (107 in decimal).

  โ”‚ 0 โ”‚ 1 โ”‚ 2 โ”‚ 3 โ”‚ 4 โ”‚ 5 โ”‚ 6 โ”‚ 7 โ”‚ 8 โ”‚ 9 โ”‚ A โ”‚ B โ”‚ C โ”‚ D โ”‚ E โ”‚ F โ”‚
โ”€โ”€โ”ผโ”€โ”€โ”€โ”ผโ”€โ”€โ”€โ”ผโ”€โ”€โ”€โ”ผโ”€โ”€โ”€โ”ผโ”€โ”€โ”€โ”ผโ”€โ”€โ”€โ”ผโ”€โ”€โ”€โ”ผโ”€โ”€โ”€โ”ผโ”€โ”€โ”€โ”ผโ”€โ”€โ”€โ”ผโ”€โ”€โ”€โ”ผโ”€โ”€โ”€โ”ผโ”€โ”€โ”€โ”ผโ”€โ”€โ”€โ”ผโ”€โ”€โ”€โ”ผโ”€โ”€โ”€๏ธŽโ”ค โ”
0xโ”‚NULโ”‚SOHโ”‚STXโ”‚ETXโ”‚EOTโ”‚ENQโ”‚ACKโ”‚BELโ”‚BS โ”‚TABโ”‚LF โ”‚VT โ”‚FF โ”‚CR โ”‚SO โ”‚SI โ”‚ โ”‚
โ”€ โ”ผ โ”€ โ”ผ โ”€ โ”ผ โ”€ โ”ผ โ”€ โ”ผ โ”€ โ”ผ โ”€ โ”ผ โ”€ โ”ผ โ”€ โ”ผ โ”€ โ”ผ โ”€ โ”ผ โ”€ โ”ผ โ”€ โ”ผ โ”€ โ”ผ โ”€ โ”ผ โ”€ โ”ผ โ”€ โ”ค โ”‚
1xโ”‚DLEโ”‚DC1โ”‚DC2โ”‚DC3โ”‚DC4โ”‚NAKโ”‚SYNโ”‚ETBโ”‚CANโ”‚EM โ”‚SUBโ”‚ESCโ”‚FS โ”‚GS โ”‚RS โ”‚US โ”‚ โ”‚
โ”€โ”€โ”ผโ”€โ”€โ”€โ”ผโ”€โ”€โ”€โ”ผโ”€โ”€โ”€โ”ผโ”€โ”€โ”€โ”ผโ”€โ”€โ”€โ”ผโ”€โ”€โ”€โ”ผโ”€โ”€โ”€โ”ผโ”€โ”€โ”€โ”ผโ”€โ”€โ”€โ”ผโ”€โ”€โ”€โ”ผโ”€โ”€โ”€โ”ผโ”€โ”€โ”€โ”ผโ”€โ”€โ”€โ”ผโ”€โ”€โ”€โ”ผโ”€โ”€โ”€โ”ผโ”€โ”€โ”€โ”ค โ”‚
2xโ”‚SPCโ”‚ ! โ”‚ " โ”‚ # โ”‚ $ โ”‚ % โ”‚ & โ”‚ ' โ”‚ ( โ”‚ ) โ”‚ * โ”‚ + โ”‚ , โ”‚ - โ”‚ . โ”‚ / โ”‚ โ”‚
โ”€ โ”ผ โ”€ โ”ผ โ”€ โ”ผ โ”€ โ”ผ โ”€ โ”ผ โ”€ โ”ผ โ”€ โ”ผ โ”€ โ”ผ โ”€ โ”ผ โ”€ โ”ผ โ”€ โ”ผ โ”€ โ”ผ โ”€ โ”ผ โ”€ โ”ผ โ”€ โ”ผ โ”€ โ”ผ โ”€ โ”ค โ”‚ A
3xโ”‚ 0 โ”‚ 1 โ”‚ 2 โ”‚ 3 โ”‚ 4 โ”‚ 5 โ”‚ 6 โ”‚ 7 โ”‚ 8 โ”‚ 9 โ”‚ : โ”‚ ; โ”‚ < โ”‚ = โ”‚ > โ”‚ ? โ”‚ โ”‚ S
โ”€โ”€โ”ผโ”€โ”€โ”€โ”ผโ”€โ”€โ”€โ”ผโ”€โ”€โ”€โ”ผโ”€โ”€โ”€โ”ผโ”€โ”€โ”€โ”ผโ”€โ”€โ”€โ”ผโ”€โ”€โ”€โ”ผโ”€โ”€โ”€โ”ผโ”€โ”€โ”€โ”ผโ”€โ”€โ”€โ”ผโ”€โ”€โ”€โ”ผโ”€โ”€โ”€โ”ผโ”€โ”€โ”€โ”ผโ”€โ”€โ”€โ”ผโ”€โ”€โ”€โ”ผโ”€โ”€โ”€โ”ค โ”œ C
4xโ”‚ @ โ”‚ A โ”‚ B โ”‚ C โ”‚ D โ”‚ E โ”‚ F โ”‚ G โ”‚ H โ”‚ I โ”‚ J โ”‚ K โ”‚ L โ”‚ M โ”‚ N โ”‚ O โ”‚ โ”‚ I
โ”€ โ”ผ โ”€ โ”ผ โ”€ โ”ผ โ”€ โ”ผ โ”€ โ”ผ โ”€ โ”ผ โ”€ โ”ผ โ”€ โ”ผ โ”€ โ”ผ โ”€ โ”ผ โ”€ โ”ผ โ”€ โ”ผ โ”€ โ”ผ โ”€ โ”ผ โ”€ โ”ผ โ”€ โ”ผ โ”€ โ”ค โ”‚ I
5xโ”‚ P โ”‚ Q โ”‚ R โ”‚ S โ”‚ T โ”‚ U โ”‚ V โ”‚ W โ”‚ X โ”‚ Y โ”‚ Z โ”‚ [ โ”‚ \ โ”‚ ] โ”‚ ^ โ”‚ _ โ”‚ โ”‚
โ”€ โ”ผ โ”€ โ”ผ โ”€ โ”ผ โ”€ โ”ผ โ”€ โ”ผ โ”€ โ”ผ โ”€ โ”ผ โ”€ โ”ผ โ”€ โ”ผ โ”€ โ”ผ โ”€ โ”ผ โ”€ โ”ผ โ”€ โ”ผ โ”€ โ”ผ โ”€ โ”ผ โ”€ โ”ผ โ”€ โ”ค โ”‚
6xโ”‚ ` โ”‚ a โ”‚ b โ”‚ c โ”‚ d โ”‚ e โ”‚ f โ”‚ g โ”‚ h โ”‚ i โ”‚ j โ”‚ k โ”‚ l โ”‚ m โ”‚ n โ”‚ o โ”‚ โ”‚
โ”€ โ”ผ โ”€ โ”ผ โ”€ โ”ผ โ”€ โ”ผ โ”€ โ”ผ โ”€ โ”ผ โ”€ โ”ผ โ”€ โ”ผ โ”€ โ”ผ โ”€ โ”ผ โ”€ โ”ผ โ”€ โ”ผ โ”€ โ”ผ โ”€ โ”ผ โ”€ โ”ผ โ”€ โ”ผ โ”€ โ”ค โ”‚
7xโ”‚ p โ”‚ q โ”‚ r โ”‚ s โ”‚ t โ”‚ u โ”‚ v โ”‚ w โ”‚ x โ”‚ y โ”‚ z โ”‚ { โ”‚ | โ”‚ } โ”‚ ~ โ”‚DELโ”‚ โ”‚
โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€ โ”˜
8xโ”‚ ร„ โ”‚ ร โ”‚ ยซ โ”‚ ร‡ โ”‚ ร‹ โ”‚ ร‰ โ”‚ โ‚ฌ โ”‚ โ€น โ”‚ ร โ”‚ ร โ”‚ โ€ฐ โ”‚ โ”ด โ”‚ ๏ธŽโ” โ”‚ โ–ˆ๏ธŽ โ”‚ ร– โ”‚ ร“ โ”‚ โ”‚
โ”€ โ”ผ โ”€ โ”ผ โ”€ โ”ผ โ”€ โ”ผ โ”€ โ”ผ โ”€ โ”ผ โ”€ โ”ผ โ”€ โ”ผ โ”€ โ”ผ โ”€ โ”ผ โ”€ โ”ผ โ”€ โ”ผ โ”€ โ”ผ โ”€ โ”ผ โ”€ โ”ผ โ”€ โ”ผ โ”€ โ”ค โ”‚
9xโ”‚ รƒ โ”‚ ร… โ”‚ ยก โ”‚ ล  โ”‚ รœ โ”‚ รš โ”‚ แบ„ โ”‚ แบ‚ โ”‚ ลธ โ”‚ ร โ”‚ ลฝ โ”‚ โ”œ โ”‚ ๏ธŽโ”˜ โ”‚ ร‘ โ”‚ ร• โ”‚ ร˜ โ”‚ โ”‚
โ”€ โ”ผ โ”€ โ”ผ โ”€ โ”ผ โ”€ โ”ผ โ”€ โ”ผ โ”€ โ”ผ โ”€ โ”ผ โ”€ โ”ผ โ”€ โ”ผ โ”€ โ”ผ โ”€ โ”ผ โ”€ โ”ผ โ”€ โ”ผ โ”€ โ”ผ โ”€ โ”ผ โ”€ โ”ผ โ”€ โ”ค โ”‚
Axโ”‚ รค โ”‚ รก โ”‚ ยป โ”‚ รง โ”‚ รซ โ”‚ รฉ โ”‚ ยฃ โ”‚ โ€บ โ”‚ รฏ โ”‚ รญ โ”‚ โ€ฑ โ”‚ โ”ฌ โ”‚ ๏ธŽโ”” โ”‚ โ–‘๏ธŽ โ”‚ รถ โ”‚ รณ โ”‚ โ”‚ E
โ”€ โ”ผ โ”€ โ”ผ โ”€ โ”ผ โ”€ โ”ผ โ”€ โ”ผ โ”€ โ”ผ โ”€ โ”ผ โ”€ โ”ผ โ”€ โ”ผ โ”€ โ”ผ โ”€ โ”ผ โ”€ โ”ผ โ”€ โ”ผ โ”€ โ”ผ โ”€ โ”ผ โ”€ โ”ผ โ”€ โ”ค โ”‚ x
Bxโ”‚ รฃ โ”‚ รฅ โ”‚ ยฟ โ”‚ ลก โ”‚ รผ โ”‚ รบ โ”‚ แบ… โ”‚ แบƒ โ”‚ รฟ โ”‚ รฝ โ”‚ ลพ โ”‚ โ”ค โ”‚ ๏ธŽ๏ธŽโ”Œ โ”‚ รฑ โ”‚ รต โ”‚ รธ โ”‚ โ”‚ t
โ”€โ”€โ”ผโ”€โ”€โ”€โ”ผโ”€โ”€โ”€โ”ผโ”€โ”€โ”€โ”ผโ”€โ”€โ”€โ”ผโ”€โ”€โ”€โ”ผโ”€โ”€โ”€โ”ผโ”€โ”€โ”€โ”ผโ”€โ”€โ”€โ”ผโ”€โ”€โ”€โ”ผโ”€โ”€โ”€โ”ผโ”€โ”€โ”€โ”ผโ”€โ”€โ”€โ”ผโ”€โ”€โ”€โ”ผโ”€โ”€โ”€โ”ผโ”€โ”€โ”€โ”ผโ”€โ”€โ”€โ”ค โ”œ e
Cxโ”‚ ร€ โ”‚ ร‚ โ”‚ โ€ž โ”‚ ร โ”‚ รˆ โ”‚ รŠ โ”‚ ยฅ โ”‚ ยฉ๏ธŽ โ”‚ รŒ โ”‚ รŽ โ”‚ ยง โ”‚ โ•‘ โ”‚ โˆš๏ธŽ โ”‚ ยช โ”‚ ร’ โ”‚ ร” โ”‚ โ”‚ n
โ”€ โ”ผ โ”€ โ”ผ โ”€ โ”ผ โ”€ โ”ผ โ”€ โ”ผ โ”€ โ”ผ โ”€ โ”ผ โ”€ โ”ผ โ”€ โ”ผ โ”€ โ”ผ โ”€ โ”ผ โ”€ โ”ผ โ”€ โ”ผ โ”€ โ”ผ โ”€ โ”ผ โ”€ โ”ผ โ”€ โ”ค โ”‚ d
Dxโ”‚ ร† โ”‚ ฮผ โ”‚ รŸ โ”‚ รž โ”‚ ร™ โ”‚ ร› โ”‚ แบ€ โ”‚ ลด โ”‚ แปฒ โ”‚ ลถ โ”‚ ยท โ”‚ โ”€ โ”‚ ยน โ”‚ โ—๏ธŽ โ”‚ ล’ โ”‚ วพ โ”‚ โ”‚ e
โ”€ โ”ผ โ”€ โ”ผ โ”€ โ”ผ โ”€ โ”ผ โ”€ โ”ผ โ”€ โ”ผ โ”€ โ”ผ โ”€ โ”ผ โ”€ โ”ผ โ”€ โ”ผ โ”€ โ”ผ โ”€ โ”ผ โ”€ โ”ผ โ”€ โ”ผ โ”€ โ”ผ โ”€ โ”ผ โ”€ โ”ค โ”‚ d
Exโ”‚ ร  โ”‚ รข โ”‚ ยฐ โ”‚ รฐ โ”‚ รจ โ”‚ รช โ”‚ ยค โ”‚ ยฎ๏ธŽ โ”‚ รฌ โ”‚ รฎ โ”‚ ยถ โ”‚ โ”‚ โ”‚ ยฒ โ”‚ ยบ โ”‚ รฒ โ”‚ รด โ”‚ โ”‚
โ”€ โ”ผ โ”€ โ”ผ โ”€ โ”ผ โ”€ โ”ผ โ”€ โ”ผ โ”€ โ”ผ โ”€ โ”ผ โ”€ โ”ผ โ”€ โ”ผ โ”€ โ”ผ โ”€ โ”ผ โ”€ โ”ผ โ”€ โ”ผ โ”€ โ”ผ โ”€ โ”ผ โ”€ โ”ผ โ”€ โ”ค โ”‚
Fxโ”‚ รฆ โ”‚ ฯ€ โ”‚ รŸ โ”‚ รพ โ”‚ รน โ”‚ รป โ”‚ แบ โ”‚ ลต โ”‚ แปณ โ”‚ ลท โ”‚ ยฑ โ”‚ โ”ผ โ”‚ ยณ โ”‚ โ—‹๏ธŽ โ”‚ ล“ โ”‚ วฟ โ”‚ โ”‚
โ”€โ”€โ”ดโ”€โ”€โ”€โ”ดโ”€โ”€โ”€โ”ดโ”€โ”€โ”€โ”ดโ”€โ”€โ”€โ”ดโ”€โ”€โ”€โ”ดโ”€โ”€โ”€โ”ดโ”€โ”€โ”€โ”ดโ”€โ”€โ”€โ”ดโ”€โ”€โ”€โ”ดโ”€โ”€โ”€โ”ดโ”€โ”€โ”€โ”ดโ”€โ”€โ”€โ”ดโ”€โ”€โ”€โ”ดโ”€โ”€โ”€โ”ดโ”€โ”€โ”€โ”ดโ”€โ”€โ”€๏ธŽโ”˜ โ”˜
          โ””โ”€โ”ฌโ”€โ”˜           โ””โ”€โ”€โ”€โ”ฌโ”€โ”€โ”€โ”˜       โ””โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”ฌโ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”˜
       Punctuation    Currency, rights  Typographical, drawing
        & quotes          & quotes          & super script

NUL : Null character         DLE : Data link escape
SOH : Start of Header        DC1 : Device control 1 (XON)
STX : Start of Text          DC2 : Device control 2
ETX : End of Text            DC3 : Device control 3 (XOFF)
EOT : End of Transmission    DC4 : Device control 4
ENQ : Enquiry                NAK : Negative-acknowledge
ACK : Acknowledgement        SYN : Synchronous idle
BEL : Bell                   ETB : End of trans. block
BS  : Backspace              CAN : Cancel
TAB : Horizontal Tab (HT)    EM  : End of medium
LF  : Line feed              SUB : Substitute
VT  : Vertical Tab           ESC : Escape
FF  : Form feed              FS  : File separator
CR  : Carriage return        GS  : Group separator
SO  : Shift Out              RS  : Record separator
SI  : Shift In               US  : Unit separator

SPC : Space                  DEL : Delete

By convention, if the control characters above need to be
printed, they use the "ยค" (E6) character.

Modern languages with complete coverage of their alphabet:

Base          Extended     Concomitant
โ”€โ”€โ”€โ”€          โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€     โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€
English       Danish       Irish
French        Norwegian    Scots Gaelic
Spanish       Swedish      Catalan
Portuguese    Dutch        Breton
Italian       Icelandic    Albanian
German        Welsh        Galician
              Finnish      Afrikaans
                           Luxembourgish
                           Estonian
                           Faroese
                           Greenlandic
                           Malay
                           Indonesian
                           Occitan
                           Romansh
                           Tagalog
                           Walloon
                           Latin

And possibly some more languages as well.

The base languages are the main ones the character set is covering.
The extended languages add a few extra characters so that they are
fully covered.
The concomitant languages, just happen to be fully covered because
they use the characters from the base and extended languages.
The character set tries to fully cover the western and northern
European languages which have an alphabet mainly derived from Latin.

Using the extended ASCII character set

The extended part of the encoding (128-255) is laid out in a similar way to the ASCII upper and lower case letters, but with two sections rather than one. This facilitates moving between upper and lower case letters by adding 32, and subtracting 32 to go from lower case to upper case. The below outlines simple calculations which can be used to arrive at the extended character, starting from the ASCII letter. e.g. "ร" is got by taking ASCII upper case "A" and adding 64 to it. To go from "ร" to the lower case form, add 32 and get "รก", just like going from ASCII "A" to lower case ASCII "a". The simple calculations for diacritics, ligatures and special characters, only apply to the ones supported in the extended character set.

This encoding is a subset of UTF-8, in that all characters come from UTF-8, so can be translated to/from UTF-8 easily. When translating to UTF-8, it does not use any combining characters, each of the accented and special letters are single code points, though it does use the text variation selector to specify that some code points are represented as text by adding an additional code point (U+FE0E). When translating from UTF-8, the characters must be normalized (go through Unicode composition) first, so that more than one code point i.e. a letter with a combining diacritical mark, becomes one.

Extended characters and their Unicode mappings

Diacritics

Accents

Dots

Ring

Subscript curls

Overlays

Multiple

Ligatures

None Latin characters