๐พ Archived View for plot47.space โบ docs โบ latin-g-extended-ascii.gmi captured on 2023-09-08 at 15:49:07. Gemini links have been rewritten to link to archived content
View Raw
More Information
โฌ
๏ธ Previous capture (2023-03-20)
-=-=-=-=-=-=-
Extended ASCII - Latin G (Latin Graphic)
Each column of the table shows the lower nibble (Hexadecimal x0-xF) of the character byte.
Each row of the table shows the upper nibble (Hexadecimal 0x-Fx) of the character byte.
Lower case "k", would therefore be represented by the byte 6B in hexadecimal (107 in decimal).
โ 0 โ 1 โ 2 โ 3 โ 4 โ 5 โ 6 โ 7 โ 8 โ 9 โ A โ B โ C โ D โ E โ F โ
โโโผโโโโผโโโโผโโโโผโโโโผโโโโผโโโโผโโโโผโโโโผโโโโผโโโโผโโโโผโโโโผโโโโผโโโโผโโโโผโโโ๏ธโค โ
0xโNULโSOHโSTXโETXโEOTโENQโACKโBELโBS โTABโLF โVT โFF โCR โSO โSI โ โ
โ โผ โ โผ โ โผ โ โผ โ โผ โ โผ โ โผ โ โผ โ โผ โ โผ โ โผ โ โผ โ โผ โ โผ โ โผ โ โผ โ โค โ
1xโDLEโDC1โDC2โDC3โDC4โNAKโSYNโETBโCANโEM โSUBโESCโFS โGS โRS โUS โ โ
โโโผโโโโผโโโโผโโโโผโโโโผโโโโผโโโโผโโโโผโโโโผโโโโผโโโโผโโโโผโโโโผโโโโผโโโโผโโโโผโโโโค โ
2xโSPCโ ! โ " โ # โ $ โ % โ & โ ' โ ( โ ) โ * โ + โ , โ - โ . โ / โ โ
โ โผ โ โผ โ โผ โ โผ โ โผ โ โผ โ โผ โ โผ โ โผ โ โผ โ โผ โ โผ โ โผ โ โผ โ โผ โ โผ โ โค โ A
3xโ 0 โ 1 โ 2 โ 3 โ 4 โ 5 โ 6 โ 7 โ 8 โ 9 โ : โ ; โ < โ = โ > โ ? โ โ S
โโโผโโโโผโโโโผโโโโผโโโโผโโโโผโโโโผโโโโผโโโโผโโโโผโโโโผโโโโผโโโโผโโโโผโโโโผโโโโผโโโโค โ C
4xโ @ โ A โ B โ C โ D โ E โ F โ G โ H โ I โ J โ K โ L โ M โ N โ O โ โ I
โ โผ โ โผ โ โผ โ โผ โ โผ โ โผ โ โผ โ โผ โ โผ โ โผ โ โผ โ โผ โ โผ โ โผ โ โผ โ โผ โ โค โ I
5xโ P โ Q โ R โ S โ T โ U โ V โ W โ X โ Y โ Z โ [ โ \ โ ] โ ^ โ _ โ โ
โ โผ โ โผ โ โผ โ โผ โ โผ โ โผ โ โผ โ โผ โ โผ โ โผ โ โผ โ โผ โ โผ โ โผ โ โผ โ โผ โ โค โ
6xโ ` โ a โ b โ c โ d โ e โ f โ g โ h โ i โ j โ k โ l โ m โ n โ o โ โ
โ โผ โ โผ โ โผ โ โผ โ โผ โ โผ โ โผ โ โผ โ โผ โ โผ โ โผ โ โผ โ โผ โ โผ โ โผ โ โผ โ โค โ
7xโ p โ q โ r โ s โ t โ u โ v โ w โ x โ y โ z โ { โ | โ } โ ~ โDELโ โ
โโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโ โ
8xโ ร โ ร โ ยซ โ ร โ ร โ ร โ โฌ โ โน โ ร โ ร โ ร โ โด โ ๏ธโ โ โ๏ธ โ ร โ ร โ โ
โ โผ โ โผ โ โผ โ โผ โ โผ โ โผ โ โผ โ โผ โ โผ โ โผ โ โผ โ โผ โ โผ โ โผ โ โผ โ โผ โ โค โ
9xโ ร โ ร
โ ยก โ ล โ ร โ ร โ แบ โ แบ โ ลธ โ ร โ ลฝ โ โ โ ๏ธโ โ ร โ ร โ ร โ โ
โ โผ โ โผ โ โผ โ โผ โ โผ โ โผ โ โผ โ โผ โ โผ โ โผ โ โผ โ โผ โ โผ โ โผ โ โผ โ โผ โ โค โ
Axโ รค โ รก โ ยป โ รง โ รซ โ รฉ โ ยฃ โ โบ โ รฏ โ รญ โ รท โ โฌ โ ๏ธโ โ โ๏ธ โ รถ โ รณ โ โ E
โ โผ โ โผ โ โผ โ โผ โ โผ โ โผ โ โผ โ โผ โ โผ โ โผ โ โผ โ โผ โ โผ โ โผ โ โผ โ โผ โ โค โ x
Bxโ รฃ โ รฅ โ ยฟ โ ลก โ รผ โ รบ โ แบ
โ แบ โ รฟ โ รฝ โ ลพ โ โค โ ๏ธ๏ธโ โ รฑ โ รต โ รธ โ โ t
โโโผโโโโผโโโโผโโโโผโโโโผโโโโผโโโโผโโโโผโโโโผโโโโผโโโโผโโโโผโโโโผโโโโผโโโโผโโโโผโโโโค โ e
Cxโ ร โ ร โ โ โ ร โ ร โ ร โ ยฅ โ ยฉ๏ธ โ ร โ ร โ ยง โ โ โ ยท โ ยช โ ร โ ร โ โ n
โ โผ โ โผ โ โผ โ โผ โ โผ โ โผ โ โผ โ โผ โ โผ โ โผ โ โผ โ โผ โ โผ โ โผ โ โผ โ โผ โ โค โ d
Dxโ ร โ ฮผ โ ร โ ร โ ร โ ร โ แบ โ ลด โ แปฒ โ ลถ โ โฐ๏ธ โ โ โ ยน โ โ๏ธ โ ล โ วพ โ โ e
โ โผ โ โผ โ โผ โ โผ โ โผ โ โผ โ โผ โ โผ โ โผ โ โผ โ โผ โ โผ โ โผ โ โผ โ โผ โ โผ โ โค โ d
Exโ ร โ รข โ ยฐ โ รฐ โ รจ โ รช โ ยค โ ยฎ๏ธ โ รฌ โ รฎ โ ยถ โ โ โ ยฒ โ ยบ โ รฒ โ รด โ โ
โ โผ โ โผ โ โผ โ โผ โ โผ โ โผ โ โผ โ โผ โ โผ โ โผ โ โผ โ โผ โ โผ โ โผ โ โผ โ โผ โ โค โ
Fxโ รฆ โ ฯ โ ร โ รพ โ รน โ รป โ แบ โ ลต โ แปณ โ ลท โ ยฑ โ โผ โ ยณ โ โ๏ธ โ ล โ วฟ โ โ
โโโดโโโโดโโโโดโโโโดโโโโดโโโโดโโโโดโโโโดโโโโดโโโโดโโโโดโโโโดโโโโดโโโโดโโโโดโโโโดโโโ๏ธโ โ
โโโฌโโ โโโโโฌโโโโ โโโโโโโโโฌโโโโโโโโ
Punctuation Currency, rights Typographical, drawing
& quotes & quotes & super script
NUL : Null character DLE : Data link escape
SOH : Start of Header DC1 : Device control 1 (XON)
STX : Start of Text DC2 : Device control 2
ETX : End of Text DC3 : Device control 3 (XOFF)
EOT : End of Transmission DC4 : Device control 4
ENQ : Enquiry NAK : Negative-acknowledge
ACK : Acknowledgement SYN : Synchronous idle
BEL : Bell ETB : End of trans. block
BS : Backspace CAN : Cancel
TAB : Horizontal Tab (HT) EM : End of medium
LF : Line feed SUB : Substitute
VT : Vertical Tab ESC : Escape
FF : Form feed FS : File separator
CR : Carriage return GS : Group separator
SO : Shift Out RS : Record separator
SI : Shift In US : Unit separator
SPC : Space DEL : Delete
By convention, if the control characters above need to be
printed, they use the "โ" (U+2318 : PLACE OF INTEREST
SIGN {operating system key (ISO 9995-7)}) character.
Modern languages with complete coverage of their alphabet:
Base Extended Concomitant
โโโโ โโโโโโโโ โโโโโโโโโโโ
English Danish Irish
French Norwegian Scots Gaelic
Spanish Swedish Catalan
Portuguese Dutch Breton
Italian Icelandic Albanian
German Welsh Galician
Finnish Afrikaans
Luxembourgish
Estonian
Faroese
Greenlandic
Malay
Indonesian
Occitan
Romansh
Tagalog
Walloon
Latin
And possibly some more languages as well.
The base languages are the main ones the character set is covering.
The extended languages add a few extra characters so that they are
fully covered.
The concomitant languages, just happen to be fully covered because
they use the characters from the base and extended languages.
The character set tries to fully cover the western and northern
European languages which have an alphabet mainly derived from Latin.
Using the extended ASCII character set
The extended part of the encoding (128-255) is laid out in a similar way to the ASCII upper and lower case letters, but with two sections rather than one. This facilitates moving between upper and lower case letters by adding 32, and subtracting 32 to go from lower case to upper case. The below outlines simple calculations which can be used to arrive at the extended character, starting from the ASCII letter. e.g. "ร" is got by taking ASCII upper case "A" and adding 64 to it. To go from "ร" to the lower case form, add 32 and get "รก", just like going from ASCII "A" to lower case ASCII "a". The simple calculations for diacritics, ligatures and special characters, only apply to the ones supported in the extended character set.
This encoding is a subset of UTF-8, in that all characters come from UTF-8, so can be translated to/from UTF-8 easily. When translating to UTF-8, it does not use any combining characters, each of the accented and special letters are single code points, though it does use the text variation selector to specify that some code points are represented as text by adding an additional code point (U+FE0E). When translating from UTF-8, the characters must be normalized (go through Unicode composition) first, so that more than one code point i.e. a letter with a combining diacritical mark, becomes one.
Extended characters and their Unicode mappings
- ร 80 = U+00C4 : LATIN CAPITAL LETTER A WITH DIAERESIS
- ร 90 = U+00C3 : LATIN CAPITAL LETTER A WITH TILDE
- รค A0 = U+00E4 : LATIN SMALL LETTER A WITH DIAERESIS
- รฃ B0 = U+00E3 : LATIN SMALL LETTER A WITH TILDE
- ร C0 = U+00C0 : LATIN CAPITAL LETTER A WITH GRAVE
- ร D0 = U+00C6 : LATIN CAPITAL LETTER AE {latin capital ligature ae (1.1)}
- ร E0 = U+00E0 : LATIN SMALL LETTER A WITH GRAVE
- รฆ F0 = U+00E6 : LATIN SMALL LETTER AE {latin small ligature ae (1.1); ash (from Old English รฆsc)}
- ร 81 = U+00C1 : LATIN CAPITAL LETTER A WITH ACUTE
- ร
91 = U+00C5 : LATIN CAPITAL LETTER A WITH RING ABOVE
- รก A1 = U+00E1 : LATIN SMALL LETTER A WITH ACUTE
- รฅ B1 = U+00E5 : LATIN SMALL LETTER A WITH RING ABOVE
- ร C1 = U+00C2 : LATIN CAPITAL LETTER A WITH CIRCUMFLEX
- ฮผ D1 = U+03BC : GREEK SMALL LETTER MU
- รข E1 = U+00E2 : LATIN SMALL LETTER A WITH CIRCUMFLEX
- ฯ F1 = U+03C0 : GREEK SMALL LETTER PI
- ยซ 82 = U+00AB : LEFT-POINTING DOUBLE ANGLE QUOTATION MARK {left guillemet; chevrons (in typography)}
- ยก 92 = U+00A1 : INVERTED EXCLAMATION MARK
- ยป A2 = U+00BB : RIGHT-POINTING DOUBLE ANGLE QUOTATION MARK {right guillemet}
- ยฟ B2 = U+00BF : INVERTED QUESTION MARK {turned question mark}
- โ C2 = U+201E : DOUBLE LOW-9 QUOTATION MARK {low double comma quotation mark}
- แบ D2 = U+1E9E : LATIN CAPITAL LETTER SHARP S
- ยฐ E2 = U+00B0 : DEGREE SIGN
- ร F2 = U+00DF : LATIN SMALL LETTER SHARP S {Eszett}
- ร 83 = U+00C7 : LATIN CAPITAL LETTER C WITH CEDILLA
- ล 93 = U+0160 : LATIN CAPITAL LETTER S WITH CARON
- รง A3 = U+00E7 : LATIN SMALL LETTER C WITH CEDILLA
- ลก B3 = U+0161 : LATIN SMALL LETTER S WITH CARON
- ร C3 = U+00D0 : LATIN CAPITAL LETTER ETH
- ร D3 = U+00DE : LATIN CAPITAL LETTER THORN
- รฐ E3 = U+00F0 : LATIN SMALL LETTER ETH
- รพ F3 = U+00FE : LATIN SMALL LETTER THORN
- ร 84 = U+00CB : LATIN CAPITAL LETTER E WITH DIAERESIS
- ร 94 = U+00DC : LATIN CAPITAL LETTER U WITH DIAERESIS
- รซ A4 = U+00EB : LATIN SMALL LETTER E WITH DIAERESIS
- รผ B4 = U+00FC : LATIN SMALL LETTER U WITH DIAERESIS
- ร C4 = U+00C8 : LATIN CAPITAL LETTER E WITH GRAVE
- ร D4 = U+00D9 : LATIN CAPITAL LETTER U WITH GRAVE
- รจ E4 = U+00E8 : LATIN SMALL LETTER E WITH GRAVE
- รน F4 = U+00F9 : LATIN SMALL LETTER U WITH GRAVE
- ร 85 = U+00C9 : LATIN CAPITAL LETTER E WITH ACUTE
- ร 95 = U+00DA : LATIN CAPITAL LETTER U WITH ACUTE
- รฉ A5 = U+00E9 : LATIN SMALL LETTER E WITH ACUTE
- รบ B5 = U+00FA : LATIN SMALL LETTER U WITH ACUTE
- ร C5 = U+00CA : LATIN CAPITAL LETTER E WITH CIRCUMFLEX
- ร D5 = U+00DB : LATIN CAPITAL LETTER U WITH CIRCUMFLEX
- รช E5 = U+00EA : LATIN SMALL LETTER E WITH CIRCUMFLEX
- รป F5 = U+00FB : LATIN SMALL LETTER U WITH CIRCUMFLEX
- โฌ 86 = U+20AC : EURO SIGN
- แบ 96 = U+1E84 : LATIN CAPITAL LETTER W WITH DIAERESIS
- ยฃ A6 = U+00A3 : POUND SIGN {pound sterling, Irish punt, Italian lira, Turkish lira, etc.}
- แบ
B6 = U+1E85 : LATIN SMALL LETTER W WITH DIAERESIS
- ยฅ C6 = U+00A5 : YEN SIGN {yuan sign}
- แบ D6 = U+1E80 : LATIN CAPITAL LETTER W WITH GRAVE
- ยค E6 = U+00A4 : CURRENCY SIGN
- แบ F6 = U+1E81 : LATIN SMALL LETTER W WITH GRAVE
- โน 87 = U+2039 : SINGLE LEFT-POINTING ANGLE QUOTATION MARK {left pointing single guillemet}
- แบ 97 = U+1E82 : LATIN CAPITAL LETTER W WITH ACUTE
- โบ AA = U+203A : SINGLE RIGHT-POINTING ANGLE QUOTATION MARK {right pointing single guillemet}
- แบ B7 = U+1E83 : LATIN SMALL LETTER W WITH ACUTE
- ยฉ๏ธ C7 = U+00A9 : COPYRIGHT SIGN + (U+FE0E : VARIATION SELECTOR-15 [VS15] {text variation selector})
- ลด D7 = U+0174 : LATIN CAPITAL LETTER W WITH CIRCUMFLEX
- ยฎ๏ธ E7 = U+00AE : REGISTERED SIGN + (U+FE0E : VARIATION SELECTOR-15 [VS15] {text variation selector})
- ลต F7 = U+0175 : LATIN SMALL LETTER W WITH CIRCUMFLEX
- ร 88 = U+00CF : LATIN CAPITAL LETTER I WITH DIAERESIS
- ลธ 98 = U+0178 : LATIN CAPITAL LETTER Y WITH DIAERESIS
- รฏ A8 = U+00EF : LATIN SMALL LETTER I WITH DIAERESIS
- รฟ B8 = U+00FF : LATIN SMALL LETTER Y WITH DIAERESIS
- ร C8 = U+00CC : LATIN CAPITAL LETTER I WITH GRAVE
- แปฒ D8 = U+1EF2 : LATIN CAPITAL LETTER Y WITH GRAVE
- รฌ E8 = U+00EC : LATIN SMALL LETTER I WITH GRAVE
- แปณ F8 = U+1EF3 : LATIN SMALL LETTER Y WITH GRAVE
- ร 89 = U+00CD : LATIN CAPITAL LETTER I WITH ACUTE
- ร 99 = U+00DD : LATIN CAPITAL LETTER Y WITH ACUTE
- รญ A9 = U+00ED : LATIN SMALL LETTER I WITH ACUTE
- รฝ B9 = U+00FD : LATIN SMALL LETTER Y WITH ACUTE
- ร C9 = U+00CE : LATIN CAPITAL LETTER I WITH CIRCUMFLEX
- ลถ D9 = U+0176 : LATIN CAPITAL LETTER Y WITH CIRCUMFLEX
- รฎ E9 = U+00EE : LATIN SMALL LETTER I WITH CIRCUMFLEX
- ลท F9 = U+0177 : LATIN SMALL LETTER Y WITH CIRCUMFLEX
- ร 8A = U+00D7 : MULTIPLICATION SIGN {z notation Cartesian product}
- ลฝ 9A = U+017D : LATIN CAPITAL LETTER Z WITH CARON
- รท AA = U+00F7 : DIVISION SIGN {obelus}
- ลพ BA = U+017E : LATIN SMALL LETTER Z WITH CARON
- ยง CA = U+00A7 : SECTION SIGN
- โฐ DA = U+2030 : PER MILLE SIGN {permille, per thousand}
- ยถ EA = U+00B6 : PILCROW SIGN
- ยฑ FA = U+00B1 : PLUS-MINUS SIGN
- โด 8B = U+2534 : BOX DRAWINGS LIGHT UP AND HORIZONTAL {Videotex Mosaic DG 23}
- โ 9B = U+251C : BOX DRAWINGS LIGHT VERTICAL AND RIGHT {Videotex Mosaic DG 20}
- โฌ AB = U+252C : BOX DRAWINGS LIGHT DOWN AND HORIZONTAL {Videotex Mosaic DG 22}
- โค BB = U+2524 : BOX DRAWINGS LIGHT VERTICAL AND LEFT {Videotex Mosaic DG 21}
- โ CB = U+2551 : BOX DRAWINGS DOUBLE VERTICAL
- โ DB = U+2502 : BOX DRAWINGS LIGHT VERTICAL {Videotex Mosaic DG 14}
- โ EB = U+2500 : BOX DRAWINGS LIGHT HORIZONTAL {Videotex Mosaic DG 15}
- โผ FB = U+253C : BOX DRAWINGS LIGHT VERTICAL AND HORIZONTAL {Videotex Mosaic DG 24}
- โ 8C = U+2510 : BOX DRAWINGS LIGHT DOWN AND LEFT {Videotex Mosaic DG 17}
- โ 9C = U+2518 : BOX DRAWINGS LIGHT UP AND LEFT {Videotex Mosaic DG 19}
- โ AC = U+2514 : BOX DRAWINGS LIGHT UP AND RIGHT {Videotex Mosaic DG 18}
- โ BC = U+250C : BOX DRAWINGS LIGHT DOWN AND RIGHT {Videotex Mosaic DG 16}
- ยท CC = U+00B7 : MIDDLE DOT {midpoint (in typography); Georgian comma; Greek middle dot (ano teleia)}
- ยน DC = U+00B9 : SUPERSCRIPT ONE
- ยฒ EC = U+00B2 : SUPERSCRIPT TWO
- ยณ FC = U+00B3 : SUPERSCRIPT THREE
- โ๏ธ 8D = U+2588 : FULL BLOCK {solid} + (U+FE0E : VARIATION SELECTOR-15 [VS15] {text variation selector})
- ร 9D = U+00D1 : LATIN CAPITAL LETTER N WITH TILDE
- โ๏ธ AD = U+2591 : LIGHT SHADE + (U+FE0E : VARIATION SELECTOR-15 [VS15] {text variation selector})
- รฑ BD = U+00F1 : LATIN SMALL LETTER N WITH TILDE
- ยช CD = U+00AA : FEMININE ORDINAL INDICATOR
- โ๏ธ DD = U+25CF : BLACK CIRCLE + (U+FE0E : VARIATION SELECTOR-15 [VS15] {text variation selector})
- ยบ ED = U+00BA : MASCULINE ORDINAL INDICATOR
- โ๏ธ FD = U+25CB : WHITE CIRCLE + (U+FE0E : VARIATION SELECTOR-15 [VS15] {text variation selector})
- ร 8E = U+00D6 : LATIN CAPITAL LETTER O WITH DIAERESIS
- ร 9E = U+00D5 : LATIN CAPITAL LETTER O WITH TILDE
- รถ AE = U+00F6 : LATIN SMALL LETTER O WITH DIAERESIS
- รต BE = U+00F5 : LATIN SMALL LETTER O WITH TILDE
- ร CE = U+00D2 : LATIN CAPITAL LETTER O WITH GRAVE
- ล DE = U+0152 : LATIN CAPITAL LIGATURE OE
- รฒ EE = U+00F2 : LATIN SMALL LETTER O WITH GRAVE
- ล FE = U+0153 : LATIN SMALL LIGATURE OE {ethel (from Old English eรฐel)}
- ร 8F = U+00D3 : LATIN CAPITAL LETTER O WITH ACUTE
- ร 9F = U+00D8 : LATIN CAPITAL LETTER O WITH STROKE {o slash}
- รณ AF = U+00F3 : LATIN SMALL LETTER O WITH ACUTE
- รธ BF = U+00F8 : LATIN SMALL LETTER O WITH STROKE {o slash}
- ร CF = U+00D4 : LATIN CAPITAL LETTER O WITH CIRCUMFLEX
- วพ DF = U+01FE : LATIN CAPITAL LETTER O WITH STROKE AND ACUTE
- รด EF = U+00F4 : LATIN SMALL LETTER O WITH CIRCUMFLEX
- วฟ FF = U+01FF : LATIN SMALL LETTER O WITH STROKE AND ACUTE
Diacritics
Accents
- โฬ โ acute (Latin: apex) - Take the ASCII upper/lower case letter "A,E,I,O,U,Y,W,ร", and add 64
- โฬ โ grave - Take the ASCII upper/lower letter "A,E,I,O,U,Y,W", add 128 and subtract 1
- โฬ โ circumflex - Take the ASCII upper/lower case letter "A,E,I,O,U,Y,W", and add 128
- โฬ โ tilde - Take the ASCII upper/lower case letter "A,N,O", add 80 and subtract 1
- โฬ โ caron - Take the ASCII upper/lower case letter "S,Z", and add 64
Dots
- โฬ โ umlaut or diaeresis - Take the ASCII upper/lower letter "A,E,I,O,U,Y,W", add 64 and subtract 1
Ring
- โฬ โ overring - Take the ASCII upper/lower case letter "A", and add 80
Subscript curls
- โฬง โ cedilla - Take the ASCII upper/lower case letter "C", and add 64
Overlays
- โฬท - slash - Take the ASCII upper/lower case letter "O,ร", and add 80
Multiple
- โฬทฬ - slash with acute - Take the ASCII upper/lower case letter "ร", and add 64, or take the ASCII upper/lower case letter "ร" and add 80, or take the ASCII upper/lower case letter "O" and add 144
Ligatures
- ร/รฆ and ล/ล - Take the ASCII upper/lower case letter which matches the first letter of the ligature (i.e. "A" or "O"), add 144 and subtract 1
None Latin characters
- แบ/ร - Take the ASCII upper/lower case letter "S", add 128 and subtract 1
- ร/รฐ - Take the ASCII upper/lower case letter "D", add 128 and subtract 1
- ร/รพ - Take the ASCII upper/lower case letter "T", add 128 and subtract 1