๐พ Archived View for plot47.space โบ ideas โบ latin-g-extended-ascii.gmi captured on 2022-03-01 at 15:16:55. Gemini links have been rewritten to link to archived content
View Raw
More Information
โก๏ธ Next capture (2022-04-28)
-=-=-=-=-=-=-
Extended ASCII - Latin G (Latin Graphic)
Each column of the table shows the lower nibble (Hexidecimal x0-xF) of the character byte.
Each row of the table shows the upper nibble (Hexidecimal 0x-Fx) of the character byte.
Lower case "k", would therefore be represented by the byte 6B in hexidecimal (107 in decimal).
โ 0 โ 1 โ 2 โ 3 โ 4 โ 5 โ 6 โ 7 โ 8 โ 9 โ A โ B โ C โ D โ E โ F
โโโผโโโโผโโโโผโโโโผโโโโผโโโโผโโโโผโโโโผโโโโผโโโโผโโโโผโโโโผโโโโผโโโโผโโโโผโโโโผโโโ โ
0xโNULโSOHโSTXโETXโEOTโENQโACKโBELโBS โTABโLF โVT โFF โCR โSO โSI โ
โ โผ โ โผ โ โผ โ โผ โ โผ โ โผ โ โผ โ โผ โ โผ โ โผ โ โผ โ โผ โ โผ โ โผ โ โผ โ โผ โ โ
1xโDLEโDC1โDC2โDC3โDC4โNAKโSYNโETBโCANโEM โSUBโESCโFS โGS โRS โUS โ
โโโผโโโโผโโโโผโโโโผโโโโผโโโโผโโโโผโโโโผโโโโผโโโโผโโโโผโโโโผโโโโผโโโโผโโโโผโโโโผโโโ โ
2xโSPCโ ! โ " โ # โ $ โ % โ & โ ' โ ( โ ) โ * โ + โ , โ - โ . โ / โ
โ โผ โ โผ โ โผ โ โผ โ โผ โ โผ โ โผ โ โผ โ โผ โ โผ โ โผ โ โผ โ โผ โ โผ โ โผ โ โผ โ โ A
3xโ 0 โ 1 โ 2 โ 3 โ 4 โ 5 โ 6 โ 7 โ 8 โ 9 โ : โ ; โ < โ = โ > โ ? โ S
โโโผโโโโผโโโโผโโโโผโโโโผโโโโผโโโโผโโโโผโโโโผโโโโผโโโโผโโโโผโโโโผโโโโผโโโโผโโโโผโโโ โ C
4xโ @ โ A โ B โ C โ D โ E โ F โ G โ H โ I โ J โ K โ L โ M โ N โ O โ I
โ โผ โ โผ โ โผ โ โผ โ โผ โ โผ โ โผ โ โผ โ โผ โ โผ โ โผ โ โผ โ โผ โ โผ โ โผ โ โผ โ โ I
5xโ P โ Q โ R โ S โ T โ U โ V โ W โ X โ Y โ Z โ [ โ \ โ ] โ ^ โ _ โ
โ โผ โ โผ โ โผ โ โผ โ โผ โ โผ โ โผ โ โผ โ โผ โ โผ โ โผ โ โผ โ โผ โ โผ โ โผ โ โผ โ โ
6xโ ` โ a โ b โ c โ d โ e โ f โ g โ h โ i โ j โ k โ l โ m โ n โ o โ
โ โผ โ โผ โ โผ โ โผ โ โผ โ โผ โ โผ โ โผ โ โผ โ โผ โ โผ โ โผ โ โผ โ โผ โ โผ โ โผ โ โ
7xโ p โ q โ r โ s โ t โ u โ v โ w โ x โ y โ z โ { โ | โ } โ ~ โDEL โ
================================================================== โ
8xโ ร โ ร โ ยซ โ ร โ ร โ ร โ โฌ โ โน โ ร โ ร โ โฐ โ ยท โ โ โ โ โ ร โ ร โ
โ โผ โ โผ โ โผ โ โผ โ โผ โ โผ โ โผ โ โผ โ โผ โ โผ โ โผ โ โผ โ โผ โ โผ โ โผ โ โผ โ โ
9xโ ร
โ ร โ ยก โ ล โ ร โ ร โ แบ โ แบ โ ลธ โ ร โ ลฝ โ โ โ โ โ โ โ ร โ ร โ
โ โผ โ โผ โ โผ โ โผ โ โผ โ โผ โ โผ โ โผ โ โผ โ โผ โ โผ โ โผ โ โผ โ โผ โ โผ โ โผ โ โ
Axโ รค โ รก โ ยป โ รง โ รซ โ รฉ โ ยฃ โ โบ โ รฏ โ รญ โ ยฑ โ โ โ โ โ โ โ รถ โ รณ โ E
โ โผ โ โผ โ โผ โ โผ โ โผ โ โผ โ โผ โ โผ โ โผ โ โผ โ โผ โ โผ โ โผ โ โผ โ โผ โ โผ โ โ x
Bxโ รฅ โ รฃ โ ยฟ โ ลก โ รผ โ รบ โ แบ
โ แบ โ รฟ โ รฝ โ ลพ โ โผ โ โ โ โ โ รฑ โ รต โ t
โโโผโโโโผโโโโผโโโโผโโโโผโโโโผโโโโผโโโโผโโโโผโโโโผโโโโผโโโโผโโโโผโโโโผโโโโผโโโโผโโโ โ e
Cxโ ร โ ร โ โ โ ร โ ร โ ร โ ยฅ โ ยง โ ร โ ร โ โ โ โด โ โ โ โ โ ร โ ร โ n
โ โผ โ โผ โ โผ โ โผ โ โผ โ โผ โ โผ โ โผ โ โผ โ โผ โ โผ โ โผ โ โผ โ โผ โ โผ โ โผ โ โ d
Dxโ ฮผ โ ร โ ร โ ร โ ร โ ร โ แบ โ ลด โ แปฒ โ ลถ โ โ โ โ โ โ โ โ โ ร โ ล โ e
โ โผ โ โผ โ โผ โ โผ โ โผ โ โผ โ โผ โ โผ โ โผ โ โผ โ โผ โ โผ โ โผ โ โผ โ โผ โ โผ โ โ d
Exโ ร โ รข โ ยฐ โ รฐ โ รจ โ รช โ ยค โ ยฉ โ รฌ โ รฎ โ โ โ โฌ โ โ โ โ โ รฒ โ รด โ
โ โผ โ โผ โ โผ โ โผ โ โผ โ โผ โ โผ โ โผ โ โผ โ โผ โ โผ โ โผ โ โผ โ โผ โ โผ โ โผ โ โ
Fxโ ฯ โ รฆ โ ร โ รพ โ รน โ รป โ แบ โ ลต โ แปณ โ ลท โ โ โ โค โ โ โ โ๏ธ โ รธ โ ล โ
โ
โโโฌโโ โโโฌโโ โโโโโฌโโโโโโโโฌโโโโ
Punctuation Currency Box drawing Chess
characters characters characters characters
NUL : Null character DLE : Data link escape
SOH : Start of Header DC1 : Device control 1 (XON)
STX : Start of Text DC2 : Device control 2
ETX : End of Text DC3 : Device control 3 (XOFF)
EOT : End of Transmission DC4 : Device control 4
ENQ : Enquiry NAK : Negative-acknowledge
ACK : Acknowledgement SYN : Synchronous idle
BEL : Bell ETB : End of trans. block
BS : Backspace CAN : Cancel
TAB : Horizontal Tab (HT) EM : End of medium
LF : Line feed SUB : Substitute
VT : Vertical Tab ESC : Escape
FF : Form feed FS : File separator
CR : Carriage return GS : Group separator
SO : Shift Out RS : Record separator
SI : Shift In US : Unit separator
SPC : Space DEL : Delete
By convention, if the control characters above need to be
printed, they use the "ยค" (E6) character.
Modern languages with complete coverage of their alphabet:
Base Extended Concomitant
โโโโ โโโโโโโโ โโโโโโโโโโโ
English Danish Irish
French Norwegian Scots Gaelic
Spanish Swedish Catalan
Portuguese Dutch Breton
Italian Icelandic Albanian
German Welsh Galician
Finnish Afrikaans
Luxembourgish
Estonian
Faroese
Malay
Occitan
Romansh
Tagalog
Walloon
Latin
And possibly some more languages as well.
The base languages are the main ones the character set is covering.
The extended languages add a few extra characters so that they are
fully covered.
The concomitant languages, just happen to be fully covered because
they use the characters from the base and extended languages.
The character set tries to fully cover the western and northern
European languages which have an alphabet mainly derived from latin.
Using the extended ASCII character set
The extended part of the encoding (128-255) is laid out in a similar way to the ASCII upper and lower case letters. This facilitates moving between upper and lower case letters by adding 32, and subtracting 32 to go from lower case to upper case. The below outlines simple calculations which can be used to arrive at the extended character, starting from the ASCII letter. e.g. "ร" is got by taking ASCII upper case "A" and adding 64 to it. To go from "ร" to the lower case form, add 32 and get "รก", just like going from ASCII "A" to lower case ASCII "a". The simple calculations for diacritics, ligatures and special characters, only apply to the ones supported in the extended character set.
This encoding is a subset of UTF-8, in that all characters come from UTF-8, so can be translated to/from UTF-8 easily. When translating to UTF-8, it does not use any combining characters, each of the accented and special letters are single code points, though it does use the text variation selector to specify that some code points are represented as text (U+FE0E). When translating from UTF-8, the characters must be normalized (go through unicode composition) first, so that more than one code point i.e. a letter with a combining diacritical mark, becomes one.
Extended characters and their UTF-8 mappings
- ร 80 = U+00C4 : LATIN CAPITAL LETTER A WITH DIAERESIS
- ร
90 = U+00C5 : LATIN CAPITAL LETTER A WITH RING ABOVE
- รค A0 = U+00E4 : LATIN SMALL LETTER A WITH DIAERESIS
- รฅ B0 = U+00E5 : LATIN SMALL LETTER A WITH RING ABOVE
- ร C0 = U+00C0 : LATIN CAPITAL LETTER A WITH GRAVE
- ฮผ D0 = U+03BC : GREEK SMALL LETTER MU
- ร E0 = U+00E0 : LATIN SMALL LETTER A WITH GRAVE
- ฯ F0 = U+03C0 : GREEK SMALL LETTER PI
- ร 81 = U+00C1 : LATIN CAPITAL LETTER A WITH ACUTE
- ร 91 = U+00C3 : LATIN CAPITAL LETTER A WITH TILDE
- รก A1 = U+00E1 : LATIN SMALL LETTER A WITH ACUTE
- รฃ B1 = U+00E3 : LATIN SMALL LETTER A WITH TILDE
- ร C1 = U+00C2 : LATIN CAPITAL LETTER A WITH CIRCUMFLEX
- ร D1 = U+00C6 : LATIN CAPITAL LETTER AE {latin capital ligature ae (1.1)}
- รข E1 = U+00E2 : LATIN SMALL LETTER A WITH CIRCUMFLEX
- รฆ F1 = U+00E6 : LATIN SMALL LETTER AE {latin small ligature ae (1.1); ash (from Old English รฆsc)}
- ยซ 82 = U+00AB : LEFT-POINTING DOUBLE ANGLE QUOTATION MARK {left guillemet; chevrons (in typography)}
- ยก 92 = U+00A1 : INVERTED EXCLAMATION MARK
- ยป A2 = U+00BB : RIGHT-POINTING DOUBLE ANGLE QUOTATION MARK {right guillemet}
- ยฟ B2 = U+00BF : INVERTED QUESTION MARK {turned question mark}
- โ C2 = U+201E : DOUBLE LOW-9 QUOTATION MARK {low double comma quotation mark}
- แบ D2 = U+1E9E : LATIN CAPITAL LETTER SHARP S
- ยฐ E2 = U+00B0 : DEGREE SIGN
- ร F2 = U+00DF : LATIN SMALL LETTER SHARP S {Eszett}
- ร 83 = U+00C7 : LATIN CAPITAL LETTER C WITH CEDILLA
- ล 93 = U+0160 : LATIN CAPITAL LETTER S WITH CARON
- รง A3 = U+00E7 : LATIN SMALL LETTER C WITH CEDILLA
- ลก B3 = U+0161 : LATIN SMALL LETTER S WITH CARON
- ร C3 = U+00D0 : LATIN CAPITAL LETTER ETH
- ร D3 = U+00DE : LATIN CAPITAL LETTER THORN
- รฐ E3 = U+00F0 : LATIN SMALL LETTER ETH
- รพ F3 = U+00FE : LATIN SMALL LETTER THORN
- ร 84 = U+00CB : LATIN CAPITAL LETTER E WITH DIAERESIS
- ร 94 = U+00DC : LATIN CAPITAL LETTER U WITH DIAERESIS
- รซ A4 = U+00EB : LATIN SMALL LETTER E WITH DIAERESIS
- รผ B4 = U+00FC : LATIN SMALL LETTER U WITH DIAERESIS
- ร C4 = U+00C8 : LATIN CAPITAL LETTER E WITH GRAVE
- ร D4 = U+00D9 : LATIN CAPITAL LETTER U WITH GRAVE
- รจ E4 = U+00E8 : LATIN SMALL LETTER E WITH GRAVE
- รน F4 = U+00F9 : LATIN SMALL LETTER U WITH GRAVE
- ร 85 = U+00C9 : LATIN CAPITAL LETTER E WITH ACUTE
- ร 95 = U+00DA : LATIN CAPITAL LETTER U WITH ACUTE
- รฉ A5 = U+00E9 : LATIN SMALL LETTER E WITH ACUTE
- รบ B5 = U+00FA : LATIN SMALL LETTER U WITH ACUTE
- ร C5 = U+00CA : LATIN CAPITAL LETTER E WITH CIRCUMFLEX
- ร D5 = U+00DB : LATIN CAPITAL LETTER U WITH CIRCUMFLEX
- รช E5 = U+00EA : LATIN SMALL LETTER E WITH CIRCUMFLEX
- รป F5 = U+00FB : LATIN SMALL LETTER U WITH CIRCUMFLEX
- โฌ 86 = U+20AC : EURO SIGN
- แบ 96 = U+1E84 : LATIN CAPITAL LETTER W WITH DIAERESIS
- ยฃ A6 = U+00A3 : POUND SIGN {pound sterling, Irish punt, Italian lira, Turkish lira, etc.}
- แบ
B6 = U+1E85 : LATIN SMALL LETTER W WITH DIAERESIS
- ยฅ C6 = U+00A5 : YEN SIGN {yuan sign}
- แบ D6 = U+1E80 : LATIN CAPITAL LETTER W WITH GRAVE
- ยค E6 = U+00A4 : CURRENCY SIGN
- แบ F6 = U+1E81 : LATIN SMALL LETTER W WITH GRAVE
- โน 87 = U+2039 : SINGLE LEFT-POINTING ANGLE QUOTATION MARK {left pointing single guillemet}
- แบ 97 = U+1E82 : LATIN CAPITAL LETTER W WITH ACUTE
- โบ AA = U+203A : SINGLE RIGHT-POINTING ANGLE QUOTATION MARK {right pointing single guillemet}
- แบ B7 = U+1E83 : LATIN SMALL LETTER W WITH ACUTE
- ยง C7 = U+00A7 : SECTION SIGN
- ลด D7 = U+0174 : LATIN CAPITAL LETTER W WITH CIRCUMFLEX
- ยฉ E7 = U+00A9 : COPYRIGHT SIGN
- ลต F7 = U+0175 : LATIN SMALL LETTER W WITH CIRCUMFLEX
- ร 88 = U+00CF : LATIN CAPITAL LETTER I WITH DIAERESIS
- ลธ 98 = U+0178 : LATIN CAPITAL LETTER Y WITH DIAERESIS
- รฏ A8 = U+00EF : LATIN SMALL LETTER I WITH DIAERESIS
- รฟ B8 = U+00FF : LATIN SMALL LETTER Y WITH DIAERESIS
- ร C8 = U+00CC : LATIN CAPITAL LETTER I WITH GRAVE
- แปฒ D8 = U+1EF2 : LATIN CAPITAL LETTER Y WITH GRAVE
- รฌ E8 = U+00EC : LATIN SMALL LETTER I WITH GRAVE
- แปณ F8 = U+1EF3 : LATIN SMALL LETTER Y WITH GRAVE
- ร 89 = U+00CD : LATIN CAPITAL LETTER I WITH ACUTE
- ร 99 = U+00DD : LATIN CAPITAL LETTER Y WITH ACUTE
- รญ A9 = U+00ED : LATIN SMALL LETTER I WITH ACUTE
- รฝ B9 = U+00FD : LATIN SMALL LETTER Y WITH ACUTE
- ร C9 = U+00CE : LATIN CAPITAL LETTER I WITH CIRCUMFLEX
- ลถ D9 = U+0176 : LATIN CAPITAL LETTER Y WITH CIRCUMFLEX
- รฎ E9 = U+00EE : LATIN SMALL LETTER I WITH CIRCUMFLEX
- ลท F9 = U+0177 : LATIN SMALL LETTER Y WITH CIRCUMFLEX
- โฐ 8A = U+2030 : PER MILLE SIGN {permille, per thousand}
- ลฝ 9A = U+017D : LATIN CAPITAL LETTER Z WITH CARON
- ยฑ AA = U+00B1 : PLUS-MINUS SIGN
- ลพ BA = U+017E : LATIN SMALL LETTER Z WITH CARON
- โ CA = U+2510 : BOX DRAWINGS LIGHT DOWN AND LEFT {Videotex Mosaic DG 17}
- โ DA = U+2518 : BOX DRAWINGS LIGHT UP AND LEFT {Videotex Mosaic DG 19}
- โ EA = U+2514 : BOX DRAWINGS LIGHT UP AND RIGHT {Videotex Mosaic DG 18}
- โ FA = U+250C : BOX DRAWINGS LIGHT DOWN AND RIGHT {Videotex Mosaic DG 16}
- ยท 8B = U+00B7 : MIDDLE DOT {midpoint (in typography); Georgian comma; Greek middle dot (ano teleia)}
- โ 9B = U+2502 : BOX DRAWINGS LIGHT VERTICAL {Videotex Mosaic DG 14}
- โ AB = U+2500 : BOX DRAWINGS LIGHT HORIZONTAL {Videotex Mosaic DG 15}
- โผ BB = U+253C : BOX DRAWINGS LIGHT VERTICAL AND HORIZONTAL {Videotex Mosaic DG 24}
- โด CB = U+2534 : BOX DRAWINGS LIGHT UP AND HORIZONTAL {Videotex Mosaic DG 23}
- โ DB = U+251C : BOX DRAWINGS LIGHT VERTICAL AND RIGHT {Videotex Mosaic DG 20}
- โฌ EB = U+252C : BOX DRAWINGS LIGHT DOWN AND HORIZONTAL {Videotex Mosaic DG 22}
- โค FB = U+2524 : BOX DRAWINGS LIGHT VERTICAL AND LEFT {Videotex Mosaic DG 21}
- โ 8C = U+2591 : LIGHT SHADE
- โ 9C = U+25CB : WHITE CIRCLE + (U+FE0E : VARIATION SELECTOR-15 [VS15] {text variation selector})
- โ AC = U+2654 : WHITE CHESS KING + (U+FE0E : VARIATION SELECTOR-15 [VS15] {text variation selector})
- โ BC = U+2655 : WHITE CHESS QUEEN + (U+FE0E : VARIATION SELECTOR-15 [VS15] {text variation selector})
- โ CC = U+2656 : WHITE CHESS ROOK + (U+FE0E : VARIATION SELECTOR-15 [VS15] {text variation selector})
- โ DC = U+2657 : WHITE CHESS BISHOP + (U+FE0E : VARIATION SELECTOR-15 [VS15] {text variation selector})
- โ EC = U+2658 : WHITE CHESS KNIGHT + (U+FE0E : VARIATION SELECTOR-15 [VS15] {text variation selector})
- โ FC = U+2659 : WHITE CHESS PAWN + (U+FE0E : VARIATION SELECTOR-15 [VS15] {text variation selector})
- โ 8D = U+2588 : FULL BLOCK {solid}
- โ 9D = U+25CF : BLACK CIRCLE + (U+FE0E : VARIATION SELECTOR-15 [VS15] {text variation selector})
- โ AD = U+265A : BLACK CHESS KING + (U+FE0E : VARIATION SELECTOR-15 [VS15] {text variation selector})
- โ BD = U+265B : BLACK CHESS QUEEN + (U+FE0E : VARIATION SELECTOR-15 [VS15] {text variation selector})
- โ CD = U+265C : BLACK CHESS ROOK + (U+FE0E : VARIATION SELECTOR-15 [VS15] {text variation selector})
- โ DD = U+265D : BLACK CHESS BISHOP + (U+FE0E : VARIATION SELECTOR-15 [VS15] {text variation selector})
- โ ED = U+265E : BLACK CHESS KNIGHT + (U+FE0E : VARIATION SELECTOR-15 [VS15] {text variation selector})
- โ๏ธ FD = U+265F : BLACK CHESS PAWN + (U+FE0E : VARIATION SELECTOR-15 [VS15] {text variation selector})
- ร 8E = U+00D6 : LATIN CAPITAL LETTER O WITH DIAERESIS
- ร 9E = U+00D1 : LATIN CAPITAL LETTER N WITH TILDE
- รถ AE = U+00F6 : LATIN SMALL LETTER O WITH DIAERESIS
- รฑ BE = U+00F1 : LATIN SMALL LETTER N WITH TILDE
- ร CE = U+00D2 : LATIN CAPITAL LETTER O WITH GRAVE
- ร DE = U+00D8 : LATIN CAPITAL LETTER O WITH STROKE {o slash}
- รฒ EE = U+00F2 : LATIN SMALL LETTER O WITH GRAVE
- รธ FE = U+00F8 : LATIN SMALL LETTER O WITH STROKE {o slash}
- ร 8F = U+00D3 : LATIN CAPITAL LETTER O WITH ACUTE
- ร 9F = U+00D5 : LATIN CAPITAL LETTER O WITH TILDE
- รณ AF = U+00F3 : LATIN SMALL LETTER O WITH ACUTE
- รต BF = U+00F5 : LATIN SMALL LETTER O WITH TILDE
- ร CF = U+00D4 : LATIN CAPITAL LETTER O WITH CIRCUMFLEX
- ล DF = U+0152 : LATIN CAPITAL LIGATURE OE
- รด EF = U+00F4 : LATIN SMALL LETTER O WITH CIRCUMFLEX
- ล FF = U+0153 : LATIN SMALL LIGATURE OE {ethel (from Old English eรฐel)}
Diacritics
Accents
- โฬ โ acute (Latin: apex) - Take the ASCII upper/lower case letter "A,E,I,O,U,Y,W", and add 64
- โฬ โ grave - Take the ASCII upper/lower letter "A,E,I,O,U,Y,W", add 128 and subtract 1
- โฬ โ circumflex - Take the ASCII upper/lower case letter "A,E,I,O,U,Y,W", and add 128
- โฬ โ tilde - Take the ASCII upper/lower case letter "A,N,O" and add 80
- โฬ โ caron - Take the ASCII upper/lower case letter "S,Z" and add 64
Dots
- โฬ โ umlaut or diaeresis - Take the ASCII upper/lower letter "A,E,I,O,U,Y,W", add 64 and subtract 1
Ring
- โฬ โ overring - Take the ASCII upper/lower case letter "A", add 80 and subtract 1
Subscript curls
- โฬง โ cedilla - Take the ASCII upper/lower case letter "C", and add 64
Ligatures and special letters
- ร/รฆ and ล/ล - Take the ASCII upper/lower case letter which matches the first letter of the ligature (i.e. "A" or "O") and add 144
- แบ/ร - Take the ASCII upper/lower case letter "S", add 128 and subtract 1
- ร/รธ - Take the ASCII upper/lower case letter "O", add 144 and subtract 1
- ร/รฐ - Take the ASCII upper/lower case letter "D", add 128 and subtract 1
- ร/รพ - Take the ASCII upper/lower case letter "T", add 128 and subtract 1