HTML character entity references.
codepoint2name = {198: 'AElig', 193: 'Aacute', 194: 'Acirc', 192: 'Agrave', 913: 'Alpha', 197: 'Aring', 195: 'Atilde', 196: 'Auml', 914: 'Beta', 199: 'Ccedil', 935: 'Chi', 8225: 'Dagger', 916: 'Delta', 208: 'ETH', 201: 'Eacute', 202: 'Ecirc', 200: 'Egrave', 917: 'Epsilon', 919: 'Eta', 203: 'Euml', 915: 'Gamma', 205: 'Iacute', 206: 'Icirc', 204: 'Igrave', 921: 'Iota', 207: 'Iuml', 922: 'Kappa', 923: 'Lambda', 924: 'Mu', 209: 'Ntilde', 925: 'Nu', 338: 'OElig', 211: 'Oacute', 212: 'Ocirc', 210: 'Ograve', 937: 'Omega', 927: 'Omicron', 216: 'Oslash', 213: 'Otilde', 214: 'Ouml', 934: 'Phi', 928: 'Pi', 8243: 'Prime', 936: 'Psi', 929: 'Rho', 352: 'Scaron', 931: 'Sigma', 222: 'THORN', 932: 'Tau', 920: 'Theta', 218: 'Uacute', 219: 'Ucirc', 217: 'Ugrave', 933: 'Upsilon', 220: 'Uuml', 926: 'Xi', 221: 'Yacute', 376: 'Yuml', 918: 'Zeta', 225: 'aacute', 226: 'acirc', 180: 'acute', 230: 'aelig', 224: 'agrave', 8501: 'alefsym', 945: 'alpha', 38: 'amp', 8743: 'and', 8736: 'ang', 229: 'aring', 8776: 'asymp', 227: 'atilde', 228: 'auml', 8222: 'bdquo', 946: 'beta', 166: 'brvbar', 8226: 'bull', 8745: 'cap', 231: 'ccedil', 184: 'cedil', 162: 'cent', 967: 'chi', 710: 'circ', 9827: 'clubs', 8773: 'cong', 169: 'copy', 8629: 'crarr', 8746: 'cup', 164: 'curren', 8659: 'dArr', 8224: 'dagger', 8595: 'darr', 176: 'deg', 948: 'delta', 9830: 'diams', 247: 'divide', 233: 'eacute', 234: 'ecirc', 232: 'egrave', 8709: 'empty', 8195: 'emsp', 8194: 'ensp', 949: 'epsilon', 8801: 'equiv', 951: 'eta', 240: 'eth', 235: 'euml', 8364: 'euro', 8707: 'exist', 402: 'fnof', 8704: 'forall', 189: 'frac12', 188: 'frac14', 190: 'frac34', 8260: 'frasl', 947: 'gamma', 8805: 'ge', 62: 'gt', 8660: 'hArr', 8596: 'harr', 9829: 'hearts', 8230: 'hellip', 237: 'iacute', 238: 'icirc', 161: 'iexcl', 236: 'igrave', 8465: 'image', 8734: 'infin', 8747: 'int', 953: 'iota', 191: 'iquest', 8712: 'isin', 239: 'iuml', 954: 'kappa', 8656: 'lArr', 955: 'lambda', 9001: 'lang', 171: 'laquo', 8592: 'larr', 8968: 'lceil', 8220: 'ldquo', 8804: 'le', 8970: 'lfloor', 8727: 'lowast', 9674: 'loz', 8206: 'lrm', 8249: 'lsaquo', 8216: 'lsquo', 60: 'lt', 175: 'macr', 8212: 'mdash', 181: 'micro', 183: 'middot', 8722: 'minus', 956: 'mu', 8711: 'nabla', 160: 'nbsp', 8211: 'ndash', 8800: 'ne', 8715: 'ni', 172: 'not', 8713: 'notin', 8836: 'nsub', 241: 'ntilde', 957: 'nu', 243: 'oacute', 244: 'ocirc', 339: 'oelig', 242: 'ograve', 8254: 'oline', 969: 'omega', 959: 'omicron', 8853: 'oplus', 8744: 'or', 170: 'ordf', 186: 'ordm', 248: 'oslash', 245: 'otilde', 8855: 'otimes', 246: 'ouml', 182: 'para', 8706: 'part', 8240: 'permil', 8869: 'perp', 966: 'phi', 960: 'pi', 982: 'piv', 177: 'plusmn', 163: 'pound', 8242: 'prime', 8719: 'prod', 8733: 'prop', 968: 'psi', 34: 'quot', 8658: 'rArr', 8730: 'radic', 9002: 'rang', 187: 'raquo', 8594: 'rarr', 8969: 'rceil', 8221: 'rdquo', 8476: 'real', 174: 'reg', 8971: 'rfloor', 961: 'rho', 8207: 'rlm', 8250: 'rsaquo', 8217: 'rsquo', 8218: 'sbquo', 353: 'scaron', 8901: 'sdot', 167: 'sect', 173: 'shy', 963: 'sigma', 962: 'sigmaf', 8764: 'sim', 9824: 'spades', 8834: 'sub', 8838: 'sube', 8721: 'sum', 8835: 'sup', 185: 'sup1', 178: 'sup2', 179: 'sup3', 8839: 'supe', 223: 'szlig', 964: 'tau', 8756: 'there4', 952: 'theta', 977: 'thetasym', 8201: 'thinsp', 254: 'thorn', 732: 'tilde', 215: 'times', 8482: 'trade', 8657: 'uArr', 250: 'uacute', 8593: 'uarr', 251: 'ucirc', 249: 'ugrave', 168: 'uml', 978: 'upsih', 965: 'upsilon', 252: 'uuml', 8472: 'weierp', 958: 'xi', 253: 'yacute', 165: 'yen', 255: 'yuml', 950: 'zeta', 8205: 'zwj', 8204: 'zwnj'}
entitydefs = {'AElig': 'Æ', 'Aacute': 'Á', 'Acirc': 'Â', 'Agrave': 'À', 'Alpha': 'Α', 'Aring': 'Å', 'Atilde': 'Ã', 'Auml': 'Ä', 'Beta': 'Β', 'Ccedil': 'Ç', 'Chi': 'Χ', 'Dagger': '‡', 'Delta': 'Δ', 'ETH': 'Ð', 'Eacute': 'É', 'Ecirc': 'Ê', 'Egrave': 'È', 'Epsilon': 'Ε', 'Eta': 'Η', 'Euml': 'Ë', 'Gamma': 'Γ', 'Iacute': 'Í', 'Icirc': 'Î', 'Igrave': 'Ì', 'Iota': 'Ι', 'Iuml': 'Ï', 'Kappa': 'Κ', 'Lambda': 'Λ', 'Mu': 'Μ', 'Ntilde': 'Ñ', 'Nu': 'Ν', 'OElig': 'Œ', 'Oacute': 'Ó', 'Ocirc': 'Ô', 'Ograve': 'Ò', 'Omega': 'Ω', 'Omicron': 'Ο', 'Oslash': 'Ø', 'Otilde': 'Õ', 'Ouml': 'Ö', 'Phi': 'Φ', 'Pi': 'Π', 'Prime': '″', 'Psi': 'Ψ', 'Rho': 'Ρ', 'Scaron': 'Š', 'Sigma': 'Σ', 'THORN': 'Þ', 'Tau': 'Τ', 'Theta': 'Θ', 'Uacute': 'Ú', 'Ucirc': 'Û', 'Ugrave': 'Ù', 'Upsilon': 'Υ', 'Uuml': 'Ü', 'Xi': 'Ξ', 'Yacute': 'Ý', 'Yuml': 'Ÿ', 'Zeta': 'Ζ', 'aacute': 'á', 'acirc': 'â', 'acute': '´', 'aelig': 'æ', 'agrave': 'à', 'alefsym': 'ℵ', 'alpha': 'α', 'amp': '&', 'and': '∧', 'ang': '∠', 'aring': 'å', 'asymp': '≈', 'atilde': 'ã', 'auml': 'ä', 'bdquo': '„', 'beta': 'β', 'brvbar': '¦', 'bull': '•', 'cap': '∩', 'ccedil': 'ç', 'cedil': '¸', 'cent': '¢', 'chi': 'χ', 'circ': 'ˆ', 'clubs': '♣', 'cong': '≅', 'copy': '©', 'crarr': '↵', 'cup': '∪', 'curren': '¤', 'dArr': '⇓', 'dagger': '†', 'darr': '↓', 'deg': '°', 'delta': 'δ', 'diams': '♦', 'divide': '÷', 'eacute': 'é', 'ecirc': 'ê', 'egrave': 'è', 'empty': '∅', 'emsp': '\u2003', 'ensp': '\u2002', 'epsilon': 'ε', 'equiv': '≡', 'eta': 'η', 'eth': 'ð', 'euml': 'ë', 'euro': '€', 'exist': '∃', 'fnof': 'ƒ', 'forall': '∀', 'frac12': '½', 'frac14': '¼', 'frac34': '¾', 'frasl': '⁄', 'gamma': 'γ', 'ge': '≥', 'gt': '>', 'hArr': '⇔', 'harr': '↔', 'hearts': '♥', 'hellip': '…', 'iacute': 'í', 'icirc': 'î', 'iexcl': '¡', 'igrave': 'ì', 'image': 'ℑ', 'infin': '∞', 'int': '∫', 'iota': 'ι', 'iquest': '¿', 'isin': '∈', 'iuml': 'ï', 'kappa': 'κ', 'lArr': '⇐', 'lambda': 'λ', 'lang': '〈', 'laquo': '«', 'larr': '←', 'lceil': '⌈', 'ldquo': '“', 'le': '≤', 'lfloor': '⌊', 'lowast': '∗', 'loz': '◊', 'lrm': '\u200e', 'lsaquo': '‹', 'lsquo': '‘', 'lt': '<', 'macr': '¯', 'mdash': '—', 'micro': 'µ', 'middot': '·', 'minus': '−', 'mu': 'μ', 'nabla': '∇', 'nbsp': '\xa0', 'ndash': '–', 'ne': '≠', 'ni': '∋', 'not': '¬', 'notin': '∉', 'nsub': '⊄', 'ntilde': 'ñ', 'nu': 'ν', 'oacute': 'ó', 'ocirc': 'ô', 'oelig': 'œ', 'ograve': 'ò', 'oline': '‾', 'omega': 'ω', 'omicron': 'ο', 'oplus': '⊕', 'or': '∨', 'ordf': 'ª', 'ordm': 'º', 'oslash': 'ø', 'otilde': 'õ', 'otimes': '⊗', 'ouml': 'ö', 'para': '¶', 'part': '∂', 'permil': '‰', 'perp': '⊥', 'phi': 'φ', 'pi': 'π', 'piv': 'ϖ', 'plusmn': '±', 'pound': '£', 'prime': '′', 'prod': '∏', 'prop': '∝', 'psi': 'ψ', 'quot': '"', 'rArr': '⇒', 'radic': '√', 'rang': '〉', 'raquo': '»', 'rarr': '→', 'rceil': '⌉', 'rdquo': '”', 'real': 'ℜ', 'reg': '®', 'rfloor': '⌋', 'rho': 'ρ', 'rlm': '\u200f', 'rsaquo': '›', 'rsquo': '’', 'sbquo': '‚', 'scaron': 'š', 'sdot': '⋅', 'sect': '§', 'shy': '\xad', 'sigma': 'σ', 'sigmaf': 'ς', 'sim': '∼', 'spades': '♠', 'sub': '⊂', 'sube': '⊆', 'sum': '∑', 'sup': '⊃', 'sup1': '¹', 'sup2': '²', 'sup3': '³', 'supe': '⊇', 'szlig': 'ß', 'tau': 'τ', 'there4': '∴', 'theta': 'θ', 'thetasym': 'ϑ', 'thinsp': '\u2009', 'thorn': 'þ', 'tilde': '˜', 'times': '×', 'trade': '™', 'uArr': '⇑', 'uacute': 'ú', 'uarr': '↑', 'ucirc': 'û', 'ugrave': 'ù', 'uml': '¨', 'upsih': 'ϒ', 'upsilon': 'υ', 'uuml': 'ü', 'weierp': '℘', 'xi': 'ξ', 'yacute': 'ý', 'yen': '¥', 'yuml': 'ÿ', 'zeta': 'ζ', 'zwj': '\u200d', 'zwnj': '\u200c'}
html5 = {'Aacute': 'Á', 'aacute': 'á', 'Aacute;': 'Á', 'aacute;': 'á', 'Abreve;': 'Ă', 'abreve;': 'ă', 'ac;': '∾', 'acd;': '∿', 'acE;': '∾̳', 'Acirc': 'Â', 'acirc': 'â', 'Acirc;': 'Â', 'acirc;': 'â', 'acute': '´', 'acute;': '´', 'Acy;': 'А', 'acy;': 'а', 'AElig': 'Æ', 'aelig': 'æ', 'AElig;': 'Æ', 'aelig;': 'æ', 'af;': '\u2061', 'Afr;': '𝔄', 'afr;': '𝔞', 'Agrave': 'À', 'agrave': 'à', 'Agrave;': 'À', 'agrave;': 'à', 'alefsym;': 'ℵ', 'aleph;': 'ℵ', 'Alpha;': 'Α', 'alpha;': 'α', 'Amacr;': 'Ā', 'amacr;': 'ā', 'amalg;': '⨿', 'AMP': '&', 'amp': '&', 'AMP;': '&', 'amp;': '&', 'And;': '⩓', 'and;': '∧', 'andand;': '⩕', 'andd;': '⩜', 'andslope;': '⩘', 'andv;': '⩚', 'ang;': '∠', 'ange;': '⦤', 'angle;': '∠', 'angmsd;': '∡', 'angmsdaa;': '⦨', 'angmsdab;': '⦩', 'angmsdac;': '⦪', 'angmsdad;': '⦫', 'angmsdae;': '⦬', 'angmsdaf;': '⦭', 'angmsdag;': '⦮', 'angmsdah;': '⦯', 'angrt;': '∟', 'angrtvb;': '⊾', 'angrtvbd;': '⦝', 'angsph;': '∢', 'angst;': 'Å', 'angzarr;': '⍼', 'Aogon;': 'Ą', 'aogon;': 'ą', 'Aopf;': '𝔸', 'aopf;': '𝕒', 'ap;': '≈', 'apacir;': '⩯', 'apE;': '⩰', 'ape;': '≊', 'apid;': '≋', 'apos;': "'", 'ApplyFunction;': '\u2061', 'approx;': '≈', 'approxeq;': '≊', 'Aring': 'Å', 'aring': 'å', 'Aring;': 'Å', 'aring;': 'å', 'Ascr;': '𝒜', 'ascr;': '𝒶', 'Assign;': '≔', 'ast;': '*', 'asymp;': '≈', 'asympeq;': '≍', 'Atilde': 'Ã', 'atilde': 'ã', 'Atilde;': 'Ã', 'atilde;': 'ã', 'Auml': 'Ä', 'auml': 'ä', 'Auml;': 'Ä', 'auml;': 'ä', 'awconint;': '∳', 'awint;': '⨑', 'backcong;': '≌', 'backepsilon;': '϶', 'backprime;': '‵', 'backsim;': '∽', 'backsimeq;': '⋍', 'Backslash;': '∖', 'Barv;': '⫧', 'barvee;': '⊽', 'Barwed;': '⌆', 'barwed;': '⌅', 'barwedge;': '⌅', 'bbrk;': '⎵', 'bbrktbrk;': '⎶', 'bcong;': '≌', 'Bcy;': 'Б', 'bcy;': 'б', 'bdquo;': '„', 'becaus;': '∵', 'Because;': '∵', 'because;': '∵', 'bemptyv;': '⦰', 'bepsi;': '϶', 'bernou;': 'ℬ', 'Bernoullis;': 'ℬ', 'Beta;': 'Β', 'beta;': 'β', 'beth;': 'ℶ', 'between;': '≬', 'Bfr;': '𝔅', 'bfr;': '𝔟', 'bigcap;': '⋂', 'bigcirc;': '◯', 'bigcup;': '⋃', 'bigodot;': '⨀', 'bigoplus;': '⨁', 'bigotimes;': '⨂', 'bigsqcup;': '⨆', 'bigstar;': '★', 'bigtriangledown;': '▽', 'bigtriangleup;': '△', 'biguplus;': '⨄', 'bigvee;': '⋁', 'bigwedge;': '⋀', 'bkarow;': '⤍', 'blacklozenge;': '⧫', 'blacksquare;': '▪', 'blacktriangle;': '▴', 'blacktriangledown;': '▾', 'blacktriangleleft;': '◂', 'blacktriangleright;': '▸', 'blank;': '␣', 'blk12;': '▒', 'blk14;': '░', 'blk34;': '▓', 'block;': '█', 'bne;': '=⃥', 'bnequiv;': '≡⃥', 'bNot;': '⫭', 'bnot;': '⌐', 'Bopf;': '𝔹', 'bopf;': '𝕓', 'bot;': '⊥', 'bottom;': '⊥', 'bowtie;': '⋈', 'boxbox;': '⧉', 'boxDL;': '╗', 'boxDl;': '╖', 'boxdL;': '╕', 'boxdl;': '┐', 'boxDR;': '╔', 'boxDr;': '╓', 'boxdR;': '╒', 'boxdr;': '┌', 'boxH;': '═', 'boxh;': '─', 'boxHD;': '╦', 'boxHd;': '╤', 'boxhD;': '╥', 'boxhd;': '┬', 'boxHU;': '╩', 'boxHu;': '╧', 'boxhU;': '╨', 'boxhu;': '┴', 'boxminus;': '⊟', 'boxplus;': '⊞', 'boxtimes;': '⊠', 'boxUL;': '╝', 'boxUl;': '╜', 'boxuL;': '╛', 'boxul;': '┘', 'boxUR;': '╚', 'boxUr;': '╙', 'boxuR;': '╘', 'boxur;': '└', 'boxV;': '║', 'boxv;': '│', 'boxVH;': '╬', 'boxVh;': '╫', 'boxvH;': '╪', 'boxvh;': '┼', 'boxVL;': '╣', 'boxVl;': '╢', 'boxvL;': '╡', 'boxvl;': '┤', 'boxVR;': '╠', 'boxVr;': '╟', 'boxvR;': '╞', 'boxvr;': '├', 'bprime;': '‵', 'Breve;': '˘', 'breve;': '˘', 'brvbar': '¦', 'brvbar;': '¦', 'Bscr;': 'ℬ', 'bscr;': '𝒷', 'bsemi;': '⁏', 'bsim;': '∽', 'bsime;': '⋍', 'bsol;': '\\', 'bsolb;': '⧅', 'bsolhsub;': '⟈', 'bull;': '•', 'bullet;': '•', 'bump;': '≎', 'bumpE;': '⪮', 'bumpe;': '≏', 'Bumpeq;': '≎', 'bumpeq;': '≏', 'Cacute;': 'Ć', 'cacute;': 'ć', 'Cap;': '⋒', 'cap;': '∩', 'capand;': '⩄', 'capbrcup;': '⩉', 'capcap;': '⩋', 'capcup;': '⩇', 'capdot;': '⩀', 'CapitalDifferentialD;': 'ⅅ', 'caps;': '∩︀', 'caret;': '⁁', 'caron;': 'ˇ', 'Cayleys;': 'ℭ', 'ccaps;': '⩍', 'Ccaron;': 'Č', 'ccaron;': 'č', 'Ccedil': 'Ç', 'ccedil': 'ç', 'Ccedil;': 'Ç', 'ccedil;': 'ç', 'Ccirc;': 'Ĉ', 'ccirc;': 'ĉ', 'Cconint;': '∰', 'ccups;': '⩌', 'ccupssm;': '⩐', 'Cdot;': 'Ċ', 'cdot;': 'ċ', 'cedil': '¸', 'cedil;': '¸', 'Cedilla;': '¸', 'cemptyv;': '⦲', 'cent': '¢', 'cent;': '¢', 'CenterDot;': '·', 'centerdot;': '·', 'Cfr;': 'ℭ', 'cfr;': '𝔠', 'CHcy;': 'Ч', 'chcy;': 'ч', 'check;': '✓', 'checkmark;': '✓', 'Chi;': 'Χ', 'chi;': 'χ', 'cir;': '○', 'circ;': 'ˆ', 'circeq;': '≗', 'circlearrowleft;': '↺', 'circlearrowright;': '↻', 'circledast;': '⊛', 'circledcirc;': '⊚', 'circleddash;': '⊝', 'CircleDot;': '⊙', 'circledR;': '®', 'circledS;': 'Ⓢ', 'CircleMinus;': '⊖', 'CirclePlus;': '⊕', 'CircleTimes;': '⊗', 'cirE;': '⧃', 'cire;': '≗', 'cirfnint;': '⨐', 'cirmid;': '⫯', 'cirscir;': '⧂', 'ClockwiseContourIntegral;': '∲', 'CloseCurlyDoubleQuote;': '”', 'CloseCurlyQuote;': '’', 'clubs;': '♣', 'clubsuit;': '♣', 'Colon;': '∷', 'colon;': ':', 'Colone;': '⩴', 'colone;': '≔', 'coloneq;': '≔', 'comma;': ',', 'commat;': '@', 'comp;': '∁', 'compfn;': '∘', 'complement;': '∁', 'complexes;': 'ℂ', 'cong;': '≅', 'congdot;': '⩭', 'Congruent;': '≡', 'Conint;': '∯', 'conint;': '∮', 'ContourIntegral;': '∮', 'Copf;': 'ℂ', 'copf;': '𝕔', 'coprod;': '∐', 'Coproduct;': '∐', 'COPY': '©', 'copy': '©', 'COPY;': '©', 'copy;': '©', 'copysr;': '℗', 'CounterClockwiseContourIntegral;': '∳', 'crarr;': '↵', 'Cross;': '⨯', 'cross;': '✗', 'Cscr;': '𝒞', 'cscr;': '𝒸', 'csub;': '⫏', 'csube;': '⫑', 'csup;': '⫐', 'csupe;': '⫒', 'ctdot;': '⋯', 'cudarrl;': '⤸', 'cudarrr;': '⤵', 'cuepr;': '⋞', 'cuesc;': '⋟', 'cularr;': '↶', 'cularrp;': '⤽', 'Cup;': '⋓', 'cup;': '∪', 'cupbrcap;': '⩈', 'CupCap;': '≍', 'cupcap;': '⩆', 'cupcup;': '⩊', 'cupdot;': '⊍', 'cupor;': '⩅', 'cups;': '∪︀', 'curarr;': '↷', 'curarrm;': '⤼', 'curlyeqprec;': '⋞', 'curlyeqsucc;': '⋟', 'curlyvee;': '⋎', 'curlywedge;': '⋏', 'curren': '¤', 'curren;': '¤', 'curvearrowleft;': '↶', 'curvearrowright;': '↷', 'cuvee;': '⋎', 'cuwed;': '⋏', 'cwconint;': '∲', 'cwint;': '∱', 'cylcty;': '⌭', 'Dagger;': '‡', 'dagger;': '†', 'daleth;': 'ℸ', 'Darr;': '↡', 'dArr;': '⇓', 'darr;': '↓', 'dash;': '‐', 'Dashv;': '⫤', 'dashv;': '⊣', 'dbkarow;': '⤏', 'dblac;': '˝', 'Dcaron;': 'Ď', 'dcaron;': 'ď', 'Dcy;': 'Д', 'dcy;': 'д', 'DD;': 'ⅅ', 'dd;': 'ⅆ', 'ddagger;': '‡', 'ddarr;': '⇊', 'DDotrahd;': '⤑', 'ddotseq;': '⩷', 'deg': '°', 'deg;': '°', 'Del;': '∇', 'Delta;': 'Δ', 'delta;': 'δ', 'demptyv;': '⦱', 'dfisht;': '⥿', 'Dfr;': '𝔇', 'dfr;': '𝔡', 'dHar;': '⥥', 'dharl;': '⇃', 'dharr;': '⇂', 'DiacriticalAcute;': '´', 'DiacriticalDot;': '˙', 'DiacriticalDoubleAcute;': '˝', 'DiacriticalGrave;': '`', 'DiacriticalTilde;': '˜', 'diam;': '⋄', 'Diamond;': '⋄', 'diamond;': '⋄', 'diamondsuit;': '♦', 'diams;': '♦', 'die;': '¨', 'DifferentialD;': 'ⅆ', 'digamma;': 'ϝ', 'disin;': '⋲', 'div;': '÷', 'divide': '÷', 'divide;': '÷', 'divideontimes;': '⋇', 'divonx;': '⋇', 'DJcy;': 'Ђ', 'djcy;': 'ђ', 'dlcorn;': '⌞', 'dlcrop;': '⌍', 'dollar;': '