Vær
opmærksom på at at Unicodeværdierne skrives forskelligt alt efter om det er i
HTML (og XML) eller JavaScript. I JavaScript skrives dansk "Æ" som \u00C6 ("u" for Unicode), i HTML/XML skrives
det Æ("x"
for hexadecimal). Tilsvarende for de øvrige værdier. [top]
Tegnsæt
HTML- og XML-/XHTML-dokumenter skal indeholde en angivelse af hvilket
tegnkodning ("character encoding") der skal anvendes af browseren ved
visning af teksten. For dansk (der indeholder specialtegnene Æ, Ø, Å, æ, ø, å)
og flere andre vesteuropæiske sprog bliver tegnsættet iso-8859-1 ofte anvendt. Med denne tegnkodning kan man
bruge de danske specialtegn direkte i sit HTML-dokument og behøver ikke at
skrive dem med tegnkode.
Har
man brug for tegn fra de udvidede Unicode tegnsæt (f.esk. "Latin
Extended-A" og "-B", "Latin Extended Addtional" eller
ikke-vestlige skriftsystemer), anvendes i stedet tegnsættet utf-8. Men bruger man dette tegnsæt, skal kode-dokumentet
også gemmes i utf-8 format, hvilket f.eks. er muligt i Microsofts enkle
tekst-editor "Notepad".
I
HTML og XHTML angives tegnsættet som værdien af "charset" i
dokumentets meta-tags, f.eks. således for HTML:
<meta
http-equiv="Content-Type" content="text/html;
charset=iso-8859-1">
I
XML er utf-8 default encoding, så strengt taget behøver man ikke angive denne.
Men vil man gøre det for fuldstændighedens skyld, gøres det som værdien af
"encoding" i XML-prologen:
<?xml version="1.0"
encoding="utf-8"?> eller på samme
plads ved andre valg af encoding.
Husk
også her at gemme dokumentet i utf-8 format hvis denne encoding er angivet.
Et
XHTML-dokument er egentlig et XML-dokument til visning i en browser.
XML-prologen er ikke påkrævet her, men anvendes den, skal man huske at der skal
være overensstemmelse mellem "encoding" i prologen og
"charset" i meta-tag'et.
Tegnkoderne
beskrevet oven for er uafhængige af disse charset-angivelser, dvs. de tegn som
tegnkoderne henviser til, vises under alle omstægheder, uanset hvilket charset
der er angivet.
Indholdet
af tabellen nedenfor er tilpasset mine egne behov, men det er nemt at finde
tilsvarende koder for andre behov ved hjælp af dette JavaScript
Unicode Code Charts. [top]
Bemærk
at i Internet Explorer kan visse af disse tegn kun gengives
hvis fonten "Arial Unicode MS", "Tahoma" eller
"Microsoft Sans Serif" er installeret på computeren. Dette kan gøres
fra Microsoft Office pakken.
Tabel 1 – Tegnkoder for specialtegn |
||||
Tegn |
HTML-værdi |
Decimalværdi |
Oktalværdi |
Unicode-værdi |
" |
" |
" |
\042 |
\u0022 |
& |
& |
& |
\046 |
\u0026 |
' |
' note |
' |
\047 |
\u0027 |
< |
< |
< |
\074 |
\u003C |
> |
> |
> |
\076 |
\u003E |
|
|
  |
\240 |
\u00A0 |
£ |
£ |
£ |
\243 |
\u00A3 |
§ |
§ |
§ |
\247 |
\u00A7 |
© |
© |
© |
\251 |
\u00A9 |
® |
® |
® |
\256 |
\u00AE |
¼ |
¼ |
¼ |
\274 |
\u00BC |
½ |
½ |
½ |
\275 |
\u00BD |
¾ |
¾ |
¾ |
\276 |
\u00BE |
À |
À |
À |
\300 |
\u00C0 |
Á |
Á |
Á |
\301 |
\u00C1 |
 |
 |
 |
\302 |
\u00C2 |
à |
˜ |
à |
\303 |
\u00C3 |
Ä |
Ä |
Ä |
\304 |
\u00C4 |
Å |
Å |
Å |
\305 |
\u00C5 |
Æ |
Æ |
Æ |
\306 |
\u00C6 |
Ç |
Ç |
Ç |
\307 |
\u00C7 |
È |
È |
È |
\310 |
\u00C8 |
É |
É |
É |
\311 |
\u00C9 |
Ê |
Ê |
Ê |
\312 |
\u00CA |
Ë |
Ë |
Ë |
\313 |
\u00CB |
Ì |
Ì |
Ì |
\314 |
\u00CC |
Í |
Í |
Í |
\315 |
\u00CD |
Î |
Î |
Î |
\316 |
\u00CE |
Ï |
Ï |
Ï |
\317 |
\u00CF |
Ð |
Ð |
Ð |
\320 |
\u00D0 |
Ñ |
Ñ |
Ñ |
\321 |
\u00D1 |
Ò |
Ò |
Ò |
\322 |
\u00D2 |
Ó |
Ó |
Ó |
\323 |
\u00D3 |
Ô |
Ô |
Ô |
\324 |
\u00D4 |
Õ |
Õ |
Õ |
\325 |
\u00D5 |
Ö |
Ö |
Ö |
\326 |
\u00D6 |
Ø |
Ø |
Ø |
\330 |
\u00D8 |
Ù |
Ù |
Ù |
\331 |
\u00D9 |
Ú |
Ú |
Ú |
\332 |
\u00DA |
Û |
Û |
Û |
\333 |
\u00DB |
Ü |
Ü |
Ü |
\334 |
\u00DC |
Ý |
Ý |
Ý |
\335 |
\u00DD |
Þ |
Þ |
Þ |
\336 |
\u00DE |
ß |
ß |
ß |
\337 |
\u00DF |
à |
à |
à |
\340 |
\u00E0 |
á |
á |
á |
\341 |
\u00E1 |
â |
â |
â |
\342 |
\u00E2 |
ã |
ã |
ã |
\343 |
\u00E3 |
ä |
ä |
ä |
\344 |
\u00E4 |
å |
å |
å |
\345 |
\u00E5 |
æ |
æ |
æ |
\346 |
\u00E6 |
ç |
ç |
ç |
\347 |
\u00E7 |
è |
è |
è |
\350 |
\u00E8 |
é |
é |
é |
\351 |
\u00E9 |
ê |
ê |
ê |
\352 |
\u00EA |
ë |
ë |
ë |
\353 |
\u00EB |
ì |
ì |
ì |
\354 |
\u00EC |
í |
í |
í |
\355 |
\u00ED |
î |
î |
î |
\356 |
\u00EE |
ï |
ï |
ï |
\357 |
\u00EF |
ð |
ð |
ð |
\360 |
\u00F0 |
ñ |
ñ |
ñ |
\361 |
\u00F1 |
ò |
ò |
ò |
\362 |
\u00F2 |
ó |
ó |
ó |
\363 |
\u00F3 |
ô |
ô |
ô |
\364 |
\u00F4 |
õ |
õ |
õ |
\365 |
\u00F5 |
ö |
ö |
ö |
\366 |
\u00F6 |
ø |
ø |
ø |
\370 |
\u00F8 |
ù |
ù |
ù |
\371 |
\u00F9 |
ú |
ú |
ú |
\372 |
\u00FA |
û |
û |
û |
\373 |
\u00FB |
ü |
ü |
ü |
\374 |
\u00FC |
ý |
ý |
ý |
\375 |
\u00FD |
þ |
þ |
þ |
\376 |
\u00FE |
ÿ |
ÿ |
ÿ |
\377 |
\u00FF |
Ā |
|
Ā |
|
\u0100 |
ā |
|
ā |
|
\u0101 |
Č |
|
Č |
|
\u010C |
č |
|
č |
|
\u010D |
Ě |
|
Ě |
|
\u011A |
ě |
|
ě |
|
\u011B |
Ğ |
|
Ğ |
|
\u011E |
ğ |
|
ğ |
|
\u011F |
Ī |
|
Ī |
|
\u012A |
ī |
|
ī |
|
\u012B |
Ō |
|
Ō |
|
\u014C |
ō |
|
ō |
|
\u014D |
Œ |
Œ |
Œ |
|
\u0152 |
œ |
œ |
œ |
|
\u0153 |
Ś |
|
Ś |
|
\u015A |
ś |
|
ś |
|
\u015B |
Š |
Š |
Š |
|
\u0160 |
š |
š |
š |
|
\u0161 |
Ū |
|
Ū |
|
\u016A |
ū |
|
ū |
|
\u016B |
Ž |
|
Ž |
|
\u017D |
ž |
|
ž |
|
\u017E |
Ǎ |
|
Ǎ |
|
\u01CD |
ǎ |
|
ǎ |
|
\u01CE |
Ǐ |
|
Ǐ |
|
\u01CF |
ǐ |
|
ǐ |
|
\u01D0 |
Ǒ |
|
Ǒ |
|
\u01D1 |
ǒ |
|
ǒ |
|
\u01D2 |
Ǔ |
|
Ǔ |
|
\u01D3 |
ǔ |
|
ǔ |
|
\u01D4 |
Ǖ |
|
Ǖ |
|
\u01D5 |
ǖ |
|
ǖ |
|
\u01D6 |
Ǘ |
|
Ǘ |
|
\u01D7 |
ǘ |
|
ǘ |
|
\u01D8 |
Ǚ |
|
Ǚ |
|
\u01D9 |
ǚ |
|
ǚ |
|
\u01DA |
Ǜ |
|
Ǜ |
|
\u01DB |
ǜ |
|
ǜ |
|
\u01DC |
^ |
ˆ |
ˆ |
|
\u02C6 |
Ḍ |
|
Ḍ |
|
\u1E0C |
ḍ |
|
ḍ |
|
\u1E0D |
Ḥ |
|
Ḥ |
|
\u1E24 |
ḥ |
|
ḥ |
|
\u1E25 |
Ḷ |
|
Ḷ |
|
\u1E36 |
ḷ |
|
ḷ |
|
\u1E37 |
Ḹ |
|
Ḹ |
|
\u1E38 |
ḹ |
|
ḹ |
|
\u1E39 |
Ṃ |
|
Ṃ |
|
\u1E42 |
ṃ |
|
ṃ |
|
\u1E43 |
Ṅ |
|
Ṅ |
|
\u1E44 |
ṅ |
|
ṅ |
|
\u1E45 |
Ṇ |
|
Ṇ |
|
\u1E46 |
ṇ |
|
ṇ |
|
\u1E47 |
Ṛ |
|
Ṛ |
|
\u1E5A |
ṛ |
|
ṛ |
|
\u1E5B |
Ṝ |
|
Ṝ |
|
\u1E5C |
ṝ |
|
ṝ |
|
\u1E5D |
Ṣ |
|
Ṣ |
|
\u1E62 |
ṣ |
|
ṣ |
|
\u1E63 |
Ṭ |
|
Ṭ |
|
\u1E6C |
ṭ |
|
ṭ |
|
\u1E6D |
– |
– |
– |
|
\u2013 |
— |
— |
— |
|
\u2014 |
‘ |
‘ |
‘ |
|
\u2018 |
’ |
’ |
’ |
|
\u2019 |
“ |
“ |
“ |
|
\u201C |
” |
” |
” |
|
\u201D |
• |
• |
• |
|
\u2022 |
… |
… |
… |
|
\u2026 |
€ |
€ |
€ |
|
\u20AC |
← |
← |
← |
|
\u2190 |
↑ |
↑ |
↑ |
|
\u2191 |
→ |
→ |
→ |
|
\u2192 |
↓ |
↓ |
↓ |
|
\u2193 |