Anexo:Referencias a entidades de caracteres XML y HTML
En los documentos SGML, HTML y XML, las construcciones lógicas llamadas character data y attribute values consisten en secuencias de caracteres, en la cual cada carácter puede manifestarse directamente (es decir, representándose a sí mismo), o puede representarse mediante una serie de caracteres llamadas referencia de caracteres, de las cuales hay dos tipos: una referencia numérica de carácter y una referencia a entidades de caracteres. Este anexo lista las referencias a entidades de caracteres válidas en los documentos HTML y XML.
Una referencia de entidad de carácter hace referencia al contenido de una entidad nombrada. Las entidades son declaradas en una DTD, utilizando la sintaxis <!ENTITY nombre "valor">
.
Formato
[editar]Una referencia de carácter numérica hace referencia a un carácter por su código Universal Character Set/Unicode, y usa el formato:
&#
nnnn;
o
&#x
hhhh;
donde nnnn es el código en base decimal, y hhhh es el código en base hexadecimal. La x debe ser minúscula en los documentos XML. La forma nnnn o hhhh puede ser cualquier número de dígitos y puede incluir ceros. La forma hhhh puede combinar mayúsculas y minúsculas, siendo las mayúsculas el estilo usual.
Por otro lado, una referencia a entidades de caracteres hace referencia a un carácter por su nombre en una entidad SGML que posee el carácter deseado como su reemplazo. La entidad debe estar ya predefinida (incluida dentro del lenguaje de marcado) o explícitamente declarada en una DTD. El formato es el mismo para cualquier entidad de referencia:
&
name;
donde name es el nombre sensible a mayúsculas de la entidad. El punto y coma es obligatorio.
Estándares públicos de conjuntos entidades de caracteres
[editar]- ISO Entity Sets
- SGML proveyó un conjunto considerable de declaraciones de entidades para los caracteres más usados en la publicación occidental, para los sistemas de escritura latina, griega y cirílica. La American Mathematical Society también contribuyó para añadir símbolos matemáticos.
- HTML Entity Sets
- Las versiones tempranas de HTML construyeron pequeños conjuntos de caracteres, relacionados con los caracteres encontrados en el árbol de fuentes Western 8-bit.
- XML Entity Sets
- El W3C MathML Working Group mantiene el conjunto público de entidades ISO, combinadas con las entidades MathML en el XML Entity Definitions for Characters. Este conjunto suple las necesidades en los documentos XHTML, MathML y las futuras versiones de HTML.
- HTML5
- HTML5 adopta las entidades XML como named character references, sin embargo, las reafirma sin referencia a sus fuentes y no las agrupa en conjuntos. Adicionalmente, la especificación de HTML5 provee mapeo entre nombre y cadena de caracteres Unicode con el uso de JSON.
Numerosos conjuntos de entidades se han desarrollado a partir de requerimientos particulares, y para scripts largos y cortos. Sin embargo, la llegada de Unicode ha mermado ampliamente su uso.
Entidades predefinidas en XML
[editar]La especificación de XML no utiliza el término "character entity" o "character entity reference". La especificación XML utiliza cinco "entidades predefinidas" representando caracteres especiales, y requiere que todos los procesadores de XML los utilicen. Las entidades también pueden ser declaradas explícitamente en el DTD[note 1], pero si se hace eso, el texto reemplazado debe ser el mismo que en su versión original. XML también permite otras entidades nombradas de cualquier tamaño para ser definidos en un entorno por documento.
La tabla siguiente lista cinco entidades predefinidas de XML:
- La columna "Nombre" menciona el nombre de la entidad.
- La columna "Carácter" muestra el carácter en sí mismo, para reproducir el carácter se utiliza el prefijo "&" y el sufijo ";":
&nombre;
. Por ejemplo, el carácter et se codifica como&
y se reproduce como &. - La columna "Punto de código Unicode" cita el carácter mediante el código estándar de notación UCS/Unicode "U+", que muestra el punto de carácter en hexadecimal. El equivalente decimal del carácter está escrito en el paréntesis.
- La columna "Estándar" indica la primera versión de XML que incluye la entidad. La columna "Descripción" cita el carácter por su nombre común, casi siempre, una traducción de los asignados en la notación UCS/Unicode.
Nombre | Carácter | Punto de código Unicode | Estándar | Descripción |
---|---|---|---|---|
quot | " | U+0022 | XML 1.0 | comillas dobles |
amp | & | U+0026 | XML 1.0 | símbolo et (&) o ampersand |
apos | ' | U+0027 | XML 1.0 | apóstrofo |
lt | < | U+003C | XML 1.0 | signo menor que |
gt | > | U+003E | XML 1.0 | signo mayor que |
Referencias de entidades de caracteres en HTML
[editar]La DTD de HTML4 define 252 entidades con un nombre, referencias que actúan como aliases mnemotécnicos para algunos caracteres de Unicode.[1] La especificación de HTML4 requiere el uso de DTDs estándar y no permite a los usuarios usar entidades adicionales.
En la tabla de abajo, La columna "Estándar" indica la primera versión del HTML DTD que define la referencia de la entidad del carácter. HTML 4.01 no provee ninguna referencia de caracteres nueva.
Para usar alguna de estas referencias en un documento HTML o XML, ingresa un ampersand (&) seguido por el nombre de la entidad y un punto y coma (;), por ejemplo, &
para el ampersand ("&").
Nombre | Carácter | Código Unicode (decimal) | Estándar | DTD[note 2] | Subconjunto ISO antiguo[note 3] | Descripción |
---|---|---|---|---|---|---|
quot | " | U+0022 (34) | HTML 2.0 | HTMLspecial | ISOnum | comillas inglesas |
amp | & | U+0026 (38) | HTML 2.0 | HTMLspecial | ISOnum | ampersand |
apos | ' | U+0027 (39) | XHTML 1.0 | HTMLspecial | ISOnum | apóstrofo |
lt | < | U+003C (60) | HTML 2.0 | HTMLspecial | ISOnum | signo menos-que |
gt | > | U+003E (62) | HTML 2.0 | HTMLspecial | ISOnum | signo más-que |
nbsp | U+00A0 (160) | HTML 3.2 | HTMLlat1 | ISOnum | espacio duro[note 4] | |
iexcl | ¡ | U+00A1 (161) | HTML 3.2 | HTMLlat1 | ISOnum | signo de exclamación de apertura |
cent | ¢ | U+00A2 (162) | HTML 3.2 | HTMLlat1 | ISOnum | centavo |
pound | £ | U+00A3 (163) | HTML 3.2 | HTMLlat1 | ISOnum | libra |
curren | ¤ | U+00A4 (164) | HTML 3.2 | HTMLlat1 | ISOnum | signo de moneda |
yen | ¥ | U+00A5 (165) | HTML 3.2 | HTMLlat1 | ISOnum | yen japonés, yuan chino |
brvbar | ¦ | U+00A6 (166) | HTML 3.2 | HTMLlat1 | ISOnum | pleca cortada |
sect | § | U+00A7 (167) | HTML 3.2 | HTMLlat1 | ISOnum | signo de sección |
uml | ¨ | U+00A8 (168) | HTML 3.2 | HTMLlat1 | ISOdia | diéresis |
copy | © | U+00A9 (169) | HTML 3.2 | HTMLlat1 | ISOnum | copyright |
ordf | ª | U+00AA (170) | HTML 3.2 | HTMLlat1 | ISOnum | indicador ordinal femenino |
laquo | « | U+00AB (171) | HTML 3.2 | HTMLlat1 | ISOnum | comillas españolas de apertura |
not | ¬ | U+00AC (172) | HTML 3.2 | HTMLlat1 | ISOnum | negación lógica |
shy | U+00AD (173) | HTML 3.2 | HTMLlat1 | ISOnum | guion blando | |
reg | ® | U+00AE (174) | HTML 3.2 | HTMLlat1 | ISOnum | marca registrada |
macr | ¯ | U+00AF (175) | HTML 3.2 | HTMLlat1 | ISOdia | macron |
deg | ° | U+00B0 (176) | HTML 3.2 | HTMLlat1 | ISOnum | grados |
plusmn | ± | U+00B1 (177) | HTML 3.2 | HTMLlat1 | ISOnum | signo más-menos |
sup2 | ² | U+00B2 (178) | HTML 3.2 | HTMLlat1 | ISOnum | 2 en superíndice |
sup3 | ³ | U+00B3 (179) | HTML 3.2 | HTMLlat1 | ISOnum | 3 en superíndice |
acute | ´ | U+00B4 (180) | HTML 3.2 | HTMLlat1 | ISOdia | acento grave |
micro | µ | U+00B5 (181) | HTML 3.2 | HTMLlat1 | ISOnum | signo de micro |
para | ¶ | U+00B6 (182) | HTML 3.2 | HTMLlat1 | ISOnum | párrafo |
middot | · | U+00B7 (183) | HTML 3.2 | HTMLlat1 | ISOnum | punto medio |
cedil | ¸ | U+00B8 (184) | HTML 3.2 | HTMLlat1 | ISOdia | cedilla |
sup1 | ¹ | U+00B9 (185) | HTML 3.2 | HTMLlat1 | ISOnum | 1 en superíndicendice |
ordm | º | U+00BA (186) | HTML 3.2 | HTMLlat1 | ISOnum | indicador ordinal masculino |
raquo | » | U+00BB (187) | HTML 3.2 | HTMLlat1 | ISOnum | comillas angulares de cierre |
frac14 | ¼ | U+00BC (188) | HTML 3.2 | HTMLlat1 | ISOnum | fracción 1/4 |
frac12 | ½ | U+00BD (189) | HTML 3.2 | HTMLlat1 | ISOnum | fracción 1/2 |
frac34 | ¾ | U+00BE (190) | HTML 3.2 | HTMLlat1 | ISOnum | fracción 3/4 |
iquest | ¿ | U+00BF (191) | HTML 3.2 | HTMLlat1 | ISOnum | Signo de apertura de interrogación |
Agrave | À | U+00C0 (192) | HTML 2.0 | HTMLlat1 | ISOlat1 | letra latina mayúscula A con acento grave |
Aacute | Á | U+00C1 (193) | HTML 2.0 | HTMLlat1 | ISOlat1 | letra latina mayúscula A con acento agudo |
Acirc | Â | U+00C2 (194) | HTML 2.0 | HTMLlat1 | ISOlat1 | letra latina A mayúscula con acento circunflejo |
Atilde | Ã | U+00C3 (195) | HTML 2.0 | HTMLlat1 | ISOlat1 | letra latina A mayúscula con virgulilla |
Auml | Ä | U+00C4 (196) | HTML 2.0 | HTMLlat1 | ISOlat1 | letra latina A mayúscula con diacrítico |
Aring | Å | U+00C5 (197) | HTML 2.0 | HTMLlat1 | ISOlat1 | letra latina mayúscula A con anillo arriba |
AElig | Æ | U+00C6 (198) | HTML 2.0 | HTMLlat1 | ISOlat1 | ligadura latina mayúscula AE |
Ccedil | Ç | U+00C7 (199) | HTML 2.0 | HTMLlat1 | ISOlat1 | letra latina mayúscula A con acento grave |
Egrave | È | U+00C8 (200) | HTML 2.0 | HTMLlat1 | ISOlat1 | letra latina mayúscula E con acento grave |
Eacute | É | U+00C9 (201) | HTML 2.0 | HTMLlat1 | ISOlat1 | letra latina mayúscula E con acento agudo |
Ecirc | Ê | U+00CA (202) | HTML 2.0 | HTMLlat1 | ISOlat1 | letra latina mayúscula E con acento circunflejo |
Euml | Ë | U+00CB (203) | HTML 2.0 | HTMLlat1 | ISOlat1 | letra latina mayúscula E con diéresis |
Igrave | Ì | U+00CC (204) | HTML 2.0 | HTMLlat1 | ISOlat1 | letra latina mayúscula I con acento grave |
Iacute | Í | U+00CD (205) | HTML 2.0 | HTMLlat1 | ISOlat1 | letra latina mayúscula I con acento agudo |
Icirc | Î | U+00CE (206) | HTML 2.0 | HTMLlat1 | ISOlat1 | letra latina mayúscula I con acento circunflejo |
Iuml | Ï | U+00CF (207) | HTML 2.0 | HTMLlat1 | ISOlat1 | letra latina mayúscula I con diéresis |
ETH | Ð | U+00D0 (208) | HTML 2.0 | HTMLlat1 | ISOlat1 | letra latina mayúscula Eth |
Ntilde | Ñ | U+00D1 (209) | HTML 2.0 | HTMLlat1 | ISOlat1 | letra latina mayúscula N con virgulilla |
Ograve | Ò | U+00D2 (210) | HTML 2.0 | HTMLlat1 | ISOlat1 | letra latina mayúscula O con acento grave |
Oacute | Ó | U+00D3 (211) | HTML 2.0 | HTMLlat1 | ISOlat1 | letra latina mayúscula O con acento agudo |
Ocirc | Ô | U+00D4 (212) | HTML 2.0 | HTMLlat1 | ISOlat1 | letra latina mayúscula O con acento circunflejo |
Otilde | Õ | U+00D5 (213) | HTML 2.0 | HTMLlat1 | ISOlat1 | letra latina mayúscula O con virguilla |
Ouml | Ö | U+00D6 (214) | HTML 2.0 | HTMLlat1 | ISOlat1 | letra latina mayúscula O con diéresis |
times | × | U+00D7 (215) | HTML 3.2 | HTMLlat1 | ISOnum | signo de multiplicación |
Oslash | Ø | U+00D8 (216) | HTML 2.0 | HTMLlat1 | ISOlat1 | letra latina mayúscula O con diagonal |
Ugrave | Ù | U+00D9 (217) | HTML 2.0 | HTMLlat1 | ISOlat1 | letra latina mayúscula U con acento grave |
Uacute | Ú | U+00DA (218) | HTML 2.0 | HTMLlat1 | ISOlat1 | letra latina mayúscula U con acento agudo |
Ucirc | Û | U+00DB (219) | HTML 2.0 | HTMLlat1 | ISOlat1 | letra latina mayúscula U con acento circunflejo |
Uuml | Ü | U+00DC (220) | HTML 2.0 | HTMLlat1 | ISOlat1 | letra latina mayúscula U con diéresis |
Yacute | Ý | U+00DD (221) | HTML 2.0 | HTMLlat1 | ISOlat1 | letra latina mayúscula Y con acento agudo |
THORN | Þ | U+00DE (222) | HTML 2.0 | HTMLlat1 | ISOlat1 | letra latina mayúscula Thorn |
szlig | ß | U+00DF (223) | HTML 2.0 | HTMLlat1 | ISOlat1 | letra latina minúscula Eszett |
agrave | à | U+00E0 (224) | HTML 2.0 | HTMLlat1 | ISOlat1 | letra latina minúscula a con acento grave |
aacute | á | U+00E1 (225) | HTML 2.0 | HTMLlat1 | ISOlat1 | letra latina minúscula a con acento agudo |
acirc | â | U+00E2 (226) | HTML 2.0 | HTMLlat1 | ISOlat1 | letra latina minúscula a con acento circunflejo |
atilde | ã | U+00E3 (227) | HTML 2.0 | HTMLlat1 | ISOlat1 | letra latina minúscula a con virguilla |
auml | ä | U+00E4 (228) | HTML 2.0 | HTMLlat1 | ISOlat1 | letra latina minúscula a con diéresis |
aring | å | U+00E5 (229) | HTML 2.0 | HTMLlat1 | ISOlat1 | letra latina minúscula a con anillo encima |
aelig | æ | U+00E6 (230) | HTML 2.0 | HTMLlat1 | ISOlat1 | ligadura latina minúscula ae |
ccedil | ç | U+00E7 (231) | HTML 2.0 | HTMLlat1 | ISOlat1 | letra latina minúscula c con cedilla |
egrave | è | U+00E8 (232) | HTML 2.0 | HTMLlat1 | ISOlat1 | letra latina minúscula e con acento grave |
eacute | é | U+00E9 (233) | HTML 2.0 | HTMLlat1 | ISOlat1 | letra latina minúscula e con acento agudo |
ecirc | ê | U+00EA (234) | HTML 2.0 | HTMLlat1 | ISOlat1 | letra latina minúscula e con acento circunflejo |
euml | ë | U+00EB (235) | HTML 2.0 | HTMLlat1 | ISOlat1 | letra latina minúscula e con diéresis |
igrave | ì | U+00EC (236) | HTML 2.0 | HTMLlat1 | ISOlat1 | letra latina minúscula i con acento grave |
iacute | í | U+00ED (237) | HTML 2.0 | HTMLlat1 | ISOlat1 | letra latina minúscula i con acento agudo |
icirc | î | U+00EE (238) | HTML 2.0 | HTMLlat1 | ISOlat1 | letra latina minúscula i con acento circunflejo |
iuml | ï | U+00EF (239) | HTML 2.0 | HTMLlat1 | ISOlat1 | letra latina minúscula i con diéresis |
eth | ð | U+00F0 (240) | HTML 2.0 | HTMLlat1 | ISOlat1 | letra latina minúscula Eth |
ntilde | ñ | U+00F1 (241) | HTML 2.0 | HTMLlat1 | ISOlat1 | letra latina minúscula n con virgulilla |
ograve | ò | U+00F2 (242) | HTML 2.0 | HTMLlat1 | ISOlat1 | letra latina minúscula o con acento grave |
oacute | ó | U+00F3 (243) | HTML 2.0 | HTMLlat1 | ISOlat1 | letra latina minúscula o con acento agudo |
ocirc | ô | U+00F4 (244) | HTML 2.0 | HTMLlat1 | ISOlat1 | letra latina minúscula o con acento circunflejo |
otilde | õ | U+00F5 (245) | HTML 2.0 | HTMLlat1 | ISOlat1 | letra latina minúscula o con virgulilla |
ouml | ö | U+00F6 (246) | HTML 2.0 | HTMLlat1 | ISOlat1 | letra latina minúscula o con diéresis |
divide | ÷ | U+00F7 (247) | HTML 3.2 | HTMLlat1 | ISOnum | Óbelo |
oslash | ø | U+00F8 (248) | HTML 2.0 | HTMLlat1 | ISOlat1 | letra latina minúscula o con diagonal |
ugrave | ù | U+00F9 (249) | HTML 2.0 | HTMLlat1 | ISOlat1 | letra latina minúscula u con acento grave |
uacute | ú | U+00FA (250) | HTML 2.0 | HTMLlat1 | ISOlat1 | letra latina minúscula u con acento agudo |
ucirc | û | U+00FB (251) | HTML 2.0 | HTMLlat1 | ISOlat1 | letra latina minúscula u con acento circunflejo |
uuml | ü | U+00FC (252) | HTML 2.0 | HTMLlat1 | ISOlat1 | letra latina minúscula u con diéresis |
yacute | ý | U+00FD (253) | HTML 2.0 | HTMLlat1 | ISOlat1 | letra latina minúscula y con acento agudo |
thorn | þ | U+00FE (254) | HTML 2.0 | HTMLlat1 | ISOlat1 | letra latina minúscula Thorn |
yuml | ÿ | U+00FF (255) | HTML 2.0 | HTMLlat1 | ISOlat1 | letra latina minúscula y con diéresis |
OElig | Œ | U+0152 (338) | HTML 4.0 | HTMLspecial | ISOlat2 | ligadura latina mayúscula OE |
oelig | œ | U+0153 (339) | HTML 4.0 | HTMLspecial | ISOlat2 | ligadura latina minúscula oe |
Scaron | Š | U+0160 (352) | HTML 4.0 | HTMLspecial | ISOlat2 | letra latina mayúscula S con carón |
scaron | š | U+0161 (353) | HTML 4.0 | HTMLspecial | ISOlat2 | letra latina minúscula s con carón |
Yuml | Ÿ | U+0178 (376) | HTML 4.0 | HTMLspecial | ISOlat2 | letra latina mayúscula Y con diéresis |
fnof | ƒ | U+0192 (402) | HTML 4.0 | HTMLsymbol | ISOtech | letra latina minúscula f con cola |
circ | ˆ | U+02C6 (710) | HTML 4.0 | HTMLspecial | ISOpub | acento circunflejo |
tilde | ˜ | U+02DC (732) | HTML 4.0 | HTMLspecial | ISOdia | virgulilla |
Alpha | Α | U+0391 (913) | HTML 4.0 | HTMLsymbol | letra griega mayúscula Alpha | |
Beta | Β | U+0392 (914) | HTML 4.0 | HTMLsymbol | letra griega mayúscula Beta | |
Gamma | Γ | U+0393 (915) | HTML 4.0 | HTMLsymbol | ISOgrk3 | letra griega mayúscula Gamma |
Delta | Δ | U+0394 (916) | HTML 4.0 | HTMLsymbol | ISOgrk3 | letra griega mayúscula Delta |
Epsilon | Ε | U+0395 (917) | HTML 4.0 | HTMLsymbol | letra griega mayúscula Epsilon | |
Zeta | Ζ | U+0396 (918) | HTML 4.0 | HTMLsymbol | letra griega mayúscula Zeta | |
Eta | Η | U+0397 (919) | HTML 4.0 | HTMLsymbol | letra griega mayúscula Eta | |
Theta | Θ | U+0398 (920) | HTML 4.0 | HTMLsymbol | ISOgrk3 | letra griega mayúscula Theta |
Iota | Ι | U+0399 (921) | HTML 4.0 | HTMLsymbol | letra griega mayúscula Iota | |
Kappa | Κ | U+039A (922) | HTML 4.0 | HTMLsymbol | letra griega mayúscula Kappa | |
Lambda | Λ | U+039B (923) | HTML 4.0 | HTMLsymbol | ISOgrk3 | letra griega mayúscula Lambda |
Mu | Μ | U+039C (924) | HTML 4.0 | HTMLsymbol | letra griega mayúscula Mu | |
Nu | Ν | U+039D (925) | HTML 4.0 | HTMLsymbol | letra griega mayúscula Nu | |
Xi | Ξ | U+039E (926) | HTML 4.0 | HTMLsymbol | ISOgrk3 | letra griega mayúscula Xi |
Omicron | Ο | U+039F (927) | HTML 4.0 | HTMLsymbol | letra griega mayúscula Omicron | |
Pi | Π | U+03A0 (928) | HTML 4.0 | HTMLsymbol | letra griega mayúscula Pi | |
Rho | Ρ | U+03A1 (929) | HTML 4.0 | HTMLsymbol | letra griega mayúscula Rho | |
Sigma | Σ | U+03A3 (931) | HTML 4.0 | HTMLsymbol | ISOgrk3 | letra griega mayúscula Sigma |
Tau | Τ | U+03A4 (932) | HTML 4.0 | HTMLsymbol | letra griega mayúscula Tau | |
Upsilon | Υ | U+03A5 (933) | HTML 4.0 | HTMLsymbol | ISOgrk3 | letra griega mayúscula Upsilon |
Phi | Φ | U+03A6 (934) | HTML 4.0 | HTMLsymbol | ISOgrk3 | letra griega mayúscula Phi |
Chi | Χ | U+03A7 (935) | HTML 4.0 | HTMLsymbol | letra griega mayúscula Chi | |
Psi | Ψ | U+03A8 (936) | HTML 4.0 | HTMLsymbol | ISOgrk3 | letra griega mayúscula Psi |
Omega | Ω | U+03A9 (937) | HTML 4.0 | HTMLsymbol | ISOgrk3 | letra griega mayúscula Omega |
alpha | α | U+03B1 (945) | HTML 4.0 | HTMLsymbol | ISOgrk3 | letra griega minúscula alpha |
beta | β | U+03B2 (946) | HTML 4.0 | HTMLsymbol | ISOgrk3 | letra griega minúscula beta |
gamma | γ | U+03B3 (947) | HTML 4.0 | HTMLsymbol | ISOgrk3 | letra griega minúscula gamma |
delta | δ | U+03B4 (948) | HTML 4.0 | HTMLsymbol | ISOgrk3 | letra griega minúscula delta |
epsilon | ε | U+03B5 (949) | HTML 4.0 | HTMLsymbol | ISOgrk3 | letra griega minúscula epsilon |
zeta | ζ | U+03B6 (950) | HTML 4.0 | HTMLsymbol | ISOgrk3 | letra griega minúscula zeta |
eta | η | U+03B7 (951) | HTML 4.0 | HTMLsymbol | ISOgrk3 | letra griega minúscula eta |
theta | θ | U+03B8 (952) | HTML 4.0 | HTMLsymbol | ISOgrk3 | letra griega minúscula theta |
iota | ι | U+03B9 (953) | HTML 4.0 | HTMLsymbol | ISOgrk3 | letra griega minúscula iota |
kappa | κ | U+03BA (954) | HTML 4.0 | HTMLsymbol | ISOgrk3 | letra griega minúscula kappa |
lambda | λ | U+03BB (955) | HTML 4.0 | HTMLsymbol | ISOgrk3 | letra griega minúscula lambda |
mu | μ | U+03BC (956) | HTML 4.0 | HTMLsymbol | ISOgrk3 | letra griega minúscula mu |
nu | ν | U+03BD (957) | HTML 4.0 | HTMLsymbol | ISOgrk3 | letra griega minúscula nu |
xi | ξ | U+03BE (958) | HTML 4.0 | HTMLsymbol | ISOgrk3 | letra griega minúscula xi |
omicron | ο | U+03BF (959) | HTML 4.0 | HTMLsymbol | NUEVO | letra griega minúscula omicron |
pi | π | U+03C0 (960) | HTML 4.0 | HTMLsymbol | ISOgrk3 | letra griega minúscula pi |
rho | ρ | U+03C1 (961) | HTML 4.0 | HTMLsymbol | ISOgrk3 | letra griega minúscula rho |
sigmaf | ς | U+03C2 (962) | HTML 4.0 | HTMLsymbol | ISOgrk3 | letra griega minúscula final sigma |
sigma | σ | U+03C3 (963) | HTML 4.0 | HTMLsymbol | ISOgrk3 | letra griega minúscula sigma |
tau | τ | U+03C4 (964) | HTML 4.0 | HTMLsymbol | ISOgrk3 | letra griega minúscula tau |
upsilon | υ | U+03C5 (965) | HTML 4.0 | HTMLsymbol | ISOgrk3 | letra griega minúscula upsilon |
phi | φ | U+03C6 (966) | HTML 4.0 | HTMLsymbol | ISOgrk3 | letra griega minúscula phi |
chi | χ | U+03C7 (967) | HTML 4.0 | HTMLsymbol | ISOgrk3 | letra griega minúscula chi |
psi | ψ | U+03C8 (968) | HTML 4.0 | HTMLsymbol | ISOgrk3 | letra griega minúscula psi |
omega | ω | U+03C9 (969) | HTML 4.0 | HTMLsymbol | ISOgrk3 | letra griega minúscula omega |
thetasym | ϑ | U+03D1 (977) | HTML 4.0 | HTMLsymbol | "NUEVO" | símbolo griego theta |
upsih | ϒ | U+03D2 (978) | HTML 4.0 | HTMLsymbol | "NUEVO" | letra griega minúscula Upsilon con gancho |
piv | ϖ | U+03D6 (982) | HTML 4.0 | HTMLsymbol | ISOgrk3 | símbolo griego Pi |
ensp | U+2002 (8194) | HTML 4.0 | HTMLspecial | ISOpub | en (tipografía)[note 4] | |
emsp | U+2003 (8195) | HTML 4.0 | HTMLspecial | ISOpub | em (tipografía)[note 4] | |
thinsp | U+2009 (8201) | HTML 4.0 | HTMLspecial | ISOpub | espacio delgado[note 4] | |
zwnj | U+200C (8204) | HTML 4.0 | HTMLspecial | NEW RFC 2070 | zero-width non-joiner | |
zwj | U+200D (8205) | HTML 4.0 | HTMLspecial | NEW RFC 2070 | zero-width joiner | |
lrm | U+200E (8206) | HTML 4.0 | HTMLspecial | NEW RFC 2070 | marca izquierda-a-derecha | |
rlm | U+200F (8207) | HTML 4.0 | HTMLspecial | NEW RFC 2070 | marca derecha-a-izquierda | |
ndash | – | U+2013 (8211) | HTML 4.0 | HTMLspecial | ISOpub | en dash |
mdash | — | U+2014 (8212) | HTML 4.0 | HTMLspecial | ISOpub | em dash |
lsquo | ‘ | U+2018 (8216) | HTML 4.0 | HTMLspecial | ISOnum | comilla simple de apertura |
rsquo | ’ | U+2019 (8217) | HTML 4.0 | HTMLspecial | ISOnum | comilla simple de cierre |
sbquo | ‚ | U+201A (8218) | HTML 4.0 | HTMLspecial | "NUEVO" | comilla simple baja de apertura |
ldquo | “ | U+201C (8220) | HTML 4.0 | HTMLspecial | ISOnum | comilla doble de apertura |
rdquo | ” | U+201D (8221) | HTML 4.0 | HTMLspecial | ISOnum | comilla doble de cierre |
bdquo | „ | U+201E (8222) | HTML 4.0 | HTMLspecial | "NUEVO" | comilla doble baja de cierre |
dagger | † | U+2020 (8224) | HTML 4.0 | HTMLspecial | ISOpub | daga |
Dagger | ‡ | U+2021 (8225) | HTML 4.0 | HTMLspecial | ISOpub | doble daga |
bull | • | U+2022 (8226) | HTML 4.0 | HTMLspecial | ISOpub | viñeta[note 5] |
hellip | … | U+2026 (8230) | HTML 4.0 | HTMLsymbol | ISOpub | elipsis horizontal |
permil | ‰ | U+2030 (8240) | HTML 4.0 | HTMLspecial | ISOtech | signo de por mil |
prime | ′ | U+2032 (8242) | HTML 4.0 | HTMLsymbol | ISOtech | prima (minutos, pies) |
Prime | ″ | U+2033 (8243) | HTML 4.0 | HTMLsymbol | ISOtech | prima doble (segundos, pulgadas) |
lsaquo | ‹ | U+2039 (8249) | HTML 4.0 | HTMLspecial | ISO proposed | comilla angular simple de apertura[note 6] |
rsaquo | › | U+203A (8250) | HTML 4.0 | HTMLspecial | ISO proposed | comilla angular simple de cierre[note 6] |
oline | ‾ | U+203E (8254) | HTML 4.0 | HTMLsymbol | "NUEVO" | línea superior |
frasl | ⁄ | U+2044 (8260) | HTML 4.0 | HTMLsymbol | "NUEVO" | diagonal de fracción |
euro | € | U+20AC (8364) | HTML 4.0 | HTMLspecial | "NUEVO" | símbolo de euro |
image | ℑ | U+2111 (8465) | HTML 4.0 | HTMLsymbol | ISOamso | letra gótica mayúscula I |
weierp | ℘ | U+2118 (8472) | HTML 4.0 | HTMLsymbol | ISOamso | letra manuscrita mayúscula P |
real | ℜ | U+211C (8476) | HTML 4.0 | HTMLsymbol | ISOamso | letra gótica mayúscula R |
trade | ™ | U+2122 (8482) | HTML 4.0 | HTMLsymbol | ISOnum | marca registrada |
alefsym | ℵ | U+2135 (8501) | HTML 4.0 | HTMLsymbol | "NUEVO" | símbolo alef[note 7] |
larr | ← | U+2190 (8592) | HTML 4.0 | HTMLsymbol | ISOnum | flecha hacia la izquierda |
uarr | ↑ | U+2191 (8593) | HTML 4.0 | HTMLsymbol | ISOnum | flecha hacia arriba |
rarr | → | U+2192 (8594) | HTML 4.0 | HTMLsymbol | ISOnum | flecha hacia la derecha |
darr | ↓ | U+2193 (8595) | HTML 4.0 | HTMLsymbol | ISOnum | flecha hacia abajo |
harr | ↔ | U+2194 (8596) | HTML 4.0 | HTMLsymbol | ISOamsa | flecha hacia la izquierda-derecha |
crarr | ↵ | U+21B5 (8629) | HTML 4.0 | HTMLsymbol | "NUEVO" | flecha hacia abajo con esquina hacia la izquierda |
lArr | ⇐ | U+21D0 (8656) | HTML 4.0 | HTMLsymbol | ISOtech | flecha doble hacia la izquierda |
uArr | ⇑ | U+21D1 (8657) | HTML 4.0 | HTMLsymbol | ISOamsa | flecha doble hacia arriba |
rArr | ⇒ | U+21D2 (8658) | HTML 4.0 | HTMLsymbol | ISOnum | flecha doble hacia la derecha |
dArr | ⇓ | U+21D3 (8659) | HTML 4.0 | HTMLsymbol | ISOamsa | flecha doble hacia abajo |
hArr | ⇔ | U+21D4 (8660) | HTML 4.0 | HTMLsymbol | ISOamsa | flecha doble hacia izquierda-derecha |
forall | ∀ | U+2200 (8704) | HTML 4.0 | HTMLsymbol | ISOtech | para todo |
part | ∂ | U+2202 (8706) | HTML 4.0 | HTMLsymbol | ISOtech | derivada parcial |
exist | ∃ | U+2203 (8707) | HTML 4.0 | HTMLsymbol | ISOtech | existe |
empty | ∅ | U+2205 (8709) | HTML 4.0 | HTMLsymbol | ISOamso | conjunto vacío; véase también U+8960, ⌀ |
nabla | ∇ | U+2207 (8711) | HTML 4.0 | HTMLsymbol | ISOtech | nabla (operador diferencial vectorial) |
isin | ∈ | U+2208 (8712) | HTML 4.0 | HTMLsymbol | ISOtech | elemento de |
notin | ∉ | U+2209 (8713) | HTML 4.0 | HTMLsymbol | ISOtech | no es un elemento de |
ni | ∋ | U+220B (8715) | HTML 4.0 | HTMLsymbol | ISOtech | contiene a |
prod | ∏ | U+220F (8719) | HTML 4.0 | HTMLsymbol | ISOamsb | productorio |
sum | ∑ | U+2211 (8721) | HTML 4.0 | HTMLsymbol | ISOamsb | suma integral |
minus | − | U+2212 (8722) | HTML 4.0 | HTMLsymbol | ISOtech | signo de menos |
lowast | ∗ | U+2217 (8727) | HTML 4.0 | HTMLsymbol | ISOtech | operador asterisco |
radic | √ | U+221A (8730) | HTML 4.0 | HTMLsymbol | ISOtech | signo radical |
prop | ∝ | U+221D (8733) | HTML 4.0 | HTMLsymbol | ISOtech | proporcional a |
infin | ∞ | U+221E (8734) | HTML 4.0 | HTMLsymbol | ISOtech | infinito |
ang | ∠ | U+2220 (8736) | HTML 4.0 | HTMLsymbol | ISOamso | ángulo |
and | ∧ | U+2227 (8743) | HTML 4.0 | HTMLsymbol | ISOtech | operador «Y» |
or | ∨ | U+2228 (8744) | HTML 4.0 | HTMLsymbol | ISOtech | operador «O» |
cap | ∩ | U+2229 (8745) | HTML 4.0 | HTMLsymbol | ISOtech | intersección |
cup | ∪ | U+222A (8746) | HTML 4.0 | HTMLsymbol | ISOtech | unión |
int | ∫ | U+222B (8747) | HTML 4.0 | HTMLsymbol | ISOtech | integral |
there4 | ∴ | U+2234 (8756) | HTML 4.0 | HTMLsymbol | ISOtech | signo de «por lo tanto» |
sim | ∼ | U+223C (8764) | HTML 4.0 | HTMLsymbol | ISOtech | operador virgulilla |
cong | ≅ | U+2245 (8773) | HTML 4.0 | HTMLsymbol | ISOtech | congruente a |
asymp | ≈ | U+2248 (8776) | HTML 4.0 | HTMLsymbol | ISOamsr | aproximado a |
ne | ≠ | U+2260 (8800) | HTML 4.0 | HTMLsymbol | ISOtech | signo de inecuación |
equiv | ≡ | U+2261 (8801) | HTML 4.0 | HTMLsymbol | ISOtech | idéntico a |
le | ≤ | U+2264 (8804) | HTML 4.0 | HTMLsymbol | ISOtech | menor o igual a |
ge | ≥ | U+2265 (8805) | HTML 4.0 | HTMLsymbol | ISOtech | mayor o igual a |
sub | ⊂ | U+2282 (8834) | HTML 4.0 | HTMLsymbol | ISOtech | subconjunto de |
sup | ⊃ | U+2283 (8835) | HTML 4.0 | HTMLsymbol | ISOtech | superconjunto de |
nsub | ⊄ | U+2284 (8836) | HTML 4.0 | HTMLsymbol | ISOamsn | no es un subconjunto de |
sube | ⊆ | U+2286 (8838) | HTML 4.0 | HTMLsymbol | ISOtech | subconjunto de o igual a |
supe | ⊇ | U+2287 (8839) | HTML 4.0 | HTMLsymbol | ISOtech | superconjunto de o igual a |
oplus | ⊕ | U+2295 (8853) | HTML 4.0 | HTMLsymbol | ISOamsb | signo de suma inscrita |
otimes | ⊗ | U+2297 (8855) | HTML 4.0 | HTMLsymbol | ISOamsb | signo de multiplicación inscrito |
perp | ⊥ | U+22A5 (8869) | HTML 4.0 | HTMLsymbol | ISOtech | operador de falsedad |
sdot | ⋅ | U+22C5 (8901) | HTML 4.0 | HTMLsymbol | ISOamsb | operador de punto |
lceil | ⌈ | U+2308 (8968) | HTML 4.0 | HTMLsymbol | ISOamsc | techo izquierdo |
rceil | ⌉ | U+2309 (8969) | HTML 4.0 | HTMLsymbol | ISOamsc | techo derecho |
lfloor | ⌊ | U+230A (8970) | HTML 4.0 | HTMLsymbol | ISOamsc | piso izquierdo |
rfloor | ⌋ | U+230B (8971) | HTML 4.0 | HTMLsymbol | ISOamsc | piso derecho |
lang | 〈 | U+2329 (9001) | HTML 4.0 | HTMLsymbol | ISOtech | paréntesis angular de apertura |
rang | 〉 | U+232A (9002) | HTML 4.0 | HTMLsymbol | ISOtech | paréntesis angular de cierre |
loz | ◊ | U+25CA (9674) | HTML 4.0 | HTMLsymbol | ISOpub | losange |
spades | ♠ | U+2660 (9824) | HTML 4.0 | HTMLsymbol | ISOpub | pica[note 5] |
clubs | ♣ | U+2663 (9827) | HTML 4.0 | HTMLsymbol | ISOpub | trébol[note 5] |
hearts | ♥ | U+2665 (9829) | HTML 4.0 | HTMLsymbol | ISOpub | corazón[note 5] |
diams | ♦ | U+2666 (9830) | HTML 4.0 | HTMLsymbol | ISOpub | diamante[note 5] |
Entidades que representan caracteres especiales en XHTML
[editar]Las DTDs de XHTML declaran explícitamente 253 entidades (incluyendo las 5 ya predefinidas de XML 1.0), por lo que son expandidas en un solo carácter, son referidas informalmente como entidades de caracteres. Éstas (con la excepción de '
) tienen los mismos nombres y representan los mismos caracteres que las 252 referencias de entidades de caracteres en HTML. Además, como una ventaja de XML, los documentos XHTML referenciar la entidad predefinida '
, el cual no forma parte del grupo anterior. Entidades adicionales de cualquier tamaño pueden ser definidas por documento. Sin embargo, la usabilidad de las referencias de entidades en XHTML es afectada por la forma en que el documento es procesado:
- Si el documento es leído por un analizador sintáctico HTML, entonces solo las 252 entidades de caracteres HTML pueden ser usadas confiablemente. El uso de
'
o alguna entidad propia no será soportado y puede producir resultados inesperados. - Si el documento es leído por un analizador sintáctico XML que no lee entidades externas, entonces solo las 5 entidades de caracteres XML pueden ser usadas con seguridad, aunque otras entidades pudiesen ser usadas si son declaradas en una DTD interna.
- Si el documento es leído por un analizador sintáctico XML que lee entidades externas, las 5 entidades de caracteres XML pueden ser usadas con seguridad. Las otras 248 entidades HTML pueden ser usadas siempre y cuando la DTD de XHTML sea accesible por el analizador mientras el documento es analizado. Otras entidades pueden ser usadas si se declaran en una DTD interna.
Debido al caso especial de '
ya mencionado, solo "
, &
, <
y >
funcionarán en todas las situaciones.
Notas
[editar]- ↑ Las referencias normativas hacia el RFC 2070 (hallada en DTDs que definen las entidades de caracteres para HTML o XHTML) es histórica; este RFC (junto con otros RFCs relacionados con partes diferentes de la especificación HTML) se volvió obsoleta en favor del RFC 2854, el cual define el MIME type "text/html" y referencia directamente a la especificación W3C para el contenido HTML actual.
- ↑
DTD: el FPI de las DTDs donde las entidades anteriores son definidas son obtenidas de una de las siguientes tres entidades:
- HTMLlat1 refiere a:
PUBLIC "-//W3C//ENTITIES Latin 1//EN//HTML"
in HTML (la DTD es definida implícitamente, no es necesario especificar la URI);PUBLIC "-//W3C//ENTITIES Latin 1 for XHTML//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml-lat1.ent"
en XHTML 1.0;
- HTMLsymbol refiere a:
PUBLIC "-//W3C//ENTITIES Symbols//EN//HTML"
in HTML (la DTD es definida implícitamente, no es necesario especificar la URI);PUBLIC "-//W3C//ENTITIES Symbols for XHTML//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml-symbol.ent"
en XHTML 1.0;
- HTMLspecial refiere a:
PUBLIC "-//W3C//ENTITIES Special//EN//HTML"
in HTML (la DTD es definida implícitamente, no es necesario especificar la URI);PUBLIC "-//W3C//ENTITIES Special for XHTML//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml-special.ent"
en XHTML 1.0.
- HTMLlat1 refiere a:
- ↑ Subconjunto ISO antiguo: son subconjuntos documentados de caracteres antiguos usados en codificaciones heredadas antes de la unificación en la norma ISO 10646.
- ↑ a b c d Espacios: un fondo azul es usado para mostrar el ancho de cada espacio.
- ↑ a b c d e hace referencia a la viñeta rellenada, en contraposición a la hueca.
- ↑ a b Propuestos por ISO: estos caracteres fueron estandarizados en la norma ISO 10646 después del lanzamiento de HTML 4.0.
- ↑
alefsym
: 'alef symbol' no es el mismo que U+05D0 'letra hebrea alef', aunque el mismo glifo sea usado para mostrar ambos caracteres.
Referencias
[editar]- ↑ «Character entity references in HTML 4» (en inglés). W3C. Consultado el 27 de septiembre de 2018.