Esquemas de codificación Java
Esta página describe los esquemas de codifiación de caracteres soportados por la plataforma Java. Usa el botón "Back" del navegador
para volver a la página que te trajo aquí.
US-ASCII
US-ASCII es un esquema de codificación de 7 bits que cubre el alfabeto Inglés. No es suficiente para cubrir los caracteres usados en
otros lenguajes, por lo que no es muy útil para internacionalización.
UTF-8
UTF-8 es un esquema de codificación de 8 bits. Los caracteres del alfabeto Inglés se utilizan usando bytes de 8 bits, y los caracteres
de otros lenguajes usando 2, 3 o 4 bytes. Por lot anto produce documentos compactos para el lenguaje Ingkés, pero muy grandes
para otros idiomas. Si la mayoría del documento está en Inglés, UTF-8 es una buena elección.
UTF-16
UTF-8 es un esquema de codificación de 16 bits. Es lo suficientemente grande para todos los caracteres de todos los alfabetos del
mundo, con la excepción de idomas basados en ideogramas como el Chino. Todos los caracteres en UTF-16 usan 2 bytes. Un
documento escrito en Inglés que usa UTF-16 es dos veces más grande que el mismo documento codificado con UTF-8. Sin
embargo, los documentos escritos en otros idiomas, serán bastante más pequeños usando UTF-16.