Tecnología

Inicio

ANSI vs. Unicode

ANSI vs. Unicode


Una computadora almacena cada letra y símbolo de texto como una secuencia de bits - unos y ceros binarios. Sistemas de codificación del alfabeto, puntuacion y otros símbolos se desarrollaron durante el siglo 20, lo que lleva a ANSI y Unicode. ANSI, que se presentó anteriormente, utiliza menos bits, pero tiene capacidad para los idiomas no europeos con dificultades; Unicode abarca muchos caracteres asiáticos y de Oriente Medio, así como el conjunto romano utilizado para otros idiomas europeos Inglés y.

tamaño

El conjunto de caracteres ANSI codifica utilizando ocho bits, o un byte de datos, por lo que maneja hasta 256 símbolos diferentes a la vez. El sistema Unicode utiliza 16 bits, o dos bytes, con capacidad de 256 x 256 o 65.536 símbolos. Además, Unicode tiene 17 planos de codificación, lo que permite un total de más de 1 millón de símbolos. Para idiomas con juegos de caracteres no romanos, ANSI utiliza un número adicional de 16 bits llamado una página de códigos. A las tiendas de computación este número una vez, no con todos los personajes, dando más flexibilidad al sistema de codificación ANSI.

idiomas

El conjunto ANSI conocido como "Windows 1252", donde "1252" se refiere al número de página de códigos, es el más popular, que abarca varios idiomas europeos Inglés y. Otras páginas de códigos definen idiomas adicionales, tales como 1254 para el turco y 1255 para el hebreo. Unicode, debido a su tamaño de la fuente más grande, tiene capacidad inherentemente más símbolos, incluidos los de Tailandia, el Braille, Cherokee y el persa antiguo.

plataformas

ANSI creció del sistema operativo Windows de Microsoft, después de haber sido desarrollado por Microsoft e IBM. Los investigadores de Apple y Xerox colaboraron en Unicode, que Microsoft ha adoptado más tarde. En el momento de la publicación, Windows es compatible con las normas ANSI y Unicode. Mac OS X utiliza su propio código de caracteres de ocho bits, similar a ANSI, y también es compatible con Unicode. El sistema operativo Linux también proporciona soporte para Unicode.

Clasificación

El conjunto de caracteres romanos ha permitido tradicionalmente a los usuarios organizar y ordenar información utilizando el orden de sus personajes. códigos ANSI siguieron el orden de los caracteres romanos, por lo que el valor de una "T" es mayor que la de una "B", haciendo tareas de la computadora como la clasificación casi automática. Aunque Unicode también puede ordenar la información basada en el orden de caracteres, es un proceso más complejo. Los primeros 127 caracteres Unicode incluyen mayúsculas y minúsculas letras romanas, lo que permite la clasificación de otras lenguas europeas Inglés y. Cada lenguaje no romana tiene su propia fórmula especie, o algoritmo.