Tecnología

Inicio

UTF-7 UTF-8 vs.

UTF-7 UTF-8 vs.


UTF-7 y UTF-8 son los dos tipos de formato de transformación Unicode, el estándar utilizado para codificar los caracteres Unicode de 16 bits, como las cartas internacionales y símbolos especiales en un formato que puede ser transmitido a través de sistemas de 7 bits u 8 bits. UTF-8 es el formato de codificación más utilizada, popular en las páginas web y muchos programas de correo electrónico. UTF-7 proporciona codificación para algunos protocolos de correo electrónico que no funcionan con UTF-8.

Unicode

Unicode es un estándar internacional para la representación de caracteres como números enteros. Se utiliza 16 bits por carácter frente a los siete bits utilizados por ASCII, el Código Estándar Americano para Intercambio de Información. ASCII puede reproducir sólo 128 caracteres en comparación con los 65.000 caracteres únicos disponibles en Unicode. Esta gama más amplia de caracteres Unicode hace más apropiado para los idiomas de Asia oriental y otros con grandes conjuntos de caracteres, pero los caracteres Unicode debe ser codificada para que puedan ser transmitidos a través de los canales bits 7 bits u 8 bits.

UTF-8

UTF-8 es el formato de transformación universal más común utilizado para convertir los caracteres Unicode en segmentos de 8 bits para su transmisión por la Web a través de correo electrónico oa través de otros canales de 8 bits. Este formato de codificación cambia cada carácter Unicode en uno a cuatro octetos, dependiendo del valor entero del carácter Unicode, y es muy eficiente para documentos que utilizan principalmente cartas también se encuentran en el juego de caracteres ASCII. UTF-8 tiende a ocupar más espacio que la codificación de un solo byte para los alfabetos no occidentales.

UTF-7

UTF-7 es una variante especial del formato de transformación universal propuesto por primera vez a mediados de la década de 1990. Fue diseñado para representar texto Unicode con una cadena de caracteres ASCII, produciendo un método de codificación más eficiente para el correo electrónico que no sea UTF-8, más la codificación QP necesario para transmitir a través de una ruta de datos de 7 bits. Utilizando la codificación UTF-7 reduce el tamaño de los caracteres codificados de manera significativa.

consideraciones

Aunque UTF-7 es más eficiente a través de canales de 7 bits que UTF-8, más, la mayoría de las autoridades citado imprimible incluyendo la red de desarrolladores de Internet Mail Consortium y Microsoft recomiendan utilizar UTF-8 sobre UTF-7 siempre que sea posible. Esto se debe a UTF-7 crea problemas de seguridad y robustez que no están presentes en su relación de 8 bits. El IMC también recomienda que todos los programas de correo-exhibición creadas 1 de enero de 1999 deberán capaz de visualizar correo en UTF-8.