Tecnología

Inicio

¿Por qué no por defecto de MySQL a UTF-8?

Con MySQL, hay dos posibles conjuntos de caracteres disponibles para que sus datos serán almacenados. Estos conjuntos de caracteres Unicode reflejan la cantidad de datos que se almacenan por carácter en la base de datos MySQL. El UTF-8 codificación Unicode (UTF-8) juego de caracteres de tres bytes se reconoce comúnmente, pero no es el juego de caracteres predeterminado para MySQL.

¿Cuáles son los sets de caracteres?

Los conjuntos de caracteres son un conjunto de normas que contienen todas las teclas de entrada de teclado disponibles. El primer juego de caracteres ASCII populares funcionó bien para el idioma Inglés, pero a medida que otras naciones comenzaron a utilizar los ordenadores y las diversas necesidades, se requiere nuevos juegos de caracteres. UCS-2 y UTF-8 son ambos conjuntos de caracteres capaces de introducir datos desde casi cualquier teclado en el mundo.

UCS-2 codificación Unicode (UCS-2)

UCS-2 es un juego de caracteres que utiliza 16 bits por carácter, apoyando el Plano multilingüe básico (BMP). En comparación, ASCII utiliza un solo byte. Los valores de códigos de bits oscilan entre 0 y 65535 y, en UCS-2, puede ser codificada en una palabra de 16 bits fija.

Tres byte UTF-8 codificación Unicode

Con UTF-8, el mismo conjunto de caracteres y bits de código rango se utiliza como UCS-2, pero sólo se utiliza entre uno a tres bytes por carácter. Mientras que UCS-2 puede ser codificada en una palabra de 16 bits fija, UTF-8 codifica a cualquiera de 8, 16 o 24 bits. UTF-8 es un estándar más reciente que UCS-2.

¿Por defecto MySQL al UCS-2

MySQL es una aplicación de base de datos muy antiguo y su creación precedió a la aplicación masiva de UTF-8. Por lo tanto, MySQL siempre ha favorecido UCS-2, que es adecuado para la mayoría de las implementaciones de bases de datos. Si desea utilizar UTF-8 en lugar, puede hacerlo cambiando la configuración de base de datos.