Tecnología

Inicio

Cómo Codificar UTF-8 en Python

Unicode UTF-8 es un esquema de codificación de caracteres que asigna códigos numéricos para los personajes. Cada personaje de todos los alfabetos, moderno y antiguo por igual, se representa en Unicode. Con la tercera edición de Python vino mejora la compatibilidad con Unicode, lo que le permite insertar caracteres Unicode en cadenas utilizando una secuencia de escape. También puede cambiar la codificación de una cadena a Unicode utilizando un solo comando. Esto es posible en Python 3, así como Python 2.

Instrucciones

1 Abra el editor de texto IDLE que viene con el lenguaje Python.

2 Declarar una cadena escribiendo esto en la parte superior de la página de código fuente:

str_0 = "text"

3 Convertir la cadena a Unicode UTF-8 mediante la función de codificación y asignarla a otra cadena. Puede realizar estas dos operaciones utilizando una sola línea de código, como esto:

str_1 = str_0.encode ( 'UTF-8')

4 Imprimir la cadena codificada utilizando el comando de impresión, como esto:

impresión (str_1)

5 Ejecutar el programa pulsando la tecla "F5". La salida se programa la versión Unicode de la cadena, que tiene el siguiente aspecto:

b'text '