Tecnología

Inicio

Cómo para forzar a cualquier archivo en un UTF-8 en Perl

Cómo para forzar a cualquier archivo en un UTF-8 en Perl


Formato de transformación Unicode (UTF-8) es un formato de codificación de caracteres que utiliza bloques de ocho bits para representar un carácter, y es ampliamente utilizado en los sistemas informáticos. Incluye la misma codificación de texto sin formato compacto como el formato ASCII, pero también permite la codificación de caracteres especiales. Esto le da una funcionalidad adicional, pero plantea problemas cuando se utiliza en el código del programa. Las versiones posteriores de la nave con Perl que codifican módulos y una función binmode que permiten que el lenguaje de programación para manejar la codificación y decodificación de archivos UTF-8. La entrada y salida a / de un programa Perl se pueden hacer para manejar caracteres UTF-8 mediante el uso de un interruptor en la línea de comandos.

Instrucciones

1 Iniciar el editor de Perl para empezar a programar el programa de Perl. Se puede usar un simple editor de texto, como Bloc de notas en Windows o el editor vi en UNIX. Tendrá que guardar el archivo con la extensión .pl para que el sistema será capaz de reconocerlo como un programa Perl.

2 Coloque un imperativo para requerir el módulo "Encode" en la parte superior del programa Perl. Usted será capaz de utilizar las funciones de codificación y decodificación en el cuerpo del programa Perl para codificar / decodificar los datos en / fuera de formato UTF-8, según sea necesario. Escriba lo siguiente en el editor de Perl para usar este método:

! / Usr / bin / perl

Codificar requerir;
Como alternativa, puede llamar al módulo Encode, de la siguiente manera:
Codificar utilizar;
Para codificar los datos, debe escribir lo siguiente en el cuerpo de su programa:
$ Salida = Codificar :: encode ( "UTF-8", $ cadena);

3 Especificar el formato de codificación UTF-8 cuando se abre un archivo. Puede hacerlo escribiendo cualquiera de los siguientes formatos en el editor:

ARCHIVO abierta, "<: codificación (ISO-8859-7)", $ archivoEntrada;

ARCHIVO abierta, "<: UTF-8", $ archivoEntrada;

Esto le indicará a Perl para codificar el archivo en el formato UTF-8, o para prepararse para codificación UTF-8.

4 Especificar los "binmode" al leer o escribir archivos, para asegurarse de que los archivos están codificados en el formato UTF-8.

Para establecer el binmode a UTF-8 cuando se lee un archivo, escriba lo siguiente en el editor:
$ Archivo = "archivo.txt";
$ ArchivoEntrada = IO :: Archivo-> Nuevo ($ archivo, "r");
binmode ($ archivoEntrada, ': UTF-8');

Para establecer el binmode a UTF-8 se graba en un archivo, escriba lo siguiente en el editor:
$ Archivo = "archivo.txt";
abierta (OUT "> $ archivo");
binmode (OUT ": UTF-8");

También puede utilizar binmode para establecer el formato de la entrada estándar y la salida a UTF-8, de la siguiente manera:
binmode (STDIN, ': UTF-8');
binmode (STDOUT, ': UTF-8');