Tecnología

Inicio

XML para la conversión ASCII

Un beneficio principal de XML es que permite etiquetar y salida de datos (o transformar) el contenido del elemento en cualquiera de una serie de formatos, incluyendo texto plano (ASCII). Si bien esto se puede hacer mediante programación, la transformación XSL está diseñado específicamente para este propósito. Los principales desafíos en la creación de una conversión impecable son dobles: obtener los datos correctos del documento XML-etiquetado; y gastos de caracteres especiales.

esquema XML

XML es, por definición, la información estructurada. Muchos documentos XML definen un esquema formal que describe cómo se pueden utilizar los elementos XML. En efecto, el esquema actúa como una hoja de ruta para el documento XML. Así que el primer paso es analizar el esquema y mapear sus elementos a sus homólogos ASCII. Esto puede ser una simple cuestión de la extracción de datos directamente del contenido de un elemento. Tenga en cuenta, sin embargo, que los atributos de un elemento también pueden contener datos críticos, tales como un número de registro de base de datos que deben ser incluidos en la conversión.

esquema implícita

Cuando no se proporciona ningún esquema formales, la estructura del documento XML está todavía implícita. Esto hace que sea posible reconstruir el esquema. Una buena estrategia en este caso es examinar los elementos dentro de la instancia de documento y escribir un esquema que maneja todos los casos en el documento.

Conjuntos de caracteres

Hay muchos juegos de caracteres para cubrir los caracteres especiales utilizados en diferentes idiomas en todo el mundo. El juego de caracteres ASCII específicamente hace referencia a texto para el idioma Inglés. De acuerdo con Richard Ishida del Consorcio de la World Wide Web ", el conjunto de caracteres Unicode contiene caracteres para la mayoría de las lenguas vivas y secuencias de comandos en el mundo." (Http://www.w3.org/International/getting-started/characters.) Para evitar posibles problemas, una buena práctica es utilizar el Unicode UTF-8 juego de caracteres al hacer sus conversiones.

entidades

XML define un pequeño conjunto de caracteres, llamados entidades predefinidas. Estas entidades incluyen los caracteres para el signo y el punto y coma, que tienen usos específicos en XML y, por tanto, están sometidas a restricciones. Para evitar esto, debe escapar de estos personajes. Por ejemplo, debe utilizar "& amp;" para representar el carácter de signo en XML. Sea consciente de estos y otros caracteres de escape especiales en sus datos.