-
¿Cuáles son las tareas básicas ETL?
-
"ETL" es sinónimo de extracción, transformación y carga - las tres tareas básicas de ETL. Extracto implica la extracción de datos de fuentes externas que desea poner en sus bases de datos. Transformar implica la manipulación de los datos externos en un formato que coincida con el formato de los datos actualmente en sus bases de datos. La carga es para importar los datos transformados en la base de datos final o sistema donde se ubicará. Algunos han encontrado que es más fácil para cargar el Priot datos para su transformación, y es posible ver la expresión escrita como "ELT". Cada tarea por sí solo puede ser complejo y existen herramientas de software y sistemas construidos específicamente para el procesamiento de ETL.
Extraer
El "Extract" tarea implica la recopilación de datos de fuentes externas que desea traer a sus sistemas y bases de datos. En una empresa, los datos pueden ser encontrados en bases de datos u hojas de cálculo independientes que no están integrados con cualquier base de datos maestra. Los datos podrían incluso ser en papel o podrían ser los datos que usted compra de un proveedor de datos. El objetivo de esta tarea es comprender el formato de los datos, evaluar la calidad general de los datos y para extraer los datos de la fuente para que pueda ser manipulado en la siguiente tarea.
Transformar
En la etapa de "Transform", se utiliza una variedad de herramientas de software y programación a medida, incluso para manipular los datos de manera que se integra con los datos que ya tiene. Por ejemplo, considere un sistema que identifica los varones con una "M" y las hembras con una "F" Si se han extraído los datos de una fuente externa que identifica a los hombres con un "1" y hembras con un "2", que necesita para transformar los datos mediante la conversión del "1" a una "M" y el "2" a un " F "de manera que coincida con los datos que residen actualmente en sus bases de datos y sistemas.
Carga
Después de haber conseguido transformar los datos que necesita para cargar físicamente en su sistema o base de datos. Antes de cargar los datos, asegúrese de que tiene una copia de seguridad de su sistema actual o que se puede hacer retroceder o deshacer la importación si falla. Después de cargar los datos, es común para ejecutar los informes de auditoría para que pueda revisar los resultados de las bases de datos y sistemas combinados para asegurarse de que los nuevos datos no ha causado ninguna errores o problemas.
ELT
Cuando la tarea "Transform" por sí es grande y compleja, es posible que desee extraer los datos, cargarlo en una tabla temporal dentro de la base de datos donde se ubicará y llevar a cabo las acciones de forma permanente el "transformar" a paso después de que haya cargado los datos. Tener los datos cargados en el sistema final durante la etapa de "transformar" a veces hace que sea más fácil para ejecutar informes y para poner a prueba los resultados de las operaciones de transformación. Debido a esto, es posible ver la expresión escrita como "ELT" en lugar de "ETL".