Tecnología

Inicio

Códigos de Minería frecuentes Pattern

patrón de la minería frecuente, también conocida como la minería conjunto de elementos frecuentes, es una técnica para grupos de artículos que con frecuencia ocurren juntos en una base de datos de descubrimiento. De acuerdo con el Dr. Christian Borgelt, Investigador Principal en el Centro Europeo de Soft Computing, patrón de la minería frecuente ha sido uno de los temas de investigación más estudiado de forma activa en la minería de datos desde principios de 1990 y numerosos algoritmos matemáticos han sido desarrollados.

Minería patrón frecuente

patrón de la minería es un problema frecuente primaria en muchas aplicaciones. Una base de datos transaccional típica - tal como una base de datos que describe el comportamiento de los compradores en la calle principal, por correo o por Internet - contiene un gran número de conjuntos de elementos y presenta un desafío en términos de desarrollo de algoritmos escalables, eficientes. patrón de algoritmos de minería frecuentes conocidos como A priori, Eclat y FP-crecimiento están entre los más conocidos.

A priori Algoritmo

El algoritmo Apriori, propuesta por primera vez por Rakesh Agrawal y Ramkrishnan Srikant de la Almaden Centro de Investigación de IBM en 1994, trabaja en el principio de que los conjuntos de elementos se cuentan cuando se producen en las transacciones. La base de datos se explora para encontrar conjuntos de elementos frecuentes 1-, los 1-conjuntos de elementos se utilizan para generar los conjuntos de elementos de 2 y así sucesivamente hasta k-conjuntos de elementos. Un conjunto de elementos k-se dice que es frecuente si y sólo si todos sus subitemsets son frecuentes. Desde que fue propuesto por primera vez, se han sugerido numerosas mejoras en el algoritmo Apriori.

Algoritmo FP-crecimiento

El algoritmo FP-crecimiento - FP significa "patrón frecuente" - emplea una técnica conocida como el algoritmo explora la base de datos para crear una lista de elementos frecuentes con el fin, que se utiliza para comprimir la base de datos descendente "divide y vencerás". en un FP-árbol. La propia FP-árbol se extrae, a partir de cada patrón frecuente longitud-1 - también conocido como un patrón sufijo - para crear un condicional FP-árbol, que contiene prefijos correspondientes a los elementos que co-ocurrir con el patrón inicial sufijo. El patrón inicial sufijo se concatena con los patrones frecuentes en el condicional FP-árbol para lograr un crecimiento patrón.

Eclat Algoritmo

Los algoritmos Apriori y FP-mina de crecimiento patrones frecuentes a partir de un conjunto de transacciones dispuestas horizontalmente. La clase de equivalencia de Transformación (Eclat) algoritmo - propuesto por J. Mohammed Zaki, un profesor de ciencias informáticas en el Instituto Politécnico Rensselaer, en 2000 - por el contrario, las minas de patrones frecuentes en una serie de transacciones dispuesta verticalmente. El algoritmo Eclat comienza con un solo elemento y utiliza una intersección de conjuntos para determinar los conjuntos de elementos frecuentes y se repite hasta que no hay más conjuntos de elementos frecuentes se pueden encontrar.


Artículos relacionados