Tecnología

Inicio

La agrupación de tipos de algoritmos

La agrupación es una técnica de aprendizaje máquina funciona mediante la agrupación de datos similar juntos. La agrupación es un tipo de aprendizaje automático sin supervisión. El algoritmo no necesita ser "entrenado" y los datos del grupo lata en grupos coherentes con una idea "preconcebida" de lo que pertenece juntos. Esto difiere de los sistemas de aprendizaje automático supervisado que debe ser "entrenados" a los datos de la etiqueta correctamente. La agrupación se utiliza principalmente como un mecanismo de reconocimiento de patrones ordenador.

Generativa o algoritmos de probabilidad basada

algoritmos de agrupamiento basado generativas de probabilidad o intento de clasificación de conjuntos de datos como una especie de distribución conocida, una agrupación común de datos numéricos. Este tipo de algoritmo sólo se puede utilizar en los datos numéricos. algoritmos generativos vienen con varias advertencias. El problema puede ser imposible de resolver si se permite que los datos de variar con demasiada libertad. algoritmos generativos también asumen que los datos encarna una distribución conocida, que no siempre es cierto. Estos tipos de algoritmos también no tienen en cuenta el "ruido" en los datos.

K-means clustering

K-means clustering fue uno de los primeros métodos de la agrupación a desarrollar. Es muy sencillo de poner en práctica, sin embargo, tiene la desventaja de ser extremadamente sensibles a sus entradas de partida. K-means clustering obras dividiendo los datos en un conjunto aleatorio de grupos y luego volver a calcular los puntos medios de cada grupo y repetir el proceso hasta que sólo hay un clúster. Esto se conoce como la convergencia.

Fuzzy Clustering

En lugar de identificar los datos como pertenecientes a grupos específicos, fuzzy clustering intenta identificar el grado en que un punto de datos pertenece a un grupo. Los algoritmos que se utilizan para hacer agrupamiento difuso se conocen como "C-means algoritmos." En el enfoque de agrupamiento difuso, un punto de datos puede pertenecer a más de un grupo. Este tipo de agrupación es útil cuando los puntos de datos pueden necesitar pertenecer a más de un grupo.

La agrupación de aglomeración

agrupación de aglomeración fue uno de los primeros algoritmos de agrupamiento a desarrollar. Se mantiene en uso, ya que es también uno de los algoritmos más simples desarrollados hasta la fecha. agrupación de aglomeración funciona mediante el tratamiento de cada punto de datos individual como un conjunto y agrupar con el punto de datos más similar. Este proceso se repite hasta que los datos "converge", o hay un gran grupo que contiene todos los datos. El proceso también se puede realizar a la inversa para el mismo efecto. Comenzando con un racimo, todos los datos se pueden dividir varias veces hasta que cada punto de datos es su propio clúster.