Tecnología

Inicio

Las desventajas de filtrado de spam bayesiano

Las desventajas de filtrado de spam bayesiano


Con el correo electrónico llega correo no deseado, molestos anuncios enviados a su bandeja de entrada no solicitado. Los primeros filtros de spam se basaron en reglas, tales como mensajes de correo electrónico "filtrar las que contienen las palabras" clic "." Sin embargo, para cada regla que se podría escribir, algunos spammer inteligente encontró una manera de evitarlo. Por ejemplo, los spammers pueden escribir mal intencionada palabras, como la escritura 'c1ick' en lugar de 'click', haciendo que la regla de filtrado inútil. La adición de filtros bayesianos, sin embargo, permitió que los programas anti-spam para adaptarse a las características cambiantes de correo no deseado.

Filtro bayesiano usa la probabilidad

filtro bayesiano que adopta un enfoque probabilístico. Cataloga palabras y otras características predefinidas de correo electrónico spam y no spam recibidos por el usuario. Cuando llega un nuevo correo electrónico, el filtro analiza en busca de estas palabras y características. Cuantas más palabras el nuevo correo electrónico tiene en común con palabras que se encuentran en el spam anterior, más probable es que el nuevo correo electrónico serán marcados como spam por el filtro bayesiano.

Filtros bayesianos aprender y adaptarse

El enfoque bayesiano permite que el filtro "aprender", como las características del cambio de spam. Al principio, podría perderse el spam que tiene el mal escrita "c1ick", por ejemplo. Pero a medida que el usuario marca que el correo electrónico como spam, el filtro comenzará la asignación de una mayor probabilidad de que el resto de mensajes que contengan esa palabra son spam.

formación necesaria

El filtrado Bayesiano es muy eficaz, pero una desventaja es que el filtro tiene que ser "entrenado". Al principio, la base de datos de correos electrónicos es pequeña y el usuario debe seguir para marcar el correo entrante como "spam" con el fin de "entrenar" el filtro. Los usuarios que reciben un bajo volumen de correo electrónico tendrán que esperar más tiempo para establecer una base de datos adecuada.

El envenenamiento bayesiano

Otra desventaja es que los spammers continúan buscando nuevas formas de "veneno" o engañar a los filtros de correo no deseado en el marcado como correo electrónico válida. Por ejemplo, los spammers pueden incluir un bloque de texto normal de un libro o página web en un intento de tener una alta proporción de las palabras "buenas" en el correo electrónico. Por suerte, esto puede ser limitado en la eficacia debido a que el filtro bayesiano define la "buena de correo electrónico" de manera diferente en función de la base de datos se construye de correo electrónico de cada usuario individual.