¿Qué es Spam Assassin?
Spam Assassin es un filtro de spam que utiliza una variedad de técnicas para identificar y marcar mensajes de spam, incluidos algoritmos de aprendizaje automático, filtrado bayesiano y filtrado basado en reglas. Está diseñado para ejecutarse en un servidor de correo, donde puede verificar el correo electrónico entrante antes de entregarlo al destinatario previsto. Spam Assassin se puede configurar para eliminar o poner en cuarentena los mensajes de spam, o para etiquetarlos con un marcador que puede ser utilizado por los clientes de correo electrónico para filtrarlos fuera de la bandeja de entrada del usuario. Algunos proveedores de servicios de correo electrónico también ofrecen Spam Assassin como una característica opcional para sus usuarios.
¿Cómo funciona?
Spam Assassin utiliza varios criterios para determinar si un mensaje es spam:
- Inspección de "Headers": Los "Headers" o encabezados de mensaje contienen información importante sobre procedencia y rutas intermedias, Spam Assassin inspecciona esta información para fines de detección.
- Análisis del Mensaje: El cuerpo y título del mensaje también son leídos por Spam Assassin, realizando búsquedas por palabras claves, cantidad de mayúsculas, presencia de vocales en dirección del remitente u otros criterios que habitualmente conforman un spam.
- Listas Negras: Actualmente, existen listas que contienen servidores de correo con antecedentes de haber generado spam en el pasado("Open-Relays"), Spam Assassin consulta estas listas negras, entre las que se encuentran: http://www.mail-abuse.com, http://www.ordb.org y http://www.surbl.org.
- Análisis probabilístico / bayesiano: Una vez definidas los criterios iniciales para detección, Spam Assassin utiliza análisis probabilístico para determinar similitudes entre mensajes entrantes y aquellos anteriormente detectados como spam.
- Listas "Hash" / Firmas de Correo: Debido a que un correo spam suele ser enviado a miles de personas a la vez, la estructura de cada mensaje es idéntica en todas sus instancias, así puede producirse un "Hash" (o identificador) inequívoco. Spam Assasin consulta lista de "Hashes" sobre mensajes conocidos, entre las que se encuentran: Vipul's Razor , Pyzor y DCC.