zah escribió:
Pero no creo que un filtro pueda aprenderlo sólo. Tendrá que "enseñarselo" un programador ¿no?
Los filtros se basan en listas de palabras, así como de asociaciones, si tal o cual palabra están cerca etc etc. Si aumentas esa lista, el algoritmo "aprende"
Ejemplo, tenemos en nuestra lista de spam las palabras
"viagra" "sell" nos llega un email con publicidad, que contiene las palabras "pr0n" "lolita", si lo marcamos como spam, esas palabras se añadirán a la lista, por lo que el algoritmo tendrá más datos para basar sus probabilidades y "aprenderá" (esto no funciona así de simple, es bastante más complicado, por lee las palabras, su distribución en el texto etc etc)
zah escribió:
De hecho tengo entendido en que no puede hacerse en un tiempo razonable, y en eso se basa una prueba
Captcha.
Muchos de esos sistemas mal planteados también fallan. pero aún así DUDO, que escaneen las imágenes, simplemente lo que harán será detectar que si un correo SÓLO lleva 4 archivos adjuntos, y el código HTML para ponerlo en orden, o viene de tal o cual dirección o el título es tal pues entonces lo marcaran como spam... no siempre es el contenido lo identificable, si no el contenedor también.