A mi no me importa el dinero: lo verdaderamente importante es lo que puedo comprarme con él…
Charla técnica como ninguna, sobre algoritmos, grafos, técnicas de predicción y árboles de decisión (creía que había vuelto a la Facultad, jeje) para poder detectar y optimizar esta detección todo tipo de spam, y no sólo de spam, sino para poder saber si una página es o no de contenido adulto, por ejemplo.
Es curioso ver cómo el pagerank puede verse afectado por este tipo de algoritmos, según se aplique en cada buscador, y cómo cada vez es más difícil engañar a los buscadores poniendo textos de enganche, aunque el contenido real no tenga nada que ver con lo que se busca.
Eso sí, con estos algoritmos hay que hilar muy fino, ya que consiste en quedarse con un conjunto de páginas que son “honradas”, y la inclusión o no en este conjunto de los sites debe hacerse con sumo cuidado tanto para no excluir páginas que deberían estar incluidas, como para no incluir las páginas “tramposas”.
Lo que más me gusta de mi profesión es la cantidad de voluntarios que hay (yo también soy una de ellos) para hacer estudios, código, … Esta charla no habría podido existir sin los cientos de voluntarios que se prestaron a realizar el estudio de páginas para poder realizar el grafo y el árbol de decisión más perfeccionado que hay ahora mismo. Creo que esta es la única aplicación útil que le veo a la estadística, ya que el resto siempre lo he visto como “la forma de ver el contenido de la botella: medio lleno o medio vacío”.
mil gracias Admin.
aki estamos en la sala de prensa para postear.
[...] Este blog es un blog vivo. Es un reflejo de lo que somos. Y estar en charlas como Detección de Spam es un placer. Si, se como suena… [...]