Redacción Mx político.- Un investigador de Rutgers ha desarrollado técnicas para ayudar a WhatsApp a identificar remitentes de basura en grupos públicos y filtrar automáticamente los mensajes basura y spam para los usuarios de WhatsApp.

El estudio, “Deshacerse de la mensajería basura en la era del cifrado de extremo a extremo: un estudio de caso de WhatsApp”, se presentará en The Web Conference 2022. Los investigadores examinaron 2,6 millones de mensajes de 5051 mensajes de WhatsApp relacionados con la política pública. Grupos de WhatsApp en India, análisis de contenido, URL y patrones de mensajes de spam a lo largo del tiempo.

WhatsApp es la aplicación de mensajería móvil más popular a nivel mundial, con más de 2 mil millones de usuarios.

La prevalencia de la basura, definida como mensajes que no son de interés o adecuados para los administradores de un grupo, fue mucho mayor de lo que anticiparon los investigadores. Según el estudio, casi uno de cada 10 mensajes enviados a estos grupos eran mensajes basura.

“Eliminar los mensajes no deseados es clave para mejorar el consumo de información de las personas que son bombardeadas por spam y para reducir las preocupaciones económicas de los usuarios”, dijo Kiran Garimella, profesor asistente de Bibliotecología y Ciencias de la Información en la Escuela de Comunicación e Información de Rutgers. “Algunos remitentes de basura tienen como objetivo robar la información de la tarjeta de crédito de los usuarios”.

El estudio encontró que la basura más difundida son los anuncios de empleo, que comprendían casi el 30 por ciento del conjunto de datos. Otros mensajes basura incluían “haga clic y gane”, que fomenta los clics en una URL y promete una recompensa. El 7,7 por ciento de los mensajes no deseados ofrecen artículos a la venta, mientras que el 7,5 por ciento ofrecen un obsequio a cambio de referencias de usuarios a una suscripción de servicio en línea, y consisten principalmente en una URL para hacer clic.

Los investigadores desarrollaron métodos para moderar los grupos públicos de WhatsApp. A diferencia de los sistemas de mensajería como el correo electrónico y Twitter, WhatsApp no ​​puede leer ni moderar el contenido del usuario debido al cifrado de extremo a extremo. Si bien esto garantiza la privacidad del usuario, la incapacidad de WhatsApp para moderar el contenido significa que el spam y los mensajes no deseados publicados por remitentes de basura pueden afectar la experiencia del usuario en la plataforma.

Según el estudio, los remitentes de spam publican en muchos grupos y, por lo general, aparecen y desaparecen varias veces para evitar que los administradores los detecten y eliminen.

Los remitentes de spam difunden los mismos mensajes de spam durante unos pocos días “activos”. Garimella dijo que esta estrategia podría mejorar la visibilidad de la basura al proporcionar una “vida útil” más larga en los mensajes recientes.

Un indicador clave de basura son las URL y los números de teléfono. Casi el 90 por ciento de los mensajes basura contenían un número de teléfono, una URL o ambos (en contraste con el 36 por ciento de los que no eran basura). Los investigadores crearon un modelo de codificación para detectar automáticamente la basura usando direcciones URL y números de teléfono. Esto puede ayudar a los administradores de WhatsApp a marcar y eliminar rápidamente estos mensajes, dijeron.

Desde el punto de vista del usuario, los investigadores crearon un modelo en el que los usuarios codifican una señal que detecta si un mensaje contiene un número de teléfono, una URL, ambos o ninguno.

“Nuestros métodos son muy prácticos y aplicables”, dijo Garimella. “WhatsApp puede aplicarlas para detener la propagación de spam en sus grupos, y nuestras técnicas se pueden usar en la plataforma de forma centralizada mientras se respetan las garantías de cifrado de extremo a extremo que WhatsApp ofrece a los usuarios para proteger su privacidad”.

Como parte de un amplio esfuerzo para reducir el spam en los grupos públicos de WhatsApp, Garimella y sus coautores comparten su código y conjunto de datos anotados con WhatsApp y lo ponen a disposición del público para que lo utilicen otros investigadores.

La investigación fue publicada en arXiv.

(14 , 1)