Des techniques de Machine Learning détectent les sites de phishing

Phishing : une technique Machine Learning détecte les sites de hameçonnage

Des chercheurs en sécurité informatique de l’Université de Plymouth et de l’Université de Portsmouth (Royaume-Uni) ont étudié des modèles Machine Learning formés sur la représentation visuelle du code d’un site web. Ils  indiquent que ces modèles peuvent aider à améliorer la précision et la vitesse de détection des sites d’hameçonnage. 

Combler les lacunes des méthodes de détection existantes

Les chercheurs visent à combler les lacunes des méthodes de détection existantes, qui sont soit trop lentes, soit pas assez précises. La technique développée par les chercheurs utilise des bibliothèques de « visualisation binaire » pour transformer le balisage et le code des pages web en images. En utilisant cette méthode, ils ont créé un ensemble de données d’images légitimes et de phishing de sites web. 

L’ensemble de données a ensuite été utilisé pour former un modèle d’apprentissage automatique afin de classer les sites web légitimes et de phishing en fonction des différences dans leur visualisation binaire. Pour tester un nouveau site web, le code de la page web cible est transformé via une visualisation binaire et exécuté via le modèle entraîné.

Pour accélérer les performances du modèle, les chercheurs ont utilisé MobileNet, un réseau de neurones optimisé pour fonctionner sur des appareils aux ressources limitées, par opposition aux serveurs Cloud. Le système crée également de façon progressive une base de données de sites web légitimes et de phishing pour éviter les inférences excessives et inutiles.

Détection précise des sites web de phishing

Des techniques de Machine Learning détectent les sites de phishing

Selon les expériences menées par les chercheurs, le modèle a atteint une précision de 94% dans la détection des sites web de phishing. Et comme celui-ci utilise un très petit réseau de neurones, il peut fonctionner sur les appareils des utilisateurs et fournir des résultats en temps quasi réel. Stavros Shiaeles, un des chercheurs, indique avoir testé la technique avec de vrais sites de phishing et légitimes. 

Après avoir testé le système de détection de sites Web d’hameçonnage, l’équipe passe maintenant à l’étape suivante pour préparer l’adoption de la technique. L’équipe dit travailler sur une nouvelle méthode étendue et essayer de déposer une demande de brevet. Sur la base des résultats de départ, l’équipe est confiante quant à cette adoption. 

Ce n’est pas la première fois que la visualisation binaire et l’apprentissage automatique sont utilisés en cybersécurité. En 2019, Shiaeles, professeur de cybersécurité à l’Université de Portsmouth, figurait parmi les co-auteurs d’une autre technique utilisant le Machine Learning et la visualisation binaire pour détecter les logiciels malveillants avec des résultats prometteurs.

Pin It on Pinterest