L’antivirus Avast utilise le big data pour améliorer la protection

La sécurité informatique est devenue un enjeu pour les internautes. Depuis plusieurs années, Avast œuvre dans la protection des ordinateurs

à travers le monde. Consciente de l’évolution constante des malwares, la société a décidé d’exploiter le Big data.

Comment fonctionnent les malwares ?

Pour comprendre la stratégie adoptée par Avast, il est essentiel de connaître au premier abord le mode de fonctionnement des malwares.

Lors des lancements des modifications automatiques sur un PC, les virus profitent de l’occasion pour s’y infiltrer. Cela se produit souvent durant les processus de mise à jour d’un logiciel ou la mise à niveau d’un système d’exploitation.

Il est même réalisable de citer les redéploiements. De ce fait, il est incontournable de disposer d’un

outil apte à se souvenir de toutes les infections rencontrées auprès des 400 millions d’usagers. Il sera alors plus aisé de détecter un bout de code jugé périlleux pour l’intégralité du système informatique. L’instrument capable de réaliser une telle prouesse reste la machine learning. En pratique, ce dernier nourrira la base de données grâce aux informations recueillies auprès de tous les ordinateurs connectés. De plus, il évoluera en fonction du contexte. Pour augmenter l’efficacité de l’instrument d’apprentissage automatique, il est nécessaire de passer par le big data. En effet, une énorme quantité de renseignement y sera stockée pour lutter de manière efficiente contre les malwares.

 

Comment se caractérise le Big data d’Avast ?

Le big data est caractérisé par 5 aspects disparates. Puisque l’on parle de méga données, la notion de volume est inséparable du pilier. Les quatre autres fondements du big data sont la vitesse, la variété, la variabilité et la véracité. Leur ensemble constitue les 5V.

Le big data et le volume

Les utilisateurs du logiciel de sécurité effectuent régulièrement des analyses sur leurs ordinateurs. Puis, les programmes scannés sont transmis auprès du Big data. Le système classifie alors les fichiers reçus en fiable ou potentiellement dangereux. Cette tâche est facile à réaliser puisque le machine learning compare chaque code dans sa base. Si un code était rencontré pour la première fois, l’apprentissage automatique prendrait la décision la mieux éclairée à son encontre.

La vitesse

Dès que les Malwares infectent un PC, ils se répandent à grande vitesse sur d’autres programmes exécutables ou même certains documents. Une réaction rapide s’avère une nécessité grâce à un système qui fonctionne de manière automatique. Dans le cas contraire, l’antivirus semblerait inefficace. La raison est que certains types de virus parviennent à se muter avant une éventuelle découverte.

La variété

La machine learning doit réagir de façon intelligente. L’objectif paraît irréalisable tant que les analyses effectuées ne sont pas variées. Concrètement, plus il détecte les données virales, plus il offrira une protection optimale.

Variabilité

Les fichiers réceptionnés auprès des propriétaires de PC du monde sont catégorisés selon le risque qu’ils représentent. Au fil du temps, un code jugé mauvais lors de sa première détection peut devenir fiable ou l’inverse. Depuis plusieurs années, les usagers d’Avast sont confrontés à des problématiques de faux positivités ou faux négativités. Un programme que vous ouvrez quotidiennement est souvent classé comme étant un virus après un scan préalable. Il sera alors inaccessible. Pourtant, après avoir consulté l’élément, il s’agit d’un logiciel indésirable. Quoi qu’il en soit, l’objectif de la société est de réduire à 0 le taux de mauvais diagnostique.

La véracité

Après diverses études, les ordinateurs ont du mal à discerner les formes de menace lorsque les données sont envoyées sous la forme brute. Auparavant, quand l’internaute télécharge un fichier, une erreur peut survenir. Pourtant, Avast continue d’analyser l’élément malgré le fait qu’il soit endommagé. Depuis l’instauration du Big data, le système est en mesure de percevoir la différence entre défaillances de matériel ou encore l’erreur de calcul.