Dans le cadre de notre dossier « Data Insights: À la découverte des experts de la science des données », Ayoub OUBIBI (Consultant/Data Engineer chez AXA Group Operations) a accepté de faire un point sur l’année écoulée et sur les grands enjeux du secteur de la data.
lebigdata.fr : Pouvez-vous vous présenter à nos lecteurs ?
Ayoub OUBIBI (AXA Group Operations) : Bonjour, je suis Ayoub OUBIBI, Consultant spécialisé en data engineering et cloud, actuellement en mission chez AXA Group Operations sur des sujets de qualité des services en utilisant des technologies Azure et Power Platform. Je suis aussi formateur en Data et Intelligence Artificielle et j’interviens sur des sujets de recherche en relation avec la Data et l’IA en préparant des articles scientifiques et en présentant des communications sur ces sujets.
Quelles sont les tendances émergentes dans le domaine de l’analyse des données en 2023, et comment ces tendances transforment-elles les stratégies et les opérations des entreprises ?
Les tendances actuelles dans le domaine de l’analyse de données sont le résultat ou la continuité des changements et d’évolutions que ce domaine connait depuis une dizaine d’années, et aussi le résultat de l’avancement scientifique et technologique dans ce domaine.
En prenant une vue macro sur les tendances actuelles, nous pouvons constater deux caractéristiques majeures : La première, c’est la simplification des taches et des flux de travail avec les nouvelles solutions et technologies d’analyse et d’ingénierie de données, nous pouvons dire que la tendance des éditeurs de solutions est de créer des outils capables de réaliser les traitements nécessaires avec plus de performance, de qualité et d’efficacité et moins de cout, d’effort et de durée de travail. Les éditeurs logiciels cherchent spécialement à ce que les non-développeurs puissent aussi être capables d’analyser ses données et démocratiser l’accès à toutes les fonctionnalités d’analyse et de traitement de données.
Le deuxième point, c’est la diversification des solutions et outils proposés, en notant que les grands éditeurs de technologies Data comme Microsoft, Google, Amazon ou autres proposent de plus en plus de solutions dans le cadre de diversification et de restructuration de leurs produits, ainsi que des nouvelles entreprises qui proposent des technologies et qui peuvent concurrencer les outils traditionnels et permettre plus de choix et d’options d’analyse de données.
Comment les technologies émergentes, telles que l’intelligence artificielle (IA) et l’apprentissage automatique (machine learning), ont-elles un impact sur les capacités d’analyse des données et les possibilités d’innovation ?
Comme tout le monde peut le constater, l’Intelligence Artificielle à impacter un grand nombre de domaines et d’activités, et l’analyse de données est aussi l’un de ces domaines. La plupart des solutions actuelles de traitement et d’analyse de données proposent des fonctionnalités ou prévoient des extensions dans des versions Beta afin d’utiliser des traitements basés sur l’IA à travers des algorithmes intégrés, comme la détection des anomalies dans les données, la capacité d’intégrer des codes de Machine Learning pour faire des prévisions ou autres utilisations qui peuvent s’avérer intéressantes en analysant les données.
Il faut distinguer ici entre deux modes d’utilisation de l’IA : la première, c’est l’utilisation des algorithmes de l’IA pour créer des nouvelles fonctionnalités à intégrer dans les solutions d’analyse de données, et la deuxième, c’est offrir un espace aux développeurs et utilisateurs des technologies d’analyse de données afin d’intégrer leurs algorithmes et être capable de fusionner entre le traitement et l’analyse de données d’un côté, et l’Intelligence artificielle et le Machine Learning d’un autre côté dans la même solution.
Quels conseils donneriez-vous aux entreprises qui souhaitent exploiter pleinement le potentiel de leurs données et tirer parti de l’analyse des données pour prendre des décisions stratégiques informées ?
La mise en place d’un projet de traitement et d’analyse de données passent par plusieurs étapes, et dans chaque étape, il est nécessaire de respecter certaines règles afin de réussir ce projet, et donc de pouvoir exploiter et profiter du capital de données que l’entreprise possède.
L’étape la plus importante dans ce projet est la partie de détection des besoins, car dans cette étape, il faut connaitre ce qu’on possède comme données, comment sont-elles stockées, quelle est la fréquence d’actualisation de ces données, et pleins d’autres questions auxquelles il faut répondre avec efficacité, car cela sera la base des choix techniques et managériaux sur le reste du projet, comme le choix de la solution, la durée du projet, les ressources nécessaires, etc.
Il ne faut pas oublier que pour garantir la réussite d’un tel projet, il faut impérativement mettre en place une feuille de route sur la qualité de données et s’assurer de garantir la performance et l’efficacité tout au long du projet.
Quels sont les principaux défis auxquels sont confrontées les entreprises en matière de gestion et d’analyse des données, et quelles sont les meilleures pratiques pour les surmonter ?
Les entreprises font toujours face à une croissance exponentielle du volume de données et à une diversification de sources et de formats de stockage, et cela présente un vrai challenge pour ces entreprises qui essaient d’intégrer de nouvelles solutions pour une gestion quotidienne efficace de ses activités. Lors du choix de la solution d’analyse et de traitement de données, il faut avoir une vue stratégique sur toutes les solutions présentes dans l’écosystème de l’entreprise, les différentes sources de données et leurs modes de stockages, et prendre cela en considération pour favoriser les solutions de stockage, de traitement et d’analyse de données capable de s’intégrer facilement dans cet écosystème technique et permettre une meilleure interopérabilité.
Il est aussi nécessaire de désigner les consignes à mettre en place pour les différentes sources externes de données, afin de garantir aussi la capacité d’interagir et d’accueillir ces données, tout en gardant la qualité et l’intégrité de données et la sécurité des systèmes de l’entreprise.
Quels sont les avantages et les limites des différentes plateformes et outils d’analyse des données, tels que les entrepôts de données, les data lakes ou les outils de visualisation des données ?
Chaque mode de stockage, et chaque outil d’analyse ou de traitement ou de visualisation de données à ces avantages et ces inconvénients, selon le contexte du projet, l’environnement technique de l’entreprise ou l’activité de l’entreprise.
En prenant le cas des entrepôts de données (Datawarehouses) vis-à-vis des datalakes, nous pouvons dire que les entrepôts de données permettent de garder une certaine structuration de données et donc garantir jusqu’un certain degré la qualité des données stockées à travers des règles qu’on peut définir sur les tables et sur les données alimentées. Pour les datalakes les choses sont différentes quand il s’agit d’un moyen de stockage plus ouvert aux différents formats, et donc plus tolérant à des types de données diversifiés, ce qui peut être un avantage dans certains projets, mais pas pour d’autres, d’où l’intérêt de bien comprendre le besoin du projet et de l’activité à couvrir, bien cerner les données nécessaires pour le projet Data à mettre en place et de bien définir les règles de récupération, de traitement et de chargement de données afin de faire le bon choix lors de la désignation de la solution technique à adopter.
Quels sont les nouveaux rôles et compétences nécessaires pour réussir dans le domaine de l’analyse des données en 2023, et comment les professionnels de l’analyse se préparent-ils à ces évolutions ?
Comme j’ai indiqué avant, les fournisseurs de solutions d’analyse de données essaient de simplifier les tâches de traitement et d’analyse afin de permettre à des profils non techniques de pouvoir interagir avec les données et de rendre les tâches plus simples et plus performantes.
Les compétences analytiques certes restent toujours les mêmes pour chaque secteur, et le principe est le même : il faut être capable de comprendre le métier pour lequel nous voulons mettre en place la solution d’analyse de données et être en mesure de savoir le poids de chaque donnée afin de réussir la conception et la modélisation.
Dans le volet technique, il est primordial de pouvoir rester à jour par rapport à l’évolution des technologies, et pouvoir apprendre de nouvelles compétences régulièrement afin de pouvoir les proposer aux entreprises et être en mesure de les mettre en place, et cela se fait à travers des formations, des certifications, la participation à des conférences et des événements présentés par les éditeurs de solutions, et aussi en établissant une veille technologique sur le domaine afin de pouvoir suivre l’avancement du domaine et avoir la nouveauté à chaque fois que des nouvelles solutions sont proposées.
Propos recueillis par Mathilde Flory
- Partager l'article :