Snowflake a annoncé que sa prochaine version prendra en charge l’exécution de code écrit en Python. Ce dernier représente le langage le plus populaire au monde. Il est également le numéro un pour le développement de modèles de machine learning.
Le support de Python est en cours d’intégration dans Snowpark. Celui-ci a été lancé en 2020 avec la prise en charge de Java et Scala pour exécuter des flux de travail avec DataFrames. Désormais, en raison d’une forte demande, Snowpark ajoute le support des DataFrames en Python.
Python intégrera nativement le moteur Snowflake
Snowflake, le spécialiste de la transmission de données via le cloud, améliore son outil de test et de développement « Snowpark » en y incorporant le langage Python. L’environnement Python de Snowflake fonctionne via Anaconda. Ce dernier gère des paquets d’outils open source souvent utilisés dans les environnements de science des données et d’analyse. Snowflake s’appuie sur le gestionnaire de paquets d’Anaconda, appelé Conda. Ainsi, il peut maintenir l’environnement.
Python à jour et bien gérer du point de vue des dépendances
Snowflake permet d’enregistrer les résultats d’une formation de machine learning sous la forme d’une fonction définie par l’utilisateur (UDF). Celle-ci peut être réinjectée dans l’entrepôt Snowflake, où elle peut être appelée via SQL. Cela fait partie du plan de Snowflake pour aider ses clients dans les cas d’utilisation analytique et d’apprentissage automatique.
Snowflake et Python : les avantages tirés de cette solution
Le rythme des innovations s’accélère grâce aux syntaxes courantes de Python. De plus, Python dispose d’un écosystème de bibliothèques open-source très riches qui permet de traiter et analyser toutes les données, où qu’elles se trouvent.
Par ailleurs, il est possible d’optimiser le temps nécessaire au développement. En fait, il n’est plus nécessaire de perdre du temps à contrôler certains environnements défaillants grâce à l’utilisation d’un gestionnaire de dépendances intégré aux paquets Python.
La suppression des copies des données non gérées permet de renforcer la sécurité et surtout la confiance. En fait, tout le code fonctionne dans une sandbox sécurisée.
- Partager l'article :