Travailler avec des données dites "Big Data" peut être un défi de taille et de nombreux outils qui résolvent ce problème ont une courbe d'apprentissage très raide.
De plus, les développeurs familiers de Python peuvent ne pas vouloir recourir à des solutions construites sur une autre pile technologique. Dans ce cours vous acquerrez la capacité de travailler avec de très grands ensembles de données en utilisant un outil natif de Python et accessible.
Tout d'abord, vous apprendrez à utiliser Dask lorsque votre application écrite en Python standard cesse de fonctionner en raison de la taille croissante des données.
Ensuite, vous découvrirez comment Dask fonctionne en dessous et quelles techniques il utilise pour rendre possible et accessible le traitement de grands ensembles de données dans divers scénarios.
Enfin, vous explorerez comment échanger Pandas et NumPy pour leurs variantes Big Data, sans pratiquement aucune modification du code.
À l'issue de ce cours, vous disposerez des compétences et des connaissances de Dask nécessaires pour écrire en toute confiance des applications de données à l'échelle, en utilisant exclusivement la stack Python.
LES ÉLÉMENTS CONSTITUTIFS DE L'INFORMATIQUE ÉVOLUTIVE
- Qu'est-ce que l'informatique évolutive ?
- Présentation de Dask