Analyse de données avec Python PANDAS
Manipulation et analyse des données avec la bibliothèque Python Pandas
Description de la Template formation courte
Description de la formation Analyse de données avec Python PANDAS
Python est un choix très populaire pour l'analyse de données en raison de sa simplicité d'apprentissage, de son écosystème de bibliothèques robustes (pandas, NumPy, Matplotlib, etc.), de sa polyvalence, de son intégration facile avec d'autres langages, de son statut open source, de sa large adoption industrielle et de sa communauté active. Ces avantages permettent aux analystes de données d'effectuer efficacement la manipulation, la visualisation et la modélisation de données, ainsi que de mettre en œuvre des techniques d'apprentissage automatique, ce qui en fait un choix incontournable dans le domaine de l'analyse de données.
Objectifs
A l'issue de cette formation, les participants seront en mesure de
Python est un choix très populaire pour l'analyse de données en raison de sa simplicité d'apprentissage, de son écosystème de bibliothèques robustes (pandas, NumPy, Matplotlib, etc.), de sa polyvalence, de son intégration facile avec d'autres langages, de son statut open source, de sa large adoption industrielle et de sa communauté active. Ces avantages permettent aux analystes de données d'effectuer efficacement la manipulation, la visualisation et la modélisation de données, ainsi que de mettre en œuvre des techniques d'apprentissage automatique, ce qui en fait un choix incontournable dans le domaine de l'analyse de données.
Objectifs
A l'issue de cette formation, les participants seront en mesure de
Programme
Présentation de l'écosystème Python scientifique
- Panorama de l’écosystème scientifique de Python : les librairies incontournables
- Savoir où trouver de nouvelles librairies et juger de leur pérennité
- Les principaux outils et logiciels open source pour la data science
- Pourquoi utiliser une distribution scientifique, Anaconda
- Comprendre l’intérêt d’un environnement virtuel et savoir l’utiliser
- L’interpréteur IPython et le serveur Jupyter
- Les bonnes pratiques pour bien démarrer votre projet de data science avec Python
- Les formats de fichiers scientifiques et les librairies pour les manipuler
Les bases de la programmation avec Python
- Principaux types de données : nombres, booléens, chaînes de caractères
- Déclaration de variable, typage dynamique, mots clés réservés
- Les opérateurs : priorité, associativité, opérateurs d’affectation, logiques, de comparaison
- Quelques fonctions utiles : print(), input(), Structures conditionnelles : if et elif, Boucle while, mots clés break et continu
- Chaînes de caractères et liste
- Définition et manipulation de chaînes de caractères
- Le type séquence
- Les listes : définition, accès à un élément
- Les références
- Les tuples
- Manipulation de listes : mot clé del, fonctions list et range; parcours d’une liste
- Les fonctions
- Mise en application / TP
Programmation Objet : rappels
- Rappels sur la programmation objet
- Les classes en Python
- Constructeurs, attributs privés, méthodes, héritage
Gestion des fichiers
- Méthodes d’accès aux fichiers : ouverture (accès en mode lecture, écriture, ajout, …), fermeture
- le mot clé with
- lecture dans un fichier
- Mise en application / TP
Les types de données complexes
- Les listes de listes
- Une liste de tuples
- Les dictionnaires
- Parcours d’un dictionnaire
- Les méthodes update(), clear(), pop(), del(), values, keys()
- Mise en application / TP
Modules et expressions régulières
- Les modules : définition, la fonction help()
- Importer des fonctions
- Créer ses propres modules
- Expressions régulières, les caractères spéciaux
- Groupes et classes de caractères
- Le module ‘re’
- Mise en application / TP
Gestion des exceptions
- Principe, exemples d’exceptions
- Mots clés try et except, else et finally
- Les assertions
Introduction à Pandas
- Pourquoi utiliser PANDAS Python ?
- Installation de Pandas
- Les principales structures de données de Python PANDAS
Utilisation de PANDAS
- Les principales structures de données de Python PANDAS
- Les séries
- Les DataFrames (Créations divers selon les types de variables Python)
- Sélection des données
- Mise en application / TP
Accès aux données d’un objet Series
- Utilisation des méthodes .loc() et .iloc()
Accès aux données d’un Dataframe
- Les opérations possibles sur un Dataframe
- Les opérations de filtrage, groupage et de concaténation
Lire les fichiers avec PANDAS
- Lire un fichier csv avec PANDAS
- Lire un fichier Excel avec PANDAS
Visualisation des données avec PANDAS
- Mise en application / TP
Bilan de fin de formation et évaluation des acquis
Le(s) formateur(s) préssenti(s)
Christophe
Expert ITChristophe G
Après bientôt 25 ans d'expertise et d'enseignement, Christophe maitrise un très large spectre de compétences front et back, Big Data ainsi qu'en termes de méthodologies agiles et gestion de projet. Christophe saura vous faire profiter de ses nombreux retours d'expérience.
Sessions et réservation
Dates | Lieu | Prix | Durée | ||
---|---|---|---|---|---|
Aucune session n'est programmée |