Accueil>Formations courtes>Analyse de données avec Python PANDAS

Analyse de données avec Python PANDAS

Manipulation et analyse des données avec la bibliothèque Python Pandas

Description de la Template formation courte

Description de la formation Analyse de données avec Python PANDAS

Python est un choix très populaire pour l'analyse de données en raison de sa simplicité d'apprentissage, de son écosystème de bibliothèques robustes (pandas, NumPy, Matplotlib, etc.), de sa polyvalence, de son intégration facile avec d'autres langages, de son statut open source, de sa large adoption industrielle et de sa communauté active. Ces avantages permettent aux analystes de données d'effectuer efficacement la manipulation, la visualisation et la modélisation de données, ainsi que de mettre en œuvre des techniques d'apprentissage automatique, ce qui en fait un choix incontournable dans le domaine de l'analyse de données.

Objectifs

A l'issue de cette formation, les participants seront en mesure de 

  • Utiliser les principaux outils de traitement et d'analyse de données pour Python
  • Extraire des données d'un fichier et les manipuler
  • Mettre en place un modèle d'apprentissage simple
  • Utiliser les mécanismes d'interconnexion aux bases de données et les principaux outils de traitement et d'analyse de données pour Python
  • 5 jours (35 heures)
  • Référence : PAND

Sessions INTER

  • A distance ou en présentiel
  • 2500 € HT

INTRA ENTREPRISE

  • Dans vos locaux ou à distance

Python est un choix très populaire pour l'analyse de données en raison de sa simplicité d'apprentissage, de son écosystème de bibliothèques robustes (pandas, NumPy, Matplotlib, etc.), de sa polyvalence, de son intégration facile avec d'autres langages, de son statut open source, de sa large adoption industrielle et de sa communauté active. Ces avantages permettent aux analystes de données d'effectuer efficacement la manipulation, la visualisation et la modélisation de données, ainsi que de mettre en œuvre des techniques d'apprentissage automatique, ce qui en fait un choix incontournable dans le domaine de l'analyse de données.

Objectifs

A l'issue de cette formation, les participants seront en mesure de 

  • Utiliser les principaux outils de traitement et d'analyse de données pour Python
  • Extraire des données d'un fichier et les manipuler
  • Mettre en place un modèle d'apprentissage simple
  • Utiliser les mécanismes d'interconnexion aux bases de données et les principaux outils de traitement et d'analyse de données pour Python

A qui s’adresse cette formation ?

Pour qui ?

Ingénieur, développeur, chercheur, data scientist, data analyst et toute personne désireuse de se former à l'univers scientifique de Python.

Prérequis

1ère expérience de la programmation - idéalement avec Python

Programme

Présentation de l'écosystème Python scientifique

  • Panorama de l’écosystème scientifique de Python : les librairies incontournables
  • Savoir où trouver de nouvelles librairies et juger de leur pérennité
  • Les principaux outils et logiciels open source pour la data science
  • Pourquoi utiliser une distribution scientifique, Anaconda
  • Comprendre l’intérêt d’un environnement virtuel et savoir l’utiliser
  • L’interpréteur IPython et le serveur Jupyter
  • Les bonnes pratiques pour bien démarrer votre projet de data science avec Python
  • Les formats de fichiers scientifiques et les librairies pour les manipuler

Les bases de la programmation avec Python

  • Principaux types de données : nombres, booléens, chaînes de caractères
  • Déclaration de variable, typage dynamique, mots clés réservés
  • Les opérateurs : priorité, associativité, opérateurs d’affectation, logiques, de comparaison
  • Quelques fonctions utiles : print(), input(), Structures conditionnelles : if et elif, Boucle while, mots clés break et continu
  • Chaînes de caractères et liste
  • Définition et manipulation de chaînes de caractères
  • Le type séquence
  • Les listes : définition, accès à un élément
  • Les références
  • Les tuples
  • Manipulation de listes : mot clé del, fonctions list et range;  parcours d’une liste
  • Les fonctions
  • Mise en application / TP

Programmation Objet : rappels

  • Rappels sur la programmation objet
  • Les classes en Python
  • Constructeurs, attributs privés, méthodes, héritage

Gestion des fichiers

  • Méthodes d’accès aux fichiers : ouverture  (accès en mode lecture, écriture, ajout, …), fermeture
  • le mot clé with
  • lecture dans un fichier
  • Mise en application / TP

Les types de données complexes

  • Les listes de listes
  • Une liste de tuples
  • Les dictionnaires
  • Parcours d’un dictionnaire
  • Les méthodes update(), clear(), pop(), del(), values, keys()
  • Mise en application / TP

Modules et expressions régulières

  • Les modules : définition, la fonction help()
  • Importer des fonctions
  • Créer ses propres modules
  • Expressions régulières, les caractères spéciaux
  • Groupes et classes de caractères
  • Le module ‘re’
  • Mise en application / TP

Gestion des exceptions

  • Principe, exemples d’exceptions
  • Mots clés try et except, else et finally
  • Les assertions

Introduction à Pandas

  • Pourquoi utiliser PANDAS Python ?
  • Installation de Pandas
  • Les principales structures de données de Python PANDAS

Utilisation de PANDAS

  • Les principales structures de données de Python PANDAS
  • Les séries
  • Les DataFrames (Créations divers selon les types de variables Python)
  • Sélection des données
  • Mise en application / TP

Accès aux données d’un objet Series

  • Utilisation des méthodes .loc() et .iloc()

Accès aux données d’un Dataframe

  • Les opérations possibles sur un Dataframe
  • Les opérations de filtrage, groupage et de concaténation

Lire les fichiers avec PANDAS

  • Lire un fichier csv avec PANDAS
  • Lire un fichier Excel avec PANDAS

Visualisation des données avec PANDAS

  • Mise en application / TP

Bilan de fin de formation et évaluation des acquis

Le(s) formateur(s) préssenti(s)

Christophe

Expert IT

Christophe G

Après bientôt 25 ans d'expertise et d'enseignement, Christophe maitrise un très large spectre de compétences front et back, Big Data ainsi qu'en termes de méthodologies agiles et gestion de projet.  Christophe saura vous faire profiter de ses nombreux retours d'expérience.

Sessions et réservation

Dates Lieu Prix Durée  
Aucune session n'est programmée

Un besoin spécifique ? contactez-nous !