Public

Toute personne souhaitant utiliser Python pour manipuler, analyser et présenter des données.

Prérequis

Avoir suivi la formation Python « Les fondamentaux du développement en Python » ou avoir un niveau équivalent.

Objectifs de la formation

A l’issue de la formation les stagiaires seront capables de :

  • Maîtriser les principales librairies de la Data Science
  • Manipuler et analyser des données avec Python
  • Construire des graphiques avancés et analyser des données de manière approfondie

Introduction aux outils et environnements data science

Présentation de l’environnement anaconda : jupyter notebook.
Introduction à jupyter notebook : fonctionnement, documentation, widgets, affichage de dataframes.
Atelier : installation et prise en main de jupyter notebook.

Manipulation et analyse de données avec numpy

Présentation de numpy et ses avantages.
Manipulation des tableaux ndarray : slicing, agrégation, fusion, filtrage.
Calculs mathématiques et statistiques (moyenne, variance, résolution d’équations).
Atelier : importation et manipulation de données avec numpy.

Exploitation des données avec pandas

Création et manipulation de dataframes.
Indexation et sélection de données (loc(), iloc()).
Gestion des données manquantes et nettoyage des données.
Fusion et pivotement des dataframes.
Atelier : chargement, nettoyage et manipulation de données tabulaires.

Intégration de données

Lecture et écriture de fichiers excel, csv, json.
Connexion à une base de données sql (lecture et requêtage).
Connexion à une api pour récupérer des données.
Atelier : extraction et transformation de données sql et api avec pandas.

Visualisation de données avec matplotlib et seaborn

Création de courbes, histogrammes, diagrammes en secteurs et nuages de points.
Mise en forme et personnalisation des graphiques.
Introduction à seaborn pour des visualisations avancées : relations (scatterplot, lineplot), distribution (histplot, kdeplot). Visualisation de corrélations et régressions (heatmap, regplot).
Atelier : analyse et visualisation de données en Matplotlib et seaborn.

Introduction à scipy pour l’analyse scientifique

Interpolation et calcul matriciel.
Statistiques avancées : régression linéaire, comparaison de populations.
Atelier : analyse de données financières avec scipy.

Récapitulatif et projet final

Synthèse des compétences acquises.
Mini-projet

L'évaluation des acquis est évaluée à travers des QCM à la fin de chaque chapitre et un projet pratique de synthèse.

Méthodes et moyens
Méthodologie basée sur l’Active Learning, exposés théoriques, étude de cas concrets, quiz et exercices.

Equipe pédagogique
Animation

M. Ismail BENNIS, Maitre des conférences à l’Université de Haute Alsace.

Organisation

Inscription : possible jusqu'à 3 jours avant le démarrage de la session.

Durée : 2 jours

Frais de formation

660€

Date limite de dépôt des dossiers
Plaquette
Taux satisfaction clients : *
Taux de réussite : *
Taux d'insertion : *

(*) :

Introduction aux outils et environnements data science

Présentation de l’environnement anaconda : jupyter notebook.
Introduction à jupyter notebook : fonctionnement, documentation, widgets, affichage de dataframes.
Atelier : installation et prise en main de jupyter notebook.

Manipulation et analyse de données avec numpy

Présentation de numpy et ses avantages.
Manipulation des tableaux ndarray : slicing, agrégation, fusion, filtrage.
Calculs mathématiques et statistiques (moyenne, variance, résolution d’équations).
Atelier : importation et manipulation de données avec numpy.

Exploitation des données avec pandas

Création et manipulation de dataframes.
Indexation et sélection de données (loc(), iloc()).
Gestion des données manquantes et nettoyage des données.
Fusion et pivotement des dataframes.
Atelier : chargement, nettoyage et manipulation de données tabulaires.

Intégration de données

Lecture et écriture de fichiers excel, csv, json.
Connexion à une base de données sql (lecture et requêtage).
Connexion à une api pour récupérer des données.
Atelier : extraction et transformation de données sql et api avec pandas.

Visualisation de données avec matplotlib et seaborn

Création de courbes, histogrammes, diagrammes en secteurs et nuages de points.
Mise en forme et personnalisation des graphiques.
Introduction à seaborn pour des visualisations avancées : relations (scatterplot, lineplot), distribution (histplot, kdeplot). Visualisation de corrélations et régressions (heatmap, regplot).
Atelier : analyse et visualisation de données en Matplotlib et seaborn.

Introduction à scipy pour l’analyse scientifique

Interpolation et calcul matriciel.
Statistiques avancées : régression linéaire, comparaison de populations.
Atelier : analyse de données financières avec scipy.

Récapitulatif et projet final

Synthèse des compétences acquises.
Mini-projet

L'évaluation des acquis est évaluée à travers des QCM à la fin de chaque chapitre et un projet pratique de synthèse.

Méthodes et moyens
Méthodologie basée sur l’Active Learning, exposés théoriques, étude de cas concrets, quiz et exercices.

Equipe pédagogique
Animation

M. Ismail BENNIS, Maitre des conférences à l’Université de Haute Alsace.


Organisation

Inscription : possible jusqu'à 3 jours avant le démarrage de la session.

Durée : 2 jours

Tarif

660€

Date limite de dépôt des dossiers
Plaquette
Satisfaction clients

 

Contact : 

  • Stéphanie RICHARD | 03.89.33.65.00 | stephanie.richard@uha.fr
 

 Téléphone : 

 

 E-Mail : 

 

 Contact : 

Téléphone : 

E-Mail :