Data science : les fondamentaux





Prix inter HT / stagiaire : 1450 €
DESCRIPTION

À l'issue de cette formation, les stagiaires seront capables d'identifier les enjeux de la Data Science et de l'IA, de schématiser le cycle d'un projet Data Science, d'appliquer les meilleures pratiques en matière de nettoyage et de préparation des données avant l'analyse, et de modéliser un problème de Data Science.

Pré-requis :
  • Bases en statistiques.
  • Langage Python.
  Télécharger le plan






DETAILS DE LA FORMATION

  •   Syllabus complet
  • Introduction à la Data Science
    Qu'est-ce que la Data Science ?
    Data Science et IA: enjeux et applications
    Outils et environnements de travail
    TP : Cas d'utilisation (discussion)

    Apprentissage automatique et Data Science
    Phases d'un projet Data Science
    Apprentissage supervisé
    Apprentissage non supervisé
    Apprentissage par renforcement
    Importance de la documentation et de la communication
    TP: Schématiser un projet Data Science en équipes

    Rappels sur le langage Python
    Introduction, installation
    Syntaxe : types, structures, fonctions, modules
    manipuler des fichiers : csv, txt, json, excel
    La programmation objet en python
    Les librairies phares
    Manipuler: NumPy, SciPy, Pandas, Matplotlib
    Python et les databases

    Nettoyage et préparation des données
    Types et qualité des données
    Techniques de nettoyage des données
    Gestion des valeurs manquantes
    Détection des doublons
    Transformation des données : normalisation, encodage
    TP: Nettoyer un jeu de données réel avec Python

    Exploration et analyse des données
    Techniques de visualisation des données
    Statistiques descriptives et inférentielles
    Identification des relations et des patterns
    TP : Explorer les données avec Pandas et Matplotlib

    Modélisation en Data Science
    Modèles statistiques et algorithmes de machine learning
    ACP : Analyse en Composantes Principales
    Régression : linéaire, multilinéaire, polynomiale
    Régression logistique
    Classification supervisée
    Arbres de décision et forêts
    KNN (K-Nearest Neighbors)
    Le K-Means clustering
    Algorithme de Support Vector Machines
    Réseaux de neurones : introduction
    TP : choix de modèles, métriques, évaluation

    Techniques de la Data Science
    Cross-validation
    Overfitting ou surapprentissage
    Biais vs variance
    Feature Engineering
    Data Visualisation
    La malédiction de la dimension
    Bonnes pratiques

    Data Science et Big Data
    Introduction à Spark
    La bibliothèque Spark MLLib
    Exemple : modéliser la régression linéaire
    Particilarités de Spark MLLib
    Aller plus loin

    Conclusion et perspectives
    Récapitulatif des compétences acquises
    Évolution de la Data Science et tendances futures
    Ressources pour approfondir les connaissances
    TP: Présentation des projets réalisés par les stagiaires

  •   Ce qui est inclus
  • + Formateur expérimenté
    + Support du cours
    + Notes de cours divers
    + Rappels

  •   Public concerné
  • + Data Analysts
    + Statisticiens
    + Développeurs

  •   Certification et évaluation
  • En cours de formation, des travaux pratiques et études de cas sont proposés. Cette formation ne propose pas encore de certification.



AVANTAGES. TEMOIGNAGES

  • Votre coach Reconvert.
  • Pédagogie orientée pratique.
  • Echanges interactifs.
  • Communautés.

La qualité est excellente, l'enseignant crée un espace de confiance et rend la formation très agréable. J'ai adoré, le professeur et son cours sont très complets. La formation a été facile à comprendre et très dynamique. Le formateur est un excellent professeur.
J. Ruiz
The Moneytizer, Mexico

La formation avec vous était géniale. C'est super intéressant et très formateur. Actuellement je suis chez Micropole, en tant que Cloud & Big Data Engineer. Merci.
A. Chuttoo
Micropole, France

Ces 4 jours ont été enrichissants. Suite à la formation HTML puis CSS, celle de Javascript m'a apporté encore plus de connaissances et de compétences sur le sujet.
J. Salgueiro
The Moneytizer, Brazil



Autres références :

Cliquez sur le logo.


Capgemini Atos Allianz TheMoneytizer CPAM M2iFormation Global Knowledge Ikea Hewlett Packard Ministère de la Défense AKKA Ministère de l'intérieur AFP Enedis Viveris Titeflex Autres




DUREE (H)



Durée : 14 heures.



PRIX. DATES. RESERVER

  •   PRESENTIEL ou CLASSE VIRTUELLE

  • Diffusée en Présentiel ou en Classe Virtuelle, cette formation peut être faite soit en :
    1- inter entreprise : avec des stagiaires de plusieurs entreprises,
    2- intra entreprise : avec des stagiaires qui sont de la même entreprise.

    Quelque soit la formule souhaitée, veuillez réservez un RDV téléphonique avec un conseiller en cliquant ci-dessous.

    Prix inter HT / stagiaire : 1450 €




Autres formations

Python par la pratique
Apprendre par la pratique à programmer en langage Python.

Django : développement web en Python
Apprendre à développer des applications web en Python avec le framework Django.

MYSQL : prise en main et langage SQL
Ecrire et tester du SQL pour les données de votre application web.

PostgreSQL
Apprendre le langage SQL à travers le serveur de bases de données PostgreSQL.

Certification Python TOSA
Se préparer en pratique à passer la certification TOSA Python3.

Scraping Web en Python
Apprendre à extraire des données depuis un site web en utilisant des modules Python.