Introduction à la data science
- Référence GKDSAINT
- Durée 2 jour(s)
Modalité pédagogique
Aller à:
Modalité pédagogique
La formation est disponible dans les formats suivants:
-
Classe inter à distance
Depuis n'importe quelle salle équipée d'une connexion internet, rejoignez la classe de formation délivrée en inter-entreprises.
-
Classe inter en présentiel
Formation délivrée en inter-entreprises. Cette méthode d'apprentissage permet l'interactivité entre le formateur et les participants en classe.
-
Intra-entreprise
Cette formation est délivrable en groupe privé, et adaptable selon les besoins de l’entreprise. Nous consulter.
Demander cette formation dans un format différent
Résumé
Haut de pageCette formation a pour objectif de donner une introduction précise et claire des problématiques et outils de la data science.
On définit la data science et on explique le métier du data scientist, On présentera les grandes familles de modèles qui sont utilisés en data science, leurs vocations et leurs problématiques. Ces modèles seront illustrés grâce à des business cases et des exemples concrets avec des programmes Python-Sckitlearn et IBM SPSS. Les jeux de données concerneront des domaines diverses comme le marketing, la santé et la maintenance prédictive.
Les modèles et algorithmes présentés dans ce cours seront développés dans des cours spécifiques du cursus Data Scientist de Global Knowledge.
Prochaines dates
Haut de pagePublic
Haut de pageObjectifs de la formation
Haut de pageA l'issue de la formation, les participants seront capables de :
- Identifier à la fois les problématiques et les outils de la data science
- Identifier les grandes familles de modèles utilisés en data science
Programme détaillé
Haut de pageINTRODUCTION A LA DATA SCIENCE
- Définition, historique et enjeux
- Domaines d’application et problématiques de la Data Science
- Environnement Big Data pour la Data Science
- Métier de la data science : journée type du data scientist
- Les acteurs et les outils du marché pour la data science
COMPETENCES TECHNIQUES POUR LA DATA SCIENCE
Extraction manipulation des données
Exploration et visualisation des données
- Objectif et démarche
- Exemple pratique
La modélisation
- Objectif et démarche
- Les grandes familles de modèles et leurs domaines d’application :
- Classifications supervisée et non supervisée et système de recommandations
- Modèles mathématique statistiques
- Machine learning et modèles cognitifs
- Exemples pratiques
Modèles de classification supervisée :
- Domaine d’application
- Programmes et langages pour les modèles
- Introduction à quelques modèles :
- Principe du modèle de la régression
- Principe du modèle des Réseaux bayésiens
- Principe du modèle d’Arbre de décision et Randon Forest
- Exemples pratiques avec Python Scikitlearn et IBM SPSS
Modèle de classification non supervisée :
- Domaine d’application
- Programmes et langages pour les modèles
- Introduction à quelques modèles : Principe du modèle K-means, Principe du modèle de Réseaux de neurones
- Exemples pratiques avec Python Scikitlearn et IBM SPSS
Modèles de recommandation et analyse d’association :
- Domaine d’application
- Programmes et langages pour les modèles
- Introduction à quelques modèles : Principe du filtrage par le contenu, Principe du filtrage Collaboratif
- Exemples pratiques avec Python Scikitlearn et IBM SPSS
Pré-requis
Haut de pageAucun
Et après
Haut de pageBon à savoir
Haut de pageSupport de cours en français remis aux participants