From Data to Insights with GCP

Obtenez des informations via l'analyse et la visualisation de données grâce à Google Cloud Platform

Traitez des pétaoctets de données en quelques secondes

Vous voulez faire des requêtes et traiter des pétaoctets de données en quelques secondes? Vous voulez savoir comment adapter automatiquement l'analyse de vos données à leur volume ? Alors la formation Data Insights est faite pour vous !

Ce cours d'une durée de deux jours, animé par un de nos formateurs certifiés Google Cloud Platform, indique comment obtenir des informations via l'analyse et la visualisation de données grâce à Google Cloud Platform. Le cours propose des scénarios interactifs et des ateliers pratiques où les participants explorent, chargent, visualisent et extraient des informations de divers jeux de données Google BigQuery. Le cours couvre le chargement des données, le requêtage, la modélisation des schémas, l'optimisation des performances, la tarification des requêtes et la visualisation des données.

  • Obtenir des informations pertinentes à partir de données à l'aide des outils d'analyse et de visualisation de Google Cloud Platform
  • Requêter interactivement des jeux de données à l'aide de Google BigQuery
  • Charger, nettoyer et transformer des données à grande échelle
  • Distinguer entre l'analyse exploratoire et explicative, et quand utiliser chaque approche
  • Explorer de nouveaux ensembles de données et obtenir rapidement et efficacement des informations cachées
  • Optimiser des modèles de données et des requêtes par rapport aux coûts et à la performance

Prix: 1490€ HT
Modalité: Inter en présentiel (demander une formation en intra-entreprise)

Prochaines dates:

Pas de formation prévue pour le moment !

SFEIR Paris

48 Rue Jacques Dulud
92200 Neuilly-sur-Seine

Programme de la formation

Module 1

Introduction à la Data sur Google Cloud Platform

  • Avant et maintenant: analyse de données scalable dans le cloud
  • Mettre en évidence les défis analytiques rencontrés par les analystes de données
  • Comparer Big Data On-Premises et sur le cloud
  • Apprendre de cas clients réels ayant effectué l'analyse de données sur le cloud
Module 2

Présentation des outils Big Data

Maîtriser la boîte à outils du Data Analyst :
  • Tâches du Data Analyst, défis et introduction aux outils Data de Google Cloud Platform
  • Démonstration : analyse de 10 milliards d'enregistrements avec Google BigQuery
  • Exploration de 9 fonctionnalités fondamentales Google BigQuery
  • Comparaison des outils GCP pour Analysts, Data Scientists et Data Engineers
  • Lab : Exploration de jeux de données avec Google BigQuery
Module 3

Explorer les données avec SQL

Se familiariser avec Google BigQuery et apprendre les meilleures pratiques :
  • Comparer les techniques d'exploration de données fréquentes
  • Apprendre à coder en SQL standard de haute qualité
  • Exploration de de jeux de données publics avec Google BigQuery
  • Aperçu de la visualisation : Google Data Studio
  • Lab : Résoudre les erreurs SQL courantes
Module 4

Tarification de Google BigQuery

Calculer les coûts de stockage et de requêtage de Google BigQuery :
  • Guide pas à pas d'un job BigQuery
  • Calculer les prix BigQuery : coûts de stockage, de requêtage et de streaming
  • Optimiser les requêtes par rapport aux coûts
  • Aperçu de la visualisation : Google Data Studio
  • Lab : Calculer les prix Google BigQuery
Module 5

Nettoyer et transformer ses données

Faire de données brutes un ensemble de données propre et enrichi :
  • Étude des 5 principes de l'intégrité des ensembles de données
  • Définir la forme de l'ensemble de données
  • Nettoyer et transformer les données en utilisant SQL
  • Nettoyer et transformer les données à l'aide d'une nouvelle interface utilisateur : Cloud Dataprep
  • Lab : Explorer et mettre en forme des données avec Cloud Dataprep
Module 6

Stockage et exportation de données

Créer de nouvelles tables et exporter les résultats :
  • Comparer les tables permanentes et temporaires
  • Enregistrer et exporter les résultats de la requête
  • Aperçu des performances : Cache de requête
  • Lab : Création de nouvelles tables permanentes
Module 7

Intégrer de nouveaux jeux de données dans Google BigQuery

Mettre ses données dans le Cloud :
  • Requête provenant de sources de données externes
  • Éviter les écueils de l'ajout de données
  • Ajouter de nouvelles données dans des tables permanentes
  • Aperçu des performances : Cache de requête
  • Lab : Insérer et requêter de nouveaux ensembles de données
Module 8

Visualisation de données

Explorer et interpréter efficacement ses données grâce à la visualisation :
  • Vue d'ensemble des principes de visualisation des données
  • Approches d'analyse exploratoire ou explicative
  • Démonstration: interface utilisateur de Google Data Studio
  • Connecter Google Data Studio à Google BigQuery
  • Lab : Exploration d'un jeu de données dans Google Data Studio
Module 9

Joindre et fusionner des ensembles de données

Combiner et enrichir ses ensemble de données :
  • Fusionner des tables de données historiques avec UNION
  • Introduire des caractères génériques de table pour les opérations de fusion facile
  • Démonstration: interface utilisateur de Google Data Studio
  • Connecter Google Data Studio à Google BigQuery
  • Lab : Exploration d'un jeu de données dans Google Data Studio
Module 10

Fonctions avancées et clauses

Écrire des requêtes avancées avec Google BigQuery :
  • Les requêtes conditionnelles SQL
  • Les fonctions analytiques et de fenêtrage
  • Protection des données avec le cryptage de champs à sens unique
  • Les sous-requêtes efficaces et la conception de Common Table Expression (CTE)
  • Comparaison entre SQL et fonctions Javascript définies par l'utilisateur
  • Lab : obtenir des informations pertinentes avec fonctions SQL avancées
Module 11

Conception de schémas et structures de données imbriquées

Modéliser ses ensembles de données à grande échelle dans Google BigQuery :
  • Comparaison entre Google BigQuery et les systèmes de gestion de base de données relationnels
  • Normalisation ou dénormalisation : le compromis de performance
  • Tableaux et données imbriquées dans Google BigQuery
  • Lab : requêtage de données imbriquées et répétées
Module 12

Plus de visualisations avec Google Data Studio

Créer des tableaux de bord parfaits au pixel près :
  • Créer des expressions conditionnelles et des champs calculés
  • Éviter les pièges impactant la performance avec la mise en cache
  • Partager des tableaux de bord et problématiques d'accès aux données
Module 13

Optimiser les performances

Dépanner et résoudre les problèmes de performance des requêtes :
  • Éviter les pièges impactant la performance de Google BigQuery
  • Empêcher les hotspots dans ses données
  • Diagnostiquer les problèmes de performances avec le plan Query Explanation
  • Lab : Optimisation et amélioration de la performance des requêtes
Module 14

Utilisations avancées

Penser, analyser et partager ses analyses comme un Data Scientist :
  • Présentation de Cloud Datalab
  • Le notebook de Cloud Datalab et ses cellules
  • Avantages de Cloud Datalab
Module 15

Accès aux données

L'impératif de la sécurité des données dans le Cloud :
  • Comparaison entre IAM et les rôles dans les ensembles de données BigQuery
  • Éviter les problèmes d'accès
  • Passage en revue des membres, rôles, organisations, de l'administration de compte et des comptes de service

Formations suivantes

Google Cloud Fundamentals: Core Infrastructure (GCP100A)

1 jour

Google Cloud Fundamentals: Big Data et Machine Learning (GCP100B)

1 jour

Architecture sur Google Cloud Platform : Infrastructure (GCP200A)

3 jours

Nous contacter

Paris

48 Rue Jacques Dulud

92200 Neuilly-sur-Seine

+33 1 41 38 52 00

Lille

Bâtiment le Canal, 2 Rue Hegel

59160 Lille

+33 3 66 72 61 32

Strasbourg

Crystal Park, 1 Avenue de l'Europe

67300 Schiltigheim

+33 3 88 47 04 38

Luxembourg

2, rue Drosbach

L-3372 Leudelange, Luxembourg

+352 26 54 47 1

Bordeaux

c/o Mama Works, 51 quai Lawton

33300 Bordeaux

Nantes

Zero Newton, 3 Rue Albert Camus

44000 Nantes

+33 2 55 59 07 00

© SFEIR 2018