Analyse de données massives avec Spark [en ligne]

Actions et panneau des détails

Fin des ventes

Informations sur l'événement

Partager cet événement

Date et heure

Endroit

Endroit

Événement en ligne

Politique de remboursement

Politique de remboursement

Pas de remboursement

Description de l'événement
Pour analyser efficacement une importante quantité de données, apprenez à utiliser Apache Spark avec Python.

À propos de cet événement

Apache Spark est l’un des logiciels libres les plus importants pour le traitement et l’analyse des données massives. Durant cet atelier, nous vous enseignerons l’utilisation d’Apache Spark avec Python (PySpark) pour analyser des jeux de données trop volumineux pour être traités par un seul ordinateur.

Avec PySpark, vous apprendrez à importer vos données, à utiliser les fonctions pour transformer, réduire et compiler vos données, et à produire des algorithmes parallèles pouvant s’exécuter sur des grappes de calcul telles que celles offertes par Calcul Québec et Calcul Canada.

Inscription

  • Participant académique : 10$
  • Participant non-académique : 200$

Prérequis

Avoir une connaissance de base de la ligne de commande Unix et Python. Référez-vous aux formations: Ligne de commande Unix [UNX101] et Python [PYT101]

Plan de cours

9h à 12h

  • 1. Introduction aux données massives et à Map-Reduce;
  • 2. Presentation d’Apache Spark;
  • 3. Importation de données avec PySpark;
  • 4. Organisation des données en clé-valeur;
  • 5. Travailler avec des données structurées (PySpark SQL);
  • 6. Développement d’algorithmes parallèles.

13h30 à 15h (Discord)

  • Période de questions
  • Exercices et aide supplémentaire

Formateur

Lucas Nogueira, analyste en calcul informatique de pointe à Calcul Québec.

Langue du cours

Français

Prérequis techniques

Nous utiliserons Zoom comme plateforme. Comme il s'agit d'un atelier pratique, il est utile d'avoir deux écrans afin de pouvoir afficher l'écran de l'instructeur d'un côté et votre propre écran de l'autre.

Nous utiliserons aussi l'interface Jupyter Lab. Assurez-vous d'avoir un navigateur Web moderne tel que Google Chrome, Firefox, Edge ou Safari.

Contact

Pour toutes questions, écrivez-nous à formation@calculquebec.ca.

Partager avec des amis

Date et heure

Endroit

Événement en ligne

Politique de remboursement

Pas de remboursement

Sauvegarder cet événement

Événement sauvegardé