Hadoop – Cloudera pour architectes et administrateurs
Version du programme : 1
Type de formation
Formation mixteDurée de formation
21 heures (3 jours)Accessibilité
OuiHadoop – Cloudera pour architectes et administrateurs
Cette formation Cloudera qui propose sa propre distribution d'Hadoop vous permettra de traiter en temps réel de très gros volumes de données.
Objectifs de la formation
- Apprendre à installer et configurer Hadoop Cloudera
- Comprendre comment gérer en permanence et maintenir des noeuds dans le cluster
- Être capable d'optimiser la performance d'un cluster
- Comprendre comment mettre en place une haute solution de disponibilité
- Connaître les meilleures pratiques pour déployer un cluster Hadoop Cloudera
Profil des bénéficiaires
- Architecte Big Data
- Avoir des notions de référentiels de gestion de SI d’entreprise et avoir des bases sur la connaissance des principes d’urbanisation d’un système d’information et les approches de gestion de projet, les architectures orientées services (SOA), l’analyse des besoins métiers et la MOA.
Contenu de la formation
INTRODUCTION
- Présentation générale d'Hadoop
- Exemples d'utilisation dans différents secteurs
- Historique et chiffres clés : Quand parle-t-on de Big Data ?
- Les possibilités d'implantation de l'infrastructure et les coûts associés
L'ÉCOSYSTÈME D'HADOOP
- Le système de fichier HDFS
- Le paradigme MapReduce et l'utilisation à travers YARN
- Le garant des informations : Zookeeper
- Le système de stockage de la donnée basé sur le socle : HBase
- La présentation de l'architecture globale : où installer les services ?
- La définition du dimensionnement pour un cluster Hadoop
- Les particularités de MapR
INSTALLATION DU SOCLE D'HADOOP
- Installation et configuration manuelle pas-à-pas sur plusieurs machines de : HDFS, YARN, Zookeeper, HBase
MANIPULATION DES DONNÉES DANS UN CLUSTER HADOOP
- Architecture, Objectif et fonctionnement de : Hue, Hive, Pig, Oozie, Sqoop, Flume, Spark
- Mise en pratique sur les différents outils
EXPLOITATION D'ARCHITECTURE COMPLEXE
- Architecture en rack : les avantages et fonctionnement et paramétrage du rack awareness
- Scalabilité et performances : le Namenode Federation
- High Availability des serveurs maitres
- Utilisation des snapshots : sauvegarde et restauration
Équipe pédagogique
Suivi de l'exécution et évaluation des résultats
- En amont de la formation : entretien permettant l’analyse des besoins des participants et/ou questionnaire de positionnement
- L’évaluation des compétences est réalisée : - Par des exercices pratiques et/ou mises en situation, tout au long de la formation - Par un exercice de synthèse et/ou un questionnaire d’auto-évaluation et/ou une certification, en fin de formation
- Feuille de présence émargée par demi-journée par les stagiaires et le formateur
- Formulaires d'évaluation de la formation à chaud et à froid (3mois après la session)
- Certificat de réalisation
- Attestation de fin de formation avec relevé des compétences acquises.
- DANS LE CAS DE FORMATIONS A DISTANCE Il est nécessaire que le stagiaire : - Possède un PC ou un Mac, avec le logiciel installé dans la bonne version - Une connexion internet stable d’au moins 8Mo/s - Un navigateur Web récent - Zoom ou Teams devra être installé (accompagnement possible)
Ressources techniques et pédagogiques
- Exposés, aides visuelles, support de cours, exercices pratiques d’utilisation
- Questions/réponses entre les stagiaires et le formateur
- En présentiel : ordinateurs Mac ou PC, connexion internet, tableau blanc/paperboard, vidéoprojecteur, partage de documents
- A distance : logiciel de visio-conférence, partage d’écran formateur et stagiaire, partage de documents
Capacité d'accueil
Délai d'accès
Accessibilité
Les personnes atteintes de handicap souhaitant suivre cette formation sont invitées à nous contacter directement, afin d’étudier ensemble les possibilités de suivre la formation. Délai d'accès : Les inscriptions doivent être réalisées une semaine avant le début de la formation. La formation peut être suivie : - En inter-entreprises : 2 à 6 personnes. Session maintenue si 2 personnes confirmées. - En intra-entreprise : 1 à 8 personnes - Individuellement : planifiée selon les disponibilités de chacun Horaires et rythmes : - En présentiel : 9h à 17h, journées consécutives ou non - A distance : sessions de 2h sur lundi 9h au samedi 12h Lieu de formation : - Sur site client - A distance