Apache Mahout - Analyse des données
Formation créée le 16/03/2021. Dernière mise à jour le 26/03/2024.
Version du programme : 1
Programme de la formation
Cette formation vous permettra d'apprendre le fonctionnement et l'utilisation d'Apache Mahout qui est un projet open source d'Apache Sfotware Foundation (A.S.F).
Objectifs de la formation
- Comprendre le fonctionnement de Mahout et ses différentes fonctionnalités
- Savoir implémenter des algorithmes de Machine Learning en local ou en environnement distribué
- Maîtriser son installation sur une ferme SPARK
Profil des bénéficiaires
- Data Analyst, Data Scientists ou développeurs ayant une appétence pour le Machine Learning.
- Une connaissance de Python, R, Scala ou SQL, est préférable.
Contenu de la formation
-
INTRODUCTION
- Présentation Apache Mahout
- Apache Mahout, son écosystème
- Les fonctionnalités d'Apache Mahout
- Les différents arbres : Décision, régression, régression automatique Les différents arbres : Décision, régression, régression automatique
- Scoring
-
L'ARCHITECTURE
- Fonctionnement d'Apache Mahout
- A savoir sur les données : Sources, formats etc...
- Travaux pratiques sur les recommandations, traitement et filtrage
-
MISE EN OEUVRE
- Installation de façon autonome
- Exemples
- Les algorithmes les plus utilisés
- Utilisation avec Hadoop Yarn | SPARK etc..
- Installation sur une ferme SPARK
Les experts qui animent la formation sont des spécialistes des matières abordées. Ils ont été validés par nos équipes pédagogiques tant sur le plan des connaissances métiers que sur celui de la pédagogie, et ce pour chaque cours qu’ils enseignent. Ils ont au minimum cinq à dix années d’expérience dans leur domaine et occupent ou ont occupé des postes à responsabilité en entreprise.
- En amont de la formation : entretien permettant l’analyse des besoins des participants et/ou questionnaire de positionnement
- L’évaluation des compétences est réalisée : - Par des exercices pratiques et/ou mises en situation, tout au long de la formation - Par un exercice de synthèse et/ou un questionnaire d’auto-évaluation et/ou une certification, en fin de formation
- Feuille de présence émargée par demi-journée par les stagiaires et le formateur
- Formulaires d'évaluation de la formation à chaud et à froid (3mois après la session)
- Certificat de réalisation
- Attestation de fin de formation avec relevé des compétences acquises.
- DANS LE CAS DE FORMATIONS A DISTANCE Il est nécessaire que le stagiaire : - Possède un PC ou un Mac, avec le logiciel installé dans la bonne version - Une connexion internet stable d’au moins 8Mo/s - Un navigateur Web récent - Zoom ou Teams devra être installé (accompagnement possible)
- Exposés, aides visuelles, support de cours, exercices pratiques d’utilisation
- Questions/réponses entre les stagiaires et le formateur
- En présentiel : ordinateurs Mac ou PC, connexion internet, tableau blanc/paperboard, vidéoprojecteur, partage de documents
- A distance : logiciel de visio-conférence, partage d’écran formateur et stagiaire, partage de documents