home 
 
 
 
ennl
 
Home
A propos
Services
Cours
Ressources
Contacts
MyABIS
C
Tous les coursbalkjeGénéralités » Introduction HW & SW » Soft skills » Cycles completsSystèmes d’exploitation » MVS - z/OS » Linux - UNIX » Mac OS X » iPad et iPhone iOSBases de données et middleware » Relational databases & SQL » Db2 for z/OS » Db2 for LUW » Oracle » SQL Server » MySQL & MariaDB » IMS » CICS » IBM MQ » WebSphere » Data Science, Big Data et AnalyticsDéveloppement d’applications » Méthodiques et techniques » TOGAF » PRINCE2 » Agile et Scrum » Les langages de programmation » Internet development » Object Oriented systems » Java » Development tools » SAS » XML » SOA & web servicesGestion de système » ITIL » SecuritybalkjeEn pratiqueInscriptions 
Big data en pratique avec Spark

Tout le monde semble être actif avec "big data" aujourd'hui. Vous voulez sans doute aussi interroger vos sources volumineuses de données (click streams, social media, données relationnelles, données capteurs, ...), et vous rencontrez des limitations avec les data-tools classiques. Dans ce cas, vous avez peut-être besoin de la puissance d'un cluster --et ses capacités de traitement en parallèle-- pour interroger vos dépôts de données distribuées.

Dans le cas où "fast prototyping" et la vitesse de traitement sont prioritaires, vous tombez sûrement sur Spark. Apache Spark est une plate-forme open source qui se concentre surtout sur la vitesse, la facilité d'utilisation, et les algorithmes analytiques. Spark est une alternative pour l'approche MapReduce de Hadoop (cf notre cours Big data en pratique avec Hadoop) qui est typiquement plus lent.

Ce cours se fonde sur les sujets traités dans Concepts Big Data. On se mettra au travail sur Linux avec Spark et ses bibliothèques pour machine learning, SQL, et graph processing. Vous apprenez comment implémenter une analyse robuste des données, en utilisant Scala avec un interface de style SQL, et vous faites connaissance avec les autres API (en Java, en Python, et en R).

À la fin de ce cours, le participant aura acquis suffisamment d'expertise de base pour configurer un environnement big data, importer des données, et les interroger avec Spark. On sera aussi capable d'écrire des programmes simples en Scala et en SparkSQL, et qui utilisent les bibliothèques MLlib, GraphX et Streaming.

Calendrier

dateduréelang.  lieu  prix
25 Jan2?Leuven  (BE)1000 EUR  (excl. TVA) 
05 Mar2EWoerden  (NL)1000 EUR  (exempte de TVA) 
INFO SESSION ET INSCRIPTION

Participants

Ce cours concerne toute personne qui veut commencer à utiliser "big data": développeurs, architectes de données, et tous ceux qui devront travailler avec la technologie big data.

Connaissances préalables

Être familier avec les concepts des data stores, et en particulier "big data"; voir notre cours Concepts Big Data. Additionnellement, la connaissance minimale d'SQL et de UNIX est un avantage. En tout cas, une expérience minimale d'une langue de programmation (p.ex. Java, PHP, Python, Scala, C++ ou C#) est nécessaire.

Contenu

Pédagogie

Enseignement classique agrémenté d'exemples pratiques, et assez de temps prévu pour pratiquer avec plusieurs exercices

Durée

2 jours.

Formateurs

Peter Vanroose.


INFO SESSION ET INSCRIPTION