home 
 
 
 
enfr
 
Home
Over ABIS
Diensten
Cursussen
Resources
Contact
MyABIS
C
Alle CursussenbalkjeAlgemeen » Introductie HW & SW » Soft skills » TrajectenOperating Systems » MVS - z/OS » Linux - UNIX » Mac OS X » iPad en iPhone iOSDatabases en middleware » Relationele databases & SQL » Db2 for z/OS » Db2 for LUW » Oracle » SQL Server » MySQL & MariaDB » IMS » CICS » IBM MQ » WebSphere » Data Science, Big Data en AnalyticsApplicatieontwikkeling » Methoden en technieken » TOGAF » PRINCE2 » Agile en Scrum » Programmeertalen » Internet development » Object Oriented systems » Java » Development tools » SAS » XML » SOA & web servicesSysteembeheer » ITIL » SecuritybalkjePraktischInschrijven 
Big data in de praktijk met Spark

Iedereen is tegenwoordig aan de slag met "big data" en data science. Ook u wil ongetwijfeld uw volumineuze databronnen (click streams, sociale media, relationele data, cloud-data, sensor-data, ...) ondervragen, en botst hierbij op de tekortkomingen van de traditionele data-analyse-tools. Dan hebt u misschien behoefte aan de rekenkracht van een cluster --en z'n parallelle verwerkingsmogelijkheden-- om uw distributed data stores te ondervragen.

Indien "fast prototyping" en verwerkingssnelheid prioritair zijn, dan komt u ongetwijfeld bij Spark terecht. Apache Spark is een open source-platform dat zich vooral toespitst op snelheid, gebruiksgemak, flexibiliteit, en analytics. Het is een interessant alternatief voor de MapReduce-aanpak van Hadoop met Hive (cf. onze cursus Big data in de praktijk met Hadoop).

In het bijzonder laat Spark toe om op een eenvoudige manier databronnen te raadplegen op HDFS, in een NoSQL-database (b.v. Cassandra of HBase), in een relationele database, in de cloud (b.v. AWS) of in lokale bestanden. Onafhankelijk daarvan kan een Spark-job eenvoudig draaien op hetzij de lokale machine (als ontwikkelomgeving), of op een Hadoop-cluster (met Yarn), of een Mesos-omgeving, of Kubernetes, of in de cloud. En dit alles via een eenvoudig Spark script of via een complexer (Java- of Python-)programma of via een web-based notebook (b.v. Zeppelin).

Deze cursus kadert in de context van de overzichtscursus Big data architectuur en infrastructuur. We gaan zelf aan de slag op Linux met Spark en met z'n bibliotheken. U leert hoe u robuuste data-processing implementeert (in Scala, Python, Java of R) met een SQL-achtige interface.

Na afloop van deze cursus hebt u voldoende basis-expertise opgebouwd om zelfstandig een ontwikkelomgeving voor Spark op te zetten en hiermee uw data zinvol te ondervragen. U zult in staat zijn, eenvoudige SparkSQL-scripts en -programma's te schrijven (met de Scala-gebaseerde SparkShell of met PySpark) die gebruik maken van de bibliotheken MLlib, GraphX, en de streaming library.

Kalender

datumduurtaal  plaats  prijs
28 May2ELeuven  (BE)1000 EUR  (excl. BTW) 
SESSIE-INFO EN INSCHRIJVEN

Doelgroep

Eenieder die praktisch aan de slag wil met Spark: ontwikkelaars, data-architecten, en iedereen die met data science technologie moet kunnen werken.

Voorkennis

Vertrouwdheid met de concepten van data clusters en distributed processing is noodzakelijk; zie hiervoor onze cursus Big data architectuur en infrastructuur. Verder is minimale kennis van SQL en Unix/Linux een pluspunt. In elk geval is minimale ervaring met een programmeertaal (b.v. Java, Python, Scala, Perl, JavaScript, PHP, C++, C#, ...) noodzakelijk.

Inhoud

Verloop van de cursus

Klassikaal onderricht, waarbij de nadruk ligt op praktische voorbeelden en uitgebreide praktijkoefeningen.

Duur

2 dagen.

Docenten

Peter Vanroose.

Reviews

     
I learn a lot from this training. Quite useful knowledge and can lead my following self-study. (, )
     
Obtain an overview of Spark and its capability. Some trying-out exercises to better know how spark works. (, )
     
Voldoende, voorbeelden waren helder en relevant. Ik had graag echter meer tijd besteed aan concreet oefenen met de stof. (, )
     
I thought the first day went a bit too slow. I guess the content is quite broad, as was the audience, so many things were explained in ample detail and in a lengthy way. The second day was much nicer as it was more to the point of Spark. (, )

SESSIE-INFO EN INSCHRIJVEN