home 
 
 
 
enfr
 
Home
Over ABIS
Diensten
Cursussen
Resources
Contact
MyABIS
C
Alle CursussenbalkjeAlgemeen » Introductie HW & SW » Soft skills » TrajectenOperating Systems » MVS - z/OS » UNIX - Linux - AIX » Mac OS X » iPad en iPhone iOSDatabases en middleware » Relationele databases & SQL » DB2 for z/OS » DB2 for LUW » Oracle » SQL Server » MySQL & MariaDB » IMS » CICS » IBM MQ » WebSphere » Big data en analyticsApplicatieontwikkeling » Methoden en technieken » TOGAF » PRINCE2 » Agile en Scrum » Programmeertalen » Internet development » Object Oriented systems » Java » Development tools » SAS » XML » SOA & web servicesSysteembeheer » ITIL » SecuritybalkjePraktischInschrijven 
Big data in de praktijk met Spark

Doel

Iedereen is tegenwoordig aan de slag met "big data". Ook u wil ongetwijfeld uw volumineuze databronnen (click streams, sociale media, relationele data, sensor-data, ...) ondervragen, en botst hierbij op de tekortkomingen van de klassieke data-tools. Dan hebt u misschien behoefte aan de rekenkracht van een cluster --en z'n parallelle verwerkingsmogelijkheden-- om uw distributed data stores te ondervragen.

Indien "fast prototyping" en verwerkingssnelheid prioritair zijn, dan komt u ongetwijfeld bij Spark terecht. Apache Spark is een open source-platform dat zich vooral toespitst op snelheid, gebruiksgemak, en analytics. Het is een alternatief voor de tragere MapReduce-aanpak van o.a. Hadoop (cf onze cursus Big data in de praktijk met Hadoop).

Deze cursus bouwt verder op de onderwerpen die in Big data concepten aangebracht worden. We gaan zelf aan de slag op linux met Spark en z'n bibliotheken voor machine learning and visualisatie. U leert hoe u robuuste data-processing implementeert in Scala met een SQL-achtige interface en met de andere APIs voor Java en Python.

Na afloop van deze cursus hebt u voldoende basis-expertise opgebouwd om zelfstandig een big data omgeving op te zetten, data te importeren en zinvol te ondervragen met Spark. U zult in staat zijn, eenvoudige Scala- en SparkSQL-programma's te schrijven die gebruik maken van de bibliotheken MLlib en GraphX.

Inhoud

  • Motivatie voor Spark & basisconcepten
  • Het Apache Spark-project en z'n componenten
  • Leer de Spark-architectuur en z'n programmeermodel kennen
  • Databronnen
  • Raadplegen van data die zich bevindt in Hadoop HDFS, Cassandra of HBase
  • Interfaces
  • Werken met de verschillende programmeer-interfaces en de webinterface
  • Programma's schrijven en debuggen die simpele data-analyseproblemen behandelen
  • Korte inleiding tot Hadoop HDFS, HBase, en Cassandra
 

Doelgroep

Eenieder die praktisch aan de slag wil met "big data": ontwikkelaars, data-architecten, en iedereen die met big data technologie moet kunnen werken.

Voorkennis

Vertrouwdheid met de concepten van data stores en i.h.b. "big data" is noodzakelijk; zie hiervoor onze cursus Big data concepten. Verder is minimale kennis van SQL en UNIX een pluspunt. In elk geval is ervaring met een programmeertaal (Java, PHP, Python, Scala, C++ of C#) noodzakelijk.

Verloop van de cursus

Klassikaal onderricht, waarbij de nadruk ligt op praktische voorbeelden, en ondersteund door uitgebreide praktijkoefeningen.

Docenten

Peter Vanroose.

Duur

2 dagen.

Kalender

U kunt zich inschrijven door te klikken op een datum
datumduurtaal  plaats  prijs
30 Nov2?Leuven  (BE)1000 EUR  (excl. BTW) 
11 Dec2NWoerden  (NL)1000 EUR  (BTW-vrij)