home 
 
 
 
enfr
 
Home
Over ABIS
Diensten
Cursussen
Resources
Contact
MyABIS
C
Alle CursussenbalkjeAlgemeen » Introductie HW & SW » Soft skills » TrajectenOperating Systems » MVS - z/OS » Linux - UNIX » Mac OS X » iPad en iPhone iOSDatabases en middleware » Relationele databases & SQL » Db2 for z/OS » Db2 for LUW » Oracle » SQL Server » MySQL & MariaDB » IMS » CICS » IBM MQ » WebSphere » Data Science, Big data en analyticsApplicatieontwikkeling » Methoden en technieken » TOGAF » PRINCE2 » Agile en Scrum » Programmeertalen » Internet development » Object Oriented systems » Java » Development tools » SAS » XML » SOA & web servicesSysteembeheer » ITIL » SecuritybalkjePraktischInschrijven 
Big data in de praktijk: text analytics

"Big data" heeft alles te maken met "analytics": grote hoeveelheden data analyseren om er "business intelligence", dus informatie uit te halen. Bij "data" denken we meestal aan getallen en tabellen, en de statistische analyses daarvan. Maar veel kennis valt te halen uit tekstuele data: gewone berichten, door mensen neergeschreven, al dan niet in volzinnen: b.v. emails, sollicitatiebrieven, Twitter- en Facebook-berichten, krantenartikelen, websites, noem maar op. De geëxtraheerde informatie kan dan gebruikt worden voor b.v. een "simpele" toepassing zoals het vinden van tekstfragmenten, gesorteerd op relevantie, op basis van een zoekterm. Een soort "Google Search" dus. Of een toepassing als sentiment-analyse.

Tijdens deze training worden eerst de belangrijkste concepten en terminologie aangebracht die bij tekstanalyse en "text mining" van belang zijn, zoals tokens, normalisatie, lemmatisatie, part-of-speech, taalmodellen, tekstclassificatie, ... Al snel blijkt dan dat geautomatiseerde tekstanalyse veel minder eenvoudig is dan het misschien lijkt: aspecten als taal, grammatica, spellingsfouten, synoniemen, negaties, woordvolgorde, leestekens ... maken de analyse complex. Tekst is namelijk in de eerste plaats bedoeld als communicatiemiddel tussen mensen, niet om door computers begrepen te worden! Zelfs de "simpele" Google Search-toepassing blijkt een hele uitdaging.

Ondertussen zijn er verschillende software-pakketten en libraries ontwikkeld die de technische onderbouw van "natural language processing" (NLP) voor hun rekening nemen. We gaan tijdens de cursus praktisch aan de slag met enkele van deze pakketten zoals de NLTK toolkit, Apache OpenNLP en Standford's NLP Suite. Hierbij komt ook het gebruik van reguliere expressies aan bod.

Na afloop van deze cursus hebt u voldoende basis-expertise opgebouwd om een specifieke toepassing op te zetten die gebruik maakt van een NLP-library en die een text mining-applicatie implementeert.

Kalender

datumduurtaal  plaats  prijs
22 Nov1ELeuven  (BE)475 EUR  (excl. BTW) 
SESSIE-INFO EN INSCHRIJVEN

Doelgroep

Deze training is bedoeld voor iedereen die praktisch aan de slag wil met "text analytics": ontwikkelaars, data-architecten, business-analisten and marketing-specialisten die een beter beeld willen krijgen van de onderliggende bouwstenen en technologieën van text analytics.

Voorkennis

Enige vertrouwdheid met statistische concepten (histogram, classificatie, hypothesetoetsen) is aangewezen, zie b.v. Statistiek basiskennis. Een minimale programmeer-achtergrond is een meerwaarde.

Inhoud

Verloop van de cursus

Klassikale opleiding, waarbij de nadruk ligt op praktische voorbeelden, en ondersteund door uitgebreide praktijkoefeningen.

Duur

1 dag.

Docenten

Peter Vanroose.


SESSIE-INFO EN INSCHRIJVEN