Crash Course Data Scientist

Download Report

Transcript Crash Course Data Scientist

4-daagse training
Crash Course
Data Scientist
Pas data science praktisch toe &
creëer waarde voor uw organisatie
 Zet uw eerste stap naar professionele data scientist
 Doorgrond de kansen van machine learning, A.I. en data
mining voor praktische toepassing in uw organisatie
 Inspirerende praktijkcases van o.a. Philips, Essent & TUI
 Ontwikkel uw eigen data science use case
Data: Locatie:
6, 27, 28 november en 4 december 2014
Kaap Doorn incl. diner en overnachting Coengebouw, Amsterdam
www.iir.nl/datascientist
Data science, waarom eigenlijk?
In veel organisaties liggen stapels data, maar ontbreekt het aan kennis en vaardigheden
om tot concrete use cases te komen. Terwijl al deze gegevens juist unieke kansen bieden
en in veel branches tot nieuwe business modellen leiden. De roep om professionals die
deze data kunnen duiden wordt dan ook steeds groter: de data scientist.
Data scientist: unieke vaardigheden
Naast kennis van geavanceerde data mining technieken moeten data scientists ook
beschikken over zakelijke, communicatieve en ondernemende vaardigheden. Het inzetten
van deze combinatie van hard & soft skills is uniek voor de data scientist en maakt hem
daarom zo waardevol.
Word first mover in uw branche
Dit opleidingsprogramma biedt u de benodigde uitrusting om uw eerste stappen
als data scientist te zetten. U leert in korte tijd hoe u uw data in waarde omzet.
Maak gebruik van deze kans om first mover in uw branche te zijn en onderscheidt u
daarmee van uw collega’s en concurrenten!
Resultaat
Na afronding kunt u data mining projecten succesvol neerzetten. Aan de hand
van echte datasets ontdekt u verschillende tooling zoals Rapid Miner en R.
Concrete praktijkcases geven u een tastbare inkijk in de mogelijkheden van
data science.
Na afronding van de crash course:
 Spreekt u de taal van een Data Scientist in termen van
statistiek, data transformaties, trucs, algoritmen en theorie
 Bent u in staat laag hangend fruit te herkennen en deze
te vertalen naar concrete meerwaarde voor uw bedrijf
 Heeft u een grote stap gezet in het behalen van
concurrentievoordeel in dit data gedreven tijdperk
 Bent u in het bezit van een custom made use case én een
kenniscertificaat op basis van het practicum en de eindtoets
www.iir.nl/datascientist
Doelgroep
De Crash Course is bedoeld voor de gevorderde data, business,
marketing of data warehouse analist. Ook informatie architecten en
developers met data mining ambities passen uitstekend in deze crash
course. Het programma sluit tevens goed aan bij ervaren big data
projectmanagers die zich verder willen specialiseren op het gebied
van data mining en machine learning.
Voorkennis
Data Science vraagt om enig specialisme van de professional die daarmee aan de slag
gaat. Daarom is het belangrijk dat u enige voorkennis en ervaring heeft met de basis
elementen van data science:
 Ervaring met het maken van selecties en overzichten uit data
 Basiskennis van beschrijvende statistiek & statistische modellen
 Enige programmeerervaring (hoeft niet actueel te zijn)
Niet zeker of uw achtergrond aansluit bij het niveau van de training? Leg het voor aan
onze opleidingsadviseur Jeremy Stevens (020 580 5455 of [email protected]).
Software
Via remote desktop account krijgt u toegang tot verschillende software benodigd voor de
training. U neemt wel uw eigen laptop mee, maar u hoeft geen ingewikkelde installaties
te doen. U maakt zo eenvoudig kennis met o.a. R, Rapid Miner, MS Excel, SAS.
Trainen in alle rust: K aap Doorn
Het programma is compact en u doet in korte tijd veel nieuwe vaardigheden op.
Daarom hebben we een trainingslocatie gevonden waar u in alle rust kunt focussen.
De eerste 3 trainingsdagen vinden plaats in Kaap Doorn, een inspirerende locatie op
de Utrechtse Heuvelrug. Naast het trainingsprogramma blijft u hier ook met uw
mede-cursisten dineren en overnachten.
Vragen over deze training?
Neem dan contact op met onze opleidingsadviseur Jeremey Stevens via
020 580 5455 of stuur een mail naar [email protected] Informeer ook naar
de mogelijkheden voor groepskorting
Deze training op maat volgen?
Wij kunnen deze training volledig afstemmen op de behoefte van uw
organisatie of afdeling. Neem hierover contact op met adviseur Saskia
van Berkel op 020 580 5440 of [email protected]
www.iir.nl/datascientist
docenten team
Bas van Ulzen is Digital Innovation Lead a.i. bij Philips. Daar is hij verantwoordelijk
voor de co-creatie van digitale proposities, waarbij data een essentieel fundament
is. Hierbij ligt zijn focus op het bedenken van nieuwe digitale service proposities
door het inzetten van connectivity. Daarvoor werkte Bas bij Essent aan digitale
innovatie voor online self-service diensten. Daar speelt data een centrale rol in
het voorspelbaar maken van het energieverbruik.
Ollie Dapper studeerde Economics & Business aan de Universiteit van Amsterdam.
Momenteel is hij founding partner bij Xomnia en verantwoordelijk voor alle
projecten, bedrijfsontwikkeling en strategische partnerships. Hij werkte als
projectmanager bij IEX Media, waar hij van A tot Z verantwoordelijk was voor de
realisatie van een online platform voor investeerders. Ook vertegenwoordigt hij
Xomnia in het Big Data Ecosysteeem: Ordina Big Arena.
Wessel Luijben is ead Data Scientist en Technology Officer bij Xomnia. Hij
studeerde af in Artificiële Intelligentie aan de VU Amsterdam. Zijn specialisatie
is machine learning binnen evolutionaire algoritmen en proces mining. Deze
kennis heeft hij toegepast bij o.a. Arkefly (sentimentanalyse en onderwerp
herkenning), Vakantieveiligingen.nl (real-time recommandatie systeem) en het
Nederlandse spoorwegennetwerk (voorspellend onderhoud).
Jeffrey van der Eijk innoveert door zijn creatieve mindset, brede business
development en BI-ervaring. Als team manager A.I. stuurt hij het team data
scientist aan op concrete toepasbaarheid. Hij werkte o.a. aan de integratie van
verkoopkanalen bij Samsung Electronics Benelux. Ook werkte hij nauw samen
met alle academische ziekenhuizen aan de verbetering van transparantie binnen
de zorg en behandeling optimalisatie binnen het DOT-DBC declaratie systeem.
Als persoon is hij enthousiast, visionair, communicatief sterk en ondernemend.
Kees Bekker studeerde econometrie aan de Rijksuniversiteit Groningen en
werkt sinds begin dit jaar als Data Scientist bij Xomnia. Hij is zeer vaardig met de
programmeertaal R, tijdserie analyse met E-views en risico modelleren. Zo heeft
hij Randstad geholpen met geautomatiseerd headhunten, Stadstoezicht
Gemeente Amsterdam met het voorspellen van criminaliteit en de Nederlandse
Zorg Autoriteit met het inzichtelijk maken van geldstromen binnen de zorg.
Agnes van Belle studeerde Artificiële Intelligentie aan zowel de Radboud
Universiteit Nijmegen als de Universiteit van Amsterdam. Als Data Scientist bij
Xomnia focust Agnes zich op Information Retrieval, Text Mining, en Natural
Language Processing. Ze ontwikkelde voor Wegener een Social Media monitor,
maakte voor Randstad een automatische herkenning van baancategorieën
en extraheerde voor Stadstoezicht Gemeente Amsterdam data uit informele
dienstrapporten.
www.iir.nl/datascientist
dagindeling
09.00
12.30
13.30
17.00
start ochtendprogramma
lunch
start middagprogramma
afsluiting
programma
Pre- course kennis test
Ter introductie van de training maakt u een korte kennistest. U kunt niet zakken of slagen voor
deze test, maar is bedoeld om het kennisniveau van de groep vast te stellen. Eventueel krijgt u
aanvullend voorbereidend studiemateriaal aangeboden om er zeker van te zijn dat iedereen het
niveau van de training aankan.
Dag 1 – 26 november 2014
Artificial Intelligence, machine learning & data mining
Introductie van Data Science
 Verwachtingen & doelstellingen van deze cursus
 Kennismakingsronde met uw mede-cursisten
 Wanneer bent u een data scientist?
Ollie Dapper, Founding Partner, Xomnia
Data driven innovation in de prak tijk:
 Data & connectiviteit als innovatie drijvers @Philips
 Co-creatie om kennis van verschillende teams te bundelen, zoals predictive modelling skills
combineren met nieuwe, ongestructureerde datasets van wearable en connected technologie
 Nieuwe data diensten voor de klant in een self-service omgeving @Essent
 De waarde van data bij het versterken van de dienstverlening; van een reactieve naar
proactieve en voorspellende partner.
Bas van Ulzen, Lead Digital Innovation, Philips
Basisprincipes en terminologie van data science
 Wat is het verschil tussen Artificiële Intelligentie, Data Mining en Machine Learning?
 Wat zijn de verschillende fases binnen een Data Mining project?
 Waarom is tooling extreem belangrijk in de exploratieve en productie fase?
 Wat zijn de voor- en nadelen van open en closed source tools?
 Wat is een compiler, interpreteer en een virtual machine?
 Wat kunnen we leren van de KDNuggets software poll?
 Wat vertelt deze poll over Excel, SAS, Eclipse, R, KNIME, Rapid Miner, en VIM?
 Wat is het verschil tussen clustering, classificatie, en regressie?
 Wat is het verschil tussen kruisvalidatie, bootstrapping, en goodness of fit?
Wessel Luijben, Lead Data Scientist en Technology Officer, Xomnia
www.iir.nl/datascientist
Dag 2 – 27 november 2014
Toegepaste waarde van A.I. technieken
Tijdens de tweede dag zoomen we verder in op de theorie aan de hand van de cases waarmee
u tijdens het practicum aan de slag gaat. Doel van deze dag is om in meer detail de theorie te
doorgronden om deze in de praktijk, tijdens dag 3, toe te passen.
Waar zit de waarde van A.I.?
 Hoe genereert u waarde door het toepassen van A.I.?
 Wat kunnen we leren van verschillende branches zoals overheid, finance en retail?
 [Demo] Classificatie: informatie gestuurd onderhoud op het Nederlandse spoor
 Ollie Dapper, Founding Partner, Xomnia
Classificatie, clusteranalyse en tekst mining
 Wat zijn belangrijkste algoritmen voor classificatie, validatie en evaluatie?
 [Theorie] Classificatie: Informatie gestuurd onderhoud op het Nederlandse spoor
 Wat zijn belangrijke algoritmen voor taalverwerking en clusteranalyse?
 [Theorie] Clusteranalyse en tekst mining: taalverwerking voor TUI Arkekefly.nl
Agnes van Belle, Text Mining Expert & Data Scientist, Xomnia
Creëren en valideren van een beslisboom model
 Wat zijn de opties voor het inladen van data binnen Rapid Miner?
 Hoe creëert en valideert u een beslisboom model?
 Hoe interpreteert u een accuratesse, kappa, en ROC score?
 Hoe optimaliseert u een proces qua RAM, DISK en CPU gebruik?
Wessel Luijben, Lead Data Scientist en Technology Officer, Xomnia
Dag 3 – 28 november 2014
Data Science practicum
Tijd om zelf aan de slag te gaan! Tijdens dit hands-on gedeelte doorloopt u 2 verschillende cases
met geprepareerde datasets. Het doel van deze dag is dat u de opgedane kennis toepast en
gevoel krijgt bij het daadwerkelijk uitvoeren van data science technieken.
Tijdreeksanalyse & risico analyse
 Welke voordelen heeft de programmeertaal R?
 Hoe integreert u R binnen Rapid Miner of KNIME?
 Welke algoritmen zijn belangrijk voor tijdreeksanalyse?
 Welke algoritmen zijn belangrijk voor risico analyse?
Kees Becker, R programming expert & Data Scientist, Xomnia
Sentiment analyse en taalherkenning
 [Verdieping] Wat zijn belangrijkste algoritmen voor classificatie, validatie en evaluatie?
 Gestructureerde en ongestructueerde data
 Standaard tabel met 1 kolom als output label en numerieke of nominale inputs
[Verdieping] Wat zijn belangrijke algoritmen voor taalverwerking en cluster analyse?
 Grammaticale boom, zinsontleding, sentiment analyse, taalherkenning
 Interactief proces: clusteren, visualiseren en aanpassen handregels
Agnes van Belle, Text Mining Expert & Data Scientist, Xomnia
www.iir.nl/datascientist
Predictive modelling
 [Competitie] Inladen van sensor data binnen Rapid Miner
 [Competitie] Exploratieve analyse en het maken van plots
 [Competitie] Maken van een voorspelmodel en validatie
 [Competitie] interpretatie resultaten
Wessel Luijben, Lead Data Scientist en Technology Officer, Xomnia
Game is on! Hoe goed is uw voorspellend resultaat?
Tijdens deze case gaat u de competitie aan met uw mede-cursisten. U ontwikkelt een eigen
classificatie model, waarbij u uw eigen keuzes maakt. U creëert een eigen Rapid Miner process
flow. Deze moet een classificatie algoritme en een selectie mechanisme bevatten.
Dag 4 – 4 december 2014
Van data naar diensten, producten en business
De vierde en laatste dag staat in het teken van evalueren. U heeft een week de tijd om de theorie
en praktijk van de eerste 3 dagen te laten bezinken. Doel van deze dag is om de gemaakte
stappen in het practicum te doorlopen en de betekenis van de uitkomsten in een breder kader te
plaatsen. Heeft u de antwoorden goed? Hoe betrouwbaar zijn ze? En wat gaat u vervolgens met
de resultaten doen?
Omzetten van data naar business
 Wat hebben we geleerd in deze cursus?
 Hoe is deze kennis concreet van toepassing op uw bedrijfsvoering?
 Waar zit binnen uw organisatie het laag hangende fruit?
 Welke tooling past het beste bij uw bedrijf?
 Welke overwegingen zijn belangrijk bij het kaderen van projecten?
 Waarom is een centraal klantbeeld belangrijk?
 Hoe verkoop ik data analyse als een dienst en zet slimme algoritmen om in een product?
 Hoe schraap ik publieke data van het internet?
Jeffrey van der Eijk, Founding Partner, Xomnia
Opstellen custom made data science use case
 Bekendmaking winner competitie dag 3
 U gaat vervolgens aan de slag met het opzetten van eigen use case voor uw organisatie.
Denk aan een recommendatie system, cross and upsell kansen, Churn opties of
Predictive maintenance
Wessel Luijben, Lead Data Scientist, Xomnia
Eindtoets
Test de opgedane kennis via een eindtoets. Uw eindcijfer wordt bepaald door het gemiddelde
van het cijfer van deze toets en uw score van het practicum
www.iir.nl/datascientist
IIR B.V., Kabelweg 37, 1014 BA Amsterdam:
Meld u aan met uw VIP CODE
Crash Course
Data Scientist
4-daagse training
Pas data science praktisch toe &
creëer waarde voor uw organisatie
3 makkelijke manieren om u aan te melden:
1. Per telefoon:
+31 (0)20 580 5400
2. Via e-mail:
[email protected]
3. Via de website: www.iir.nl/datascientist
Prijs
4-daagse crash course incl. lesmateriaal, 2x overnachting en diner € 3.399,-
Alle prijzen zijn per persoon en exclusief BTW en inclusief documentatie, koffie/thee en lunch
Blijf op de hoogte via social media
Volg IIR op LinkedIn
Word lid van de IIR LinkedIn groep Big Data Forum en discussieer mee
Op de hoogte met Twitter
Volg @Data_Academy en blijf op de hoogte van het laatste nieuws
Inclusief interactieve leeromgeving
Alle presentaties, video’s, artikelen en huiswerk staan op onze online leeromgeving. Zo heeft u alle
cursusinformatie op één plek! Ook kunt u hier makkelijk contact houden met andere deelnemers,
of vragen stellen aan uw docent.
Gegevensregistratie:
Uw gegevens worden door IIR geregistreerd en gebruikt om u op de
hoogte te houden van onze producten en die van zorgvuldig geselecteerde
bedrijven. Mochten uw gegevens niet correct zijn of wenst u dat uw
gegevens niet gebruikt wordt voor deze doeleinden, neem dan contact
op met onze database afdeling op 020 - 580 5470 of e-mail [email protected]
Algemene voorwaarden:
Op alle aanbiedingen zijn onze algemene voorwaarden van toepassing.
Deze zijn gedeponeerd bij de K.v.K te Amsterdam, onder nummer 33200358.
De algemene voorwaarden zijn te downloaden op onze website www.iir.nl/
algemene_voorwaarden en worden op verzoek kosteloos toegezonden.