HOOGSTEOPLTAB

Download Report

Transcript HOOGSTEOPLTAB

Centraal Bureau voor de Statistiek
Centrum voor Beleidsstatistiek
Documentatierapport Hoogst behaalde en hoogst
gevolgde opleiding (HOOGSTEOPLTAB)
Datum:
20 oktober 2014
Documentatierapport HOOGSTEOPLTAB
Bronvermelding
Publicatie van uitkomsten geschiedt door het onderzoeksbureau of de opdrachtgever op
eigen titel. Verwijzing naar het CBS betreft uitsluitend het gebruik van de
microdatabestanden. Dat wordt als volgt geformuleerd:
“Eigen berekening [naam onderzoeksbureau, c.q. opdrachtgever] op basis van bij het
CBS beschikbaar gestelde microdatabestanden betreffende hoogste opleidingsgegevens
van personen”
2
Documentatierapport HOOGSTEOPLTAB
Beschikbare bestanden:
120726 HOOGSTEOPLTAB 1999V1 t/m 2005V1;
120619 HOOGSTEOPLTAB 2006V1 t/m 2009V1;
120918 HOOGSTEOPLTAB 2010V1;
130924 HOOGSTEOPLTAB 2011V1;
141020 HOOGSTEOPLTAB 2012V1.
In de Versiegeschiedenis wordt een chronologisch overzicht gegeven over dit onderwerp.
De gebruiker dient rekening te houden met het volgende:

De koppelsleutel voor personen is veranderd van SRTNUM en RIN naar
RINPERSOONS en RINPERSOON. Het omzetten van de ene sleutel naar de andere
wordt beschreven in het script “koppelvariabelen gelijk zetten spss.sps” voor de
Remote Access en On-site gebruikers te vinden in de map \8_Utilities\Tools\. Let
vooral op het omzetten van RIN naar RINPERSOON omdat RINPERSOON wordt
weggeschreven mét voorloopnullen.

De omschrijvingen en toelichtingen op de variabelen, referentiebestanden en
codelijsten zijn voor de Remote Access en Onsite gebruikers te vinden in:
\8_Utilities\Code_Listings\SSBcodelijsten
\8_Utilities\Code_Listings\SSBreferentiebestanden
\8_Utilities\Code_Listings\SSBtoelichtingen
\8_Utilities\Code_Listings\SSBvariabelen.
In verband met eventuele wijzigingen wordt de inhoud van deze mappen maandelijks
geactualiseerd.

In de map \8_Utilities\Code_Listings\SSBreferentiebestanden is specifiek voor alle
opleidingsnummers met groeperingen het referentiebestand OPLEIDINGSNRREFVv
beschikbaar.

Om de kwaliteit van de uitkomsten te beoordelen wordt sterk aangeraden om ‘de
opleidingstool’ te gebruiken. Voor de Remote Access en On-site gebruikers te vinden
op: \8_Utilities\Tools\Opleidingstool.

In dit documentatierapport worden de begrippen OPLNIV en HOOGSTEOPLTAB
door elkaar gebruikt. HOOGSTEOPLTAB is de opvolger van OPLNIV.

Voor de persoonskenmerken en/of achtergronden dient u de beschikbare GBAbestanden te raadplegen. Deze staan in de catalogus van het Centrum voor
Beleidstatistiek onder de thema’s Bevolking of Sociaal Statistisch Bestand. Voor het
aanvragen van deze bestanden geldt de gebruikelijke procedure.
3
Documentatierapport HOOGSTEOPLTAB
4
Documentatierapport HOOGSTEOPLTAB
Inhoudsopgave
Bronvermelding....................................................................................................... 2
Beschikbare bestanden: .......................................................................................... 3
1.
Inleiding ........................................................................................................... 7
2.
Toelichting op de bestanden ............................................................................ 8
Onderwerp microdatabestand(en) ............................................................................................ 8
Inhoud ...................................................................................................................................... 8
Eenheid en populatie ................................................................................................................ 8
Historie ..................................................................................................................................... 9
Bijzonderheden ........................................................................................................................ 9
Het Stelsel van Sociaal-statistische Bestanden (SSB) ............................................................ 11
3.
Bestandsopbouw en toelichting ..................................................................... 12
Bestandsopbouw van dit onderwerp ...................................................................................... 12
Toelichting op de variabelen .................................................................................................. 13
Versiegeschiedenis ....................................................................................................... 14
5
Documentatierapport HOOGSTEOPLTAB
6
Documentatierapport HOOGSTEOPLTAB
1. Inleiding
Het Centrum voor Beleidsstatistiek stelt, onder bepaalde voorwaarden, microdata
(geanonimiseerde data op persoons-, bedrijfs- en/of adresniveau) ter beschikking voor
onderzoek. Dit rapport beschrijft de inhoud en structuur over het onderwerp “hoogste
opleidingsgegevens van personen”.
Hoofdstuk 2 beschrijft in het algemeen de microdatabestanden zoals populatieafbakening
en herkomst van de gegevens.
In hoofdstuk 3 wordt allereerst de bestandsindeling gegeven. Daarnaast worden voor de
categoriale variabelen alle mogelijke scores en hun betekenis opgesomd.
Bij dit rapport is per bestand tot en met 2010 een bijlage met frequentietellingen
beschikbaar. In deze bijlagen worden van de (semi-) continue variabelen de frequenties
van de eerste en laatste vijf waarden gegeven. Met deze frequentietellingen kan tevens
een beeld verkregen worden over de vullingsgraad van de verschillende variabelen, dat
van belang kan zijn omdat niet altijd alle variabelen (volledig) gevuld zijn.
7
Documentatierapport HOOGSTEOPLTAB
2. Toelichting op de bestanden
Onderwerp microdatabestand(en)
Dit onderwerp is afkomstig uit het Stelsel van Sociaal-statistische Bestanden (SSB).
Inhoud
Dit bestand bevat het opleidingsnummer van de hoogst behaalde en hoogst gevolgde
opleiding op peilmoment, voor zover bekend uit diverse jaargangen van registers en
Enquête Beroepsbevolking (EBB).
De gegevens van peildatum laatste vrijdag van september van jaar JJJJ worden in grote
lijnen ook representatief geacht voor de periode tot en met mei JJJJ+1. Verreweg de
meeste opleidingsniveau-verhogingen vinden plaats in de periode juni-september JJJJ+1.
Om uit opleidingsnummers opleidingsniveau en -richting (CBS-publicatie-indelingen,
Standaard Onderwijs Indeling (SOI) of International Standard Classification of
Education (ISCED)) te bepalen zijn SSB-referentieboeken beschikbaar. Zie
\8_Utilities\Code_Listings\SSBreferentiebestanden.
Er is ook een protocol beschikbaar waarin in een aantal stappen wordt uitgelegd hoe op
statistisch verantwoorde wijze gebruik kan worden gemaakt van HOOGSTEOPLTAB.
Onderdeel ervan is een SSB-tool om de relatieve onnauwkeurigheid van de uitkomst in
een cel te bepalen. Zie: \8_Utilities\Tools\Opleidingstool.
HOOGSTEOPLTAB heeft een veel hogere dekkingsgraad dan tot nu toe onder bronnen
voor opleidingsniveau gebruikelijk was. Een groot voordeel is dat schattingen over het
opleidingsniveau meestal betrouwbaarder zijn dan die uit de traditionele bronnen, met
name wanneer het kleinere populaties betreft. Een ander pluspunt is dat het merendeel
van de gegevens afkomstig is uit onderwijsregisters, en die staan bekend om hun goede
kwaliteit. Een belangrijk doel van de onderwijsregistraties is immers toezicht van het Rijk
op de doelmatigheid van de onderwijsuitgaven, en om die reden worden de gegevens aan
strenge accountantscontroles onderworpen.
Eenheid en populatie
De doelpopulatie is de GBA-bevolking op peilmoment. HOOGSTEOPLTAB bevat alleen
records van personen waarvan de hoogste opleiding bekend is. De informatie is voor een
deel van de bevolking integraal en voor de overige personen op steekproefbasis.
NB. Bij de serie HOOGSTEOPL's met JJJJ = 2006-2009 is gebruik gemaakt van
GBAADRESBUS 2010V1, bij HOOGSTEOPL2010 is de GBAADRESBUS 2011V1
gebruikt.
Omdat er inmiddels volgens een andere systematiek gewerkt wordt (met actuele en
gecoördineerde versies van de GBAADRESBUS), kan het voorkomen dat:
a) er personen in HOOGSTEOPL zitten die volgens de gecoördineerde versie op
peilmoment niet tot de populatie van Nederland behoren,
8
Documentatierapport HOOGSTEOPLTAB
b) er personen missen in HOOGSTEOPL waarvan we wel een niveau wisten, maar
waarvan op het moment van samenstellen van de component niet bekend was dat ze tot
de populatie van Nederland behoorden.
Vanaf HOOGSTEOPLTAB 2011V1 wordt de GBA-populatie afgebakend met behulp
van de gecoördineerde versie van de GBAADRESBUS (voor 2011 is dat
GBAADRESBUS 2011V1).
Omdat bij het bepalen van de gewichten ook gebruik gemaakt wordt van de
GBAADRESBUS, kan het voorkomen dat de gewichten niet exact optellen tot de
populatie, wanneer die wordt gedefinieerd op basis van de recentste (actuele)
VRLGBAADRESBUS.
Historie
Dit bestand is beschikbaar voor peilmomenten ultimo september, vanaf 1999 t/m 2011.
Geherstructureerd: 1999-2005 en gereviseerd: 2006-2009.
Bijzonderheden
HOOGSTEOPLTAB wordt samengesteld uit data van diverse onderwijsregistraties en
een serie jaargangen van de Enquête Beroeps bevolking (EBB, vanaf 1996). De laatste
decennia heeft het CBS de beschikking gekregen over steeds meer registers met
inschrijvings- en diplomagegevens van door overheid bekostigde onderwijsinstellingen.
Het betreft de volgende registraties:
- CRIHO (centraal register van inschrijvingen in het hoger onderwijs, vanaf 1983
(wo)/1986 (hbo))
- ERR (examenresultatenregister voortgezet onderwijs (vanaf examenjaar 1999)
- Onderwijsnummerbestanden voortgezet onderwijs (vanaf schooljaar 2003/’04,
middelbaar beroepsonderwijs (vanaf schooljaar 2004/’05), volwasseneneducatie inclusief
voortgezet algemeen volwassenenonderwijs (vanaf schooljaar 2005/’06).
- Bestanden van de studiefinanciering (WSF, vanaf 1995)
- Bestanden met opleidingsgeschiedenissen zoals opgegeven door werkzoekenden bij het
UWV WERKbedrijf (personen die ingeschreven stonden in 2010 of later). De informatie
in dit bestand is alleen gebruikt voor opleidingen die gevolgd zijn in de periode voor de
start van de onderwijsregisters en dan nog alleen wanneer er geen valide informatie
beschikbaar is uit de EBB. Bij eerstegeneratieallochtonen is de informatie ook
meegenomen wanneer die betrekking had op de periode voorafgaande aan zijn/haar eerste
immigratie in Nederland.
Aangezien met name de onderwijsregistraties nog niet zo heel lang bestaan, ontbreekt er
helaas registerinformatie over veel oudere Nederlanders. Ook particuliere opleidingen
vallen buiten het bereik van de onderwijsregisters. Daarnaast is van veel allochtonen die
hun opleiding in het buitenland hebben gevolgd op dit moment onvoldoende betrouwbare
registerinformatie beschikbaar. Dit betekent dat er voor het samenstellen van het
Opleidingsniveaubestand een aanvullend beroep moet worden gedaan op de EBB. Anders
9
Documentatierapport HOOGSTEOPLTAB
dan bij de onderwijsregistraties zijn de gegevens van de EBB alleen op steekproefbasis
beschikbaar.
Informatie uit een register of uit de EBB die met grote waarschijnlijkheid verouderd is,
wordt niet gebruikt. Bijv. in het geval iemand is geënquêteerd in een EBB van een aantal
jaren geleden en het zeer waarschijnlijk is dat die persoon inmiddels een hoger
opleidingsniveau heeft bereikt.
Wegens selectiviteit zijn de records in HOOGSTOPLTAB voorzien van een
ophooggewicht, zodat de resultaten uit het bestand representatief zijn voor de hele
Nederlandse bevolking en selecte subpopulaties. Voor nadere informatie zie
\8_Utilities\Code_Listings\SSBvariabelen, GEWICHTHOOGSTEOPL.OMS.
HOOGSTEOPLTAB 2012V1 is de eerste in de reeks jaargangen die tevens gebruik
maakt van data uit de EBB's na herontwerp 2012. De EBB rapporteert voor de jaargangen
na herontwerp een trendbreuk in de onderwijsniveaucijfers op gedetailleerder
aggregatieniveau ten opzichte van eerdere jaargangen.
Hoewel de EBB na herontwerp op dit moment slechts een relatief kleine bijdrage levert
bij de vulling van HOOGSTEOPLTAB is enige invloed van die trendbreuk in 2012
onvermijdelijk.
Daarnaast is de onderwijsniveau-indeling in de EBB door de globalere vraagstelling
minder verfijnd dan in het verleden. Een onderscheid tussen 2-digit SOI-niveaus is
daarom in de EBB niet altijd meer mogelijk. In het productieproces van HOOGSTEOPL
wordt de opleiding met hoogste niveau geselecteerd op basis van SOI 2-digit niveau. Het
is evident dat dit selectieproces enige hinder zal ondervinden van de verminderde nuance
van de onderwijsniveaucategorieën van de EBB. Uit de resultaten komen aanwijzingen
naar voren dat m.n. het aantal personen met hoogste opleidingsniveau SOI 42 hierdoor
wat is gestegen ten koste van SOI 41 en SOI 43. In de 8-delige publicatie-indeling komt
dit verschijnsel deels tot uiting in de meer dan trendmatige stijging van de categorie mbo2
en mbo3. Het effect op hoger aggregatieniveau van de publicatie-indeling is minder
groot.
HOOGSTEOPLTAB 2006V1 is de eerste in een nieuwe reeks na revisie.
Een aantal belangrijke wijzigingen/verbeteringen bij revisie:
- Er is gebruik gemaakt van opleidingsgeschiedenissen zoals bekend bij het UWV
WERKbedrijf, om de dekking van het bestand te verbeteren voor met name ouderen en
eerstegeneratieallochtonen.
- Er is gebruik gemaakt van vervolgpeilingen (en niet alleen de eerste peiling) uit de
EBB, zodat opleidingen die mensen afronden tijdens de periode dat ze geënquêteerd
worden, worden meegenomen.
Door de vernieuwde methodiek toegepast met ingang van revisie zijn cijfers uit
jaargangen 1999 tot en met 2005 niet geheel vergelijkbaar met die uit latere jaargangen.
Als je een publicatie-indeling van het CBS op het gebied van opleidingsniveau wilt
gebruiken (bijvoorbeeld Lager-Middelbaar-Hoger), ga je als volgt te werk.
10
Documentatierapport HOOGSTEOPLTAB
- Koppel aan OPLNRHB of OPLNRHG uit het OPLEIDINGSNR-refboek de variabele
CTO (code type opleiding)
- Koppel aan CTO uit het CTO-refboek een van de publicatie-indelingen. Zie het
datamodel CTOREFVV onder 8_Utilities\Code_Listings\SSBreferentiebestanden;
LET OP: voor het hoogst behaalde niveau en het hoogst gevolgde niveau zijn aparte
variabelen beschikbaar!
De reden is dat mensen die als hoogste opleiding een propedeusejaar gevolgd en evt.
behaald hebben, vallen in de categorie bachelor/hoger bij hoogst gevolgd, maar in
vwo/middelbaar bij hoogst behaald.
NB. Er is een voorbeeldcatalogus beschikbaar.
0 t/m 14 jarigen die deel uitmaken van de GBA-bevolking zijn voor zover ze niet in de
gebruikte registers voorkomen ook toegevoegd aan dit bestand.
Voor alle 0 t/m 11 jarigen wordt opleidingsinformatie geïmputeerd, voor 12 t/m 14
jarigen alleen voor zover geen informatie beschikbaar is in de gebruikte
onderwijsregistraties.
Voor 0 t/m 14 jarigen, niet voorkomend in registers, wordt het opleidingsniveau 'bekend'
verondersteld, op basis van een aantal aannames. Ten eerste wordt voor de hoogst
behaalde opleiding van 0 t/m 11 jarigen een opleidingsnummer gehanteerd op
kleuteronderwijsniveau (basisonderwijs groep 1-2); voor 12 t/m 14 jarigen een
opleidingsnummer op niveau basisonderwijs groep 3-8. Wat betreft de hoogst gevolgde
opleiding veronderstellen we het volgende: 0 t/m 5 jarigen kleuteronderwijs, 6 t/m 11
jarigen basisonderwijs groep 3-8 en 12 t/m 14 jarigen secundair onderwijs, eerste fase
zonder nadere aanduiding.
Voor geherstructureerde HOOGSTEOPL's met JJJJ = 1999-2005 is nog de oudere
systematiek van imputatie toegepast, waarbij geen onderscheid werd gemaakt binnen het
basisonderwijs.
Het Stelsel van Sociaal-statistische Bestanden (SSB)
Het SSB bevat gegevens over alle personen, banen en uitkeringen in Nederland die op
microniveau aan elkaar relateerbaar zijn. Hiervoor zijn gegevens over personen uit
registraties en enquêtes op microniveau gekoppeld en waar nodig consistent gemaakt.
Een belangrijke doelstelling van het SSB is een gegevensbestand samen te stellen dat een
samenhangende, consistente beschrijving geeft van een aantal aspecten van de bevolking
van Nederland. Voor achtergrondinformatie over het SSB zie: SSB informatie.
11
Documentatierapport HOOGSTEOPLTAB
3. Bestandsopbouw en toelichting
Bestandsopbouw van dit onderwerp
Onderstaand volgt een overzicht van alle variabelen.
Nr.
1
2
3
4
5
Variabele en omschrijving
RINPERSOONS
Soort RINPERSOON
RINPERSOON
Samen met RINPERSOONS is dit de persoon
OPLNRHB
Opleidingsnummer hoogst behaalde opleiding
OPLNRHG
Opleidingsnummer hoogst gevolgde opleiding
GEWICHTHOOGSTEOPL
Ophooggewicht; 1.000000 als bron is registratie of GBA 0-14
12
Form.
A1
A9
A6
A6
DOT14.6
Documentatierapport HOOGSTEOPLTAB
Toelichting op de variabelen
In deze paragraaf wordt van de categoriale variabelen de waarden en hun betekenis
gegeven.
RINPERSOONS
R
RINPERSOON WEL IN GBA
13
Documentatierapport HOOGSTEOPLTAB
Versiegeschiedenis
Bestandsnaam
120619 HOOGSTEOPLTAB 2006V1
120619 HOOGSTEOPLTAB 2007V1
120619 HOOGSTEOPLTAB 2008V1
120619 HOOGSTEOPLTAB 2009V1
120726 HOOGSTEOPLTAB 1999V1
120726 HOOGSTEOPLTAB 2000V1
120726 HOOGSTEOPLTAB 2001V1
120726 HOOGSTEOPLTAB 2002V1
120726 HOOGSTEOPLTAB 2003V1
120726 HOOGSTEOPLTAB 2004V1
120726 HOOGSTEOPLTAB 2005V1
120918 HOOGSTEOPLTAB 2010V1
130924 HOOGSTEOPLTAB 2011V1
141020 HOOGSTEOPLTAB 2012V1
Reden
Eerste plaatsing
Eerste plaatsing
Eerste plaatsing
Eerste plaatsing
Eerste plaatsing
Eerste plaatsing
Eerste plaatsing
Eerste plaatsing
Eerste plaatsing
Eerste plaatsing
Eerste plaatsing
Eerste plaatsing
Eerste plaatsing
Eerste plaatsing
14