Det
sociale miljøs betydning for de unges uddannelsesmønster
Dokumentation
af fremgangsmåde og metode - Jens Gundgaard, COWI 20. januar 2008
og diskretionsprincipper
ved behandling af mikrodata.
Udtrækket fra Danmarks
Statistik består af alle 23-årige (dvs. mellem 23 år og 24 år i kontinuerlig
alder) opgjort den 15. oktober 2006, som var til stede i Danmark 1. januar 2007:
58.080 23-årige
- samt deres forældre
(hvis der er oplysninger om dem): 51.400 fædre og 52.318 mødre (fædre og mødre
kan være forældre til flere børn - f.eks. i tilfælde af tvillinger).
For disse personer er
der udtrukket oplysninger fra forskellige registre. Nogle oplysninger er kun for
børnene, andre for forældrene og andre for både børn og forældre. Ved udtræk
på denne størrelse vil der være række små fejl og manglende oplysninger,
som der skal tages hensyn til, når de relevante variable dannes. Det følgende
er en beskrivelse af, hvordan der er dannet et arbejdsdatasæt, som der er udført
analyser på.
Variabel dannes, hvis
der er oplysninger om enten Højest fuldført eller Igangværende uddannelse
eller begge to. Hvis kun den ene er til rådighed bruges den. Hvis begge til rådighed
bruges den højeste. Ungdomsuddannelse defineres som gymnasium og tilsvarende,
erhvervsuddannelse eller højere målt oktober 2006.
Om
23-årige har afsluttet eller er i gang med en videregående uddannelse
Variabel dannes, hvis
der er oplysninger om enten Højest fuldført eller Igangværende uddannelse
eller begge to. Hvis kun den ene er til rådighed bruges den. Hvis begge til rådighed
bruges den højeste. Videregående uddannelse defineres som kort, mellem, lang
uddannelse såvel som forskeruddannelse målt oktober 2006.
Egen
sociale baggrund
Svag social baggrund
(eller hjemmebaggrund) er defineret på baggrund af nogle veldefinerede
risikofaktorer:
§
Ingen af forældrene har en
uddannelse med erhvervskompetence. Forældrenes fuldførte uddannelser er
opgjort oktober 1998. Variabel dannes hvis der er oplysninger om mindst én forælder
og denne har uddannelsesoplysninger. Uddannelse med erhvervskompetence defineres
som faglig uddannelse eller højere.
§
Den unge bor ikke hos både sin
biologiske far og mor. Der er anvendt variabel for forældremarkering i 1998,
som indikerer om den unge bor eller ikke bor hos begge biologiske (eller
adoptiv-) forældre. Variabel er kun dannet, hvis forældremarkeringsvariablen
indeholder oplysninger.
§
Mindst en af forældrene har
sin overvejende indkomst fra kontanthjælp/førtidspension. Der er anvendt
variable for bruttoindkomst, kontanthjælp og førtidspension/folkepension
(aktiveringsydelser er ikke inkluderet i kontanthjælpsvariablen). Negative værdier
er sat til 0. For hver forælder er (kontanthjælp+førtidspension/folkepension)
sat i forhold til bruttoindkomsten for ikke-nul-værdier af bruttoindkomst. For
nul-værdier af bruttoindkomst er andel sat til 0 hvis (kontanthjælp+førtidspension/folkepension)
er nul, og andel er sat til 1, hvis (kontanthjælp+førtidspension/folkepension)
er forskellig fra nul. Hvis andel over 50% for faren eller moren tæller det som
en risikofaktor - ellers ikke. Variabel dannet uanset, om der er oplysninger og
indkomstoplysninger om forældre.
Svag
hjemmebaggrund defineres som de 23-årige, der som 15-årige voksede op i et
hjem præget af mindst to af ovenstående risikofaktorer
Individkarakteristika
Der
er udtrukket oplysninger om etnisk oprindelse (Dansker - indvandrer -
efterkommer) samt oprindelsesland, som er klassificeret som Danmark, vestligt,
ikke-vestligt (Rumænien og Bulgarien har for nyligt skiftet status og er nu
klassificeret som vestligt - denne nye klassifikation er anvendt). Desuden er
der individoplysninger om køn. Disse individkarakteristika er tilgængelige for
alle 23-årige.
Sammenkørsel
af datasæt
Kriterier
for sammenkørsel
De
udtrukne oplysninger er sammenkørt til ét datsæt vha. personnumre, fædres
personnumre, mødres personnumre eller institutionsnumre (afhængigt af hvilke
oplysninger, der er tale om).
Der
er dannet er arbejdsdatasæt til analyser. Observationer er kun medtaget til
arbejdsdatsættet, hvis
§
Der er uddannelsesoplysninger
om højest fuldført uddannelse hos den af forældrene, som der er oplysninger
om.
Bortfaldsproblematik
De nødvendige
inklusionskriterier fører uheldigvis til, at det anvendte datamateriale ikke er
helt repræsentativt for en årgang af unge. Blandt årgangen af 23-årige i
2006 er der 84% med dansk oprindelse, 14% indvandrere og 2% efterkommere (fra både
vestlige og ikke-vestlige lande). Efter eksklusionskriterierne er der kun ca. 4%
indvandrere og lidt under 2% efterkommere. En del af indvandrerne er naturligt
irrelevante for undersøgelsen, da de er kommet til landet efter skolealderen og
ikke har gået i en dansk skole (ca. halvdelen af de ekskluderede har haft en
"indvandring" efter 1998), men der er også indvandrere (såvel som
danskere), der er ekskluderet pga. mangelfulde oplysninger om forældrene.
Antageligt er der overrepræsentation af personer med svag hjemmebaggrund blandt
dem, der er ekskluderet pga. mangelfulde uddannelsesoplysninger. Et forsøg på
klassificering af personer med mangelfulde uddannelsesoplysninger er dog
vurderet til at være spekulativ, og der er ikke eksperimenteret med at
korrigere for bortfaldsproblematikken.
Endeligt
arbejdsdatasæt
Efterfølgende er der
yderligere ekskluderet alle 23-årige personer, som går på skoler med
oplysninger om mindre end 10 elever (1358 af de unge). Herved består det
endelige arbejdsdatasæt af 43.735 personer.
Geografiske
opdelinger
Geografiske opdelinger
er foretaget på kommuneniveau og på områder i fem udvalgte byer i Danmark (København,
Århus og Odense). De geografiske opdelinger er fortrinsvist foretaget med
henblik på at illustrere forskelle og ligheder på kort.
På kommuneniveau er
lavet grupperede opgørelser for en række af variablene. Læsø og Fanø er
ekskluderet fra disse opgørelser, da datamaterialet for disse kommuner vurderes
til at være for spinkelt. Illustreret på kort følger opdelingen af kommuner
kommunegrænserne efter kommunalreformen i 2007.
I København er anvendt
følgende gruppering af skoler til byområder:
Vesterbro
Nørrebro
Valby
Brønshøj
Vanløse
I Århus er anvendt følgende
gruppering af skoler til byområder:
Århus
midtby
Vestlige
forstæder
Nordlige
forstæder
I Odense er anvendt følgende
gruppering af skoler til byområder:
Vest
Nordvest
Sydøst
Midt
Nordøst
Syd
Nord
Beskrivelse
af analyser
Der er udarbejdet en række
analyser. Analyserne er deskriptive af natur og der tages det forbehold, at de
fundne tendenser ikke nødvendigvis afspejler kausale sammenhænge. De fleste
analyser er univariate eller bivariate, og der er potentielle observerbare og
uobserverbare faktorer, som der ikke er kontrolleret for. Endvidere skal der
tages forbehold for usikkerhed pga. variationer fra årgang til årgang, et
relativt spinkelt datagrundlag, når der analyseres på nogle geografiske
opdelinger samt tidligere nævnte bortfaldsproblematikker.
Analyserne
handler om andelen af de 23-årige som er i gang med eller har fuldført
ungdomsuddannelse og andelen af de 23-årige som er i gang med eller har fuldført
videregående uddannelse.
Der
er udført en række analyser, og for nogle af analyserne er resultaterne præsenteret
som kort. Til analyserne er der bl.a. gjort brug af: