V krizi smisla tiči misel






         

4.09.2012

Statistična simulacija – spremembe uredbe o samozaposlenih v kulturi

Zapisano pod: Ekonomija, Kulturna ekonomika, Politične 'analize' — andee - 4.09.2012

Vsem ljubiteljem statističnih in matematičnih analiz prilagam empirični del prispevka, ki ga s kolegicama pripravljamo za študentski del konference v Mariboru. Vsebinsko ta analiza secira učinke sprememb uredbe o samozaposlenih, ki jo je pred kratkim pripravilo naše “super-ministrstvo” in se navezuje na moj predhodni zapis, le da je sedaj analiza kar precej bolj izdelana. Več o sami zgodbi uredbe lahko preberete v člankih iz Dela ter Mladine. Opozarjam, da je naša analiza zaenkrat delana na podatkih o samozaposlenih, veljavnih maja letos (uporabili smo gradiva za sejo Nacionalnega sveta za kulturo, namenjeno tej tematiki), ko smo pisali prvo verzijo analize.

Vsi konstruktivni komentarji so seveda kot vedno dobrodošli.

Prispevek lahko preberete tukaj.

Za pokušino kopiram uvodni del:

———————–
V empiričnem delu prispevka bomo s kratko parametrično simulacijo prikazali učinke predlaganih sprememb uredbe o samozaposlenih, ki jih predlaga Ministrstvo za izobraževanje, znanost, kulturo in šport Republike Slovenije, na število in strukturo samozaposlenih v bodoče. Naj najprej razložimo osnovno zgradbo simulacije. Sodeč po kriterijih v spremembah uredbe, naj bi bilo poslej za pridobitev statusa za plačevanje prispevkov potrebno zbrati 71 točk od možnih stotih, odtega se 20 točk podeljuje za »obseg«, torej število opravljenih predstav, vlog in projektov, preostalih 80 pa se podeljuje za »izjemnost«, torej prispevek k razvoju področja, osvojene nagrade, število strokovnih kritik ipd. Od teh kriterijev se pri večini poklicev za osvojene nagrade podeljuje 10 točk.

V naši simulaciji bomo torej skušali oceniti, kakšno bo število samozaposlenih po uveljavitvi sprememb, v primerjavi s prejšnjim številom samozaposlenih. V ta namen smo predpostavili, da je porazdelitev števila točk posameznikov, ki prosijo za status porazdeljena po normalni, Gaussovi porazdelitvi. To pomeni, da izhajamo iz nekega povprečja, ki ga dosegajo posamezniki po doseženih točkah, ter ocenjenega standardnega odklona. Naj na tem mestu spregovorimo nekaj besed o takšnih predpostavkah. Predpostaviti normalno porazdelitev se morda zdi naraven korak, saj se na podoben način preučuje številne druge porazdelitve, ki imajo povezavo z človeškim delovanjem in odločanjem. Vendar bomo navedli nekaj razlogov, zakaj temu ni tako.

Ko smo pokazali v prvem delu prispevka, je odločanje komisij pri dodeljevanju statusa po navadi razpeto med dvema skrajnima vodiloma: na eni strani ga vodi priznavanje izjemnosti dosežkov kulturnih ustvarjalcev, na drugi strani pa je status samozaposlenega tudi socialni korektiv. V primeru točkovanja po novih kriterijih bi torej pričakovali, da je v primeru, ko je osnovno vodilo točkovanja priznavanje izjemnosti, točkovanje bolj neizprosno in dosledno, ter s tem bližje pravi normalni porazdelitvi. V primeru pa, ko točkovanje upošteva tudi socialne dejavnike statusa, je pričakovati, da bo povprečna vrednost podeljenih točk višja, zato se bo krivulja normalnosti pomaknila v desno, najverjetneje pa tudi dobila značilno nagnjeno obliko (glej sliko 2). V tem primeru je seveda potrebno biti pazljiv pri upoštevanju predpostavk normalnosti.

Drugi problem, ki ga nosi predpostavka normalnosti pri naših izračunih so osnovni momenti distribucije: srednja vrednost ter varianca oz. standardni odklon. Ker na tem področju ni dostopnih tako rekoč nikakršnih podatkov, je potrebno enostavno predpostaviti vrednosti osnovnih momentov ter opazovati, kako se izračuni spreminjajo v odvisnosti od variacij v teh parametrih. Literatura navaja kot najbolj običajne rešitve v tem primeru simulacije prek metode bootstrap (glej npr. Wasserman 2006; Davidson & MacKinnon 2005; MacKinnon 2002), kjer bi bilo dovolj zbrati podatke za nek dovolj velik vzorec iz populacije, ter na tej osnovi opraviti simulacije s ponavljanjem, kjer prvotni vzorec postane nova populacija. Metode bootstrap so postale zelo priljubljene predvsem z delom ameriškega statistika Bradleyja Efrona (Efron 1982; Efron & Tibshirani 1994), sami pa jih bomo skušali uporabiti pri nadaljnjem delu na raziskovanju problema, kjer bomo skušali zbrati ustrezne podatke prek simulacije točkovanja za manjši vzorec samozaposlenih s pomočjo preteklih članov komisij na odgovornih javnih institucijah. Žal nam zaenkrat zbrani podatki niso omogočali opraviti te vrste simulacije že v tem prispevku.

Tretji problem, ki se pojavlja je, da je klasična normalna porazdelitev neomejena navzdol in navzgor.V primeru točkovanja uredbe pa smo seveda omejeni tako navzdol (nihče ne more dobiti manj kot nič točk) kot tudi navzgor. Zato je bolj primerno in točno govoriti o »prirezani« (angl. truncated) normalni porazdelitvi. Primerjava obeh porazdelitev je prikazana na slikah 1 in 2 spodaj.

Vendar tudi to ni dovolj dober opis. V primeru, ko bo zaradi podeljevanja točk po kriteriju socialnega korektiva (ko bo torej povprečje točk višje od običajne srednje vrednosti normalne porazdelitve), lahko govorimo o nagnjeni (angl. skewed) normalni porazdelitvi. Prikaz takšne porazdelitve (nagnjene v levo) je na sliki 3 spodaj.

V našem primeru bomo vsaj za začetek izhajali iz preproste parametrične predpostavke normalne porazdelitve točk samozaposlenih po novih kriterijih točkovanja ter kasneje pogledali še posledice za izračune, ko upoštevamo prirezano normalno porazdelitev. Posledic nagnjenosti krivulje v levo (kar bo najverjetneje prisotno zaradi bolj milega ocenjevanja s strani komisij) ne bomo mogli opazovati, saj bi za to potrebovali podatke, iz katerih bi lahko sklepali o koeficientu nagnjenosti (angl. skewness).Takšna ocena bi bila možna le v primeru simulacije, opravljene na konkretnih podatkih (npr. simulacije bootstrap). Že iz zgornje slike pa je razvidno, da bo pri krivulji nagnjeni v levo ploščina pod krivuljo levo od povprečja večja od običajne (ali prirezane) normalne porazdelitve. Zato bi ob upoštevanju nagnjenosti zagotovo prišli še do bolj negativnih podatkov za število samozaposlenih po uveljavitvi uredbe (še večje število tistih, ki povprečja ne bodo dosegali in bodo torej na zgornji krivulji pod t.j. levo od povprečja).
———————–

  • Share/Bookmark


2 komentarjev »

  1.   amuk — 14.09.2012 @ 17:31

    Super! Vse pohvale za analitičen pristop k tematiki in ne le pregovarjanje, brez poskusa kvantitativnega ovrednotenja učinkov. Glede bootstrapa, npr. aritmetična sredina ocenjena z bootstrap metodo je enaka aritmetični sredini originalnega vzorca. Bootsrap se uporablja predvsem za ocenjevanje porazdelitve nekega parametera, npr. za oceno variance aritmetične sredine. Potem, sicer to ni ravno pomembno, ampak ok. Če je povprečje točk višje od običajne srednje vrednosti to implicira samo, da bo sredina normalne porazdelitve premaknjena v desno in ne nujno ukrivljena. Za ukrivljenost, kakršna je na priloženi sliki potrebuješ komisijo, ki dejansko podeli več slabih ocen ob dani sredini, kot je slabih ocen pri normalni porazdelitvi. Tako se generira debeli levi rep na grafu. Vsaj zdi se mi… Bom spremljal, želim vam vso srečo!

  2.   andee — 15.09.2012 @ 12:55 andee

    Najlepša hvala! Glede bootstrapa sem predvsem hotel opozoriti, da bi bilo potrebno vključiti neparametrične (ali polparametrične) metode, ker ni čisto jasno, kakšna je v našem primeru distribucija oz. njeni parametri. Vendar vem, da bi v tem primeru moral govoriti (če sploh) o neparametričnem bootstrapu, priznam, da tu nisem hotel pretirano razvijati prispevka naprej. Se pa zelo zahvaljujem tudi za repliko glede nagnjenosti krivulje, ki je najverjetneje zelo na mestu!

RSS vir za komentarje na objavo. Trackback URI

Komentiraj

Komentiranje iz tujine je omogočeno zgolj prijavljenim uporabnikom !

Blog V krizi smisla tiči misel | Zagotavlja SiOL | O Sistemu |