V krizi smisla tiči misel






         

31.08.2014

Indeks stanja na področju kulture za 33 evropskih držav (v letu 2009)

Prispevek na zgornjo temo, ki sem ga obljubljal že dlje časa, bo v prvi končni obliki predstavljen na bližajočih se konferencah raziskovalcev kulturne politike ICCPR v nemškem Hildesheimu in na 14. konferenci združenja EBES v španski Barceloni.

V nastajajočem prispevku, ki smo ga s soavtorjema Miroslavom Verbičem in Vesno Čopič naslovili »Index construction and multivariate analysis in high-dimensional settings: application to a cultural policy index« smo na podatkih »knjižice« Cultural Statistics Pocketbook 2011 (ki uporablja podatke za leto 2009) in drugih podatkov Eurostata konstruirali indeks, ki smo mu prvotno dejali indeks kulturne politike, morda pa bi ga bilo primerneje imenovati indeks stanja na področju kulture (torej dejansko Cultural Index).

Metodološki postopek izračuna indeksa je bil precej statistično kompleksen. Glavni problem, s katerim smo se srečali, je visokodimenzionalna narava izračuna indeksa, saj smo uporabili nabor 236 skupnih spremenljivk za 33 evropskih držav (28 držav EU ter Islandija, Norveška, Švica, Turčija in Makedonija). Visokodimenzionalnost v statistiki označuje situacije, ko imamo opravka s precej več spremenljivkami kot opazovanji in ponavadi terja statistične korekcije za pravilne izračune parametrov in statistik. Po domače povedano: predstavljajte si opravljati faktorsko analizo, ki ponavadi zahteva razmerje med spremenljivkami in opazovanji vsaj 1:10, s skoraj obratnim razmerjem, torej malo manj kot 10:1… Logična posledica je na eni strani pristranost v parametrih in na drugi strani neobstoj osnovnih statistik, kot je pri faktorski analizi Kaiser-Meyer-Olkinova statistika in druge.

Ob tem gre dodati, da se s tovrstnimi situacijami srečujete pri izračunih različnih indeksov na katerem koli področju družbe (npr. kmetijstva, zdravstva, “aktivnega staranja”, itd.), ko imate podatke za vrsto spremenljivk na ravni npr. 28-tih EU držav, torej imate ponovno opravka s precej več spremenljivkami kot opazovanji. V tem verjetno leži precejšnja uporabnost spoznanj članka tudi za druga področja ekonomije in družbe.

Literatura je sicer glede reševanja tega problema še precej skopa (visokodimenzionalna statistika je predmet intenzivnejših analiz šele v zadnjem desetletju), osnovni nasvet pa je uporaba bootstrapa pri izračunu parametrov in statistik. Ker ta pojem uporabljam zadnje čase kar pogosto: bootstrap je simulacijska metoda, ki je v zadnjih desetletjih postala temeljna metoda korigiranja pristranosti v izračunih, ki so posledica problemov z vzorcem in netočnih (ali celo neobstoječih) standardnih napak. Avtor metode je ameriški statistik Bradley Efron, po besedah mojih preteklih bloomingtonskih predavateljev (in tudi po mojem prepričanju) bi si Efron za to že zdavnaj zaslužil Nobelovo nagrado, vendar je podobno kot še nekateri (npr. Art Owen za metodo empiričnega verjetja; Rob Tibshirani za cenilko LASSO) ne bo prejel, ker ni ekonomist oz. ni prav blizu krogom, ki to nagrado podeljujejo.

Naših 236 spremenljivk je bilo sestavljenih iz 12 sklopov:
1) Splošni razvoj: BDP, raven tveganja revščine, raven poseljenosti države, raven izobraženosti v dveh osnovnih starostnih skupinah, delež delovno aktivnih prebivalcev, raven zaposlenosti, raven dolgoročne brezposelnosti;
2) Kulturna dediščina: število objektov kulturne dediščine, uvrščenih v listo UNESCO-ve dediščine, v neki državi;
3) Izobraževanje v kulturi: delež študentov umetnosti, humanistike, novinarstva in arhitekture (ločeno za vsa štiri področja); raven znanja tujih jezikov; delež študentov, ki gredo v tuje države; delež tujih študentov v domači državi;
4) Zaposlovanje v kulturi: delež zaposlenih v različnih panogah kulture;
5) Deleži kulturniških poklicev v skupni populaciji;
6) Deleži različnih skupin prebivalstva v kulturi: ženske, zaposleni za polovični čas, samozaposleni, visoko izobraženi, itd.;
7) Kulturne industrije: različni podatki o dodani vrednosti, prihodkih, zaposlenih itd. v podjetjih v kulturi;
8 ) Zunanja trgovina: številni podatki o ravni menjave različnih kulturnih dobrin (kultura skupno, umetnost, antikvitete, CDji, DVDji, časopisi, knjige) neke države s tujino;
9) Participacija in obisk kulturnih dogodkov: različni podatki o obiskovanju in sodelovanju v kulturnih dogodkih;
10) Internetne navade: vrsta podatkov o uporabi interneta, povezani s kulturo;
11) Zasebni izdatki za kulturo: vrsta podatkov o različnih oblikah zasebnih izdatkov za kulturo;
12) Javno financiranje kulture: podatki o višini skupnega proračuna (na splošni, državni in lokalni ravni) ter o višini proračuna za kulturo (ponovno na splošni, državni in lokalni ravni).

Naš metodološki postopek je bil torej sestavljen iz več stopenj:

1) Najprej smo se morali soočiti s tem, da veliko podatkov kulturne statistike pri več državah manjka. Resda (z izjemo podatkov o javnem financiranju) ne gre za manjkanja več kot npr. 20% vrednosti posamezne spremenljivke, vseeno pa je bil to resen začetni problem. Uporabili smo multiplo imputacijo po metodi »z uporabo pogojev« (angl. Fully Conditional Specification Method oz. FCS metoda, avtorjev van Buurena, Branda, Groothuis-Oudshoorna in Rubina, ki je zelo pogosto uporabljena metoda multiple imputacije v zadnjem času in je podrobneje opisana tule; metodo podpira tudi statistični paket Stata v modulu MICE oz. v ukazu mi impute chained). Pri metodi se manjkajoče spremenljivke po iteracijskem postopku sproti dopolnjujejo in hkratno tudi vplivajo na vrednosti druga druge. Na tak način lahko upoštevamo njihove vzajemne povezave, ker je npr. lokalno financiranje kulture odvisno tudi celotne ravni javnega financiranja kulture, BDP, stopnje zaposlenosti v kulturi itd., kljub temu, da so slednje spremenljivke prav tako nepopolne oz. imajo manjkajoče vrednosti. Pri vseh spremenljivkah smo kot določilne dejavnike vključevali dejavnike splošnega razvoja (BDP, raven revščine, raven izobraženosti, gostoto poselitve, zaposlitvene spremenljivke, itd.), ker pa je metoda FCS občutljiva na vrstni red spremenljivk, smo pri imputacijah na prvo mesto vedno postavljali kulturne dejavnike (raven zaposlenosti v kulturi, raven izobraževanja v kulturi, število objektov kulturne dediščine, itd.).

2) V drugi fazi smo vse podatke standardizirali z uporabo Statinega ukaza egen std, s čimer so bili vsi podatki merjeni po isti merski lestvici in pripravljeni za uporabo.

3) Nato smo pognali osnovno faktorsko analizo z uporabo vseh 236 spremenljivk in ocenili število faktorjev glede na velikost lastnih vrednosti in scree prikaz, v našem primeru je bilo jasno videti, da število faktorjev ne presega osem, najverjetneje pa zadoščajo štirje glavni faktorji.

4) Z uporabo prirejene bootstrapske rutine, ki sem jo zapisal tukaj, smo najprej ocenili faktorske uteži skupnega modela za osem faktorjev. Rezultati so prikazani v spodnji tabeli, zapisani so samo koeficienti oz. uteži, ki so bile značilne vsaj pri statistični stopnji značilnosti 0.10. Na tej osnovi smo poimenovali faktorje, vidno je bilo tudi, da so smiselno zastopani le trije faktorji. Faktorje, ki predstavljajo glavne dimenzije preučevanega pojava, torej sistemskega stanja na področju kulture smo poimenovali takole – prvi faktor: »splošni poslovni vidiki kulture« (zaposlenost v kulturi, zunanja trgovina s poudarkom za izvozu, kulturne industrije, zasebni izdatki za kulturo; grobi podatki o javnem financiranju kulture); drugi faktor: »participacija v kulturi« (deleži različnih skupin v kulturi in delež kulturniških poklicev v skupni populaciji; participacija in obiskovanje kulture; internetne navade; nekateri zasebni izdatki za kulturo); tretji faktor: »domača in javna vlaganja v kulturo« (BDP na prebivalca; javni izdatki za kulturo na prebivalca; nekateri dejavniki zunanje trgovine, predvsem uvoz kulturnih dobrin; internetne navade, bolj striktno povezane s kulturno vsebino; nekateri zasebni izdatki za kulturo).

5) S ponovno uporabo podobne bootstrapske rutine smo ocenili tudi regresijske koeficiente (scores) za izračun omenjenih faktorjev in jih nato tudi dejansko izračunali. Iz tako izračunanih faktorjev, ki so seveda po definiciji standardizirane normalne spremenljivke, smo izračunali indeks(e) tako, da smo vrednosti, ki se nahaja 3 standardne odklone nad povprečjem (ki je seveda v tem primeru enako nič, torej je ta vrednost enaka 3) pripisali vrednost 100, vrednosti 3 standardne odklone pod povprečjem (oz. -3) pa pripisali vrednost 0. Ostale vrednosti vseh treh indeksov smo razmernostno izračunali na tako zamejeni lestvici. Rezultati izračunanih indeksov so spodaj.

Vrednosti prvega indeksa vsaj v grobem ustrezajo pričakovanjem: daleč najvišji indeks ima Velika Britanija, kar gre lahko na račun njihove jezikovne hegemonije in s tem presežkov v zunanji trgovini s kulturnimi izdelki. Druga na lestvici je Francija, ki je tam tudi zaradi zelo dobre vrednosti zunanje trgovine z umetniškimi izdelki (arts&antiques), kjer sta z Veliko Britanijo daleč spredaj. Prednjačijo še tri države jezikovno dominantnih prostorov: Nemčija, Španija in Italija. Hrvaška s svojim visokim mestom preseneča, morda je to posledica imputiranja, ker so bile pri njej vse vrednosti zunanje trgovine v osnovi manjkajoče. Večino zadnjih mest zasedejo manjše države, med njimi pričakovano najdemo tudi Slovenijo, ki ima tudi po izsledkih domačih študij probleme z menjavo kulturnih dobrin s tujino.

Vrednosti drugega indeksa potrdijo, da je »nordijski kulturni model«, o katerem piše denimo Peter Duelund, tisti, ki najmočneje stavi na participacijo v kulturi. Na prvih mestih po vrednostih tega indeksa se tako nahajajo prav vse skandinavske države ter države baltskega kroga. Na zadnjih mestih so države jugovzhodne ter vzhodne Evrope. Slovenijo najdemo glede tega na repu zgornje polovice lestvice.

Vrednosti tretjega indeksa, da so pričakovano na vrhu države z najvišjim BDP, prednjači Luksemburg, ki tudi sicer daleč prednjači pri ravni javnih izdatkov za kulturo, kar je verjetno tudi posledica njegove majhnosti. Med prvo peterico najdemo še Avstrijo, Irsko, Norveško in Belgijo. Slovenija se sicer po ravni javnih izdatkov uvrsti v zgornji del lestvice, vendar jo nižje uvrščajo vrednosti drugih spremenljivk, predvsem pri uvozu kulturnih dobrin, kjer prav tako nismo dobro uvrščeni.

6) Naslednji metodološki korak, o katerem ne bom posebej poročal tukaj, je predstavljala teoretska potrditev modela oz. t.i. potrjevalna faktorska analiza (z uporabo Cronbahove alfe in testiranja prileganja modelov s pomočjo običajnih statistik, ki se uporabljajo pri analizi modelov strukturnih enačb). Rezultati so potrdili, da je najbolj sprejemljiv model s tremi faktorji, ki so podindeksi za latentno opazovan konstrukt stanja na področju kulture.

7) Zadnji, morda najbolj zanimiv metodološki korak je predstavljala clustering analiza oz. analiza skupinjenja. Napravili smo osnovno analizo po hierarhični metodi z dopolnitvijo nehierarhične metode K-means. Analizo smo napravili po vrednostih treh faktorjev in po uvrstitvah na pripadajočih treh lestvicah. Vrednosti statistik (statistika Calinski-Harabasz in razmerje Duda-Hart) so pokazale na šest grobih skupin držav. Spodnji dendrogram pokaže potek združevanja in skupine držav po hiearhični metodi za vrednosti faktorjev.

Opazne so naslednje skupine držav:
1) Velike zahodne države: Velika Britanija, Francija in Nemčija;
2) Model manjših, participativnih držav: Litva, Latvija, Estonija, Slovenija, Nizozemska, Švica;
3) Nordijski model: Norveška, Islandija, Švedska, Finska in Danska;
4) Manjše, liberalne države: Luksemburg, Avstrija, Irska;
5) Vzhodno-evropski model: Madžarska, Češka, Poljska, Slovaška, Bolgarija, z dodatkom Portugalske;
6) Južno in jugovzhodno evropski model: Makedonija, Turčija, Romunija, Hrvaška, Italija, Španija, Malta, Grčija, Ciper, z dodatkom Belgije.

Uporaba K-means metode je edine spremembe povzročila v premešanju zadnjih dveh skupin, izmed katerih se je oblikovala skupina jugovzhodnih držav: Grčija, Turčija, Romunija in Makedonija. Vse preostale države (Madžarska, Češka, Poljska, Slovaška, Bolgarija, Hrvaška, Portugalska, Italija, Španija, Ciper, Malta in Belgija) so uvrščene skupaj, z izjemo Belgije, ki pa izpade že pri naslednji analizi, bi jih lahko poimenovali države Vzhodne Evrope in Mediterana.

V spodnjem grafu pa je prikazano še skupinjenje po rangih, torej uvrstitvah na lestvicah. Iz njega je prav tako vidnih šest osnovnih skupin držav:
1) Baltsko-srednjeevropski model: Litva, Latvija, Estonija, Slovenija in Madžarska;
2) Mediteransko-jugovzhodno evropski model: Hrvaška, Italija, Turčija, Makedonija, Romunija, Malta in Grčija;
3) Vzhodno-evropski model: Poljska, Češka, Portugalska, Slovaška in Bolgarija;
4) Model majhnih, liberalnih držav: Luksemburg, Ciper in Irska, v nekaterih modeliranjih k temu modelu gravitira tudi Slovenija;
5) Nordijski model: Islandija, Finska, Norveška, Švedska, Danska, z dodatkom Švice;
6) Zahodni model: Nizozemska, Belgija, Velika Britanija, Francija, Španija, Nemčija in Avstrija.

Tako, to je bilo storjenega doslej. Kaj so glavne ugotovitve, kje glavne omejitve analize in kje bo pot nadaljnjega dela?

Vse skupaj bi sam strnil v sledeče štiri točke, glede na glavne ugotovitve:

1) Izmed zbranih spremenljivk na področju stanja kulture, katerih evidenco vodi Eurostat, smo uspeli prepoznati tri glavne dimenzije, ki smo jih poimenovali: a) »splošni poslovni vidiki kulture« (zaposlenost v kulturi; zunanja trgovina s poudarkom za izvozu; kulturne industrije; zasebni izdatki za kulturo; grobi podatki o javnem financiranju kulture); b) »participacija v kulturi« (participacija in obiskovanje kulture; internetne navade; deleži različnih skupin v kulturi in delež kulturniških poklicev v skupni populaciji; nekateri zasebni izdatki za kulturo); c) »domača in javna vlaganja v kulturo« (BDP na prebivalca; javni izdatki za kulturo na prebivalca; uvoz kulturnih dobrin na prebivalca; internetne navade, bolj striktno povezane s kulturno vsebino; nekateri zasebni izdatki za kulturo). Vsaki dimenziji smo izračunali pripadajoči indeks in razložili položaje držav na lestvicah. Tukaj seveda ostaja še nekaj nejasnosti, ki jih bo odpravila nadaljnja analiza pred objavo.

2) Analiza skupinjenja je razbrala šest osnovnih skupin držav:
- Baltsko-srednjeevropski model: Litva, Latvija, Estonija, Slovenija in Madžarska;
- Mediteransko-jugovzhodno evropski model: Hrvaška, Italija, Turčija, Makedonija, Romunija, Malta in Grčija (v nekaterih modeliranjih se kaže obstoj ločenega jugovzhodnega modela s štirimi članicami: Turčijo, Grčijo, Makedonijo in Romunijo);
- Vzhodno-evropski model: Poljska, Češka, Slovaška, Bolgarija, s Portugalsko nekje med tem in predhodnim modelom;
- Model majhnih, liberalneje usmerjenih in kulturi relativno naklonjenih držav: Luksemburg, Ciper in Irska, v nekaterih modeliranjih (ki jih tu nismo prikazali) k temu modelu gravitira tudi Slovenija;
- Nordijski model: Islandija, Finska, Norveška, Švedska, Danska, v nekaterih modeliranjih z dodatkom Švice;
- Zahodni model: Nizozemska, Belgija, Velika Britanija, Francija, Španija, Nemčija in Avstrija.
V grobem pa grafi potrdijo tudi tezo, postavljeno v prispevku Čopič, Inkei, Kangas in Srakar (2013), da lahko evropske države glede na empirične podatke stanja v kulturi ločimo v dve večji skupini: Zahodno-Evropske; in Vzhodno-Evropske in Mediteranske države. Te ugotovitve predstavljajo pomemben korak v empirični analizi kulturne politike in pri analizi in razlikovanju modelov kulturne politike in terjajo nadaljnjo obravnavo in analizo (nekaj je bo dopolnjene pred objavo oz. predstavitvami člankov). Med drugim ponujajo tudi osnovo za izračun »razdalj« med državami glede posameznih elementov stanja v kulturi, kar bi bila dobra tema za enega (ali več) nadaljnjih prispevkov oz. za nadaljnjo smer raziskovanja.

3) Nujni napotek za področje kulturne statistike, ki sledi iz naše analize: v sedanjem času je prisotnega bistveno preveč ukvarjanja z izborom in merjenjem samih indikatorjev, lahko bi celo dejali, da je celotno sedanje področje kulturne statistike usmerjeno zgolj v to tematiko. Naša analiza oz. kar bo iz nje še nastalo, je pokazala, da je v tem trenutku na voljo že dovolj statističnih indikatorjev, da pa v veliki meri primanjkuje resnejših analiz oz. uporab podatkov. Nasvet področju kulturne statistike na ravni EU torej je, da se veliko močneje usmerja v uporabo podatkov, saj bo šele slednje pokazalo, kaj je možno storiti s sedanjimi podatki in nakazalo tudi, kje so resnično nujni koraki pri nadgradnji sedanjega sistema kulturne statistike na ravni EU. Veliko več samega »mesa« torej in veliko manj ukvarjanja zgolj s prenovo okostja, ki ga je sedaj preprosto preveč in postaja bolj samo sebi namen, kar je pokazalo tudi zimsko srečanje avtorjev Kompendija evropskih kulturnih politik in trendov, kjer je skupina za kulturno statistiko ostajala zgolj pri ugotovitvah, da je vsa kulturna statistika zanič, da so podatki manjkajoči in napačni itd. Naša analiza torej jasno pokaže, da mora kulturna statistika nujno preiti k spodbujanju uporabe in (zaradi mene tudi kritične) analize sedanjih podatkov in manj energije usmerjati zgolj v razmišljanja o boljšem ogrodju podatkov.

4) Zadnjič, in morda najpomembneje: metodološka zgradba naše analize je pokazala tudi pot, po kateri je mogoča uporaba visokodimenzionalnih baz podatkov pri izgradnji tovrstnih indeksov na vseh področjih gospodarstva, javnega sektorja in družbe nasploh. Ker se tovrstni problemi lahko hitro pojavijo, kar smo omenjali že v začetku zapisa, ima lahko naša analiza širše aplikacije in s tem resnično precejšnjo uporabnost.

  • Share/Bookmark

17.08.2014

Še nekaj kratkih

Na hitro:

1) Obsežnejši zapiski princetonskih predavanj o visokodimenzionalni statistiki prof. Ramona van Handela so dostopni tukaj.

2) Mnogi ste se že srečali s programiranjem v prosto dostopnem statističnem paketu R, ki je verjetno ena boljših stvari, ki se je statistikom in ekonometrikom zgodila v zadnjem desetletju in pol. Ker je paket precej svojsko napisan, prav pride vedeti, kako in s katerimi ukazi lahko v njem navigiramo. Več o tem najdete v temle prispevku.

3) Primer uporabe multivariatne analize (metode glavnih komponent in skupinjenja) v R na primeru letalstva pa najdete tukaj.

  • Share/Bookmark

17.06.2014

Public Budgets for Culture in the EU During Financial Crisis: An Econometric Perspective

Tale članek bo drug teden predstavljen v Montrealu na osrednji konferenci združenja kulturnih ekonomistov ACEI.

Tole je angleški povzetek. Ko bo kaj več časa, morda napišem še kaj več na to temo.

The article analyses whether EU countries use similar cultural financing strategies during crisis as they use in economically successful years. To provide an answer to the question we evaluate the following main hypothesis: “Effects of the financial crisis were reflected in the cuts in general, central and local budgets for culture.” To estimate it we use methods from multivariate analysis (hierarchical and K-means clustering, principal components analysis), and panel data regression analysis (static and dynamic models). Due to the endogenous (reverse-causal) nature of relationship between central and local budgets in culture that has so far not been modelled, explained and econometrically tested, we also use panel VAR methodology to resolve and estimate the consequences of this relationship. We use dataset from Eurostat according to COFOG methodology. It has to be noted that this is one of the first (or perhaps the first) econometric analyses of public budgets for culture and their determinants in the EU and in general.

We are able to establish three main findings: 1) during the period 2008-2011 in 13 studied European countries cuts in cultural budgets as measured from deviations to the trend were present on both central as well as local level (somewhat contrary to what was established by previous study of Čopič et al., 2013); 2) the patterns of cuts in the cultural budgets have not always followed cultural policy characteristics of the studied countries; 3) there indeed exists a reverse-causal relationship among central and local cultural budgets – raising the central cultural budget will also raise the local cultural budgets, while, on the other hand, raising of the local cultural budgets will have minor if not negative effects on the level of central cultural budget. This has important policy consequences and has to be verified and tested in future empirical studies.

P.S.: Powerpoint predstavitev z nekaj najnovejšimi korekcijami in dopolnili najdete tukaj.

  • Share/Bookmark

Blog V krizi smisla tiči misel | Zagotavlja SiOL | O Sistemu |