Αναλύσεις με STATA

Το στατιστικό πρόγραμμα STATA αποτελεί ιδιοκτησία της StataCorp LLC και το βασικό του πλεονέκτημα είναι η ελευθερία που παρέχει στον χρήστη μέσω των συνεχώς αναπτυσσόμενος και εξελισσόμενων βιβλιοθηκών που παρέχει η εταιρεία αλλά και οι χρήστες μέσα από διάφορα sites ή blogs όπως π.χ. The Stata blog. Αν και το βασικό πλεονέκτημα του προγράμματος είναι ο κώδικας του παρόλα αυτά μερικοί χρήστες ίσως βρίσκουν δύσκολη την συγγραφή του κώδικά αλλά και τον χειρισμό των αποτελεσμάτων.

 

Με ένα απλό παράδειγμα θα προσπαθήσουμε να δείξουμε κάποιες από τις δυνατότητες του προγράμματος μέσα από την ανάλυση χρονικών σειρών. Ως δεδομένα χρησιμοποιήσαμε τον δείκτη ΑΕΠ για τα έτη 1995 έως και 2017 από την ΕΛΣΤΑΤ.

 

Η εισαγωγή του dataset γίνεται με την βοήθεια της εντολής

 

import excel «C:\…\stata_example.xlsx», sheet(«Φύλλο1») firstrow

 

year pop GDP
1995 10562164 8811.0354
1996 10608821 9712.3557
1997 10661312 10759.669
1998 10720566 11684.323
1999 10761705 12431.927
2000 10805796 13071.436
2001 10862146 14011.397
2002 10902005 14993.642
2003 10928091 16371.103
2004 10955163 17682.605
2005 10987352 18133.788
2006 11020393 19768.947
2007 11048499 21061.195
2008 11077863 21844.501
2009 11107024 21385.943
2010 11121383 20324.041
2011 11104995 18642.861
2012 11045040 17311.292
2013 10965241 16475.176
2014 10892369 16401.986
2015 10820964 16381.013
2016 10775989 16377.889
2017 10768193 16736.104

 

Στην συνέχεια δίνουμε την περιγραφή των μεταβλητών

label variable year «Έτος»

label variable pop «Πληθυσμός»

label variable GDP «ΑΕΠ»

 

Για την καλύτερη γραφική απεικόνιση των δεδομένων κατασκευάσαμε μια νέα μεταβλητή, την pop2

 

generate pop2=pop/100

label pop2 «Πληθυσμός (Εκατοντάδες)»

 

Το διάγραμμα χρονικής μεταβολής του πληθυσμού  παράγεται από την εντολή tsline pop2 και παράγει το παρακάτω γράφημα

Παρόμοια, η εντολή tsline GDP παράγει το παρακάτω γράφημα

 

Παρατηρούμε παρόμοια μεταβολή των δύο μεγεθών που χαρακτηρίζεται από την σταθερή πτώση των τιμών τους μετά το 2010.

Τέλος, η ταυτόχρονη απεικόνιση των δύο μεταβλητών με την βοήθεια της εντολής  tsline GDP pop2 δεν μπορεί να αποδώσει με την προηγούμενη λεπτομέρεια τις χρονικές μεταβολές τους.

 

Μια λύση είναι ο συνδυασμός αυτών των δύο γραφημάτων με την βοήθεια των εντολών

 

line pop2 year, saving(g1)

line GDP year, saving(g2)

gr combine g1.gph g2.gph

 

Η πρώτη εξέταση έγινε με την βοήθεια υποδείγματος γραμμικής παλινδρόμησης με την βοήθεια της εντολής

regress GDP year

και τα αποτελέσματα έδειξαν ότι το υπόδειγμα είναι στατιστικά σημαντικό (F(1,21)=16.45, p<0.001) και μέτριας ερμηνευτικότητας (R2=43.93)

Η σύγκριση των πραγματικών έναντι των εκτιμώμενων τιμών με την βοήθεια των εντολών

predict fitted_values

 

line fitted_values GDP year

δείχνει ότι η γραμμική παλινδρόμηση δεν μπορεί να συλλάβει τις μεταβολές του δείκτη ΑΕΠ

 

Η δεύτερη εκτίμηση έγινε με την βοήθεια της μεθόδου ARIMA(p,d,q) και οδήγησε στο μοντέλο ARMA(2,0) καθώς παρουσίασε τον χαμηλότερο συντελεστή BIC και AIC.  Η νέα εκτίμηση έγινε με την βοήθεια των εντολών

arima GDP, arima(2,0,0)

predict f1

estout, stat(aic bic)

line f1 GDP year

ήταν σαφέστατα βελτιωμένη όπως φαίνεται και από το παρακάτω γράφημα

Αυτό ήταν ένα απλό παράδειγμα της χρήσης του προγράμματος STATA για ανάλυση. Για οποιαδήποτε απορία ή εάν χρειαστείτε βοήθεια στην ανάλυση σας μπορείτε να επικοινωνήσετε μαζί μας.