Το στατιστικό πρόγραμμα STATA αποτελεί ιδιοκτησία της StataCorp LLC και το βασικό του πλεονέκτημα είναι η ελευθερία που παρέχει στον χρήστη μέσω των συνεχώς αναπτυσσόμενος και εξελισσόμενων βιβλιοθηκών που παρέχει η εταιρεία αλλά και οι χρήστες μέσα από διάφορα sites ή blogs όπως π.χ. The Stata blog. Αν και το βασικό πλεονέκτημα του προγράμματος είναι ο κώδικας του παρόλα αυτά μερικοί χρήστες ίσως βρίσκουν δύσκολη την συγγραφή του κώδικά αλλά και τον χειρισμό των αποτελεσμάτων.
Με ένα απλό παράδειγμα θα προσπαθήσουμε να δείξουμε κάποιες από τις δυνατότητες του προγράμματος μέσα από την ανάλυση χρονικών σειρών. Ως δεδομένα χρησιμοποιήσαμε τον δείκτη ΑΕΠ για τα έτη 1995 έως και 2017 από την ΕΛΣΤΑΤ.
Η εισαγωγή του dataset γίνεται με την βοήθεια της εντολής
import excel «C:\…\stata_example.xlsx», sheet(«Φύλλο1») firstrow
year | pop | GDP |
1995 | 10562164 | 8811.0354 |
1996 | 10608821 | 9712.3557 |
1997 | 10661312 | 10759.669 |
1998 | 10720566 | 11684.323 |
1999 | 10761705 | 12431.927 |
2000 | 10805796 | 13071.436 |
2001 | 10862146 | 14011.397 |
2002 | 10902005 | 14993.642 |
2003 | 10928091 | 16371.103 |
2004 | 10955163 | 17682.605 |
2005 | 10987352 | 18133.788 |
2006 | 11020393 | 19768.947 |
2007 | 11048499 | 21061.195 |
2008 | 11077863 | 21844.501 |
2009 | 11107024 | 21385.943 |
2010 | 11121383 | 20324.041 |
2011 | 11104995 | 18642.861 |
2012 | 11045040 | 17311.292 |
2013 | 10965241 | 16475.176 |
2014 | 10892369 | 16401.986 |
2015 | 10820964 | 16381.013 |
2016 | 10775989 | 16377.889 |
2017 | 10768193 | 16736.104 |
Στην συνέχεια δίνουμε την περιγραφή των μεταβλητών
label variable year «Έτος»
label variable pop «Πληθυσμός»
label variable GDP «ΑΕΠ»
Για την καλύτερη γραφική απεικόνιση των δεδομένων κατασκευάσαμε μια νέα μεταβλητή, την pop2
generate pop2=pop/100
label pop2 «Πληθυσμός (Εκατοντάδες)»
Το διάγραμμα χρονικής μεταβολής του πληθυσμού παράγεται από την εντολή tsline pop2 και παράγει το παρακάτω γράφημα
Παρόμοια, η εντολή tsline GDP παράγει το παρακάτω γράφημα
Παρατηρούμε παρόμοια μεταβολή των δύο μεγεθών που χαρακτηρίζεται από την σταθερή πτώση των τιμών τους μετά το 2010.
Τέλος, η ταυτόχρονη απεικόνιση των δύο μεταβλητών με την βοήθεια της εντολής tsline GDP pop2 δεν μπορεί να αποδώσει με την προηγούμενη λεπτομέρεια τις χρονικές μεταβολές τους.
Μια λύση είναι ο συνδυασμός αυτών των δύο γραφημάτων με την βοήθεια των εντολών
line pop2 year, saving(g1)
line GDP year, saving(g2)
gr combine g1.gph g2.gph
Η πρώτη εξέταση έγινε με την βοήθεια υποδείγματος γραμμικής παλινδρόμησης με την βοήθεια της εντολής
regress GDP year
και τα αποτελέσματα έδειξαν ότι το υπόδειγμα είναι στατιστικά σημαντικό (F(1,21)=16.45, p<0.001) και μέτριας ερμηνευτικότητας (R2=43.93)
Η σύγκριση των πραγματικών έναντι των εκτιμώμενων τιμών με την βοήθεια των εντολών
predict fitted_values
line fitted_values GDP year
δείχνει ότι η γραμμική παλινδρόμηση δεν μπορεί να συλλάβει τις μεταβολές του δείκτη ΑΕΠ
Η δεύτερη εκτίμηση έγινε με την βοήθεια της μεθόδου ARIMA(p,d,q) και οδήγησε στο μοντέλο ARMA(2,0) καθώς παρουσίασε τον χαμηλότερο συντελεστή BIC και AIC. Η νέα εκτίμηση έγινε με την βοήθεια των εντολών
arima GDP, arima(2,0,0)
predict f1
estout, stat(aic bic)
line f1 GDP year
ήταν σαφέστατα βελτιωμένη όπως φαίνεται και από το παρακάτω γράφημα
Αυτό ήταν ένα απλό παράδειγμα της χρήσης του προγράμματος STATA για ανάλυση. Για οποιαδήποτε απορία ή εάν χρειαστείτε βοήθεια στην ανάλυση σας μπορείτε να επικοινωνήσετε μαζί μας.