Στατιστική Ανάλυση Δεδομένων με χρήση Η/Υ
Μαθησιακά αποτελέσματα:
Με την επιτυχή ολοκλήρωση του μαθήματος, ο φοιτητής/τρια αναμένεται να:
- Μπορεί να μεταφράσει ένα ερευνητικό ερώτημα σε κατάλληλο (ους) έλεγχο (ους) υποθέσεων ή/και στην κατασκευή κατάλληλου μοντέλου παλινδρόμησης, δοθέντων των δεδομένων και του τρόπου συλλογής τους (του πειραματικού σχεδίου ή του σχεδίου δειγματοληψίας) και εντός των ορίων του περιεχομένου του μαθήματος.
- Μπορεί να εφαρμόζειστατιστικούς ελέγχους υποθέσεων και να κατασκευάζει διαστήματα εμπιστοσύνης που επιλέγει κατάλληλα για την εξαγωγή συμπερασμάτων από πειραματικά ή δειγματοληπτικά δεδομένα (και εντός των ορίων του περιεχομένου του μαθήματος).
- Μπορεί να κατασκευάζει κατάλληλα μοντέλα παλινδρόμησης για να διερευνήσει τη σχέση δύο ή περισσότερων μεταβλητών.
- Έχει (επί)γνωση των προϋποθέσεων που απαιτούνται για την εφαρμογή των στατιστικών μεθόδων που επιλέγει καθώς και της αναγκαιότητας ελέγχου των προϋποθέσεων αυτών.
- Μπορεί να ελέγχει τις προϋποθέσεις που απαιτούνται για την εφαρμογή των στατιστικών μεθόδων που επιλέγει και αν αυτές δεν ικανοποιούνται μπορεί να επιλέγει εναλλακτικές μεθόδους (και εντός των ορίων του περιεχομένου του μαθήματος).
- Αντιλαμβάνεται και ερμηνεύει σωστά τη στατιστική σημαντικότητα.
- Μπορεί να διατυπώνει συμπεράσματα για στοχαστικά φαινόμενα και πειράματα και να τα ερμηνεύει σωστά και με όρους του φυσικού προβλήματος και όχι κατ’ ανάγκη με χρήση στατιστικής ορολογίας.
- Έχει (επί)γνωση της αβεβαιότητας (και του μεγέθους της) που αναπόδραστα εμπεριέχεται στα συμπεράσματα που αφορούν στοχαστικά φαινόμενα και πειράματα.
- Μπορεί να κρίνει και να αξιολογεί ισχυρισμούς και συμπεράσματα που βασίζονται σε πειραματικά ή δειγματοληπτικά δεδομένα.
- Μπορεί να επιλέγει και να εφαρμόζει τις κατάλληλες μεθόδους στατιστικής συμπερασματολογίας που απαιτούνται για την ολοκλήρωση μιας ερευνητικής εργασίας (εντός των ορίων του περιεχομένου του μαθήματος).
- Μπορεί να χρησιμοποιεί κατάλληλο λογισμικό (στατιστικά πακέτα και κατάλληλα προγραμματιστικά περιβάλλοντα όπως αυτό της γλώσσας R) για την περιγραφή και τη στατιστική ανάλυση και επεξεργασία πειραματικών ή δειγματοληπτικών δεδομένων.
- Έχει γνώση των θεμάτων δεοντολογίας και ηθικής που σχετίζονται με τη συλλογή και χρήση δεδομένων και τη δημοσιοποίηση των συμπερασμάτων που εξάγονται από αυτά.
Περιεχόμενο:
- Στατιστικά πακέτα (τι προσφέρουν, κοινά χαρακτηριστικά, πώς τα χρησιμοποιούμε).
-
Επισκόπηση βασικών θεμάτων στατιστικής συμπερασματολογίας:
- Στατιστική σημαντικότητα.
- Διαστήματα εμπιστοσύνης (α) για τον μέσο ενός πληθυσμού (β) για τη διαφορά των μέσων δύο πληθυσμών με ανεξάρτητα δείγματα και με ζευγαρωτές παρατηρήσεις (γ) για το ποσοστό ενός (διωνυμικού) πληθυσμού δ) για τη διαφορά δύο ποσοστών ε) για τη διακύμανση ενός πληθυσμού στ) για το λόγο των διακυμάνσεων δύο πληθυσμών.
- Στατιστικοί έλεγχοι (α) για τον μέσο ενός πληθυσμού (β) για τη σύγκριση των μέσων δύο πληθυσμών με ανεξάρτητα δείγματα και με ζευγαρωτές παρατηρήσεις (γ) για το ποσοστό ενός (διωνυμικού) πληθυσμού και (δ) για τη σύγκριση δύο ποσοστών ε) για τη διακύμανση ενός πληθυσμού στ) για το λόγο των διακυμάνσεων δύο πληθυσμών.
- Ανάλυση διακύμανσης (α) με έναν παράγοντα (β) με δύο παράγοντες με και χωρίς αλληλεπίδραση.Έλεγχοι πολλαπλών συγκρίσεων.
- Έλεγχος X2 (καλής προσαρμογής, ανεξαρτησίας).
-
Πώς γίνεται ο έλεγχος των αναγκαίων για την εφαρμογή των παραμετρικών στατιστικών ελέγχων υποθέσεων/παραδοχών.
- Έλεγχοι κανονικότητας ενός πληθυσμού (Kolmogorov-Smirnovtest, Anderson-Darlingtest, κτλ.).
- Έλεγχοι ισότητας διασπορών (Bartletttest, Cochrantest, κτλ.).
- Διαγράμματα υπολοίπων, Normal probability plotκτλ..
-
Τι επιλογές έχουμε στις περιπτώσεις που δεν ικανοποιούνται οι αναγκαίες για την εφαρμογή των παραμετρικών στατιστικών ελέγχων υποθέσεις/παραδοχές.
- Μη παραμετρικοί έλεγχοι (Sign test, Mann-Whitney test, Wilcoxon test, Kruskal-Wallis test, Friedman test, κτλ.).
-
Ανάλυση παλινδρόμησης
- Απλή γραμμική παλινδρόμηση και συσχέτιση.
- Πολλαπλή παλινδρόμηση και συσχέτιση.
-
Αποκλίσεις από τις υποθέσεις του γραμμικού μοντέλου.
- Διαγράμματα υπολοίπων για την ανίχνευση αποκλίσεων.
- Μη γραμμικά μοντέλα και μετασχηματισμοί δεδομένων
Προτεινόμενα συγγράμματα:
Κούτρας, Μ. Β. και Ευαγγελάρας Χ., Ανάλυση Παλινδρόμησης-Θεωρία και Εφαρμογές, Εκδόσεις Σταμούλη, 2010
Αξιολόγηση: Εργαστηριακές ατομικές ασκήσεις, Ομαδικές και μικρές ατομικές εργασίες, Τελική ατομική εργασία.
Upon completion of this course, the student is expected to be able to:
- apply estimation and testing methods in order to make data-based decisions
- apply checks for method’s assumptions
- comprehend and interpret correctly the statistical significance
- comprehend the notion of uncertainty which is always contained in statistical inference critique data-based claims and evaluate data-based decisions
- use statistical software to summarize data numerically and visually, and to perform data analysis
Course description:
1) Statistical packages (how to use).
2) The principles of statistical inference and inference about means, proportions and variances (confidence intervals and hypothesis tests for a population mean, proportion or variance and for comparing two population means, proportions or variances; Analysis of variance and multiple comparisons tests ; Goodness-of-fit test; Chi-Square test of independence).
3) How to apply checks for method’s assumptions (tests for Normality, tests for comparing variances, normal probability plots, residuals plots, etc.).
4) Non-parametric tests (Sign test, Mann-Whitney test, Wilcoxon test, Kruskal-Wallis test, Friedman test, etc.).
5) Simple linear regression analysis
Teaching aids: Textbooks
Examination: Laboratory autonomous exercises/practicals, Group and small autonomous assignments.