STATISTIK 2: STATISTIK FÖR BIOLOGER, LOGOPEDER OCH PSYKOLOGER 2011, 5 sp

 

 

Kursledare: professor Jukka Corander, Matematiska Institionen

 

Period 4, 9.5.-13.5.2011

 

All undervisning under kursen sker i Stansens PC-klass, B121, ASA-huset.

 

Deltagarna delas i två grupper; den ena gruppen har datorövningar/föreläsningar kl 10.15-12.00 och den andra gruppen kl 13.15-15.00.

 

Gruppindelningen sker enligt överenskommelse med de ämnen som representerar den huvudsakliga målgruppen för kursen:

 

Logopedi och psykologi:  kl 10.15-12.00

Biologi och övriga ämnen: kl 13.15-15.00

 

Kursen består av kombinerade föreläsningar/datorövningar och en hemtentamen. I hemtentamen skall deltagarna kunna kritiskt tillämpa statistisk metodik på diverse datamaterial för att ta ställning till frågor och hypoteser som är typiska i multivariata analyser. Resultat från dessa analyser samt egna reflexioner kring dem sammanställs i en rapport som skickas till föreläsaren per mejl för bedömning. Eventuella icke-godkända rapporter returneras till deltagarna med beskrivning av de ändringar som måste utföras för att studieprestationen skall godkännas.

 

Hemtentamen kan laddas ned här.

 

I datorövningarna används statistikprogrammet SPSS och vissa andra, fritt tillgängliga program.

 

Föreläsningsdagbok (uppdateras dagligen):

 

Del 1:

 

En beskrivning av övningsuppgifterna finns här.

 

Del 2:

 

En beskrivning av övningsuppgifterna finns här.

 

Del 3:

 

En beskrivning av övningsuppgifterna finns här.

 

Del 4:

 

En beskrivning av övningsuppgifterna finns här.

 

Del 5:

 

En beskrivning av övningsuppgifterna finns här.

 

Del 6:

 

En beskrivning av övningsuppgifterna finns här.

 

Del 7:

 

En beskrivning av övningsuppgifterna finns här.

 

Kursen bygger på den grundläggande statistiska teorin och de data-analytiska metoder som behandlades under kursen Statistik 1. Tonvikten kommer att ligga vid diverse multivariata metoder som används både för explorativ data-analys och jämförelser av vetenskapliga hypoteser för experimentella data.

 

Kursens målsättningar:

 

1. Deltagarna lär sig de grundläggande principerna bakom allmänt tillämpade multivariata metoder.

2. Lära sig använda och tolka resultat av multivariata statistiska analyser.

 

Under kursen diskuteras följande statistiska metoder:

 

1. Principalkomponentanalys

2. ANOVA och MANOVA

3. Multipel regression

4. Logistisk regression

5. Faktoranalys

6. Grafiska modeller

 

 

Tyvärr finns det inga svenskspråkiga böcker om enbart multivariat analys. Boken ‘Statistisk dataanalys’ av Svante Körner & Lars Wahlgren (2006, Studentlitteratur) erbjuder en bra icke-teknisk beskrivning bl a av variansanalys, linjär regressionsanalys samt logistisk regressionsanalys.  En engelskspråkig bok om multivariat analys, Applied Multivariate Statistical Analysis (2003) av W. Härdle och L. Simar, finns online på författarnas hemsida här. Eftersom deras tidigare hemsida som innehåller en direkt länk till boken i pdf-format verkar ofta drabbas av serverproblem, finns en lokal kopia här.

 

Kortfattade beskrivningar av många multivariata metoder utan matematiska formler hittas här (på engelska). Även annanstans på nätet finns det några rätt bra beskrivningar: Principalkomponentanalys, Introduktion till grafiska modeller i molekylbiologisk kontext, Faktoranalys i nötskal, Flerdimensionell skalning

 

Föreläsningsdagbok veckovis (omfattar det material som diskuteras på föreläsningarna)

Vecka 12 & 13:  elementär matrisalgebra (kap. 2 i H & S), geometrisk presentation av multivariata data (kap. 8 i H & S), principalkomponentanalys (PCA) (kap. 9 i H & S), ett fascinerande exempel på PCA från genetik finns att ladda ner här (artikel i Nature). Detta material diskuterar PCA (och även andra grundläggande statistiska mojänger) på ett relativt icke-tekniskt sätt.

Vecka 14: Multivariat regressionsanalys (kap. 3 i H & S). En snabb introduktion hittas även här och en diskussion om missbruk av regressionsanalys i kriminologi finns här.

Vecka 15: samband och kausalitet, grafiska modeller för diskreta variabler. En utmärkt icke-teknisk beskrivning och diskussion av problem associerade med identifiering av kausalitet via grafiska modeller finns att ladda ner från David Freedmans hemsida här. Exempelkörningar och resultat från analyser av sambandsstrukturer med MIM: paket1, paket2. Online programmet B-Course för analyser av sambandsstrukturer och för klassificering hittar man här.

Vecka 16: grafiska modeller för kontinuerliga variabler, samt för kombinationer av diskreta och kontinuerliga modeller, logistisk regression och odds-kvot. Exempel på modellval för logistisk regression, diskussion om interaktionstermernas betydelse i modeller.

Vecka 17: klusteranalys (i kap. 11 i H & S behandlas de elementära metoderna). Dessa tre exempel har diskuterats mer i detalj: ett, två, tre. Beskrivning av modell-baserad klustring av biologiska data. Faktoranalys (kap. 10 i H & S). En kortfattad jämförelse av explorativ och konfirmatorisk faktoranalys finns här. Se även Faktoranalys i nötskal

Vecka 17: mera on ANOVA och MANOVA. Allmän introduktion till olika typer av ANOVA hittar man här. En tillämpad beskrivning av MANOVA i ett psykometriskt sammanhang finns här.

 

 

 

 

 

 

 

 

 Updated by Jukka Corander April 29th 2011.