STATISTIK 1: STATISTIK FÖR BIOLOGER, LOGOPEDER OCH PSYKOLOGER 2010, 5 sp

 

Statistik—trist & scary? Denna kurs försöker öppna dörren till statistikens värld och visa att den är både hanterlig och nyttig—den kan t.o.m. spara liv om den används rätt. Tveksam? Se här. Ifall videon krånglar, här finns en YouTube backup.

 

Kursledare: professor Jukka Corander, Matematik, Institutionen för naturvetenskaper

 

Period 2, v 46, mån 15. - fre 19. november.

 

All undervisning under kursen sker i Stansens PC-klass, B121, ASA-huset.

 

Deltagarna delas i två grupper; den ena gruppen har datorövningar/föreläsningar kl 12.15-14.00 och den andra kl 14.15-16.00.

 

Gruppindelningen sker enligt överenskommelse med de ämnen som representerar den huvudsakliga målgruppen för kursen:

 

Logopedi och psykologi:  kl 12.15-14.00

Biologi och övriga ämnen: kl 14.15-16.00

 

Kursen består av kombinerade föreläsningar/datorövningar och en hemtentamen. I hemtentamen skall deltagarna kunna kritiskt tillämpa statistisk metodik på diverse datamaterial för att ta ställning till frågor och hypoteser som är typiska i forskningssammanhang. Resultat från dessa analyser samt egna reflexioner kring dem sammanställs i en rapport som skickas till föreläsaren, antingen per mejl eller per internpost. En godkänd rapport returneras med kommentarer till  studiekansliet för deltagares huvudämne eller direkt till deltagaren ifall rapporten sänts per mejl. Eventuella icke-godkända rapporter returneras till deltagarna med beskrivning av de ändringar som måste utföras för att studieprestationen skall godkännas.

 

Hemtentamen kan laddas ned här. Tips om lämplig litteratur finns beskrivna i hemtentamen. 

 

I datorövningarna används statistikprogrammet SPSS och Excel. Här finns Excel macro för beräkning av konfidensintervall i samband med binomialproportioner (saknas i SPSS).

 

Föreläsningsdagbok (uppdateras dagligen):

 

OBS! Samtliga SPSS/Excel övningsuppgifter kommer att uppdateras med svar och tips efter kursen!

 

DAG 1:

 

Statistik = trist/svårt/skrämmande/irrelevant?

 

Insikter i ämnet statistik ger en färdighet att tolka och bearbeta information på ett kritiskt sätt,   bl a bedöma hur pålitlig informationen är.

 

Viktig medborgarfärdighet för alla - från journalist till beslutsfattare till forskare mm.!

 

Grundläggande element i statistik är förståelse för sannolikhetskalkylens regler och hur man kan relatera dem till verkligheten på ett reliabelt sätt.

 

Vi går igenom elementär sannolikhetskalkyl och explorativ statistik: lögndetektortestet, fallet Sally Clark, betingad sannolikhet, egenskaper hos slumptal, slumpmässig spatiell variation hos skattningar av cancerfrekvens (se här och här för bilder).

 

Datorövningarna för Dag 1 finns här.

 

DAG 2:

 

Felkällor hos undersökningar, korrelation och regression. Vi mätte handbredd och betraktade dess korrelation med individens längd. Ett minnestest användes för att undersöka fenomenet ‘regression towards mean’.

 

Datorövningarna för Dag 2 finns här.

 

DAG 3:

 

Konfidensintervall, hypotesprövning, p-värden, jämförelse av experimentgrupper. Data snooping. Parametriska och icke-parametriska test av likhet hos två grupper.

 

Datorövningarna för Dag 3 finns här.

 

DAG 4:

 

Binomialexperiment (jordklotet skall studsa runt), jämförelser av två binomialexperiment (kamp i basket), statistisk styrka, tolkning av p-värden (se presentationen av Peter Bacchetti), jämförelser i ANOVA (variansanalys). Repetering av enkel regression och konfideninterval för medelvärdet.

 

Datorövningarna för Dag 4 finns här.

 

DAG 5:

 

Godisexperiment, Frekvenstabeller, Chi^2 test av samband, Simpson’s paradox. Vi tittar på korstabeller, Chi-square testet och Simpson’s paradox i ett svep genom dessa exempel. Djupdykning i marginella och betingade sannolikheternas värld får vi genom detta genetiska exempel.

 

Datorövningarna för Dag 5 finns här.

 

————————————————————————————————————————

Statistik är vetenskapen om hantering av osäkerhet. Osäkerhet? Javisst, den finns överallt, dock ofta något dolt för våra sinnen. När våra mobiltelefoner skall ta kontakt med basstationer, måste systemet kunna hantera en viss osäkerhet i processen. När vi utför vetenskapliga experiment och fattar beslut om att åka på semester till en avlägsen ort vid Amazonfloden, måste vi tampas med osäkerhet. Tyvärr är människan inte formad av evolutionen till en naturbegåvning för detta jobb, utan man måste först lära sig den grundläggande logiken bakom de verktyg som matematiken erbjuder för hantering av osäkerhet. Dessa verktyg bygger på sannolikheter och de lagar som gäller för dem.

 

Kursens målsättningar:

 

1. Deltagarna lär sig grundprinciperna för sannolikhetskalkylen genom olika tillämpningar som belyser sannolikhetens karaktär. Denna kunskap är av stor vikt, då man skall kritiskt bedöma diverse sätt att hantera osäkerhet.

2. Lära sig olika visuella och numeriska sätt att betrakta och presentera information som finns i ett datamaterial.

3. Efter kursen skall man kunna utföra enkla statistiska analyser självständigt.

4. Lära sig tolka resultat av statistiska analyser på ett kritiskt sätt.

 

Kursens innehåll:

 

1. Deskriptiv statistik

2. Grunderna i sannolikhetslära

3. Skattningar och konfidensintervall

4. Hypotesprövning

5. Korrelation och regression

6. Analys av korstabeller

7. Försöksplanering och variansanalys

 

 

Som en bas för inlärning av grundläggande statistik kan man använda sig av boken: Biometri av Ulf Olsson m. fl. (2005). Kursbiblioteket har ett rätt stort antal exemplar av boken, men får man ej tag på den, kan andra liknande böcker eller kompendier användas utan vidare. Exempelvis finns det över 10 exemplar av kompendiet Statistik: en introduktion av Östen Widjeskog i ÅA-biblioteket. Två introduktioner till diverse statistiska metoder i HTML-format finns här och här (bägge på engelska). Wikipedia innehåller rätt utförliga beskrivningar av vanliga statistiska begrepp och metoder, dock oftast endast på engelska.

 

Synvinkeln på sannolikhet och statistik är ofta onödigt snäva i grundböcker, därför försöker vi utvidga vyerna med övrigt kursmaterial. Exempelvis hittar man en kort beskrivning av begreppet sannolikhet och dess historia i Wikipedia. Denna länk på Wikipediasidan innehåller en mer utförlig diskussion om olika tolkningar av sannolikheter.

Nedan finns en föreläsningsdagbok för än äldre variant av denna kursen. Vissa delar av materialet kommer att behandlas under den nya kursen.

Obs! De flesta av termerna nedan är också beskrivna i Olsson m fl eller i Widjeskogs kompendium.

Vecka 36 & 37: Exempel på ett statistiskt problem med kriminologisk anknytning,  statistisk ordbok på nätet (förklarar termer på svenska), sannolikhetsbegreppet, Monty Hall -problem, skaltyper, deskriptiv statistik, exempel på problem med enkla deskriptiva mått (Läs absolut detta!), betingad sannolikhet (på svenska, på engelska), den senare beskrivningen är mer detaljerad!, Bayes teorem (på svenska, på engelska), den senare beskrivningen är mer detaljerad!, Venn-diagram, åklagarens dilemma och fallet Sally Clark (se längst ner på Wikipedia-sidan). Nätresurs för statistik vid UCLA (denna sida erbjuder omfattande möjligheter för interaktiva demonstrationer gällande experiment, statistisk grafik, fördelningar, analyser mm). Nätresursen innehåller även en e-bok för grundläggande sannolikhetskalkyl och statistik.

 

Vecka 37 & 38: Statistiska modeller I (läs absolut detta!), p-värden, odds, odds-kvot, tolkning av p-värden (av Peter Bacchetti, Obs! Om länken inte fungerar, här finns en lokal kopia), hypotesprövning, nollhypotes, styrka, t-test, en skeptisk artikel om vetenskapliga resultat

Vecka 39: Punktskattning, Konfidensintervall(!), analys av korstabeller(!), marginellt kontra betingat oberoende (!)

Vecka 40: Korrelation, Regressionsanalys, Grafiska exempel på modelldiagnostik,  R-square, partiell korrelation, variansanalys, försöksplanering

Vecka 41: Icke-parametriska metoder, speciellt ges uppmärksamhet åt: Spearman's rank korrelation, Kendall's tau, Mann-Whitney-Wilcoxon test, Kolmogorov-Smirnov test, samt sk. Resampling metoder

Vecka 42: Repetition