Här hittar du enkla guider till olika tekniker för statistisk analys med statistikprogrammet Stata. Fokus är på själva genomförandet och tolkningen, inte på teorin och antagandena bakom. I guiderna visas koden till statistikprogrammet, output från programmet, tillsammans med förklaringar i text. All kod ska vara reproducerbar, så om du vill kan du ladda ned datan som länkas i inläggen och följa med i instruktionerna. Sidan drivs av Anders Sundell. Engelsk version.
Följ mig på Twitter eller Youtube för exempel på datavisualiseringar.
Uppgifter för att öva på analyser eller andra kommandon.Övningsuppgifter för Stata 1| Facit
Enkla frågor om datahantering, beskrivande statistik och kort om regressionsanalys.
STATA
Datahantering
Allt man behöver göra för att förbereda sina analyser.
Komma igång med Stata
Programmets olika delar, ange projektmapp, spara do-filer, m.m.Skapa en datamängd
Importera data eller skapa en datamängd från scratch.Koda om variabler
Byt ut eller ta bort enskilda värden med kommandona generate, replace och recode.Centrera, standardisera och normalisera variabler
Tre användbara omkodningar: centrera, standardisera och normalisera variabler.Skapa index av flera variabler
Hur man skapar additiva index, antingen som summa eller medelvärden, och hur man använder Cronbach's alpha för att kontrollera reliabiliteten.Jobba med enkätdata
Vi går igenom fem vanliga problem när man jobbar med enkätdata, till exempel felvända skalor och missing-koder.If-satser och villkor
Använd villkor för att köra analyser eller andra kommandon på specifika undergrupper.Logaritmera variabler
Logaritmisk transformering för att hantera variabler med skeva fördelningar.Slå ihop datamängder
Kombinera data från olika källor med kommandot merge.Aggregera datamängder
Aggregera datamängder så att de visar sammanfattande värden med kommandot collapse.
Regressionsanalys
Ett av de vanligaste verktygen för statistisk analys. Används för att undersöka samband mellan minst två variabler. Introduktion | Video
Börja här. Grundprinciperna, med två variabler.Tolka resultatet
Vad de olika delarna av Statas output för regressionanalys betyder, med förklarande anteckningar.Kontrollvariabler
Lägg till kontrollvariabler för att utesluta alternativa förklaringar.Predicera värden med hjälp av regressionsekvationen
Använd den så kallade regressionsekvationen för att predicera värden, alltså göra gissningar eller förutsägelser, utifrån en regressionsanalys.Dummyvariabler
Använd dummyvariabler för att kunna få med kategoriska variabler i analysen.Kurvlinjära (kvadratiska) effekter
För att undersöka ickelinjära samband, till exempel när det finns en avtagande eller tilltagande effekt, eller när något först är positivt och sedan negativt, eller vice versa.Interaktioner - två värden
Effekter som varierar mellan två olika grupper.Interaktioner - kontinuerliga variabler
Effekter som varierar i enlighet med en tredje variabels värde.Logaritmiska variabler
Analyser med logaritmiska variabler, till exempel för att modellera avtagande effekter.Logistisk regressionsanalys
För beroende variabler som bara har två värden, noll eller ett.Tabeller för resultat av regressionsanalys
Gör enkelt snygga och pedagogiska tabeller med kommandot esttab.
Beskrivande statistik och enklare analyser
Ofta bra för att få en överblick över datan innan man går vidare till mer avancerade analyser.Enkel beskrivande statistik
Enkla kommandon för att visa bland annat medelvärden och göra frekvenstabeller.Korstabeller
Enkla tabeller som visar sambandet mellan variabler genom att räkna procent.Medelvärden i grupper
Räkna ut medelvärden i olika grupper.t-test
Signifikanstesta medelvärdesskillnader mellan olika grupper, eller mot ett referensvärde.Korrelation
En av de enklaste sambandsanalyserna.
Grafer med mera
Olika tekniker för att visa datan och samband grafiskt.Scatterplots | Video
Spridningsdiagram som visar sambandet mellan två variabler som en punktsvärm.Histogram
Visar en variabels fördelning med staplar.Stapeldiagram
Visar värden i olika grupper med staplar.Linjediagram
Bra för att exempelvis visa hur variabler utvecklats över tid.Karta över Sveriges kommuner
Visa en variabels värde i olika kommuner som färger på en karta med kommandot spmap.Karta över världens länder
Visa en variabels värde i världens länder eller i olika världsdelar som färger på en karta med kommandot spmap.Visualisera regressionskoefficienter
Använd kommandot coefplot för att visa resultat från regressionsanalyser grafiskt. Vi går också igenom hur man standardiserar sina variabler för att göra koefficienterna mer jämförbara.
Tidsserier och paneldata
Jobba med tid i Stata, antingen för en enhet (tidsserier) eller många (paneldata).
Ställa in data för tidsserier
Ange tidsvariabler, laggade, ledande och delta-variabler, plotta data över tid.Ställa in paneldata (time-series cross-section)
Ange panel- och tidsvariabler, olika typer av paneldata (long eller wide), hur man tar bort dubletter.Omforma paneldata mellan long och wide
Byta struktur på paneldata, mellan långt (long) och brett (wide) format, med hjälp av kommandot reshape.
Panelregression med fixed effects
Hur man använder och förstår så kallade "fixed effects" i analys av paneldata.
Avancerat
Mer avancerade funktioner för att underlätta och effektivisera arbetet med data och analyser.Macron
Jobba med Statas system för tillfälliga variabler och object, macron.Loopar med forvalues
Kör en serie kommandon gång på gång, automatiskt, över en serie värden.Loopar med foreach
Kör en serie kommandon gång på gång, automatiskt, över en lista med olika värden.