Enkätundersökningar kan göras av många anledningar, men oavsett vilket är ingen undersökning värd mer än de slutsatser man kan dra av dess resultat. Jag har använt enkätundersökningar för att sondera marknaden inför lansering av nya produkter eller företag, och där har de varit ett ovärderligt verktyg. I det här inlägget beskriver jag hur man tar en undersökning från idé till sammanställda och utvärderade resultat med hjälp av Google Docs, Excel/OpenOffice, pivottabeller och statistiska tester.

Det första man måste fråga sig när man bestämt sig för att göra en enkätundersökning är självklart vilken information man är ute efter. Vilka samband är intressanta att undersöka, och vilka alternativ ska respondenterna få välja mellan? När detta är bestämt kan själva datainsamlingen börja. Det finns en uppsjö verktyg för detta, men jag har hittills aldrig behövt något mer avancerat än formulär-funktionen i Google Docs. Där går det att enkelt sätta upp enkäter med många olika typer av frågor. Resultaten visas som ett kalkylark, som enkelt kan exporteras till Excel eller OpenOffice.

Pivottabell-verktyget i ExcelVäl i Excel kan analysen av resultaten börja. Det verktyg jag tycker är mest effektivt för att analysera resultat är pivottabellen. (I OpenOffice heter motsvarande funktion datapilot). I en pivottabell går det att snabbt sätta upp olika typer av sammanställningar av sitt källdata (enkätresultaten i det här fallet).
Ett exempel får visa hur pivottabellen kan användas. Säg att vi har en enkät med tre frågor: ”Din ålder?”, ”Vilket pris vore för lågt för vår produkt?” och ”Hur sannolikt (1-3) är det att du skulle köpa vår produkt?”. På frågan om ålder kan respondenten välja mellan ett antal åldersgrupper i stil med ”18-25 år”. Om vi nu vill analysera hur åldern påverkar intresset för vår produkt sätter vi upp en pivottabell där varje åldersgrupp får en rad, där antal i åldersgruppen som svarat 1, 2 respektive 3 på frågan om sannolikhet för köp visas i olika kolumner. Med hjälp av verktygen i Excel/OpenOffice kan vi sedan enkelt laborera med våra data, för att ändra analysen till att t.ex. titta på hur frågan om personen vill köpa produkten påverkar genomsnittligt pris man är beredd att betala.

En relevant fråga i samband med att man analyserar data med hjälp av pivottabeller är om de samband man ser är signifikanta, det vill säga om de verkligen är samband och inte lika gärna kan bero på slumpen. För att besvara den frågan kan t.ex. ett chi2-test användas (om variablerna inte går att rangordna). Indata till chi2-testet är dels pivottabellen som vi tror påvisar ett samband mellan två variabler (t.ex. kön och produktintresse) och dels det förväntade resultatet om resultaten varit slumpmässiga. Säg att vi t.ex. vill undersöka samband mellan kön och intresse för produkten. Vår pivottabell respektive tabell med förväntade resultat skulle då se ut som nedan. Att förväntat värde, eller väntevärdet, överallt är 15 beror på att alla alternativ är lika sannolika om det inte finns något samband mellan kön och intresse, och eftersom vi har sex alternativ blir väntevärdet antalet svar/6, dvs 90/6=15. För att genomföra chi2-testet i Excel använder vi funktionen chi2.test: chi2.test(b4:d5;g4:i5), vilket ger ett resultat på 0,0013 eller 0,13%. Detta anger sannolikheten att resultatet är slumpmässigt. För att resultatet av chi2-testet ska bli rättvisande krävs att:
  • De tabeller vi jämför innehåller absoluta frekvenser, i vårt exempel alltså faktiskt antal svar och inte procent av svaren som varje alternativ utgör
  • De variabler vi jämför undersöker bör inte gå att rangordna
  • Den förväntade frekvensen för varje alternativ bör vara minst 5, i annat fall får man slå ihop grupper av svar så att den förväntade frekvensen blir större

Underlag för chi2-test i Excel
I enkäter där respondenterna får svara fritt på frågor snarare än att välja mellan förbestämda alternativ krävs lite arbete för att få vettiga resultat i en pivottabell. I exemplet ovan blir det t.ex. svårt att analysera hur åldern påverkar betalningsviljan, om man istället för åldersgrupper svarat med exakt ålder. I en pivottabell visas ju då varje ålder på en egen rad, vilket troligtvis blir ganska många. För att analysera sådan data kan vi antingen skapa grupper i efterhand genom att klippa och klistra eller motsvarande. Med vi får också tillgång till två mer kraftfulla verktyg: Pearsons korrelationskoefficient kombinerat med T-test. En korrelationskoefficient används för att undersöka samband mellan två variabler. I vårt exempel kan vi använda Pearsons korrelationskoefficent för att avgöra om det finns ett linjärt statistiskt samband mellan t.ex. ålder och betalningsvilja – och hur starkt ett sådant samband i så fall är. Det innebär att vi t.ex. kan se om betalningsviljan ökar eller minskar med åldern. Ett t-test kan därefter visa om det funna sambandet är statistiskt signifikant. (T-testet kan även användas när respondenten får välja mellan fördefinierade alternativ, förutsatt att avståndet mellan alla alternativ är lika långt).

Hur undersöker man då ett samband rent konkret? Säg att vi i Excel har våra enkätresultat i en tabell som nedan. För att undersöka sambandet mellan ålder och betalningsvilja använder vi funktionen ”pearson”: pearson(a2:a10;b2:b10). Ett resultat nära 1 innebär att betalningsviljan ökar med åldern, medan ett resultat nära -1 innebär att betalningsviljan minskar med åldern. Ju närmare 0 resultatet är, desto mindre samband finns mellan ålder och betalningsvilja. Kan sambandet vi fått fram bero på slumpen då? Funktionen t.test avslöjar sannolikheten att sambandet är slumpmässigt: t.test(a2:a10;b2:b10,2,2) ger resultatet, p-värdet, 10^-6, eller 0,0001%. Ett p-värde över 5% brukar tolkas som att det inte finns något samband som inte beror på slumpen. Som vi ser i bilden nedan ser det mycket riktigt ut att finnas ett tydligt samband mellan ålder och köpvilja.
Data och plottning
Läs vidare:
Tagged with:
 

Kommentera

E-postadressen publiceras inte. Obligatoriska fält är märkta *

Följande HTML-taggar och attribut är tillåtna: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>