När Antaganden ANCOVA är Irrelevant53

När Antaganden ANCOVA är Irrelevant53 följande

När Antaganden ANCOVA är Irrelevant

Varje gång ett tag, jag arbetar med en kund som har fastnat mellan en viss statistisk sten och städet.

Det händer när de försöker köra en analys av kovarians (ANCOVA) modellen, eftersom de har en kategorisk oberoende variabel och en kontinuerlig kovariat.

Problemet uppstår när en medförfattare, ledamot, eller granskare insisterar på att ANCOVA är olämpligt i denna situation, eftersom en av de följande ANCOVA antaganden inte är uppfyllda:

1. Den oberoende variabeln och kovariat är oberoende av varandra.

2. Det finns ingen interaktion mellan oberoende variabel och kovariat.


Om du tittar upp dem i någon försöks lärobok, som vanligtvis är där du hittar information om ANOVA och ANCOVA kommer du verkligen hitta dessa antaganden. Så kritikern har fina referenser.

Detta är dock ett fall där det är viktigt att stanna upp och fundera över om de antaganden gäller för din situation, och hur behandlar antagandet kommer att påverka analysen och de slutsatser man kan dra.

Ett exempel

Ett mycket enkelt exempel på detta kan vara en studie som undersöker skillnaden i höjderna barn som gör och inte har en parasit. Eftersom en stor bidragsgivare till barns höjd är ålder, är detta ett viktigt kontrollvariabel.

I detta diagram ser du sambandet mellan ålder X1, på x-axeln och höjd på y-axeln på två olika värden på X2, parasit status. X2 = 0 indikerar grupp av barn som har parasiten och X2 = 1 är den grupp av barn som inte gör det.

Yngre barn tenderar att vara drabbad av parasiten oftare. Det vill säga, medelåldern (medelvärdet av X1) av de blå prickarna är klart lägre än genomsnittsåldern för de svarta stjärnor. Med andra ord, i åldrarna barn med parasiten är lägre än de utan.

Så oberoende mellan den oberoende variabeln (parasit status) och kovariat (okänd) är tydligt kränks.

Hur man handskas med Brott mot Antaganden

Dessa är dina alternativ:

1. Släpp kovariat från modellen så att du inte bryter mot antaganden om ANCOVA och köra en envägs ANOVA. Detta verkar vara den populära alternativet bland de flesta kritiker.

2. Behåll både kovariat och den oberoende variabeln i modellen ändå.

3. Kategori den kovariat i låga och höga åldrar, kör sedan en 2&# 215; 2 ANOVA.

Alternativ # 3 är ofta förespråkade, men jag hoppas att ni snart kommer att se varför det är onödigt, i bästa fall. Godtyckligt dela en numerisk variabel i kategorier är bara kasta bort bra information.

Låt oss undersöka alternativ # 1.

Problemet med det visas i graf det återspeglar inte data eller relationerna mellan variablerna.

Med kovariat i modellen, är skillnaden i medelhöjd för barn med och utan parasiten uppskattas för barn i samma ålder (höjden på röda linjen).

Om du tappar kovariat är skillnaden i medelhöjden uppskattas till det totala medelvärdet för varje grupp (den lila linjen).

Med andra ord, kommer någon effekt av ålder läggas till effekten av parasiten status, och du kommer att överdriva effekten av parasiten på den genomsnittliga skillnaden i barnens höjder.

Varför är det ett antagande, då?

Du är förmodligen fråga dig själv "varför i hela friden skulle detta vara ett antagande om ANCOVA om att ta bort kovariat leder oss att överdriva relationer?"

För att förstå varför måste vi undersöka problemet här antaganden adressering.

I analysen av kovarians delen av Geoffrey Keppel utmärkta bok, design och analys: En forskare handbok, säger han:

Några sidor senare han påstår,

Det viktigaste kriteriet för kovariat är en betydande linjär korrelation med den beroende variabeln, Y. I de flesta fall, poängen på kovariat erhålls före inledningen av experimentell behandling …. Ibland poängen samlas efter experimentet är klar . Ett sådant förfarande är försvarbart endast när det är säkert att den experimentella behandlingen inte påverkade den kovariat …. Analysen av kovarians bygger på antagandet att kovariat är oberoende av de experimentella behandlingarna.

Med andra ord handlar det om inte förmörkat de resultat som kan dras av experimentellt manipulerade behandlingar. Om kovariat hade samband med behandlingen, skulle det tyda på ett problem med slumpmässig fördelning, eller det skulle tyda på att behandlingarna själva orsakat kovariateffekter värden. Dessa är mycket viktiga faktorer i experiment.

Men om, som i vårt parasit exempel, den viktigaste kategoriska oberoende variabeln observeras och inte manipuleras, är oberoende antagandet mellan kovariat och den oberoende variabeln irrelevant.

Det är en konstruktion antagande. Det är inte en modell antagande.

Den enda effekten av antagandet av den oberoende variabeln och kovariat är oberoende är i hur du tolkar resultaten.

Så vad är en lämplig lösning?

Lämpligt svar är # 2-hålla kovariat i analysen, och inte tolka resultat från en observationsstudie som om de kom från ett experiment.

Den sista frågan blir då: Om din kritiker har förbjudit ord ANCOVA eftersom du inte har ett experiment, vad kallar ni det?

Nu är det ner till semantik. Det är korrekt att kalla det en allmän linjär modell. en multipel regression, eller (i min tillval), en ANCOVA (jag har aldrig sett någon balk på att ringa en analys en ANOVA när de två kategoriska IVs var relaterade).

De kritiker som får hängas upp på detta antagande är oftast de som vill ha ett specifikt namn. General Linear Model är tvetydig för dem. Jag har haft kunder som hade att kalla det en multipel regression, även om huvud oberoende variabeln var det kategoriska en.

Ett alternativ är användning "kategorisk prediktor variabel" istället för "oberoende variabel" när man beskriver variabeln i ANCOVA. Det senare innebär manipulation; den förstnämnda inte gör det.

Detta är ett fall där det är värt att kämpa för din analys. men inte namnet. Poängen med allt detta är att kommunicera resultat korrekt.

På jakt efter prisvärda statistikutbildning med de bästa statistik mentorer runt? Vill du ställa en expert alla dina brinnande statistik frågor? Kolla Statistiskt sett, vårt exklusiva medlemsprogram med månatliga webbseminarier och öppna Q&A sessioner.

Källa: www.theanalysisfactor.com

Kommentera

E-postadressen publiceras inte. Obligatoriska fält är märkta *

ett + sex =