Különbség a T-TEST és az ANOVA között

T-TEST vs. ANOVA

A statisztikai adatok gyűjtése és kiszámítása az átlag megszerzése érdekében gyakran hosszú és fárasztó folyamat. A t-teszt és az egyirányú varianciaanalízis (ANOVA) a két leggyakoribb teszt, amelyet erre a célra használnak.

A t-teszt egy statisztikai hipotézis teszt, ahol a teszt statisztikája követi a Student t-eloszlását, ha a nullhipotézist alátámasztják. Ezt a tesztet akkor alkalmazzák, amikor a teszt statisztikája a normál eloszlást követi, és a teszt statisztikában egy skálázási kifejezés értéke ismert. Ha a méretezési kifejezés ismeretlen, akkor azt a rendelkezésre álló adatok alapján becsléssel helyettesítik. A teszt statisztikája a hallgató t-eloszlását követi.

William Sealy Gosset 1908-ban vezette be a t-statisztikát. Gosset vegyész volt a Írország dublini Guinness sörgyárához. A Guinness sörgyár politikája az volt, hogy Oxfordból és Cambridge-ből a legjobb diplomások toborzására kerüljön sor, akik közül kiválaszthatják azokat, akik biokémiai és statisztikai alkalmazásokat tudnak biztosítani a vállalat által létrehozott ipari folyamatokhoz. William Sealy Gosset volt az egyik ilyen diplomás. A folyamat során William Sealy Gosset kidolgozta a t-tesztet, amelyet eredetileg arra terveztek, hogy költséghatékony módon ellenőrizze a restu (a sörgyár által készített sötét sört) minőségét. Gosset 1908 körül, Biometrikában közzétette a tesztet „Student” tollal, a „Student” név alatt. A toll nevének oka a Guinness ragaszkodása volt, mivel a vállalat meg akarta tartani politikáját a statisztikák „üzleti titkaik” részeként történő felhasználásáról..

A T-teszt statisztikája általában a T = Z / s formát követi, ahol Z és s az adatok függvényei. A Z változót úgy tervezték, hogy érzékeny legyen az alternatív hipotézisre; gyakorlatilag a Z változó nagysága nagyobb, ha az alternatív hipotézis igaz. Időközben az 's' egy méretezési paraméter, amely lehetővé teszi a T eloszlásának meghatározását. A t-próba alapjául szolgáló feltevések a következők: a) Z a normál normál eloszlást követi a nulla hipotézis alapján; b) a ps2 egy ull ‡ 2 eloszlást követett p szabadságfokkal a nullhipotézis alapján (ahol p pozitív állandó); és c) a Z érték és az s érték független. Egy meghatározott t-próba esetében ezek a körülmények a vizsgált populáció következményei, valamint az adatok mintavételének módja..

Másrészt a varianciaanalízis (ANOVA) statisztikai modellek gyűjteménye. Míg az ANOVA alapelveit a kutatók és a statisztikusok már régóta használják, Sir Ronald Fisher csak 1918-ban tett javaslatot a varianciaanalízis hivatalos formalizálására egy cikkben, melynek címe „A rokonok közötti összefüggés a mendeli öröklés feltételezésével” című cikkben. . Azóta az ANOVA hatályát és alkalmazását kibővítették. Az ANOVA valójában tévedés, mivel nem az eltérések eltéréséből származik, hanem a csoportok közti különbségekből. Ez magában foglalja a kapcsolódó eljárásokat is, ahol egy adott változóban a megfigyelt variancia megoszlik olyan komponensekre, amelyek a különböző variációs forrásoknak tulajdoníthatók.

Alapvetően egy ANOVA statisztikai tesztet nyújt annak meghatározására, hogy több csoport átlagai egyenlőek-e, és ennek eredményeként a t-tesztet kétnél több csoportra általánosítja. Az ANOVA hasznosabb lehet, mint egy kétmintás t-teszt, mivel kisebb esélye van az I típusú hiba elkövetésére. Például, ha több kétmintás t-teszt lenne, nagyobb az esélye egy hiba elkövetésére, mint az átlag eléréséhez ugyanazon változók ANOVA-jával. A modell ugyanaz, és a teszt statisztikája az F arány. Egyszerűbben fogalmazva: a t-tesztek csak az ANOVA különleges esete: az ANOVA elvégzésével ugyanaz az eredmény lesz a többszörös t-teszteknél. Az ANOVA modellek három osztályba sorolhatók: a) Fix effektusú modellek, amelyek feltételezik, hogy az adatok normál populációból származnak, csak egymástól különböznek egymástól; b) Az adatokat feltételező véletlenszerű effektusmodellek olyan változó populációk hierarchiáját írják le, amelyek eltéréseit a hierarchia korlátozza; és c) vegyes hatású modellek, amelyek olyan helyzetekben vannak, amikor a rögzített és a véletlenszerű effektusok is vannak jelen.

Összefoglaló:

A t-tesztet akkor kell használni, ha meghatározzák, hogy két átlag vagy átlag azonos vagy eltérő. Három vagy több átlag vagy átlag összehasonlításakor az ANOVA előnyös.
A t-tesztnek több esélye van egy hiba elkövetésére, annál több eszközt használnak, ezért ANOVA-t használnak két vagy több eszköz összehasonlításakor.

Vegyes