Az adatok szó az összegyűjtött és rögzített információkra utal. Lehet számok, szavak, mérések és még sok más formájában.
Kétféle adat létezik, ezek minőségi és mennyiségi adatok. A két adattípus közötti különbség az, hogy a mennyiségi adatokat a numerikus információk leírására használják. Például a hőmérséklet mérése ilyen típusú adatok alá tartozik.
Másrészről a kvalitatív adatok szolgálnak az információk szavakkal való leírására. Az adatgyűjtés után meg kell szervezni, ezért el kell különíteni a csoportos adatokat a nem csoportosított adatoktól. Mindkettő hasznos adatforma, de a különbség közöttük az, hogy a nem csoportosított adatok nyers adatok. Ez azt jelenti, hogy nemrégiben összegyűjtötték, de nem sorolták be semmilyen csoportba vagy osztályba. Másrészt a csoportosított adatok olyan adatok, amelyeket a nyers adatok alapján csoportokba rendeztek.
Mint fentebb említettem, a csoportosított adatok azok az adatok, amelyeket gyűjtés után csoportokba sorolunk. A nyers adatokat különböző csoportokba sorolják, és egy táblázat készül. A táblázat elsődleges célja az egyes csoportokban előforduló adatpontok bemutatása. Például, amikor tesztet végeznek, az eredmények a forgatókönyv adatai, és ezeknek az adatoknak a csoportosítására számos módszer létezik. Például rögzíthető azoknak a hallgatóknak a száma, akik az egyes 20 pont fölött pontoztak.
Alternatív megoldásként az osztályok is használhatók. Például egy 90-100-as szám az F 0-59-ig egészen az egyes kategóriákig, megmutatva, hogy hány hallgató van az egyes kategóriákban. A csoportos adatok megjelenítéséhez és értelmezéséhez a legjobb a hisztogramok és a frekvencia táblázat. Íme egy példa
Az adatok csoportosítása a következő előnyökkel rendelkezik:
A nem csoportosított adatok, amelyeket nyers adatoknak is neveznek, azok az adatok, amelyeket a gyűjtés után egyetlen csoportba sem nem soroltak be. Az adatokat számok vagy jellemzők szerint kategorizálják, ezért az adatokat, amelyeket egyik kategóriába sem soroltak be, nem csoportosítják. Például amikor a népszámlálást elvégezi, és azt szeretné elemezni, hogy egy adott területen hány 45 évesnél fiatalabb nő van, először tudnia kell, hogy hány ember tartózkodik ezen a területen..
Az ezen a területen lakó személyek száma nem csoportosított adatok vagy nyers információk, mivel semmit nem soroltak be kategóriába. Megállapíthatjuk tehát, hogy a nem csoportosított adatok olyan adatok, amelyeket a minta vagy a populáció egyes tagjaira vonatkozó információk megmutatására használnak.
A nem csoportosított adatok néhány előnye a következő:
A csoportosított adatok azok az adatok, amelyeket az elemzés után osztályokba rendeztek. Példa lehet arra, hogy hány zsák kukorica volt összegyűjtve az esős évszakban. Másrészt a nem csoportosított adatok olyan adatok, amelyek egyik csoportba sem esnek. Még mindig nyers adatok.
Adatok gyűjtésekor a nem csoportosított adatokat részesítik előnyben, mivel az információk továbbra is az eredeti formájukban vannak. Nem megsemmisítették osztályozással vagy alosztáson keresztül. Az elemzés és a grafikonok rajzolásakor azonban a csoportosított adatok részesülnek előnyben, mivel egyszerűen értelmezhetők.
A csoportosított és nem csoportosított adatok átlagának kiszámításakor eltérés lesz. A csoportosított adatok átlaga azért előnyös, mert pontosabb a nem csoportosított adatok átlagához képest. A nem csoportosított adatok átlaga a medián helytelen manipulációjához vezethet, ezért a legtöbb esetben hatástalannak tekintik.
A frekvencia táblázatokat a csoportos adatok adatainak megjelenítésére használjuk, míg a nem csoportosított adatok esetében az információ nagy számjegyként jelenik meg. Ennek oka az a tény, hogy az információ még mindig nyers.
A csoportosított adatok olyan adatok, amelyeket frekvencia-eloszlásba soroltak be, míg a nem csoportosított adatokat semmilyen módon nem összegzik.