Adatbányászat vs. adattárolás
Az adatbányászat folyamata a számítástechnika egyik ágára vonatkozik, amely a minták nagy adathalmazokból történő kinyerésével foglalkozik. Ezeket a készleteket ezután statisztikai módszerekkel és mesterséges intelligenciával kombináljuk. A modern üzleti vállalkozásban az adatbányászat felelős a nyers adatok mesterséges intelligencia forrásá történő átalakításáért. Az adatokat manipulálják, és így megbízható döntéseket hozhatnak, amelyek felhasználhatók a döntéshozatalban. Ez előnyhöz juttatja a vállalkozásokat a versenyhez képest, mivel rendelkeznek adatkészletekkel, amelyekre megbízhatóságot lehet biztosítani. Az adatbányászatot a szervezetek profilozási gyakorlatokban is használják, ideértve a marketing, a tudományos felfedezés felügyelete és a csalások felderítését.
Vannak más általános kifejezések is, amelyek kapcsolódhatnak az adatbányászathoz, mint például az adathalászat, az kotrás vagy az adat-szippantás. Mindez az adatbányászat különböző variációinak irányába mutat, amelyeket kis adathalmazok mintavételéhez használnak, amelyek túl kicsik a statisztikai következtetések létrehozásához. Ezek azonban alapvető fontosságúak a használt adatok érvényességének felvázolásában, és felhasználhatók egy hipotézis felállításához, amikor egy adott adatpopulációra számítanak..
Az adattárház viszont egy olyan kifejezés, amely egy szervezet rendszerét írja le, amelyet az adatgyűjtéshez használnak. Az adattárház által összegyűjtött adatok szolgálnak az ügyleti rendszerekkel, mint például számla, beszerzési nyilvántartások vagy akár kölcsön-nyilvántartások. Az adatrekordokat a létrehozás egyes pontjaiból veszik, és egyetlen tető alá, azaz az adattárházba gyűjtik. Ezután ezeket az adatokat jelentik, és a jelentést összesített módon készítik el, hogy segítsék az üzleti információk felhasználóit érvényes döntések meghozatalában. Az adattárház hatékony működéséhez adatforrás, adatbázis és jelentéskészítő eszköz szükséges.
Ezért elmondható, hogy az adattárház egy adatbázis, amelyet kifejezetten az elemzett adatok jelentésére használnak. Ezek az adatok a különféle rendszerekből származnak, amelyeket a jelentésre készítettek.
Funkciójának teljesítése érdekében az adattárház három különálló rétegben tartja fenn a funkciókat. Ezek magukban foglalják a stádiumot, az integrációt és a hozzáférést. Az átmeneti folyamat során a nyers adatokat a fejlesztők csak elemzés és támogatás céljából tárolják. Az integrációs réteget az adatok integrációjához használják, és absztrakciós szint eléréséhez az adatok felhasználóitól. Végül, a hozzáférési réteg fontos az adatok kiszolgálásából az adatok különböző felhasználóitól való kiszorításában.
Az adatbányászatra és az adattárolásra egyaránt hivatkozhatunk olyan eszközökként, amelyeket üzleti intelligencia gyűjtésére használnak. A kettő közötti fő különbség az üzleti intelligencia gyűjtésének módja. Ezért elmondható, hogy a jól tárolt adatok meglehetősen egyszerűen bányászhatók és felhasználhatók. Az adattárház tehát azért felelős, hogy megkönnyítse az adatbányászat munkáját az összes releváns adat központi helyen történő elhelyezésében, nem pedig akkor, amikor az adatbányászatnak folyamatosan kell adatot keresnie különböző helyszíneken. Ez elősegíti az adatbányászatra fordított idő és a bányászatban felhasznált erőforrások megtakarítását.
összefoglalás
Az adatbányászat az adatok kinyerése a nagy adatkészletekből.
Az adattárolás az összes releváns adat együttes összesítésének folyamata.
Az adatbányászat és az adattárolás üzleti intelligencia-gyűjtő eszközök.
Az adatbányászat az adatgyűjtés során specifikus.
Az adattárolás időmegtakarítást és hatékonyságnövelést jelent azáltal, hogy a szervezet különböző területein található, különböző helyről származó adatokat összehozza.
Az adattárház három rétegből áll, nevezetesen az átfedésből, az integrációból és a hozzáférésből.