Módszertan és folyamat

Módszertan és folyamat

Az egyes szoftvergyártó cégek különböző módszertanokat fejlesztettek ki az adatbányászati tevékenység műveléséhez, melyek gyakran a szoftver funkcionalitásában is megjelennek. Nagyon hasonlóak viszont e módszertanok abban, hogy az adatbányászati tevékenységet olyan elkülönülő lépések sorozataként írják le, amely lépések sorrendje nem rögzített, és többször is lehet (és kell is) egy lépést alkalmazni.


Ábra 1 A módszertanok zömében szereplő lépések sorozata

A Data-mining klasszikus munkafolyamatát talán leginkább az CRISP-DM módszertan segítségével lehet bemutatni, amelyet néhány módszertan áttanulmányozása után a leginkább kidolgozottnak és életszerűnek ítéltünk. A CRISP-DM (CRoss Industry Standard Process for Data-Mining) adatbányászati módszertan egy nemzetközi szinten elfogadott, kipróbált, és széles körben alkalmazott módszertan.