Споредба на алгоритми за класификација
Abstract
Денес бројот на нови технологии секојдневно расте. Податочното рударење е една од поновите технологии која се уште е актуелна за проучување. За таа цел во овој труд прво ги разгледуваме податочното рударење и класификацијата, а потоа се задржуваме на дрвата за одлучување како еден од начините за имплементација на класификацијата. Исто така ги разгледуваме перформансите на алгоритмите за градење на дрва за одлучување, како и ентропијата, Gini коефициентот, грешката при класификација, прецизност и recall, ROC криви... Понатаму, правиме споредба на едни од најпознатите алгоритми за класификација и ги презентираме резултатите добиени со примена на ID3 и J48 алгоритмите (Ј48 и Ј48 graft) на наша база на податоци. Заклучуваме дека најдобри предвидувања се добиваат со употреба на Ј48 алгоритмот кога користиме 10-fold cross-validation и со употреба на ID3 кога користиме training set.