Τεχνικές παράλληλης επεξεργασίας για επιλογή χαρακτηριστικών με τον αλγόριθμο Feature Subset Selection

dc.contributor.advisorΒαρσάμης, Δημήτριος
dc.contributor.authorΤαλαγκόζης, Χρήστος Ε.
dc.contributor.departmentΣχολή Τεχνολογικών Εφαρμογών, Τμήμα Μηχανικών Πληροφορικής Τ.Ε.el
dc.contributor.masterΠΜΣ "ΕΦΑΡΜΟΣΜΕΝΗ ΠΛΗΡΟΦΟΡΙΚΗ"el
dc.date.accessioned2017-11-13T16:44:57Z
dc.date.accessioned2024-09-27T18:07:13Z
dc.date.available2017-11-13T16:44:57Z
dc.date.issued2017-05
dc.descriptionΤο πλήρες κείμενο της εργασίας είναι διαθέσιμο κατόπιν αιτήματοςel
dc.description.abstractΗ επιλογή χαρακτηριστικών είναι ένα σημαντικό ερευνητικό θέμα στη μηχανική μάθηση και την αναγνώριση προτύπων. Είναι αποτελεσματική στη μείωση των διαστάσεων, στην αφαίρεση άσχετων δεδομένων, στην αύξηση της ακρίβειας της μάθησης και στη βελτίωση της κατανόησης των αποτελεσμάτων. Ωστόσο, τα τελευταία χρόνια, τα δεδομένα έχουν γίνει ολοένα και μεγαλύτερα τόσο στον αριθμό των προτύπων όσο και στον αριθμό των χαρακτηριστικών σε πολλές εφαρμογές. Η κλασική μέθοδος επιλογής χαρακτηριστικών είναι πολύ χρονοβόρα κατά την επεξεργασία δεδομένων μεγάλης κλίμακας λόγω του δαπανηρού κόστους υπολογισμού. Για τη βελτίωση της υπολογιστικής ταχύτητας, η παράλληλη επιλογή χαρακτηριστικών θεωρείται ως η αποτελεσματικότερη μέθοδος. Το Matlab είναι ένα εργαλείο το οποίο μπορεί να χρησιμοποιηθεί για την εφαρμογή παράλληλου και κατανεμημένου μοντέλου επεξεργασίας μεγάλων προβλημάτων εξόρυξης δεδομένων. Σε αυτή τη διπλωματική προτείνεται και υλοποιείται μία παράλληλη μέθοδος επιλογής χαρακτηριστικών με βάση το σειριακό μοντέλο. Επιπλέον, για ακόμη μεγαλύτερη βελτίωση, ο αλγόριθμος k-means, ο οποίος χρησιμοποιείται στο εσωτερικό της μεθόδου της επιλογής χαρακτηριστικών, αναδημιουργείται και του εφαρμόζεται παράλληλο μοντέλο επεξεργασίας. Τόσο η υλοποίηση του παραλλήλου k-means, όσο και η υλοποίηση του αλγορίθμου επιλογής χαρακτηριστικών είναι κλιμακούμενες. Η αποτελεσματικότητα των μεθόδων περιγράφεται μέσω ανάλυσης παραδειγμάτων.el
dc.description.abstractFeature Subset Selection is an important research topic in machine learning and pattern recognition. It is effective in reducing dimensionality, removing irrelevant data, increasing learning accuracy, and improving result comprehensibility. However, in recent years, data has become increasingly larger in both number of instances and number of features in many applications. Classical Feature Subset Selection method is out of work in processing large-scale dataset because of expensive computational cost. For improving computational speed, parallel Feature Subset Selection is taken as the efficient method. Matlab is a tool, that can be used to apply parallel and distributional computing model to process large-scale data mining problems. In this thesis, a parallel Feature Subset Selection method based on the serial model is proposed and implemented. Additionaly for even further improvement, the clustering algorithm k-means, that is used inside Feature Subset Selection method, is recreated and parallel processing applied. Both implementations of the parallel k-means and Feature Subset Selection methods are scalable. The efficiency of the methods is described through example analysis.en
dc.format.extent92el
dc.heal.publisherIDteiser
dc.identifier.urihttps://repository2024.ihu.gr/handle/123456789/3261
dc.language.isoelel
dc.publisherΤ.Ε.Ι. Κεντρικής Μακεδονίαςel
dc.rightsΑναφορά Δημιουργού-Μη Εμπορική Χρήση-Όχι Παράγωγα Έργα 4.0 Διεθνές
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/4.0/deed.el
dc.subjectΠΑΡΑΛΛΗΛΗ ΕΠΕΞΕΡΓΑΣΙΑ (ΗΛΕΚΤΡΟΝΙΚΟΙ ΥΠΟΛΟΓΙΣΤΕΣ)el
dc.subject.ddc004.35el
dc.subject.keywordΤεχνικές παράλληλης επεξεργασίαςel
dc.subject.keywordΑλγόριθμος Feature Subset Selectionel
dc.subject.keywordMatlabel
dc.subject.keywordΑλγόριθμος k-meansel
dc.titleΤεχνικές παράλληλης επεξεργασίας για επιλογή χαρακτηριστικών με τον αλγόριθμο Feature Subset Selectionel
dc.typeΔιπλωματική εργασία
heal.dateAvailable3000-01-01

Αρχεία

Πρωτότυπος φάκελος/πακέτο

Τώρα δείχνει 1 - 2 από 2
Δεν υπάρχει διαθέσιμη μικρογραφία
Ονομα:
Talagozis.pdf
Μέγεθος:
2.01 MB
Μορφότυπο:
Adobe Portable Document Format
Περιγραφή:
Διπλωματική εργασία
Δεν υπάρχει διαθέσιμη μικρογραφία
Ονομα:
Talagozis Parousiasi.pptx
Μέγεθος:
1.01 MB
Μορφότυπο:
Microsoft Powerpoint XML
Περιγραφή:
Παρουσίαση