Διπλωματικές εργασίες
Μόνιμο URI για αυτήν τη συλλογήhttps://repository2024.ihu.gr/handle/123456789/30484
Οι διπλωματικές εργασίες σπουδαστών μεταπτυχιακού κύκλου σπουδών
Περιηγούμαι
Πλοήγηση Διπλωματικές εργασίες ανά Θέμα "005.7565"
Τώρα δείχνει 1 - 1 από 1
- Αποτελέσματα ανά σελίδα
- Επιλογές ταξινόμησης
Τεκμήριο Διαχείριση μεγάλου όγκου δεδομένων με το οικοσύστημα Hadoop και τη NoSQL βάση δεδομένων HBase(Τ.Ε.Ι. Κεντρικής Μακεδονίας, 2018-06) Ντόγαρης, Αθανάσιος; Τσιμπίρης, Αλκιβιάδης; Σχολή Τεχνολογικών Εφαρμογών, Τμήμα Μηχανικών Πληροφορικής Τ.Ε.; ΠΜΣ "ΕΦΑΡΜΟΣΜΕΝΗ ΠΛΗΡΟΦΟΡΙΚΗ"Σκοπός της διπλωματικής εργασίας είναι η μελέτη των δυνατοτήτων του οικοσυστήματος Hadoop και της HBase που είναι μία ανοιχτού λογισμικού NoSQL βάση δεδομένων ιδανική για αποθήκευση δεδομένων μεγάλου όγκου (Big Data). Το Hadoop αναπτύχθηκε από την Apache Software Foundation (ASF) και είναι μία πλατφόρμα λογισμικού (framework) γραμμένη σε JAVA για τη συγγραφή και την εκτέλεση κατανεμημένων εφαρμογών, οι οποίες επεξεργάζονται μεγάλου όγκου δεδομένα. Το Hadoop είναι μία παραλλαγή του MapReduce της Google και του File System της Google (GFS). Η πλατφόρμα Hadoop αποτελείται από πολλά συστατικά όπως: MapReduce, το Hadoop Distributed File System (HDFS), το Hive και την HBase μία NoSQL βάση δεδομένων τα οποία και θα μελετηθούν στη διπλωματική αυτή. Τα NoSQL συστήματα πλεονεκτούν έναντι των σχεσιακών συστημάτων, στις περιπτώσεις που απαιτείται διαχείριση μεγάλου όγκου δεδομένων σε παράλληλη επεξεργασία και δεν χρειάζεται να γίνει σχεσιακός σχεδιασμός της βάσης δεδομένων. Η HBase δεν υποστηρίζει μία δομημένη γλώσσα ερωτημάτων (SQL), αντίθετα διαθέτει δικές της εντολές ανάκτησης δεδομένων. Στα πλαίσια της διπλωματικής αυτής θα μελετηθεί η HBase Shell, μία script γλώσσα αλληλεπίδρασης με το σύστημα HBase που χρησιμοποιεί τη διεπαφή της γραμμής εντολών για τη δημιουργία, διαγραφή και τροποποίηση πινάκων (CRUD), για την καταχώρηση, μέτρηση, διαγραφή των δεδομένων στην HBase. Θα μελετηθεί επίσης και το Hue (Hadoop User Experience), το οποίο παρέχει ένα web interface για την εκτέλεση ερωτημάτων καθώς και τη δημιουργία, συντήρηση και εκτέλεση διαφόρων εργασιών στο Hadoop και κατ’επέκταση στην HBase. Θα δημιουργηθούν επίσης ευρετήρια στα δεδομένα με το ElasticSearch.