Mastodon
Connect with us

Chatbots & Virtual Agents

Πλαίσιο ανίχνευσης ανωμαλιών για όλους από το MIT

Η Sarah Alnegheimish και το Orion φέρνουν την ανίχνευση ανωμαλιών πιο κοντά σε όλους μέσω της μηχανικής μάθησης και του ανοιχτού κώδικα.

Published

on

Πλαίσιο ανίχνευσης ανωμαλιών για όλους από το MIT

Η έρευνα της Sarah Alnegheimish

Η Sarah Alnegheimish εστιάζει την έρευνά της στη διασταύρωση της μηχανικής μάθησης και της συστημικής μηχανικής. Στόχος της είναι να καταστήσει τα συστήματα μηχανικής μάθησης πιο προσιτά, διαφανή και αξιόπιστα. Ως διδακτορική φοιτήτρια στην ομάδα Data-to-AI του κύριου ερευνητή Kalyan Veeramachaneni στο Εργαστήριο Πληροφοριακών και Αποφασιστικών Συστημάτων (LIDS) του MIT, αφιερώνει την ενέργειά της στην ανάπτυξη του Orion, ενός ανοιχτού κώδικα, φιλικού προς τον χρήστη πλαισίου μηχανικής μάθησης και βιβλιοθήκης χρονικών σειρών που μπορεί να ανιχνεύει ανωμαλίες χωρίς επίβλεψη σε βιομηχανικές και λειτουργικές ρυθμίσεις μεγάλης κλίμακας.

Πρώιμες επιρροές και εκπαιδευτική πορεία

Ως κόρη ενός πανεπιστημιακού καθηγητή και μιας εκπαιδευτικού, η Alnegheimish έμαθε από νωρίς τη σημασία της ελεύθερης διάδοσης της γνώσης. «Μεγάλωσα σε ένα περιβάλλον όπου η εκπαίδευση είχε μεγάλη αξία, και αυτό είναι μέρος του γιατί θέλω να κάνω τα εργαλεία μηχανικής μάθησης προσιτά σε όλους». Η προσωπική της εμπειρία με ανοιχτούς πόρους ενίσχυσε το κίνητρό της. «Η προσβασιμότητα είναι το κλειδί για την υιοθέτηση. Για να έχεις αντίκτυπο, η νέα τεχνολογία πρέπει να είναι διαθέσιμη σε αυτούς που τη χρειάζονται. Αυτός είναι ο σκοπός της ανάπτυξης ανοιχτού κώδικα».

Ακαδημαϊκή και επαγγελματική εξέλιξη

Η Alnegheimish απέκτησε το πτυχίο της στο Πανεπιστήμιο King Saud (KSU), όπου ήταν μέρος της πρώτης ομάδας φοιτητών στην επιστήμη των υπολογιστών. «Πριν δημιουργηθεί αυτό το πρόγραμμα, η μόνη άλλη διαθέσιμη ειδικότητα στην πληροφορική ήταν η τεχνολογία πληροφοριών (IT)». Η συμμετοχή στην πρώτη ομάδα ήταν συναρπαστική αλλά και προκλητική, καθώς απαιτούσε ανεξάρτητη μάθηση. «Ανακάλυψα το MIT OpenCourseWare ως πόρο για να διδάξω τον εαυτό μου».

Η δημιουργία του Orion

Η διπλωματική εργασία της Alnegheimish επικεντρώθηκε στην ανίχνευση ανωμαλιών σε χρονικές σειρές — την αναγνώριση απροσδόκητων συμπεριφορών ή μοτίβων στα δεδομένα, που μπορεί να παρέχουν κρίσιμες πληροφορίες στους χρήστες. Παραδείγματα περιλαμβάνουν ασυνήθιστα μοτίβα στην κυκλοφορία δικτύου που μπορεί να υποδηλώνουν απειλές κυβερνοασφάλειας ή ανώμαλες αναγνώσεις αισθητήρων σε βαριά μηχανήματα που μπορούν να προβλέψουν μελλοντικές αποτυχίες.

Η τεχνολογία πίσω από το Orion

Το Orion χρησιμοποιεί μοντέλα βασισμένα σε στατιστική και μηχανική μάθηση που καταγράφονται και συντηρούνται συνεχώς. Οι χρήστες δεν χρειάζεται να είναι ειδικοί στη μηχανική μάθηση για να χρησιμοποιήσουν τον κώδικα. Μπορούν να αναλύσουν σήματα, να συγκρίνουν μεθόδους ανίχνευσης ανωμαλιών και να διερευνήσουν ανωμαλίες σε ένα ολοκληρωμένο πρόγραμμα. Ο κώδικας, το πλαίσιο και τα δεδομένα είναι όλα ανοιχτού κώδικα.

Ανακατασκευή μοντέλων για ανίχνευση ανωμαλιών

Στο διδακτορικό της, η Alnegheimish εξερευνά καινοτόμους τρόπους ανίχνευσης ανωμαλιών χρησιμοποιώντας το Orion. «Όταν ξεκίνησα την έρευνά μου, όλα τα μοντέλα μηχανικής μάθησης έπρεπε να εκπαιδευτούν από την αρχή στα δεδομένα σας. Τώρα, μπορούμε να χρησιμοποιήσουμε προεκπαιδευμένα μοντέλα», λέει. Η εργασία με προεκπαιδευμένα μοντέλα εξοικονομεί χρόνο και υπολογιστικό κόστος. Η πρόκληση είναι ότι η ανίχνευση ανωμαλιών σε χρονικές σειρές είναι μια νέα εργασία για αυτά.

Σχεδιασμός με προσβασιμότητα

Η Alnegheimish μιλάει εκτενώς για τις προσπάθειές της να κάνει το Orion πιο προσβάσιμο. «Πριν έρθω στο MIT, πίστευα ότι το κρίσιμο μέρος της έρευνας ήταν η ανάπτυξη του μοντέλου μηχανικής μάθησης ή η βελτίωσή του. Με τον καιρό, συνειδητοποίησα ότι ο μόνος τρόπος να κάνεις την έρευνά σου προσβάσιμη και προσαρμόσιμη είναι να αναπτύξεις συστήματα που την καθιστούν προσβάσιμη».

Η αξία της ταυτόχρονης ανάπτυξης συστημάτων και μοντέλων

Η αξία της ταυτόχρονης ανάπτυξης συστημάτων και μοντέλων φαίνεται στο έργο της Alnegheimish ως μέντορας. Είχε την ευκαιρία να συνεργαστεί με δύο φοιτητές που έκαναν το μεταπτυχιακό τους στην μηχανική. «Τους έδειξα μόνο το σύστημα και την τεκμηρίωση για το πώς να το χρησιμοποιήσουν. Και οι δύο μπόρεσαν να αναπτύξουν τα δικά τους μοντέλα με τις αφαιρέσεις που χρησιμοποιούμε. Αυτό επιβεβαίωσε ότι ακολουθούμε το σωστό δρόμο».

Η χρήση μεγάλων γλωσσικών μοντέλων

Η Alnegheimish διερεύνησε επίσης αν ένα μεγάλο γλωσσικό μοντέλο (LLM) θα μπορούσε να χρησιμοποιηθεί ως μεσολαβητής μεταξύ των χρηστών και ενός συστήματος. Ο πράκτορας LLM που έχει υλοποιήσει μπορεί να συνδεθεί με το Orion χωρίς οι χρήστες να χρειάζεται να γνωρίζουν τις λεπτομέρειες του πώς λειτουργεί το Orion. «Σκεφτείτε το ChatGPT. Δεν έχετε ιδέα ποιο είναι το μοντέλο πίσω από αυτό, αλλά είναι πολύ προσβάσιμο σε όλους.»

«Ο απώτερος στόχος μου είναι να κάνω την AI πιο προσβάσιμη σε όλους», λέει. Μέχρι στιγμής, το Orion έχει φτάσει πάνω από 120.000 λήψεις, και πάνω από χίλιοι χρήστες έχουν επισημάνει το αποθετήριο ως ένα από τα αγαπημένα τους στο Github. «Παραδοσιακά, μετρούσες τον αντίκτυπο της έρευνας μέσω αναφορών και δημοσιεύσεων. Τώρα, έχεις άμεση υιοθέτηση μέσω ανοιχτού κώδικα».

Advertisement