Mastodon
Connect with us

Robotics

Νέο σύστημα επιτρέπει στα ρομπότ να επιλύουν προβλήματα χειρισμού σε δευτερόλεπτα

Νέο σύστημα από MIT και NVIDIA επιταχύνει τη ρομποτική σχεδίαση.

Published

on

Νέο σύστημα επιτρέπει στα ρομπότ να επιλύουν προβλήματα χειρισμού σε δευτερόλεπτα

Η πρόκληση της συσκευασίας

Ετοιμάζεστε για τις πολυαναμενόμενες καλοκαιρινές διακοπές; Πρώτα, πρέπει να πακετάρετε όλα τα απαραίτητα αντικείμενα στη βαλίτσα σας, διασφαλίζοντας ότι όλα θα χωρέσουν με ασφάλεια χωρίς να σπάσει κάτι εύθραυστο. Για τους ανθρώπους, αυτή είναι μια απλή διαδικασία χάρη στις ισχυρές οπτικές και γεωμετρικές ικανότητές τους. Ωστόσο, για ένα ρομπότ, αυτό αποτελεί μια εξαιρετικά περίπλοκη πρόκληση σχεδιασμού που απαιτεί ταυτόχρονη σκέψη για πολλές ενέργειες, περιορισμούς και μηχανικές δυνατότητες.

Η καινοτομία του MIT και της NVIDIA

Ερευνητές από το MIT και την NVIDIA Research ανέπτυξαν έναν καινοτόμο αλγόριθμο που επιταχύνει δραματικά τη διαδικασία σχεδιασμού των ρομπότ. Η προσέγγισή τους επιτρέπει στο ρομπότ να “σκέφτεται μπροστά” αξιολογώντας χιλιάδες πιθανές λύσεις ταυτόχρονα και στη συνέχεια να βελτιώνει τις καλύτερες ώστε να ανταποκρίνονται στους περιορισμούς του ρομπότ και του περιβάλλοντός του. Αντί να δοκιμάζει κάθε πιθανή ενέργεια μεμονωμένα, όπως πολλές υπάρχουσες προσεγγίσεις, αυτή η νέα μέθοδος εξετάζει χιλιάδες ενέργειες ταυτόχρονα, επιλύοντας πολυβήματα προβλήματα χειρισμού μέσα σε λίγα δευτερόλεπτα.

Η δύναμη των GPUs

Οι ερευνητές αξιοποιούν τη μαζική υπολογιστική ισχύ των εξειδικευμένων επεξεργαστών, γνωστών ως graphics processing units (GPUs), για να επιτύχουν αυτή την επιτάχυνση. Σε ένα εργοστάσιο ή αποθήκη, η τεχνική τους θα μπορούσε να επιτρέψει στα ρομπότ να καθορίσουν γρήγορα πώς να χειρίζονται και να πακετάρουν στενά αντικείμενα διαφορετικών σχημάτων και μεγεθών χωρίς να τα καταστρέφουν ή να συγκρούονται με εμπόδια, ακόμα και σε στενούς χώρους.

Η σημασία του χρόνου στη βιομηχανία

«Αυτό θα ήταν πολύ χρήσιμο σε βιομηχανικά περιβάλλοντα όπου ο χρόνος έχει σημασία και πρέπει να βρείτε μια αποτελεσματική λύση όσο το δυνατόν γρηγορότερα. Αν ο αλγόριθμός σας χρειάζεται λεπτά για να βρει ένα σχέδιο, αντί για δευτερόλεπτα, αυτό κοστίζει χρήματα στην επιχείρηση», λέει ο William Shen, μεταπτυχιακός φοιτητής του MIT και κύριος συγγραφέας της μελέτης για αυτή την τεχνική.

Σχεδιασμός σε παράλληλο

Ο αλγόριθμος των ερευνητών είναι σχεδιασμένος για αυτό που ονομάζεται σχεδιασμός εργασίας και κίνησης (task and motion planning – TAMP). Ο στόχος ενός αλγορίθμου TAMP είναι να καταλήξει σε ένα σχέδιο εργασίας για ένα ρομπότ, το οποίο είναι μια υψηλού επιπέδου ακολουθία ενεργειών, μαζί με ένα σχέδιο κίνησης, που περιλαμβάνει παραμέτρους χαμηλού επιπέδου, όπως θέσεις αρθρώσεων και προσανατολισμό λαβής, που ολοκληρώνουν αυτό το υψηλού επιπέδου σχέδιο.

Η διαδικασία του cuTAMP

Ο αλγόριθμος, που ονομάζεται cuTAMP, επιταχύνεται χρησιμοποιώντας μια παράλληλη υπολογιστική πλατφόρμα που ονομάζεται CUDA, προσομοιώνει και βελτιώνει χιλιάδες λύσεις ταυτόχρονα. Αυτό γίνεται με συνδυασμό δύο τεχνικών, δειγματοληψίας και βελτιστοποίησης. Η δειγματοληψία περιλαμβάνει την επιλογή μιας λύσης για δοκιμή. Αντί να δειγματοληπτεί λύσεις τυχαία, το cuTAMP περιορίζει το εύρος των πιθανών λύσεων σε εκείνες που είναι πιο πιθανό να ικανοποιήσουν τους περιορισμούς του προβλήματος.

Η εφαρμογή και οι δυνατότητες του cuTAMP

Όταν δοκιμάστηκε σε προκλήσεις συσκευασίας παρόμοιες με το Tetris σε προσομοίωση, το cuTAMP χρειάστηκε μόνο λίγα δευτερόλεπτα για να βρει επιτυχημένα, χωρίς συγκρούσεις σχέδια που μπορεί να χρειάζονταν πολύ περισσότερο χρόνο για να επιλυθούν με σειριακές προσεγγίσεις σχεδιασμού. Και όταν εφαρμόστηκε σε ένα πραγματικό ρομποτικό βραχίονα, ο αλγόριθμος πάντα βρήκε μια λύση σε λιγότερο από 30 δευτερόλεπτα.

Η ευελιξία και το μέλλον του συστήματος

Το σύστημα λειτουργεί σε διάφορα ρομπότ και έχει δοκιμαστεί σε έναν ρομποτικό βραχίονα στο MIT και σε ένα ανθρωποειδές ρομπότ στην NVIDIA. Δεδομένου ότι το cuTAMP δεν είναι ένας αλγόριθμος μηχανικής μάθησης, δεν απαιτεί δεδομένα εκπαίδευσης, κάτι που θα μπορούσε να το επιτρέψει να εφαρμοστεί άμεσα σε πολλές καταστάσεις. Ο αλγόριθμος είναι γενικεύσιμος σε καταστάσεις πέρα από τη συσκευασία, όπως ένα ρομπότ που χρησιμοποιεί εργαλεία.

Στο μέλλον, οι ερευνητές θέλουν να αξιοποιήσουν μεγάλα γλωσσικά μοντέλα και μοντέλα γλώσσας όρασης μέσα στο cuTAMP, επιτρέποντας σε ένα ρομπότ να διατυπώνει και να εκτελεί ένα σχέδιο που επιτυγχάνει συγκεκριμένους στόχους βάσει φωνητικών εντολών από έναν χρήστη.

Αυτή η εργασία υποστηρίζεται, εν μέρει, από το Εθνικό Ίδρυμα Επιστημών (NSF), το Γραφείο Επιστημονικής Έρευνας της Πολεμικής Αεροπορίας, το Γραφείο Ναυτικής Έρευνας, το MIT Quest for Intelligence, την NVIDIA και το Ινστιτούτο Ρομποτικής και Τεχνητής Νοημοσύνης.

Advertisement