Το MIT παρουσίασε αυτή την εβδομάδα ένα νέο μοντέλο εκπαίδευσης ρομπότ. Αντί για το τυπικό σύνολο εστιασμένων δεδομένων που χρησιμοποιούνται για τη διδασκαλία νέων εργασιών στα ρομπότ, η μέθοδος είναι μεγάλη, μιμούμενη τον τεράστιο όγκο πληροφοριών που χρησιμοποιούνται για την εκπαίδευση μεγάλων γλωσσικών μοντέλων (LLM).
Uber: Συνεργασία με κινεζική startup αυτόνομης οδήγησης για ρομποταξί στα Αραβικά Εμιράτα
Οι ερευνητές σημειώνουν ότι η μάθηση μίμησης μπορεί να αποτύχει όταν εισάγονται μικρές προκλήσεις. Αυτά μπορεί να είναι πράγματα όπως φωτισμός, διαφορετικό σκηνικό ή νέα εμπόδια. Σε αυτά τα σενάρια, τα ρομπότ απλά δεν έχουν αρκετά δεδομένα για να τα αξιοποιήσουν προκειμένου να προσαρμοστούν.
Η ομάδα αναζήτησε μοντέλα όπως το GPT-4 για ένα είδος προσέγγισης δεδομένων για την επίλυση προβλημάτων.
Ρομπότ και γλώσσα μάθησης
«Στον τομέα της γλώσσας, τα δεδομένα είναι όλα απλώς προτάσεις», λέει ο Lirui Wang, επικεφαλής συγγραφέας της νέας εργασίας. «Στη ρομποτική, δεδομένης της ετερογένειας στα δεδομένα, αν θέλεις να προεκπαιδεύσεις με παρόμοιο τρόπο, απαιτείται μια διαφορετική αρχιτεκτονική».
Η ομάδα εισήγαγε μια νέα αρχιτεκτονική που ονομάζεται Heterogeneous Pretrained Transformers (HPT), η οποία συγκεντρώνει πληροφορίες από διαφορετικούς αισθητήρες και διαφορετικά περιβάλλοντα. Στη συνέχεια χρησιμοποιήθηκε ένας μετασχηματιστής για να συγκεντρώσει τα δεδομένα σε μοντέλα εκπαίδευσης. Όσο μεγαλύτερος είναι ο μετασχηματιστής, τόσο καλύτερη είναι η έξοδος.
Ελπίδες για μια μεγάλη ανακάλυψη
Στη συνέχεια, οι χρήστες εισάγουν το σχέδιο του ρομπότ, τη διαμόρφωση και την εργασία που θέλουν να γίνει.
«Το όνειρό μας είναι να έχουμε έναν παγκόσμιο εγκέφαλο ρομπότ που θα μπορείτε να τον “κατεβάσετε” και να τον χρησιμοποιήσετε για το ρομπότ σας, χωρίς καθόλου εκπαίδευση», είπε ο αναπληρωτής καθηγητής της CMU, David Held, σχετικά με την έρευνα. «Ενώ βρισκόμαστε μόλις στα αρχικά στάδια, θα συνεχίσουμε να πιέζουμε σκληρά και ελπίζουμε ότι η κλιμάκωση θα οδηγήσει σε μια σημαντική ανακάλυψη στις ρομποτικές πολιτικές, όπως συνέβη με τα μεγάλα γλωσσικά μοντέλα».
Η έρευνα χρηματοδοτήθηκε, εν μέρει, από το Ερευνητικό Ινστιτούτο Toyota (TRI). Πέρυσι στην τεχνολογική έκθεση TechCrunch Disrupt, το TRI έκανε το ντεμπούτο σε μια μέθοδο για την εκπαίδευση ρομπότ ολονυκτίως. Πιο πρόσφατα, πέτυχε μια συνεργασία που θα ενοποιήσει την έρευνά της για τη μάθηση ρομπότ με το hardware της αμερικανικής εταιρείας σχεδιασμού μηχανικής και ρομποτικής, Boston Dynamics.
Πηγή: ot.gr