Αν για κάποιον τρελό λόγο θέλετε για να είστε… νευρικοί σχετικά τε την τεχνητή νοημοσύνη (AI), θα ήταν καλό να μάθετε το εξής: Μερικοί από τους πιο έξυπνους ανθρώπους στον πλανήτη δίνουν μάχη να δημιουργήσουν τεστ που τα μην μπορούν να παραστούν από τα συστήματα τεχνητής νοημοσύνης!
Σύμφωνα με τους New York Times, τα τελευταία χρόνια, τα μοντέλα τεχνητής νοημοσύνης υποβάλλονται σε ποικίλα τεστ. Πολλά από αυτά τα τεστ αποτελούνταν από δυσεπίλυτα προβλήματα διαμετρήματος S.A.T. (σ.σ. τεστ πολλαπλής επιλογής, το οποίο εξετάζει την ικανότητα ανάπτυξης κριτικής σκέψης και απόδειξης γνώσεων μέσα σε πολύ μικρό χρονικό διάστημα) σε τομείς όπως τα μαθηματικά, η επιστήμη και η λογική.
Η σύγκριση των βαθμολογιών των μοντέλων χρησίμευσε με την πάροδο του χρόνου στη γέννηση μιας πρόχειρης μονάδας μέτρησης της προόδου της τεχνητής νοημοσύνης.
Αλλά τα συστήματα τεχνητής νοημοσύνης έγιναν τελικά πολύ καλά σε αυτά τα τεστ κι έτσι δημιουργήθηκαν νέα, πιο δύσκολα τεστ – συχνά με τους τύπους ερωτήσεων που συναντούν οι μεταπτυχιακοί φοιτητές στις εξετάσεις τους.
Ούτε αυτά τα τεστ μπόρεσαν να αποτελέσουν ανυπέρβλητα εμπόδια για την τεχνητή νοημοσύνη. Νέα μοντέλα, από εταιρείες όπως η OpenAI, η Google και η Anthropic έχουν λάβει υψηλές βαθμολογίες σε πολλές προκλήσεις επιπέδου διδακτορικού, περιορίζοντας τη χρησιμότητα αυτών των τεστ και γεννώντας στο μυαλό των επιστημόνων ένα ανατριχιαστικό ερώτημα: Τα συστήματα είναι πλέον τόσο έξυπνα που δεν μπορούμε να ξέρουμε το πόσο;
Αυτή την εβδομάδα, οι ερευνητές του Κέντρου για την Ασφάλεια της AI απάντησαν σε αυτό το ερώτημα με μια νέα αξιολόγηση, που ονομάζεται «Τελευταίο Τεστ της Ανθρωπότητας» και υποστηρίζουν ότι είναι το πιο δύσκολο τεστ στο οποίοι έχει υποβληθεί ποτέ ένα συστήματα τεχνητής νοημοσύνης.
Το «Τελευταίο Τεστ της Ανθρωπότητας» είναι πνευματικό τέκνο του Ντάν Χέντρικς, ενός γνωστού ερευνητή γύρω από την ασφάλεια της τεχνητής νοημοσύνης και διευθυντής του Κέντρου για την Ασφάλεια της AI (Το αρχικό όνομα του τεστ, «Τελευταία Μάχη της Ανθρωπότητας», απορρίφθηκε επειδή ήταν υπερβολικά δραματικό).
Ο Χέντρικς συνεργάστηκε με την Scale AI, μια εταιρεία τεχνητής νοημοσύνης με την οποία συνέταξε ένα τεστ που αποτελείται από περίπου 3.000 ερωτήσεις πολλαπλής επιλογής και γρήγορων απαντήσεων και σχεδιάστηκε για να διακομίζονται οι ικανότητας των συστημάτων τεχνητής νοημοσύνης σε τομείς που κυμαίνονται από την αναλυτική φιλοσοφία μέχρι την πυραυλική μηχανική.
Οι ερωτήσεις υποβλήθηκαν από ειδικούς σε αυτούς τους τομείς, συμπεριλαμβανομένων καθηγητών κολεγίων και βραβευμένων μαθηματικών, στους οποίους ζητήθηκε να υποβάλουν εξαιρετικά δύσκολες ερωτήσεις στις οποίες γνώριζαν τις απαντήσεις.
Οι απαιτήσεις δεν είναι μικρές. Για παράδειγμα, υπάρχει ερώτηση γύρω από την ανατομία του κολιμπριού. «Τα κολιμπριά έχουν ένα οβάλ οστό που απαρτίζεται από δυο μέρη και τα κάνει να ξεχωρίζουν από τα υπόλοιπα πτηνά της τάξης τους [Apodiformes]. Πρόκειται για ένα σησαμοειδές οστό, που είναι ενσωματωμένο στο πλάγιο ουραίο τμήμα…», ξεκινά, και καταλήγει να ζητά την εξής απάντηση: «Πόσα ζεύγη συνδέσμων υποστηρίζονται από το εν λόγω οστό;». Εξίσου δύσκολο ένα πρόβλημά που θέτει, το οποίο έγκειται στο πεδίο της Φυσική.
Όπως γίνεται κατανοητό, όλα αυτά χρήσουν τόσο ειδικών γνώσεων όσο και δυνατότητας ταχύτατων υπολογισμών – κατά τη λογική αυτών των τεστ. Όπερ σημαίνει ότι αυτές οι μηχανές καλούνται να αγγίζουν ή να ξεπερνούν τα όρια των ανθρώπινων δυνατοτήτων.
Οι ερωτήσεις πέρασαν από μια διαδικασία φιλτραρίσματος δυο βημάτων για να καταλήξουν στο «Τελευταίο Τεστ της Ανθρωπότητας». Αρχικά, υποβλήθηκαν προβλήματα προς επίλυση σε κορυφαία μοντέλα τεχνητής νοημοσύνης.
Εάν τα μοντέλα δεν μπορούσαν να τα επιλύσουν (ή εάν το ποσοστό των απαντήσεών τους με τυχαία επιλογή ήταν χειρότερο απ’ ό,τι με πολλαπλή επιλογή), τότε οι συγκεκριμένες ερωτήσεις αναθεωρούντο από ειδικούς και βελτιώνονταν ως προς τη σαφήνειά τους, ούτως ώστε να μην ευθύνεται η διατύπωσή τους για τυχόν αποτυχίες εκ μέρους των μοντέλων τεχνητής νοημοσύνης.
Ο Χέντρικς δήλωσε πως ο όγκος των βαθμολογιών αναμένεται να αυξηθεί ραγδαία, με την αύξηση να αγγίζει το 50% μέχρι το τέλος του 2025. Τότε, τόνισε ο ίδιος, τα συστήματα τεχνητής νοημοσύνης είναι δυνατόν να προβαίνουν σε «χρησμούς παγκόσμιας κλάσης». Να είναι, δηλαδή, ικανά να απαντούν σε ερωτήσεις για οποιοδήποτε ζήτημα, με μεγαλύτερη ακρίβεια απ’ ό,τι οι άνθρωποι που ειδικεύονται σε αυτά τα ζητήματα.
Κι ίσως χρειαστεί να αναζητήσουμε άλλους τρόπους για να μετρήσουμε τις επιπτώσεις της τεχνητής νοημοσύνης, όπως να εξετάσουμε οικονομικά δεδομένα ή να κρίνουμε εάν μπορεί να κάνει νέες ανακαλύψεις σε τομείς όπως τα μαθηματικά και η επιστήμη.
Μέρος αυτού που προκαλεί σύγχυση σχετικά με το ζήτημα της προόδου της τεχνητής νοημοσύνης, είναι το ερώτημα κατά πόσον γνωρίζουμε πραγματικά εάν και σε τι βαθμό γίνεται απειλητική. Έχουμε μοντέλα τεχνητής νοημοσύνης ικανά να διαγνώσουν ασθένειες πιο αποτελεσματικά από τους γιατρούς, κερδίζουν ασημένια μετάλλια στη Διεθνή Ολυμπιάδα Μαθηματικών και νικούν κορυφαίους προγραμματιστές σε ανταγωνιστικές προκλήσεις του είδους.
Από την άλλη, υπάρχουν φορές που τα μοντέλα παλεύουν με βασικές εργασίες, όπως η αριθμητική ή η συγγραφή μετρικής ποίησης. Λόγω αυτού, έχουν αποκτήσει τη φήμη ότι είναι εκπληκτικά χρήσιμα σε ορισμένα πράγματα και εντελώς άχρηστων σε άλλα. Παράλληλα έχουν γεννηθεί ποικίλες εκτιμήσεις γύρω από το πόσο γρήγορα βελτιώνονται.
Οι ειδικοί επισημαίνουν ότι απαιτείται να δημιουργηθούν εργαλεία ικανά να αξιολογήσουν καλύτερα την πρόοδο και τις ικανότητες που αποκτούν τα συστήματα τεχνητής νοημοσύνης, προκειμένου ο άνθρωπος να είναι σε θέση να γνωρίζει ανά πάσα ώρα και στιγμή αν και σε τι βαθμό απειλείται το ίδιο του το μέλλον…
Πηγή: in.gr