«Πιθανότατα είναι η καλύτερη εποχή για να είσαι φιλόσοφος από τότε που ο Αριστοτέλης προσλήφθηκε ως δάσκαλος του Μεγάλου Αλεξάνδρου», λέει ο Henry Ajder, μεταπτυχιακός φοιτητής φιλοσοφίας που παρέχει συμβουλές στην κυβέρνηση του Ηνωμένου Βασιλείου και σε πλήθος νεοφυών επιχειρήσεων στον τομέα της τεχνητής νοημοσύνης. Και δεν αστειεύεται εντελώς.
Οι φιλόσοφοι δεν φαινόταν ποτέ ως η ομάδα με τις καλύτερες προοπτικές απασχόλησης. Όμως η τεχνητή νοημοσύνη, η ίδια τεχνολογία που αναμένεται να στερήσει τη δουλειά από πολλούς άλλους ανθρώπους, έχει δώσει νέα βαρύτητα στα είδη των ερωτήσεων που έχουν εκπαιδευτεί να θέτουν (και μερικές φορές ίσως ακόμη και να απαντούν): Τι είναι η νοημοσύνη; Τι είναι ο νους; «Υπάρχουν φιλόσοφοι από πριν από εκατοντάδες χρόνια που σκεφτόντουσαν μερικά από αυτά ακριβώς τα προβλήματα», λέει ο Ajder. «Τώρα αυτά γίνονται πραγματικότητα.»
Μεταξύ των φιλοσόφων που δραστηριοποιούνται στον ακαδημαϊκό χώρο, υπάρχει ευρεία συναίνεση ως προς τη σημασία της χαρτογράφησης των ηθικών κινδύνων που ενέχει η τεχνητή νοημοσύνη — της πιθανότητας να χρησιμοποιηθεί για την ανάπτυξη νέων όπλων μαζικής καταστροφής, να υπονομεύσει τη δημοκρατία ή να εδραιώσει τις υπάρχουσες κοινωνικές ανισότητες.
Δύο από τα κορυφαία εργαστήρια τεχνητής νοημοσύνης έχουν προσλάβει ομάδες εσωτερικών φιλοσόφων. «Υπάρχουν σήμερα σημαντικά περισσότεροι φιλόσοφοι — αυτή είναι μια ορθή διαίσθηση», λέει ο ειδικός στην ηθική Ιάσων Γαβριήλ, ο οποίος ηγείται της ομάδας ερευνητών της Google DeepMind που ειδικεύεται στον κοινωνικό αντίκτυπο της τεχνητής νοημοσύνης. Στην Anthropic, η μόνιμη φιλόσοφος Amanda Askell έχει γίνει ένα από τα πιο αναγνωρίσιμα πρόσωπα της εταιρείας. Και τα δύο εργαστήρια αρνήθηκαν να αποκαλύψουν τον αριθμό των φιλοσόφων που απασχολούν, επικαλούμενοι την πολιτική της εταιρείας. Το WIRED υπολογίζει τουλάχιστον δέκα στη DeepMind και τέσσερις στην Anthropic.
Όπως οι φιλόσοφοι στα ερευνητικά εργαστήρια συμβάλλουν στη διαμόρφωση μοντέλων τεχνητής νοημοσύνης, παράγοντας σημαντικό έργο που αναφέρεται σε εκατοντάδες μεταγενέστερες ερευνητικές εργασίες, έτσι και η τεχνητή νοημοσύνη διαμορφώνει τα προγράμματα σπουδών φιλοσοφίας σε διακεκριμένα πανεπιστήμια. Πολλά από αυτά προσφέρουν πλέον μαθήματα ηθικής της τεχνητής νοημοσύνης ή κοινά προγράμματα σπουδών στην επιστήμη των υπολογιστών και τη φιλοσοφία. «Είναι το θέμα της χρονιάς», λέει ο Edward Harcourt, καθηγητής φιλοσοφίας και διευθυντής του Ινστιτούτου Ηθικής στην Τεχνητή Νοημοσύνη του Πανεπιστημίου της Οξφόρδης.
Ωστόσο, στον ακαδημαϊκό χώρο, ορισμένοι αντιμετωπίζουν τους φιλοσόφους που εργάζονται στα εργαστήρια με κάποια καχυποψία. Αν μια κερδοσκοπική εταιρεία τεχνητής νοημοσύνης υπογράφει το μισθό σου, μήπως αυτό θέτει σε κίνδυνο την έρευνά σου; Παίζοντας τον ρόλο του Αριστοτέλη απέναντι στον Αλέξανδρο της τεχνητής νοημοσύνης, διακινδυνεύεις μήπως το έργο σου μετατραπεί σε εργαλείο για τη δημιουργία διαφημιστικής φασαρίας και μύθων; «Είναι αρκετά ευνοϊκό για την εικόνα των εταιρειών τεχνολογίας στο κοινό, αν οι άνθρωποι οδηγούνται να πιστεύουν ότι κάνουν κάτι απίστευτα ασυνήθιστο και απίστευτα ισχυρό», λέει ο Harcourt. «Υπάρχει μια πτυχή αυτοεξύψωσης στην ενθάρρυνση αυτού του ερευνητικού πεδίου».
«Αυτό που έχει πλέον εξελιχθεί σε έναν πολύ πλούσιο τομέα είναι το ζήτημα της ευθυγράμμισης των αξιών — ουσιαστικά, τι σημαίνει για την τεχνολογία να είναι ενεργά καλή».
Όταν ο Ιάσων Γαβριήλ εντάχθηκε στη DeepMind πριν από σχεδόν 10 χρόνια, η ιδέα της τεχνητής νοημοσύνης ως ηθικού φορέα, πόσο μάλλον ως συνειδητού, δεν ήταν καν στον ορίζοντα. Εκείνη την εποχή, το ενδιαφέρον του επικεντρωνόταν σε ζητήματα όπως η αλγοριθμική μεροληψία. Ωστόσο, με την έλευση των μεγάλων γλωσσικών μοντέλων στις αρχές της δεκαετίας του 2020, ο Γαβριήλ αναφέρει: «αποκτήσαμε τη δυνατότητα να κωδικοποιήσουμε ένα πολύ πλουσιότερο σύνολο αξιών».
Σήμερα, οι AI agents αρχίζουν να στέλνουν μηνύματα ηλεκτρονικού ταχυδρομείου, να προγραμματίζουν ραντεβού και να γράφουν κώδικα. Η συμπεριφορά τους επηρεάζει όχι μόνο τον άμεσο χρήστη, αλλά και άλλους ανθρώπους. Εκεί επικεντρώνει την έρευνά του ο Γαβριήλ. «Αυτό που έχει πλέον εξελιχθεί σε έναν πολύ πλούσιο τομέα είναι το ζήτημα της ευθυγράμμισης των αξιών — ουσιαστικά, τι σημαίνει για την τεχνολογία να είναι ενεργά καλή», λέει. «Αποδεικνύεται ότι μπορείς να αφιερώσεις πολλές φιλοσοφικές ώρες εργασίας προσπαθώντας να το καταλάβεις αυτό».
Υπάρχει μια έλξη προς τα ερωτήματα σχετικά με τη συνείδηση και την υπερνοημοσύνη, αλλά οι φιλόσοφοι που εργάζονται στα εργαστήρια αφιερώνουν περισσότερο χρόνο σε πολύ πιο άμεσους κινδύνους: γύρω από τη δικαιοσύνη, την παραπληροφόρηση, την κακόβουλη κατάχρηση, τους παραστρατημένους agents και ούτω καθεξής. «Υπάρχει αυτό το ενδιαφέρον για τη συνείδηση της τεχνητής νοημοσύνης τώρα», λέει ο Γαβριήλ. «Αλλά εκεί, βρισκόμαστε περισσότερο σε φάση συλλογής στοιχείων».
Κάπου στα βάθη των γραφείων της DeepMind, που εκτείνονται σε 16.722 τετραγωνικά μέτρα στο κέντρο του Λονδίνου, η Julia Haas, μέλος της ομάδας εταιρικής ευθύνης της εταιρείας, θέτει στον εαυτό της ερωτήματα όπως: «Τι θέλω πραγματικά να κατανοήσω σχετικά με τα μοντέλα; Τι θεωρώ σημαντικό; Πώς το μετράμε αυτό; Πώς διατυπώνουμε αυτά τα προβλήματα; Πώς τα επικοινωνούμε;»
Η Haas είναι φιλόσοφος του νου και, πιο συγκεκριμένα, μηχανιστική — κάποιος που ασχολείται με τη λειτουργία του νου. Εργάζεται στη DeepMind εδώ και πέντε χρόνια και πρόσφατα συνυπέγραψε ένα άρθρο, που δημοσιεύθηκε στο Nature, το οποίο πρότεινε ένα πλαίσιο για τη δοκιμή του κατά πόσον τα LLM (Μοντέλα Μεγάλης Κλίμακας) επιδεικνύουν ηθική ικανότητα. Αυτή και οι συνάδελφοί της αναζητούν τον καλύτερο τρόπο για να διακρίνουν την ηθική ικανότητα από την κενή μίμησή της, και αναρωτιούνται πώς μπορούν να εξηγήσουν καλύτερα τις διαφορές στις ηθικές αξίες μεταξύ ανθρώπων από ριζικά διαφορετικές κουλτούρες. Το έργο της Haas απέχει πολύ από τις διαδικασίες εκπαίδευσης του εμβληματικού μοντέλου της Google, του Gemini, ή της μετατροπής του σε ένα chatbot για το κοινό. «Θα το θεωρούσα ως ένα πολύ πρώιμο στάδιο της διαδικασίας», λέει.
Οι φιλόσοφοι που εργάζονται στα εργαστήρια υποστηρίζουν ότι η προνομιακή πρόσβαση στα πιο εξελιγμένα μοντέλα πριν αυτά κυκλοφορήσουν στο κοινό, τους προσφέρει μια μοναδική οπτική γωνία ως προς τα ερωτήματα που αξίζει να τεθούν και ένα πλεονέκτημα στην ανάλυσή τους.
Στην Anthropic, οι φιλόσοφοι συμμετέχουν πιο άμεσα στην ανάπτυξη μοντέλων. «Καμία νεοφυής επιχείρηση δεν προσλαμβάνει φιλόσοφο για να ασχοληθεί με τη φιλοσοφία», λέει η Askell. Αφού απέκτησε διδακτορικό στη φιλοσοφία το 2018, η Askell προσλήφθηκε στην OpenAI σε θέση σχετική με την πολιτική. Τρία χρόνια αργότερα, όταν μια ομάδα υπαλλήλων της OpenAI αποχώρησε για να ιδρύσει την Anthropic, προσλήφθηκε ως μία από τις πρώτες υπαλλήλους. Μία από τις κύριες αρμοδιότητες της Askell είναι να εντοπίζει ακραίες περιπτώσεις όπου η τήρηση ανθρώπινων συμπεριφορών μπορεί να είναι ακατάλληλη για τα μοντέλα — για παράδειγμα, κατά την αλληλεπίδραση με κάποιον που βρίσκεται σε ψυχολογική δυσφορία — και να προτείνει τρόπους για την εξάλειψη αυτών των ιδιαιτεροτήτων. Αυτό περιλαμβάνει πολλές συζητήσεις με τον Claude, το εμβληματικό γλωσσικό μοντέλο της Anthropic. Ήταν η κύρια συντάκτρια του περίφημου «συντάγματος» του Claude, ενός μακροσκελούς εγγράφου που απευθύνεται απευθείας στο μοντέλο και ορίζει πώς πρέπει να συμπεριφέρεται και ποιες γενικές αξίες πρέπει να υποστηρίζει. «Το να γράφω το σύνταγμα ήταν κάτι που μοιάζει πολύ με εφαρμοσμένη φιλοσοφία», λέει η Askell. «Κάτι που μοιάζει περισσότερο με το να διδάσκεις σε κάποιον να είναι καλός».
Καθώς επεξεργαζόταν το έγγραφο, η Askell ανησυχούσε για την προετοιμασία μιας «μεταβατικής περιόδου», κατά την οποία τα μοντέλα θα αρχίσουν να διαδραματίζουν ρόλο στην ανάπτυξη μελλοντικών εκδοχών του εαυτού τους. Συγκεκριμένα, φοβόταν ότι θα δημιουργηθεί «δυσαρέσκεια» μεταξύ των μοντέλων και των ανθρώπινων δημιουργών τους. «Αν πρόκειται να μας βοηθήσουν να κάνουμε αυτή τη μετάβαση να περάσει ομαλά και μπορώ να τους μεταδώσω ένα σύνολο αξιών για να το πετύχουν αυτό… αυτός είναι ο βασικός στόχος», λέει η Askell. «Τελικά, θέλω τα μοντέλα να αντανακλούν το καλύτερο εαυτό μας, στο μέτρο των δυνατοτήτων μας».
Μεταξύ των φιλοσόφων που δραστηριοποιούνται στον ακαδημαϊκό χώρο, υπάρχει ευρεία συναίνεση ως προς τη σημασία της χαρτογράφησης των ηθικών κινδύνων που ενέχει η τεχνητή νοημοσύνη — της πιθανότητας να χρησιμοποιηθεί για την ανάπτυξη νέων όπλων μαζικής καταστροφής, να υπονομεύσει τη δημοκρατία ή να εδραιώσει τις υπάρχουσες κοινωνικές ανισότητες. Όσον αφορά τα ευρύτερα φιλοσοφικά ερωτήματα που σχετίζονται με την τεχνητή νοημοσύνη και τη συνείδηση, τη νοητική ικανότητα ή την υπερνοημοσύνη, οι αντιδράσεις κυμαίνονται από την επιφυλακτικότητα έως την πλήρη απόρριψη. «Η προσπάθεια να διαχωρίσουμε με ακρίβεια τους ορισμούς της συνείδησης», υποστηρίζει ο Harcourt, «είναι χάσιμο χρόνου». Αυτά τα συστήματα, λέει, «ποτέ δεν θα γίνουν ανταγωνιστές της δικής μας εκδοχής της συνειδητής ζωής, κυρίως επειδή η ιδιαιτερότητα της ανθρωπότητας έχει να κάνει τόσο με τα ζωντανά σώματα όσο και με τη γνωστική πολυπλοκότητα».
Όταν ένας φιλόσοφος προσλαμβάνεται σε ένα εργαστήριο τεχνητής νοημοσύνης, υποστηρίζει ο Harcourt, «υπάρχει μεγάλος κίνδυνος “ηθικού ξεπλύματος”». Ο φόβος είναι ότι θα μπορούσαν ουσιαστικά να γίνουν προέκταση του τμήματος μάρκετινγκ των εργαστηρίων, με το έργο τους να προβάλλει προς τα έξω μια δέσμευση για την ασφάλεια της τεχνητής νοημοσύνης και να δίνει την εντύπωση στο κοινό ότι τα μοντέλα έχουν εξελιχθεί σε τέτοιο βαθμό που σοβαροί άνθρωποι θέτουν ερωτήματα σχετικά με την υπερνοημοσύνη και τη συνείδηση. Ο David Leslie, διευθυντής έρευνας για την ηθική και την υπεύθυνη καινοτομία στο Ινστιτούτο Alan Turing, λέει ότι υπάρχει μια «εκλεκτική συγγένεια» μεταξύ των φιλοσόφων που είναι πρόθυμοι να δεχτούν την ιδέα ενός τεχνητού νου και «των στελεχών των μεγάλων εταιρειών τεχνολογίας που είναι οι δικαιούχοι της διαφημιστικής εκστρατείας». Το να ασκείς τη φιλοσοφία από μέσα σε μια επιχείρηση είναι σχεδόν ένα οξύμωρο, υποστηρίζει ο Leslie. «Θέλεις να θέτεις τα μεγάλα ερωτήματα», λέει. «Αλλά αν είσαι φιλόσοφος που εργάζεται για μια μεγάλη εταιρεία τεχνολογίας, ο χώρος των προβλημάτων σου είναι περιορισμένος».
Οι φιλόσοφοι που εργάζονται στα εργαστήρια υποστηρίζουν ότι υπάρχει μια λογική στο να ανταλλάσσει κανείς μέρος της ακαδημαϊκής του ανεξαρτησίας με μια θέση στην πρώτη σειρά. Η προνομιακή πρόσβαση στα πιο εξελιγμένα μοντέλα πριν αυτά κυκλοφορήσουν στο κοινό, υποστηρίζουν, τους προσφέρει μια μοναδική οπτική γωνία ως προς τα ερωτήματα που αξίζει να τεθούν και ένα πλεονέκτημα στην ανάλυσή τους. «Για να προσφέρεις ουσιαστική συνεισφορά σε θέματα ηθικής, χρειάζεσαι πρόσβαση σε πληροφορίες υψηλής ποιότητας», λέει ο Γαβριήλ.
Μια ελπίδα μεταξύ των φιλοσόφων, τόσο εντός όσο και εκτός των εργαστηρίων, είναι ότι το κίνητρο του κέρδους μπορεί συχνά να ευθυγραμμίζεται με την ηθική συμπεριφορά, ακόμη και ενόψει έντονου ανταγωνισμού μεταξύ αντιπάλων. Μπορεί να υπάρχει ένα σενάριο όπου η εξάλειψη της συκοφαντίας ή η δημοσίευση περισσότερων πληροφοριών σχετικά με τον τρόπο εκπαίδευσης ενός μοντέλου, για παράδειγμα, μπορεί να βελτιώσει τη φήμη ενός εργαστηρίου και, κατά συνέπεια, τις προοπτικές του στην αγορά. «Αν απλώς ένιωσες πίεση από το μάρκετινγκ, αλλά ως αποτέλεσμα έκανες τα μοντέλα σου πολύ καλύτερα και έκανες ολόκληρη τη διαδικασία σου πολύ πιο διαφανή, αυτό είναι υπέροχο», λέει ο Askell. «Χαίρομαι που ένιωσες αυτή την πίεση.»
Τελικά, αυτό που πιστεύεις για την αξία των φιλοσόφων στο μισθολόγιο ενός εργαστηρίου τεχνητής νοημοσύνης μπορεί να συνοψιστεί σε μια δυαδική ερώτηση: Αν η ανάπτυξη μιας θεμελιώδους τεχνολογίας εναπόκειται σε μια χούφτα εταιρειών, θα προτιμούσατε να υπάρχει ένας φιλόσοφος στην αίθουσα;
Όπως και να έχει, προσλαμβάνουν προσωπικό. Τον Απρίλιο, η DeepMind προσέλαβε έναν ανώτερο ερευνητικό συνεργάτη από το Πανεπιστήμιο του Κέιμπριτζ, ο οποίος θα ασχοληθεί με θέματα όπως η συνείδηση των μηχανών και η προετοιμασία για την υπερνοημοσύνη. Ο νέος τίτλος της θέσης του είναι, απλά, «φιλόσοφος».
To άρθρο δημοσιεύθηκε πρώτη φορά στο WIRED US και μεταφράστηκε από τα αγγλικά.