«Το κείμενό σας είναι 100% φτιαγμένο από AI.» Αυτό γράφει η ιστοσελίδα ZeroGPT όταν αναλύει απόσπασμα του Φρανκενστάιν της Mary Shelley. Σε άλλες ιστοσελίδες που εξετάζουν κείμενα για ίχνη τεχνητής νοημοσύνης, τα αποτελέσματα διαφέρουν. Κάποιες βρίσκουν το κείμενο ανθρώπινο, άλλες το κρίνουν κατά το ήμισυ προϊόν AI.
Αν η Shelley δεν ταξίδεψε στο παρελθόν με smartphone και chatbot πριν γράψει το διάσημο βιβλίο της, τότε μάλλον κάτι άλλο συμβαίνει. Σε έναν αλλόκοτο «ουροβόρο» κύκλο, η τεχνητή νοημοσύνη εκπαιδεύεται να γράφει βασισμένη στο έργο πραγματικών συγγραφέων, για να καταλήξει να θεωρεί πως τα πρωτότυπα κείμενα έχουν γραφτεί από AI.
«Το AI αγγίζει επιφανειακά στοιχεία ύφους, αλλά δυσκολεύεται να αναπαράγει τη βαθύτερη “στιλομετρική υπογραφή” ενός δημιουργού».
Το ζήτημα δεν είναι μόνο θεωρητικό. Η βραβευμένη με Νόμπελ Olga Tokarczuk πυροδότησε μια μεγάλη λογοτεχνική συζήτηση τον Μάιο, όταν παραδέχτηκε ότι χρησιμοποιεί μοντέλα τεχνητής νοημοσύνης για έρευνα και ανταλλαγή ιδεών κατά τη διάρκεια της συγγραφικής της διαδικασίας. Υπήρξαν αντιδράσεις και η Tokarczuk διευκρίνισε ότι τα χρησιμοποιεί αυστηρά ως εργαλείο για προκαταρκτική έρευνα, όπως ακριβώς θα συμβουλευόταν μια βιβλιοθήκη.
Τον Μάρτιο του 2026, ο εκδοτικός οίκος Hachette απέσυρε το βιβλίο «Shy Girl» της Mia Ballard σε ΗΠΑ και Βρετανία. Είναι η πρώτη φορά που μεγάλος εκδότης αποσύρει εμπορικό τίτλο λόγω υποψίας χρήσης AI.
Και προκύπτουν διάφορα ερωτήματα, σχετικά με την ποιότητα των κειμένων της τεχνητής νοημοσύνης, τη δυνατότητα που έχουμε να τα αναγνωρίζουμε και την ηθική διάσταση της μίμησης.
Παράλληλα, ανοίγει συζήτηση σχετικά με την ικανότητα ενός εκδοτικού οίκου να εντοπίζει κείμενα που έχουν γραφτεί από ΑΙ ή ενός καθηγητή να αντιλαμβάνεται πότε το έχουν χρησιμοποιήσει οι φοιτητές στις εργασίες τους.
Η παγίδα της στατιστικής
Το φαινόμενο αυτό συζητήθηκε αρκετά τον τελευταίο καιρό, καθώς χρήστες των social media εντόπισαν ανιχνευτές που θεωρούν πως κλασικά κείμενα γράφτηκαν από ΑΙ. Αρκετοί κατέληξαν στο εύλογο συμπέρασμα πως ευθύνεται η εκτενής χρήση των βιβλίων αυτών για εκπαίδευση της τεχνητής νοημοσύνης. Ωστόσο, όπως εξηγεί στο WIRED Greece ο Γιώργος Μικρός, καθηγητής Ψηφιακών Ανθρωπιστικών Επιστημών στο Hamad Bin Khalifa University του Κατάρ, δεν πρόκειται για ζήτημα ταύτισης περιεχομένου με τα δεδομένα εκπαίδευσης, αλλά για σύμπτωση στατιστικών μοτίβων.
Η κλασική λογοτεχνία του 19ου αιώνα, με το τυποποιημένο ύφος, την κανονική σύνταξη και το επίσημο λεξιλόγιο, παρουσιάζει χαμηλό perplexity και χαμηλό burstiness. Στα μάτια του αλγορίθμου, η Shelley γράφει «ασφαλή» κείμενα, ακριβώς όπως θα τα παρήγαγε ένα γλωσσικό μοντέλο.
Γιατί αποτυγχάνουν, όμως, οι ανιχνευτές; Ο κ. Μικρός αναφέρει πως τα εργαλεία αυτά απλώς μετρούν τη στατιστική «προβλεψιμότητα». Συγκεκριμένα, αξιολογούν το perplexity, δηλαδή πόσο πιθανή είναι κάθε επόμενη λέξη με βάση τις προηγούμενες, και το burstiness, την ποικιλία στο μήκος και τον ρυθμό των προτάσεων.
Η κλασική λογοτεχνία του 19ου αιώνα, με το τυποποιημένο ύφος, την κανονική σύνταξη και το επίσημο λεξιλόγιο, παρουσιάζει χαμηλό perplexity και χαμηλό burstiness. Στα μάτια του αλγορίθμου, η Shelley γράφει «ασφαλή» κείμενα, ακριβώς όπως θα τα παρήγαγε ένα γλωσσικό μοντέλο, εξηγεί.
«Οι detectors μετρούν απλώς πόσο μοιάζει στατιστικά ένα κείμενο με αυτό που θα παρήγαγε ένα μοντέλο. Αυτό τους καθιστά εγγενώς αναξιόπιστους», λέει ο κ. Μικρός, του οποίου η πρόσφατη έρευνα, Beyond the surface: stylometric analysis of GPT-4o’s capacity for literary style imitation, εξέτασε αν το GPT-4o μπορεί να μιμηθεί αξιόπιστα το ύφος της Shelley και του Hemingway.
«Στην ερευνητική βιβλιογραφία, τα ποσοστά ψευδώς θετικών αναγνωρίσεων (false positives) παραμένουν ανησυχητικά υψηλά», σημειώνει ο κ. Μικρός, αναφερόμενος σε αυτές τις εφαρμογές ανίχνευσης. «Για τον λόγο αυτό υπάρχει ευρύ consensus στην εκπαιδευτική κοινότητα για μη χρήση των εργαλείων αυτών ως μέθοδο πιστοποίησης της συγγραφικής ταυτότητας των εργασιών που εκπονούνται σε ακαδημαϊκό πλαίσιο», σημειώνει ο καθηγητής.
Πρόκληση για το ΑΙ η μίμηση της λογοτεχνίας
Τα ευρήματα της έρευνας δείχνουν ότι, ακόμα και με τη μέθοδο του in-context learning, με την οποία δίνονται παραδείγματα απευθείας μέσα στο prompt, το παραγόμενο κείμενο εξακολουθεί να παρουσιάζει σημαντική επικάλυψη με τις γενικές, τυποποιημένες εξόδους του μοντέλου. Το AI αγγίζει επιφανειακά στοιχεία ύφους, αλλά δυσκολεύεται να αναπαράγει τη βαθύτερη «στιλομετρική υπογραφή» ενός δημιουργού.
Τα κείμενα που παρήγαγε η τεχνητή νοημοσύνη χωρίς οδηγίες μίμησης είναι τα πιο αναγνωρίσιμα ως AI-generated: χαμηλότερος αριθμός λέξεων, ομοιόμορφο μήκος προτάσεων, μέτριο μήκος λέξεων.
To AI τα πήγε καλύτερα όταν προσπάθησε να μιμηθεί το πιο περιεκτικό και δομικά συνεπές ύφος του Hemingway, σύμφωνα με τη μελέτη, όμως αντιμετώπισε προκλήσεις με την αναπαραγωγή του πιο σύνθετου και πλούσιο σε περιγραφές ύφους της Shelley.
«Αυτά τα ευρήματα υποδηλώνουν ότι η αποτελεσματικότητα των μιμήσεων που δημιουργούνται από το GPT εξαρτάται σε μεγάλο βαθμό από τη στιλιστική πολυπλοκότητα και την ιδιαιτερότητα του αρχικού συγγραφέα», συμπεραίνει η έρευνα και σημειώνει πως οι ικανότητες μίμησης του ανθρώπινου λογοτεχνικού στιλ είναι πολλά υποσχόμενες, όμως παραμένουν ανεπαρκείς σε σύγκριση με το βάθος, τη συνοχή και την καινοτομία της ανθρώπινης συγγραφικής δημιουργίας.
Η ηθική διάσταση της μίμησης
Ένα άλλο ζήτημα που προκύπτει καθώς εξελίσσονται οι δυνατότητες των LLM είναι οι ηθικές επιπτώσεις της μίμησης του ύφους. Αν ένα μοντέλο μπορεί να παράγει κείμενο «στο ύφος του Hemingway» ή «στο ύφος της Shelley», πού τελειώνει η έμπνευση και πού αρχίζει η παραβίαση;
Όταν εκατομμύρια άνθρωποι χρησιμοποιούν τα ίδια εργαλεία για να παράγουν κείμενο, όλα αρχίζουν να μοιάζουν μεταξύ τους.
Το δίκαιο της πνευματικής ιδιοκτησίας προστατεύει την έκφραση, όχι το ύφος -και αυτή η διάκριση γίνεται όλο και πιο δύσκολο να διατηρηθεί όταν η μίμηση λειτουργεί σε τέτοιο επίπεδο. Για ζωντανούς συγγραφείς το ερώτημα είναι πιο επείγον: τι σημαίνει να έχεις «δική σου φωνή» όταν αυτή η φωνή μπορεί να αναπαραχθεί και να πουληθεί χωρίς τη συγκατάθεσή σου;
Και, καθώς το ΑΙ δεν χρησιμοποιείται μόνο σε ερευνητικό πλαίσιο, προκύπτει ο κίνδυνος της ομογενοποίησης του κειμένου. Όταν εκατομμύρια άνθρωποι χρησιμοποιούν τα ίδια εργαλεία για να παράγουν κείμενο, όλα αρχίζουν να μοιάζουν μεταξύ τους.
Η «φωνή», το στιλ ενός συγγραφέα, είναι από μόνη της πληροφορία και λέει κάτι για το πώς σκέφτεται αυτός που γράφει. Και κάτι χάνεται, όταν η γλώσσα γίνεται αποτέλεσμα πρόβλεψης παρά επιλογής. Εξαιρετική ειρωνεία να κατηγορείται μια μηχανή ότι έγραψε το Φρανκενστάιν, ένα βιβλίο για τη δημιουργία ζωής από κομμάτια άλλων, συνθέτοντας τμήματα άλλων κειμένων.