Πριν από περίπου δύο χρόνια, οι φοιτητικές εργασίες άρχισαν να υποβάλλονται με άψογη σύνταξη, αλάνθαστη δομή και ακριβέστατες μεταβάσεις επιχειρημάτων. Πίσω από αυτή την ξαφνική ευγλωττία δεν κρυβόταν σκληρή μελέτη, αλλά αλγοριθμική παραγωγή: η τεχνητή νοημοσύνη είχε εισβάλει στην ακαδημαϊκή ζωή όχι ως απλός ψηφιακός βοηθός, αλλά ως ένας αόρατος συγγραφέας (ghost writer).
Σήμερα, στα πανεπιστήμια, στα σχολεία, αλλά και στην καθημερινή εργασία πολλών από εμάς, η χρήση Μεγάλων Γλωσσικών Μοντέλων (LLMs) αποτελεί τη νέα κανονικότητα, όπου chatbots αναλαμβάνουν τη σύνοψη ή σύνθεση κειμένων, την έρευνα, ακόμη και τη ρύθμιση του ύφους, ώστε το κείμενο να ακούγεται «πιο ανθρώπινο» και να παρακάμπτει τα φίλτρα ανίχνευσης.
«Βρισκόμαστε μπροστά σε μια βαθύτερη, συστημική πρόκληση: τη σταδιακή μεταφορά της ίδιας της ανθρώπινης σκέψης εκτός του ανθρώπινου οργανισμού.»
Το φαινόμενο έχει ξεπεράσει το στάδιο της «αντιγραφής» ή «λογοκλοπής»· πλέον, βρισκόμαστε μπροστά σε μια βαθύτερη, συστημική πρόκληση: τη σταδιακή μεταφορά της ίδιας της ανθρώπινης σκέψης εκτός του ανθρώπινου οργανισμού. Τα LLMs μετασχηματίστηκαν ραγδαία από εργαλεία διαλόγου σε αυτό που ονομάζω ολοκληρωμένες πλατφόρμες «Γνώσης ως Υπηρεσία» (Knowledge as a Service) υποσχόμενα ότι θα μας απαλλάξουν από τη βάσανο της αναζήτησης και του λάθους, από τον πνευματικό μόχθο – που, όμως, αποτελεί τον πυρήνα της μάθησης.
Η κατάσταση αυτή είχε προβλεφθεί και στη φιλοσοφία και στη θεωρία των μέσων. Ήδη από το 1964 ο McLuhan τόνιζε ότι οι τεχνολογίες αναδιοργανώνουν τη γνωστική μας δομή ως επεκτάσεις του νευρικού συστήματος: όταν ο νους «ξεφορτώνεται» (offloads) λειτουργικό βάρος στο ψηφιακό περιβάλλον, αυτό λειτουργεί ως γνωστικός ενισχυτής, και απελευθερώνονται ανθρώπινοι νοητικοί πόροι για ανώτερη δημιουργικότητα και κριτική ανάλυση.
Αναζητώντας τα όρια μεταξύ ανθρώπινου νου και περιβάλλοντος, η θεωρία του Εκτεταμένου Νου (Extended Mind) των Clark και Chalmers (1999) υποστηρίζει ότι αν ένας αλγόριθμος εκτελεί μια λειτουργία, που, αν εκτελείτο εντός του εγκεφάλου, θα αναγνωριζόταν ως γνωστική, τότε η τεχνολογία αυτή συνιστά οργανική επέκταση της σκέψης μας∙ δηλαδή, μη βιολογικά εργαλεία αποτελούν μέρος του γνωστικού μας συστήματος. Η κρίσιμη ισορροπία, όμως, ανατρέπεται όταν το μέσο παύει να επεκτείνει απλώς τις δυνατότητες και αντιθέτως αρχίζει να τις υποκαθιστά, οδηγώντας σε μια σταδιακή εξάρτηση, όπου ο άνθρωπος χάνει πλέον την ικανότητα να εκτελέσει τη νοητική εργασία χωρίς μηχανική υποστήριξη.
Use it or lose it
Στην αλληλεπίδραση με τα σύγχρονα LLMs συμβαίνει ακριβώς αυτό: αντί να λειτουργεί ως «νοητική επέκταση», η παραγωγική ΤΝ ορίζει τη δομή, την ερμηνεία, το εννοιολογικό πλαίσιο και τον σκοπό, υποκαθιστώντας την ανώτερη εκτελεστική λειτουργία της σκέψης και υποβαθμίζοντας τον άνθρωπο από δημιουργό σε παθητικό ελεγκτή.
Για τους νέους, κυρίως τα παιδιά, οι μεταγνωστικές δεξιότητες των οποίων ακόμα αναπτύσσονται, ο κίνδυνος είναι δομικός: η άμεση ικανοποίηση που προσφέρουν τα εμπορικά chatbots τούς στερεί την εξάσκηση στη νοητική προσπάθεια ενώ παράλληλα ενεργοποιεί έναν βρόχο ντοπαμίνης, που αφήνει τον προμετωπιαίο φλοιό υπολειτουργικό, με ενδεχόμενο αποτέλεσμα οι νευρωνικές διαδρομές της κριτικής συλλογιστικής σταδιακά να ατροφούν.
Προσπαθώντας να προσεγγίσω μια λύση στο πρόβλημα της γνωστικής αδράνειας, τον Απρίλιο 2026 παρουσίασα στο συνέδριο HAICAI 2026 για τη συνεργασία ανθρώπου-μηχανής μια πρόταση (υπό δημοσίευση στα πρακτικά από το Springer Nature) που εισάγει εσκεμμένα «παιδαγωγικά εμπόδια» στη διεπαφή του χρήστη ενός μεγάλου γλωσσικού μοντέλου (ΜΓΜ) μέσω ενός Reflexive Prompting Design στην αρχιτεκτονική του. Με απλά λόγια, το σύστημα λειτουργεί ως σωκρατικός συνομιλητής και, αντί να δίνει άμεση απάντηση, ζητά από τον χρήστη να καταγράψει τις υποθέσεις, τον σκοπό και την αρχική του επιχειρηματολογία, και καθοδηγεί βήμα-βήμα την τελική παραγωγή κειμένου. Ο σχεδιασμός ενσωματώνει ένα Thought Version Control System (στα πρότυπα του GitHub), το οποίο καταγράφει με διαφάνεια τα στάδια της ανθρώπινης συλλογιστικής πορείας και τις παρεμβάσεις της μηχανής. Υπολογίζοντας την «απόσταση» ανάμεσα στην ανθρώπινη και τη μηχανική συμβολή, το σύστημα αποτυπώνει το πραγματικό γνωστικό κέρδος του χρήστη. Πόσο χρήσιμη θα ήταν μια τέτοια λύση για συστήματα ΤΝ στον τομέα της εκπαίδευσης;
Το στοίχημα της ψηφιακής κυριαρχίας

Με τις σκέψεις αυτές συνομίλησα στις αρχές Ιουνίου με τον Βασίλειο Κατσούρο, Διευθυντή Ερευνών στο Ινστιτούτο Επεξεργασίας του Λόγου (ΙΕΛ) του Ερευνητικού Κέντρου ΑΘΗΝΑ, με εξειδίκευση στην τεχνητή νοημοσύνη, τη μηχανική μάθηση και την επεξεργασία σήματος. Μιλήσαμε για την ταχεία εξέλιξη των μεγάλων γλωσσικών μοντέλων τεχνητής νοημοσύνης και τον τρόπο με τον οποίο αυτά αλλάζουν τη γνώση, την εκπαίδευση και την παραγωγή πληροφορίας.
Βασίλης Κατσούρος: Τα σημερινά μοντέλα δεν είναι απλές εφαρμογές, αλλά σύνθετες αρχιτεκτονικές πολλαπλών επιπέδων, με τεράστιο αριθμό παραμέτρων. Η ανάπτυξη και λειτουργία τους απαιτούν σημαντική υπολογιστική ισχύ, γεγονός που συνεπάγεται υψηλό ενεργειακό αποτύπωμα. Αυτό προϋποθέτει σημαντικές επενδύσεις σε προηγμένες υπολογιστικές υποδομές, γεγονός που καθιστά την πρόσβαση σε ισχυρούς υπολογιστικούς πόρους καθοριστικό παράγοντα, ιδιαίτερα για μικρότερες χώρες.
– Τι «καταλαβαίνουν» αυτά τα μοντέλα; Πώς επηρεάζουν τον τρόπο με τον οποίο σκεφτόμαστε και μαθαίνουμε;
Δεν έχουν την ανθρώπινη έννοια της κατανόησης. Παρά τη μεγάλη χρησιμότητα των εργαλείων αυτών, τονίζεται ότι δεν διαθέτουν πραγματική κατανόηση του κόσμου, αλλά λειτουργούν ως συστήματα στατιστικής παραγωγής γλώσσας∙ με απλά λόγια, εκπαιδεύονται να προβλέπουν την επόμενη πιθανή λέξη, παράγοντας κείμενα που ακούγονται απόλυτα πειστικά.
Μπορούν να παραγάγουν πολύ συνεκτικό λόγο, αλλά αυτό δεν σημαίνει ότι έχουν αντίληψη ή συνείδηση. Επιπλέον, μέσα από τη διαδικασία alignment, οι κατασκευαστές ενσωματώνουν αξίες και κανόνες συμπεριφοράς, κάτι που σημαίνει ότι κάθε μοντέλο φέρει και ένα συγκεκριμένο αξιακό πλαίσιο.
Αυτή η στατιστική ορθότητα δημιουργεί μια επικίνδυνη γνωστική ψευδαίσθηση: επειδή το παραγόμενο κείμενο είναι ευανάγνωστο, ο χρήστης βιώνει μια «ευκολία επεξεργασίας» (processing fluency) και θεωρεί λανθασμένα ότι κατέχει τη γνώση. Ωστόσο, όταν ο ίδιος χρήστης κληθεί να αναπτύξει το επιχείρημα προφορικά, χωρίς να έχει τα αποτελέσματα του chatbot στην οθόνη του, η σημασιολογική δομή συχνά αποδυναμώνεται, αποκαλύπτοντας μια επιστημολογική εξάρτηση.
«Καθώς αποτελεί το απόσταγμα της συλλογικής ανθρώπινης γνώσης, η τεχνολογία αυτή οφείλει να παραμείνει προσβάσιμη σε όλους.»
– Παρατηρούμε ότι οι χρήστες τείνουν όλο και περισσότερο να αναθέτουν διαδικασίες ανάλυσης και συλλογιστικής σε ΜΓΜ, κάτι που εγείρει ερωτήματα για το πώς διαμορφώνεται η ανθρώπινη κριτική σκέψη και η ευθύνη της τελικής απόφασης.
Εδώ βρίσκεται το πιο κρίσιμο ζήτημα. Παρατηρούμε ότι μετακυλίουμε όλο και περισσότερο γνωσιακό φορτίο στα μοντέλα. Δηλαδή, αντί να επεξεργαζόμαστε εμείς την πληροφορία, αφήνουμε το σύστημα να το κάνει για εμάς. Αυτό δημιουργεί ένα νέο δίλημμα: αποδεχόμαστε την απάντηση όπως δίνεται ή τη χρησιμοποιούμε ως αφετηρία για περαιτέρω σκέψη;
Η δεύτερη επιλογή είναι αυτή που διατηρεί τη γνωσιακή μας αυτονομία. Ιδίως στην εκπαίδευση, όπου συζητείται η πιθανότητα καθοδηγούμενης μάθησης μέσω ΤΝ, τα μοντέλα δεν πρέπει να παρέχουν απλώς απαντήσεις αλλά να υποστηρίζουν τη σκέψη των μαθητών καθώς αυτή εξελίσσεται.
– Άρα ένα «σωκρατικό μοντέλο» όπως αυτό που προτείνω θα είχε νόημα να αναπτυχθεί;
Βέβαια. Η πιο σημαντική έννοια σε αυτόν τον σχεδιασμό είναι αυτό που ονομάζετε cognitive scaffolding, δηλαδή η υποστηρικτική καθοδήγηση της σκέψης. Τα μοντέλα δεν πρέπει απλώς να δίνουν απαντήσεις, αλλά να καθοδηγούν τον μαθητή βήμα-βήμα, ώστε να αναπτύσσει ο ίδιος τη συλλογιστική του.
Στο ΑΘΗΝΑ έχουμε πειραματιστεί με παρόμοια εργαλεία για εκπαιδευτικούς και μαθητές, κυρίως σε περιβάλλοντα Γυμνασίου και Λυκείου, με θετικά αποτελέσματα. Συγκεκριμένα, το πρόγραμμα AI4EDU (Conversational AI assistant for teaching and learning), με συντονιστή το Ινστιτούτο Επεξεργασίας του Λόγου (ΙΕΛ), ξεκίνησε βασιζόμενο σε μια καινοτόμο ιδέα που είχε διαμορφωθεί πριν από την εμφάνιση των γλωσσικών μοντέλων. Η αρχική προσέγγιση στηριζόταν σε μια παλαιότερη τεχνολογία ερωταπαντήσεων (Q&A), που έτρεχε στο υλικό των εκπαιδευτικών. Ωστόσο, η μετέπειτα κυκλοφορία του ChatGPT άλλαξε τα δεδομένα, επιτρέποντας στην ομάδα μας να ενσωματώσει την προηγμένη τεχνολογία αιχμής των ΜΓΜ.
Στο πλαίσιο αυτό, αναδείχθηκαν δύο κρίσιμα ζητήματα: αφενός ο τρόπος με τον οποίο αξιοποιείται το υπάρχον εκπαιδευτικό υλικό για τη δημιουργία μιας εξατομικευμένης εμπειρίας για τους μαθητές και αφετέρου η σωστή διαμόρφωση της συμπεριφοράς του μοντέλου, ώστε να είναι κατάλληλο για εκπαιδευτική χρήση.
Στην πρώτη φάση του προγράμματος αναπτύχθηκαν μικρά ψηφιακά εργαλεία που δοκιμάστηκαν εκτός τάξης από μαθητές και εκπαιδευτικούς, με τους δεύτερους να τα χρησιμοποιούν για σύνθεση και διάθεση υλικού. Σήμερα, το εγχείρημα μεταφέρεται μέσα στη σχολική τάξη, αλλάζοντας ριζικά το σενάριο, καθώς ο εκπαιδευτικός αναλαμβάνει τον κρίσιμο ρόλο του ενορχηστρωτή της διαδικασίας. Αυτή η νέα προσέγγιση απαιτεί εξειδικευμένα εργαλεία ΤΝ που προσαρμόζονται στους διακριτούς ρόλους δασκάλων και μαθητών, υποβοηθώντας στοχευμένα τη μεταξύ τους συνεργασία.
ΜΕΛΤΕΜΙ, ΚΡΙΚΡΙ και SciNoBo: Το ελληνικό οικοσύστημα τεχνητής νοημοσύνης ως δημόσιο αγαθό
– Πώς εξελίχθηκε το τοπίο των μεγάλων γλωσσικών μοντέλων τα τελευταία χρόνια;
Ξεκινήσαμε με κλειστά μοντέλα και στη συνέχεια εμφανίστηκαν τα πρώτα ανοιχτά συστήματα, όπως το LLaMA της Meta (Large Language Model Meta AI). Από εκεί και πέρα είχαμε μια ραγδαία έκρηξη τόσο σε ανοιχτά όσο και σε κλειστά μοντέλα. Πλέον δεν μιλάμε για ένα ενιαίο μοντέλο, αλλά για ολόκληρες αρχιτεκτονικές, συχνά με πολλές εκατοντάδες δισεκατομμύρια ή και τρισεκατομμύρια παραμέτρους, ή ακόμη και για συστήματα mixture of experts (MoE), που συνδυάζουν μοντέλα των δεκάδων εκατομμυρίων παραμέτρων. Αυτή η εξέλιξη δείχνει ότι η τεχνολογία έχει περάσει σε ένα νέο επίπεδο πολυπλοκότητας.
Σε κάθε περίπτωση, είναι σημαντικό να κατανοήσουμε ότι μιλάμε για προϊόντα. Οι εταιρείες δεν αναπτύσσουν απλώς τεχνολογία, αλλά προϊόντα «γνωστικής υποστήριξης» που στοχεύουν σε μαζική χρήση. Ο απλός στόχος είναι να μπορεί οποιοσδήποτε να δώσει μια ερώτηση και να λάβει μια άμεση απάντηση. Ωστόσο, πίσω από αυτό υπάρχει μια πολύπλοκη αρχιτεκτονική, αλλά και ένα υψηλό ενεργειακό και υπολογιστικό κόστος, που δεν πρέπει να υποτιμάται.
– Υπάρχει διαφορά μεταξύ των μεγάλων εμπορικών μοντέλων και των δικών σας;
Ναι, σημαντική. Τα δικά μας μοντέλα δεν στοχεύουν να ανταγωνιστούν τα μεγάλα εμπορικά συστήματα στο επίπεδο της «υπερνοημοσύνης». Στόχος είναι να δημιουργηθούν μικρότερα, αποδοτικά μοντέλα που μπορούν να λειτουργήσουν πάνω σε συγκεκριμένες βάσεις γνώσης και να εξυπηρετήσουν μικρομεσαίες επιχειρήσεις, δημόσια διοίκηση και εκπαιδευτικά περιβάλλοντα. Η έμφαση είναι στην πρακτική εφαρμογή και στην προσαρμογή σε τοπικά δεδομένα και γλώσσες.
Υλοποιήσαμε το ΜΕΛΤΕΜΙ σε τέσσερις πυλώνες: αλγορίθμους, τεχνογνωσία, υπολογιστικούς πόρους (μέσω υποδομών νέφους της Amazon που διέθεσε το ΕΔΥΤΕ) και, κυρίως, γλωσσικά δεδομένα.
Η μακροχρόνια συλλογή δεδομένων από το Ινστιτούτο Επεξεργασίας του Λόγου (ΙΕΛ), ήδη από τη δεκαετία του ’90, υπήρξε καθοριστική, καθώς η ανάπτυξη ενός τέτοιου μοντέλου για την ελληνική γλώσσα (που δεν παρουσιάζει ομοιότητες με άλλες γλωσσικές οικογένειες και ομιλείται από μόλις 15 εκατομμύρια ανθρώπους παγκοσμίως) έπρεπε να ξεκινήσει από το μηδέν.
Το ΚΡΙΚΡΙ είναι επίσης γλωσσικό μοντέλο, ενώ το SCINoBo είναι ένα επιστημονικά καθοδηγούμενο σύστημα ΤΝ που αναλύει και ταξινομεί την παγκόσμια επιστημονική γνώση, εντοπίζοντας ερευνητικές τάσεις και ερμηνεύοντας το περιεχόμενο και τον ρόλο των επιστημονικών αναφορών. Για την εκπαίδευσή τους συγκεντρώθηκε και καθαρίστηκε ένα τεράστιο σώμα της τάξης των 30 δισεκατομμυρίων ελληνικών λέξεων, αποκλείοντας σκόπιμα τα μέσα κοινωνικής δικτύωσης. Επιλέχθηκαν ποιοτικές πηγές με ελεύθερα πνευματικά δικαιώματα, όπως διατριβές, βιβλία, σχολικά εγχειρίδια και η ελληνική νομοθεσία.
«Ο πνευματικός μόχθος αποτελεί τον πυρήνα της μάθησης.»
– Πώς εκπαιδεύονται αυτά τα μικρότερα μοντέλα;
Η εκπαίδευση του μοντέλου είναι μια διαρκής, δυναμική διαδικασία και όχι ένα μεμονωμένο γεγονός, καθώς τα συστήματα πρέπει να επικαιροποιούνται συνεχώς για να ενσωματώνουν νέες έννοιες και ανάγκες της πραγματικότητας.
Η περιορισμένη διαθεσιμότητα έτοιμων ψηφιακών δεδομένων για την ελληνική γλώσσα καθιστά ιδιαίτερα απαιτητική τη συλλογή και τον καθαρισμό τους, διαδικασίες που απαιτούν σημαντικούς υπολογιστικούς πόρους, ενώ εξίσου μεγάλη πρόκληση αποτελεί και η διαδικασία αξιολόγησης του μοντέλου. Η ερευνητική μας ομάδα αντιμετωπίζει αυτή την πρόκληση κατασκευάζοντας χιλιάδες νέα παραδείγματα ερωταπαντήσεων, ώστε μέσα από την επιλογή των βέλτιστων απαντήσεων το μοντέλο να βελτιώνεται συνεχώς και να προσφέρει τη μέγιστη δυνατή ακρίβεια.
Η ανάπτυξη αυτών των μοντέλων υπήρξε σε μεγάλο βαθμό μια διαδικασία πειραματισμού και μάθησης. Όταν ξεκινήσαμε, δεν ήταν δεδομένο ποιο θα ήταν το τελικό αποτέλεσμα. Το ΜΕΛΤΕΜΙ βασίστηκε στην πρώτη ανοιχτή έκδοση του γαλλικού Mistral και είχε 7 δις παραμέτρους. Το ΚΡΙΚΡΙ ακολούθησε ένα χρόνο μετά, με το Llama 3.1 της ΜΕΤΑ. Αναπτύσσοντας το ΜΕΛΤΕΜΙ αποκτήσαμε πολύτιμη τεχνογνωσία, η οποία αξιοποιήθηκε και επεκτάθηκε με την ανάπτυξη του ΚΡΙΚΡΙ. Στο ΚΡΙΚΡΙ δημιουργήσαμε δεδομένα συλλογισμού, και παρακολουθήσαμε πώς το μοντέλο αναπτύσσει τη συλλογιστική του ανάλυση.
– Δηλαδή, κάτι σαν μια ρουτίνα που παρακολουθεί τη συλλογιστική του μοντέλου;
Κάτι πιο απλό από ρουτίνα· ουσιαστικά ο συλλογισμός στο μοντέλο δεν είναι τίποτα άλλο παρά δεδομένα, που περιγράφουν το πώς πρέπει «να σκεφτεί». Δηλαδή, σε κάθε πρόβλημα, αντί να δώσεις <οδηγία+απάντηση>, δίνεις <οδηγία+τρόπο σκέψης+απάντηση>. Στη φάση του supervised fine tuning και του alignment του λες «αυτή η σκέψη είναι καλύτερη από την άλλη σκέψη».
Αυτό που αποκαλούμε reasoning δεν είναι κάτι μυστηριώδες· είναι ένα εκπαιδευτικό μοτίβο που διδάσκεται μέσω δεδομένων· έτσι τα μοντέλα μαθαίνουν όχι μόνο να απαντούν αλλά και «να σκέφτονται» βήμα-βήμα. Επειδή δεν είχαμε ανθρώπινους πόρους για τη συγγραφή οδηγιών, χρησιμοποιήσαμε μεγαλύτερα μοντέλα για τη δημιουργία συνθετικών δεδομένων, τα οποία χρησιμοποιήσαμε για την εκπαίδευση των μοντέλων.
Βέβαια, πάντα πρέπει να βλέπουμε τα μοντέλα τη χρονική στιγμή που κυκλοφορούν, με τον αριθμό των παραμέτρων που έχουν, το πώς έχουν εκπαιδευτεί και τις δυνατότητές τους· σήμερα πλέον θεωρούνται μικρά μοντέλα αυτά. Ωστόσο για εμάς αποτέλεσαν ένα ιδιαίτερα σημαντικό ερευνητικό και τεχνολογικό εγχείρημα.
Στόχος μας είναι να συμβάλουμε στην ενίσχυση της ψηφιακής κυριαρχίας και της τεχνολογικής αυτονομίας της χώρας στον τομέα της τεχνητής νοημοσύνης. Αυτό αφορά αφενός την υποστήριξη της ελληνικής γλώσσας, η οποία ανήκει στις γλώσσες με σχετικά περιορισμένους ψηφιακούς πόρους, και αφετέρου την ανάπτυξη εγχώριας τεχνογνωσίας και ανθρώπινου δυναμικού, ώστε να υπάρχει η δυνατότητα σχεδιασμού, εκπαίδευσης και αξιοποίησης τέτοιων συστημάτων στη χώρα μας.
– Πώς τα ελληνικά μοντέλα συνεισφέρουν στην ψηφιακή κυριαρχία της χώρας μας;
Σε αντίθεση με τα διεθνή μοντέλα (GPT, Gemini, Claude), τα οποία διαθέτουν εκατοντάδες δισεκατομμύρια παραμέτρους, εκπαιδεύονται σε τεράστιο όγκο πολυγλωσσικών δεδομένων και έχουν ισχυρές δυνατότητες γενίκευσης και συλλογισμού, τα ελληνικά μοντέλα έχουν άλλο σκοπό.
Η στρατηγική τους προτεραιότητα εστιάζει όπως είπαμε στη γλωσσική ακρίβεια, τη βελτιστοποίηση για συγκεκριμένα εγχώρια περιβάλλοντα και την ενίσχυση των εθνικών και ευρωπαϊκών υποδομών. Δεν στοχεύουν στην αντικατάσταση των παγκόσμιων κολοσσών, αλλά στη συμπλήρωσή τους μέσα από εξειδικευμένες τοπικές εφαρμογές, συμβάλλοντας παράλληλα στην ευρύτερη ευρωπαϊκή προσπάθεια για μείωση της τεχνολογικής εξάρτησης από τους μεγάλους παρόχους του εξωτερικού.
Συνολικά, το ΜΕΛΤΕΜΙ, το ΚΡΙΚΡΙ και το SciNoBo συγκροτούν ένα αυτόνομο οικοσύστημα γλωσσικών τεχνολογιών που κινείται στον άξονα της δημόσιας γνώσης και της ψηφιακής κυριαρχίας, προσαρμοσμένο πλήρως στις ανάγκες της ελληνικής πραγματικότητας. Το οικοσύστημα αυτό προσφέρει στους ακαδημαϊκούς ένα γόνιμο πεδίο για την έρευνα της επεξεργασίας φυσικής γλώσσας (NLP) και στη δημόσια διοίκηση ένα ασφαλές μέσο για την ψηφιοποίηση και οργάνωση εγγράφων.
Παράλληλα, αποτελεί πολύτιμο εργαλείο για επιχειρήσεις και προγραμματιστές, επιτρέποντάς τους να ενσωματώνουν προηγμένες εφαρμογές τεχνητής νοημοσύνης, όπως η εξυπηρέτηση πελατών και η ανάλυση κειμένων, χωρίς τις μεταφραστικές στρεβλώσεις των ξένων συστημάτων και με απόλυτη σεβασμό στο εγχώριο πολιτισμικό και κοινωνικό πλαίσιο.
Για παράδειγμα, λόγω της στοχευμένης εκπαίδευσής τους, γνωρίζουν την ελληνική γλώσσα και κουλτούρα, οπότε προσφέρουν chatbots εξυπηρέτησης και αυθεντικού περιεχομένου μάρκετινγκ, χωρίς τις στρεβλώσεις της αυτόματης μετάφρασης.
Εξασφαλίζουν έτσι στις μικρομεσαίες επιχειρήσεις επιχειρηματική αυτονομία και σταθερότητα χωρίς τους περιορισμούς των ξένων τεχνολογικών κολοσσών, ενώ λειτουργούν και ως «γνωστικοί πολλαπλασιαστές», επιτρέποντας σε μικρές ομάδες να διαχειρίζονται μεγάλο όγκο πληροφοριών με ελάχιστους πόρους, ενισχύοντας καταλυτικά την ανταγωνιστικότητα και τον ψηφιακό τους μετασχηματισμό.
Για παράδειγμα, έχουμε χρήσεις σε ηλεκτρονικά καταστήματα, τα οποία αναγνωρίζουν και απαντούν ακόμα και σε ερωτήσεις που είναι γραμμένες σε «σπασμένα ελληνικά». Στον νομικό κλάδο, το ΚΡΙΚΡΙ αναλύει μακροσκελή συμβόλαια και ΦΕΚ χωρίς τις νοηματικές στρεβλώσεις των ξένων εργαλείων, ενώ στον δημόσιο τομέα, μπορεί να αυτοματοποιήσει τη διαχείριση των αιτημάτων των πολιτών με ασφάλεια, κρατώντας τα δεδομένα εντός των εγχώριων υποδομών. Στο τοπικό μάρκετινγκ τα μοντέλα μας παράγουν διαφημιστικά κείμενα χωρίς αγγλισμούς, ενώ στην εκπαίδευση λειτουργούν ως ψηφιακοί βοηθοί που εξηγούν θέματα ελληνικής ιστορίας ή λογοτεχνίας με βάση την εγκεκριμένη ύλη και χωρίς τον κίνδυνο παραγωγής λανθασμένων πληροφοριών.
Η απάντηση της Ευρώπης στους τεχνολογικούς κολοσσούς
– Ποιος είναι ο ρόλος της Ευρώπης και της Ελλάδας στην τεχνολογική εξέλιξη της ΤΝ;
Η Ευρώπη επιδιώκει την τεχνολογική της αυτονομία στην τεχνητή νοημοσύνη, αντιμετωπίζοντας ωστόσο σημαντικό έλλειμμα ιδιωτικών επενδύσεων σε σχέση με τις ΗΠΑ και την Κίνα. Καθώς η ανάπτυξη μεγάλων μοντέλων απαιτεί τεράστιους υπολογιστικούς πόρους και κεφάλαια, η υπέρμετρη εξάρτηση από αμερικανικές υποδομές cloud και κλειστά μοντέλα απειλεί την ευρωπαϊκή ψηφιακή κυριαρχία και την ασφάλεια των δεδομένων.
Στον ιδιωτικό τομέα, η γαλλική Mistral αποτελεί τη μόνη θετική εξαίρεση, αναπτύσσοντας μοντέλα ανοιχτού κώδικα υψηλών επιδόσεων. Η ανάγκη ψηφιακής κυριαρχίας των λιγότερο ομιλούμενων γλωσσών καλύπτεται από δημόσιες επενδύσεις, με τα εθνικά μοντέλα να αναπτύσσονται κυρίως από πανεπιστήμια και ερευνητικά κέντρα. Στο πεδίο αυτό, η Ελλάδα υπήρξε πρωτοπόρος διεθνώς, κυκλοφορώντας το ΜΕΛΤΕΜΙ τον Φεβρουάριο του 2024 (μαζί με την Ιταλία και την Ιαπωνία), ακολουθώντας τη Γερμανία (που είχε βγάλει πρώτη το δικό της μοντέλο τον Οκτώβριο 2023), ενώ αντίστοιχες εθνικές προσπάθειες έχουν παρουσιάσει αργότερα και η Βουλγαρία, η Ισπανία, η Πορτογαλία και η Πολωνία.
Σήμερα, για την αντιμετώπιση των υπολογιστικών ελλειμμάτων, αναπτύσσεται μια πανευρωπαϊκή πρωτοβουλία για τη δημιουργία ενός κοινού, ανοιχτού ευρωπαϊκού μοντέλου (Open European LLM) με ενεργή συμμετοχή της Ελλάδας. Η προσπάθεια αυτή θα ενισχυθεί μέσω των εργοστασίων ΤΝ (AI Factories), τα οποία εξασφαλίζουν πλήρη διαλειτουργικότητα μεταξύ των ευρωπαϊκών υποδομών ΤΝ· έτσι, ελληνικά πανεπιστήμια, ερευνητικά κέντρα και ΜΜΕ θα αποκτήσουν πρόσβαση σε υπολογιστικές υποδομές άλλων ευρωπαϊκών χωρών, ενώ ευρωπαϊκοί φορείς θα αξιοποιούν την ελληνική υποδομή του Φάρου. Παράλληλα, μέσω περιφερειακών κόμβων επέκτασης (antennas), ο νέος ελληνικός υπερυπολογιστής Δαίδαλος πρόκειται να συνδεθεί άμεσα με Κύπρο, Σερβία, Μάλτα και Βόρεια Μακεδονία, διευρύνοντας το δίκτυο συνεργασίας και ενισχύοντας τον στρατηγικό ρόλο της χώρας στην ευρύτερη περιοχή.
Το μέλλον της τεχνητής νοημοσύνης: Δημόσιο αγαθό και κοινωνική ευθύνη
Το βασικό διακύβευμα για την επόμενη δεκαετία είναι αν η τεχνητή νοημοσύνη θα λειτουργήσει ως δημόσιο αγαθό ή ως ένα συγκεντρωμένο προϊόν λίγων εταιρειών. Ο κ. Κατσούρος υποστηρίζει ότι, καθώς αποτελεί το απόσταγμα της συλλογικής ανθρώπινης γνώσης, και έχει εκπαιδευτεί πάνω στο διαχρονικό πνευματικό κεφάλαιο εκατομμυρίων ανθρώπων, η τεχνολογία αυτή οφείλει να παραμείνει προσβάσιμη σε όλους· «όταν εθνικοί φορείς, όπως το Ινστιτούτο Επεξεργασίας του Λόγου του Ερευνητικού Κέντρου ΑΘΗΝΑ, αναπτύσσουν μοντέλα με πόρους του φορολογούμενου πολίτη, το τελικό προϊόν πρέπει να επιστρέφει στην κοινωνία».
«Η ΤΝ να γίνει ένα καθημερινό ανοιχτό εργαλείο που θα ενισχύει και δεν θα αντικαθιστά την ανθρώπινη νόηση, την κριτική σκέψη και τη δημιουργικότητά μας.»
Η διαχείριση αυτού του δημόσιου αγαθού φέρνει στο προσκήνιο άμεσες και επείγουσες προκλήσεις. Πρώτον, απαιτούνται τεράστιες δημόσιες επενδύσεις και στρατηγικές κεφαλαιακές συμμαχίες, καθώς η συντήρηση αυτών των υποδομών έντασης κεφαλαίου είναι αδύνατη χωρίς αυτές. Δεύτερον, η αντιμετώπιση του υψηλού ενεργειακού και περιβαλλοντικού κόστους απαιτεί άμεσες λύσεις. Τρίτον, είναι αναγκαία η θεσμική θωράκιση μέσω ρυθμιστικών πλαισίων όπως το AI Act, που προκρίνουν τη ρύθμιση έναντι της απορρύθμισης, εξισορροπώντας παράλληλα τις πιέσεις για τα πνευματικά δικαιώματα.
Η ιστορία αποδεικνύει ότι η πρόοδος βασίστηκε στα ανοιχτά μοντέλα∙ η συνέχισή της προϋποθέτει τη διασφάλιση της ανοιχτής γνώσης και τη βιωσιμότητα των σχετικών επενδύσεων. Το νέο όραμα για την ΤΝ μετατοπίζεται πλέον πέρα από τον παγκόσμιο ανταγωνισμό, αναδεικνύοντας μια βαθιά κοινωνική ευθύνη: η ΤΝ να γίνει ένα καθημερινό ανοιχτό εργαλείο που θα ενισχύει και δεν θα αντικαθιστά την ανθρώπινη νόηση, την κριτική σκέψη και τη δημιουργικότητά μας.
Παράρτημα
Τα ελληνικά μοντέλα: ποια είναι, πού τα βρίσκουμε και πώς τα χρησιμοποιούμε
Τα ελληνικά μεγάλα γλωσσικά μοντέλα ΜΕΛΤΕΜΙ και ΚΡΙΚΡΙ καθώς και το σύστημα SciNoBo αποτελούν μια συστηματική προσπάθεια ενίσχυσης της ελληνικής γλωσσικής τεχνολογίας και ψηφιακής κυριαρχίας. Σε αντίθεση με τα διεθνή εμπορικά συστήματα γενικής χρήσης, τα συγκεκριμένα μοντέλα σχεδιάστηκαν με έμφαση στην προσαρμογή σε χαμηλότερους πόρους, στην υποστήριξη της ελληνικής γλώσσας και στη δυνατότητα αξιοποίησης σε εκπαιδευτικά, ερευνητικά και διοικητικά περιβάλλοντα.
Το ΜΕΛΤΕΜΙ αποτελεί το πρώτο ανοιχτό μεγάλο γλωσσικό μοντέλο που εστιάζει συστηματικά στην ελληνική γλώσσα. Βασίζεται σε αρχιτεκτονικές της οικογένειας Mistral και διαθέτει 7 δισεκατομμύρια παραμέτρους. Εκπαιδεύτηκε σε εκτεταμένα ελληνικά δεδομένα και στη συνέχεια προσαρμόστηκε μέσω instruction tuning, ώστε να μπορεί να λειτουργεί και ως conversational assistant. Η βασική του λειτουργία στηρίζεται στην πρόβλεψη ακολουθίας λέξεων (tokens), όπως όλα τα σύγχρονα γλωσσικά μοντέλα, με στόχο την παραγωγή συνεκτικού και γλωσσικά φυσικού ελληνικού κειμένου. Η σημασία του εντοπίζεται κυρίως στη δημιουργία ενός ανοικτού θεμέλιου μοντέλου για την ελληνική τεχνολογία NLP (natural language processing, επεξεργασία φυσικής γλώσσας).
Το ΚΡΙΚΡΙ, που βασίζεται σε νεότερες αρχιτεκτονικές τύπου Llama της Meta, αποτελεί εξέλιξη αυτής της προσέγγισης, με 8 δισεκατομμύρια παραμέτρους και βελτιωμένα στάδια εκπαίδευσης. Εδώ δίνεται μεγαλύτερη έμφαση στη βελτίωση της ποιότητας των απαντήσεων και στη συμμόρφωση με οδηγίες χρήσης (instruction following), μέσω συνδυασμού ανθρώπινης ανατροφοδότησης και συνθετικών δεδομένων. Σε σχέση με το ΜΕΛΤΕΜΙ, το ΚΡΙΚΡΙ εμφανίζει πιο σταθερή συμπεριφορά σε σύνθετα ερωτήματα και καλύτερη προσαρμογή σε εφαρμογές που απαιτούν διαλογική αλληλεπίδραση. Η λειτουργία του παραμένει στοχαστική (probabilistic) και βασισμένη σε γλωσσικά μοτίβα, αλλά με ενισχυμένη «εκπαιδευτική» βάση που βελτιώνει τη χρηστικότητα.
Το SciNoBo, από την άλλη, δεν είναι ΜΓΜ όπως τα προηγούμενα, αλλά εντάσσεται στη λογική των επιστημονικά καθοδηγούμενων ή knowledge-grounded συστημάτων. Έχει σχεδιαστεί για να κάνει δύο πολύ συγκεκριμένες επιστημονικές εργασίες: (α) Ταξινόμηση επιστημονικών πεδίων (SciNoBo FoS), αναλύοντας αναφορές (citations), μεταδεδομένα και δίκτυα διεθνών επιστημονικών άρθρων, ώστε να τα κατατάξει αυτόματα σε μια λεπτομερή, ιεραρχική δομή επιστημονικών κλάδων (Field of Science), κάτι που βοηθά να εντοπίζονται νέες ερευνητικές τάσεις· και (β) ανάλυση αναφορών (SciNoBo Citance Analysis), εξετάζοντας σε επιστημονικά άρθρα τις αναφορές σε άλλες μελέτες, όπου το σύστημα αναλύει την πρόθεση των συγγραφέων (π.χ. αν συγκρίνουν τη δουλειά τους ή αν επαναχρησιμοποιούν μια μέθοδο), την πολικότητα (αν συμφωνούν ή διαφωνούν με το προηγούμενο έργο) και τα σημασιολογικά στοιχεία.
Σε αντίθεση με τα γενικά γλωσσικά μοντέλα, το SciNoBo δεν βασίζεται αποκλειστικά σε ανοιχτού τύπου γλωσσική πρόβλεψη, αλλά συνδυάζει την παραγωγή κειμένου με ανάκτηση και αξιοποίηση δομημένης επιστημονικής γνώσης. Η αρχιτεκτονική του βασίζεται σε υβριδικά σχήματα retrieval και generation, με στόχο τη μείωση των λανθασμένων ή μη τεκμηριωμένων απαντήσεων και την ενίσχυση της επιστημονικής ακρίβειας. Με αυτόν τον τρόπο λειτουργεί περισσότερο ως ένα εργαλείο επιστημονικής ευφυΐας και εξόρυξης γνώσης (scholarly communication & bibliometric tool) που υποστηρίζει την ανοιχτή επιστήμη παρά ως γενικό chatbot.
Καθώς πρόκειται για μοντέλα ανοιχτού κώδικα (open-source), η κύρια δεξαμενή φιλοξενίας τους είναι η παγκόσμια πλατφόρμα του Hugging Face. Σε αντίθεση με εμπορικές εφαρμογές όπως το ChatGPT, τα μοντέλα αυτά δεν διαθέτουν μια μόνιμη, απλή σελίδα chat για το ευρύ κοινό, αλλά η αξιοποίησή τους γίνεται κατά βάση μέσω προγραμματισμού ή εξειδικευμένων υποδομών. Συγκεκριμένα, το ΜΕΛΤΕΜΙ και το ΚΡΙΚΡΙ είναι διαθέσιμα στο huggingface.co και οι προγραμματιστές μπορούν να το κατεβάσουν και είτε να το τρέξουν τοπικά ή να το εγκαταστήσουν στη δική τους cloud υποδομή μέσω της βιβλιοθήκης transformers της Python, ενώ οι απλοί χρήστες μπορούν να δοκιμάσουν το ΚΡΙΚΡΙ στη διεύθυνση chat.ilsp.gr. Το SciNoBo είναι κι αυτό προσβάσιμο μέσω του scinobo-assistant.ilsp.gr, και απευθύνεται κυρίως στον ερευνητικό και ακαδημαϊκό τομέα.