Δεκάδες εκατομμύρια άνθρωποι αναζητούν καθημερινά απαντήσεις στη Google. Όλο και συχνότερα, τις βρίσκουν διατυπωμένες στην κορυφή της σελίδας, μέσα από τα AI Overviews: σύντομες περιλήψεις που παράγονται από το Gemini και συνοδεύονται από links που υποτίθεται ότι τεκμηριώνουν όσα διαβάζει ο χρήστης.
Ελάχιστοι, όμως, γνωρίζουν ότι σε πάνω από τις μισές περιπτώσεις, αυτές οι πηγές δεν στηρίζουν ουσιαστικά τους ίδιους τους ισχυρισμούς που εμφανίζονται στην απάντηση.
Αυτό ήταν το ανησυχητικό συμπέρασμα πρόσφατης έρευνας των New York Times, η οποία βασίστηκε σε ανάλυση της Oumi, μιας startup τεχνητής νοημοσύνης με Έλληνα ιδρυτή και CEO. Σύμφωνα με τα ευρήματα, τα AI Overviews της Google έγιναν μεν πιο ακριβή μετά τη μετάβαση από το Gemini 2 στο Gemini 3, όμως οι σωστές απαντήσεις ήταν συχνότερα «ungrounded»: οι πηγές που παρέθετε η Google δεν τεκμηρίωναν πλήρως τις πληροφορίες που εμφάνιζε.
Η βασική φιλοσοφία της Oumi είναι η χρήση της τεχνητής νοημοσύνης για την καλύτερη αυτοματοποίηση της ίδιας της διαδικασίας του AI engineering — με στόχο πιο ακριβή, πιο οικονομικά και πιο προσαρμοσμένα μοντέλα για κάθε οργανισμό.
Με απλά λόγια, η απάντηση μπορεί να ήταν σωστή, αλλά ο δρόμος προς την επαλήθευσή της αρκετά θολός.
Πίσω από την Oumi, την εταιρεία που παρείχε τα εργαλεία για αυτή την ανάλυση, βρίσκεται ο Μάνος Κουκουμίδης, ένας πολυμήχανος μηχανικός τεχνητής νοημοσύνης που έχει βρεθεί εδώ και αρκετά χρόνια στην καρδιά της μηχανικής για AI. Πριν ιδρύσει την εταιρεία του, εργάστηκε στη Google στα πρώτα βήματα της προσπάθειας να μετατραπούν τα μεγάλα text-to-text γλωσσικά μοντέλα της εταιρείας σε εμπορικό προϊόν, λίγο πριν το ChatGPT αλλάξει ριζικά το τοπίο. Όπως λέει στο WIRED Greece, συμμετείχε στο αρχικό v-team για το PaLM 2, το μοντέλο που προηγήθηκε του Gemini, προτού η σχετική προσπάθεια επεκταθεί ραγδαία και μεταφερθεί αργότερα στη DeepMind.
Σήμερα, όμως, ο Κουκουμίδης ποντάρει σε μια σχεδόν αντίθετη υπόθεση για το μέλλον της τεχνητής νοημοσύνης. Αν η πρώτη φάση της AI έκρηξης έστρεψε τις εταιρείες στα μεγάλα, κλειστά μοντέλα γενικής χρήσης, η Oumi χτίζεται πάνω στην ιδέα ότι το μέλλον δεν θα ανήκει απαραίτητα στο μεγαλύτερο μοντέλο, αλλά —μακριά από την εξάρτηση σε αυτά— στο πιο κατάλληλο και εξειδικευμένο μοντέλο για τη σωστή δουλειά.
«Οι εταιρείες περνούν ήδη από γενικευμένο AI που νοικιάζουν, στην εξειδικευμένη νοημοσύνη που τους ανήκει», εξηγεί στο WIRED Greece. Αυτή είναι η βασική φιλοσοφία της Oumi: η χρήση της τεχνητής νοημοσύνης για την καλύτερη αυτοματοποίηση της ίδιας της διαδικασίας του AI engineering — με στόχο πιο ακριβή, πιο οικονομικά και πιο προσαρμοσμένα μοντέλα για κάθε οργανισμό.
Ο ιδρυτής της Oumi μίλησε στο WIRED Greece για αυτή τη μετάβαση, για τη διαδικασία που ανέδειξε τα τυφλά σημεία του Gemini στα AI Overviews της Google, και για τον λόγο που πιστεύει ότι η πραγματική επανάσταση της τεχνητής νοημοσύνης ίσως εξελίσσεται μακριά από τα μεγαλύτερα μοντέλα γενικής χρήσης.
Από το νοικιασμένο AI στα μοντέλα που σου ανήκουν
«Δημιουργήστε και αναπτύξτε το καλύτερο εξειδικευμένο μοντέλο για την εργασία σας. Ελέγξτε το πλήρως».
Αυτή είναι η υπόσχεση της Oumi, η οποία δημιουργεί ουσιαστικά AI για τη δημιουργία του ίδιου του AI, βοηθώντας τους πελάτες της μέσω prompting σε φυσική γλώσσα να κατασκευάσουν τα δικά τους μοντέλα, πιο φθηνά και με μεγαλύτερο έλεγχο και ακρίβεια.
Για τον Κουκουμίδη, η μετατόπιση αυτή σε εξατομικευμένα μοντέλα πριν από δύο χρόνια ήταν αρκετά μειοψηφική άποψη. Τα closed, generic APIs της OpenAI, της Google ή άλλων μεγάλων παρόχων προσέφεραν ταχύτητα και εύκολη πρόσβαση. «Οι μεγάλοι επενδυτές μας έλεγαν, έχετε φανταστική ομάδα, αλλά η OpenAI θα κυριαρχήσει. Οπότε χτίστε μια εφαρμογή πάνω στο ChatGPT και θα τη χρηματοδοτήσουμε».
Για τον Κουκουμίδη, όμως, τα μεγάλα και γενικά μοντέλα είχαν και ένα δομικό όριο: ήταν, όπως εξηγεί, μοντέλα «built for everything, optimized for nothing». Ουσιαστικά, ήταν AI χτισμένο για να κάνει πολλά πράγματα, αλλά όχι απαραίτητα βελτιστοποιημένο για το συγκεκριμένο πρόβλημα μιας εταιρείας, ενός οργανισμού ή μιας βιομηχανίας.
Όπως μπορεί κανείς να ζητήσει από ένα AI coding assistant να χτίσει ένα application, έτσι η Oumi θέλει να επιτρέπει σε κάποιον να περιγράψει, σε φυσική γλώσσα, τι ακριβώς μοντέλο χρειάζεται.
«Άμα έχεις κάτι που δεν είναι optimized για το use case σου, για τη δική σου χρήση, χάνεις πολύ σε ποιότητα», υποστηρίζει. Αντίθετα, ισχυρίζεται πως ένα μοντέλο που προσαρμόζεται σε συγκεκριμένο πεδίο, με τα δεδομένα και τον τρόπο λειτουργίας μιας εταιρείας, μπορεί να φτάσει ή και να ξεπεράσει την απόδοση μεγαλύτερων μοντέλων γενικής χρήσης, και μάλιστα με πολύ μικρότερο κόστος.
«Μιλάμε για 10 φορές μικρότερο κόστος, και αυτό δεν είναι νούμερα δικά μου», συμπληρώνει. «Πρόσφατα η Curson έκανε δικό της μοντέλο για τις χρήσεις της που είναι καλύτερο από το ChatGPT και το Claude, με δέκα φορές μικρότερο κόστος».
Το επιχείρημα υπέρ των προσαρμοσμένων μοντέλων της Oumi δεν αφορά μονάχα τεχνικές λεπτομέρειες, αλλά είναι και επιχειρησιακό. Για βιομηχανίες που έχουν έντονη ρύθμιση, όπως οι τράπεζες, η υγεία ή η δημόσια διοίκηση, το να μη στέλνεις ευαίσθητα δεδομένα σε ένα εξωτερικό API είναι σοβαρό ζήτημα ασφάλειας και ιδιωτικότητας. Για εταιρείες που αρχίζουν να χτίζουν κρίσιμες λειτουργίες πάνω στο AI, είναι και ζήτημα ελέγχου.
«Αν κάτι είναι τόσο απαραίτητο για τη δική σου επιτυχία και λειτουργία, δεν μπορείς να εξαρτάσαι από το roadmap ή τις αποφάσεις ενός παρόχου», λέει ο Κουκουμίδης. «Πρέπει να πάρεις τον έλεγχο του πεπρωμένου της εταιρείας σου».
Εδώ ακριβώς μπαίνει η Oumi. Η εταιρεία δεν παρουσιάζεται απλώς ως ακόμη ένας πάροχος μοντέλων. Ο Κουκουμίδης τη βλέπει περισσότερο ως ένα σύστημα που καθοδηγεί οργανισμούς στο να χτίσουν, να αξιολογήσουν, να βελτιώσουν και τελικά να διαθέσουν στην παραγωγή τα δικά τους εξειδικευμένα AI μοντέλα. Η Oumi είναι ανοιχτή σε διαφορετικές οικογένειες μοντέλων και δεν κλειδώνει τον χρήστη σε ένα συγκεκριμένο οικοσύστημα.
Το πιο ενδιαφέρον, όμως, είναι ο τρόπος με τον οποίο θέλει να αυτοματοποιήσει την ίδια τη διαδικασία του AI development. Ο Κουκουμίδης το παρομοιάζει με αυτό που έκαναν εργαλεία όπως το Cursor ή το Claude Code για το software development. Όπως μπορεί κανείς να ζητήσει από ένα AI coding assistant να χτίσει ένα application, έτσι η Oumi θέλει να επιτρέπει σε κάποιον να περιγράψει, σε φυσική γλώσσα, τι ακριβώς μοντέλο χρειάζεται.
«Φαντάσου έναν δημοσιογράφο που θέλει ένα μοντέλο που να μετατρέπει σύντομες σημειώσεις σε πιο εκτεταμένες, δομημένες σημειώσεις, χωρίς να στέλνει το υλικό του σε εξωτερικό provider όπως η OpenAI, γιατί δεν θέλει να μοιραστεί το ρεπορτάζ του», λέει. «Στην Oumi θα μπορεί να περιγράψει αυτό το ζητούμενο σε φυσική γλώσσα». Από εκεί και πέρα, τα εργαλεία της εταιρείας θα καθοδηγήσουν τον χρήστη σε όλα τα βήματα δημιουργίας ενός AI μοντέλου. Το σύστημα θα προτείνει τα κατάλληλα metrics, θα δημιουργήσει test sets αν δεν υπάρχουν, θα αξιολογήσει ποιο μοντέλο και ποιο μέγεθος ταιριάζει καλύτερα στο task, θα μετρήσει το baseline, θα εντοπίσει failure patterns, θα δημιουργήσει training data, θα εκπαιδεύσει το μοντέλο, θα το ξαναξιολογήσει και τελικά θα προτείνει είτε νέο iteration είτε deployment.
«Ουσιαστικά κάνει όλο το loop του AI scientist αυτόματα», λέει. «Αυτό που πριν έπαιρνε κάποτε μήνες, από μηχανικούς τεχνητής νοημοσύνης οι οποίοι πληρώνονται τρελά λεφτά, μπορεί, σαν ανθρώπινη προσπάθεια, να πάρει μόλις μερικά λεπτά».
Αυτό δεν σημαίνει ότι το σύστημα εξαφανίζει τον άνθρωπο από τη διαδικασία. Αντίθετα, ο Κουκουμίδης επιμένει ότι είναι αυτοματοποιημένο αλλά και διαφανές. Ο χρήστης μπορεί να δει τα βήματα, να αλλάξει τις παραμέτρους, να προσθέσει νέα κριτήρια αξιολόγησης, να δώσει feedback σε φυσική γλώσσα. «Σου δίνει όλες τις συνταγές», εξηγεί, περιγράφοντάς το όχι μόνο ως εργαλείο που επιτρέπει σε μη ειδικούς να κάνουν περισσότερα, αλλά και ως μια πλατφόρμα που «turbocharge» τους πιο έμπειρους μηχανικούς.
Υπάρχει και μια ειρωνία στην εξέλιξη του AI, σύμφωνα με τις παρατηρήσεις του Κουκουμίδη. Η τεχνητή νοημοσύνη ξεκίνησε να αυτοματοποιεί το software development, το marketing, το HR και την κυβερνοασφάλεια. Αλλά το ίδιο το AI engineering έμενε σε μεγάλο βαθμό χειροποίητο. «Δεν ξέρω αν το κάναμε από έλλειψη φαντασίας ή από προστασία και αυτοσυντήρηση», λέει γελώντας. «Κοιτάγαμε παντού για εφαρμογές, εκτός από το δικό μας πεδίο της μηχανικής AI. Αυτό ήρθαμε να αλλάξουμε».
Τα λάθη του Gemini και το Halloumi
Τα εργαλεία της εταιρείας μπορούν να χρησιμοποιηθούν τόσο για τη δημιουργία μοντέλων τεχνητής νοημοσύνης όσο και για τη διάγνωση προβλημάτων και τη βελτιστοποίησή τους. Κάπως έτσι προέκυψε και η συνεργασία με τους New York Times, που ενδιαφέρθηκαν να μελετήσουν την εγκυρότητα των πηγών στις περιλήψεις του Gemini, ανιχνεύοντας «τρύπες» μέσα από το… Halloumi.
Το Halloumi, το εργαλείο που χρησιμοποιήθηκε στην έρευνα, δανείζεται το όνομά του από το hallucination και το Oumi — και, όπως λέει ο Κουκουμίδης, δεν ήταν δική του ιδέα. «Την πρότεινε Αμερικανός, και εγώ μάλιστα είχα και μερικούς δισταγμούς. Αλλά άρεσε σε πολλούς Αμερικανούς, οπότε είπα εντάξει, άμα τραβάει, ας το πούμε Halloumi».
Ένα μοντέλο μπορεί να δώσει μια απάντηση που τυχαίνει να είναι ακριβής, αλλά να τη συνοδεύσει με links που δεν αποδεικνύουν όσα λέει. Για τον χρήστη, το αποτέλεσμα μοιάζει τεκμηριωμένο, παρότι μπορεί να είναι αρκετά παραπλανητικό.
Το εργαλείο δεν εξετάζει απλώς αν μια AI απάντηση είναι σωστή ή λάθος, αλλά και αν οι ισχυρισμοί της απάντησης στηρίζονται πράγματι στις πηγές που παρατίθενται. Αυτό είναι το κρίσιμο σημείο του: ένα μοντέλο μπορεί να δώσει μια απάντηση που τυχαίνει να είναι ακριβής, αλλά να τη συνοδεύσει με links που δεν αποδεικνύουν όσα λέει. Για τον χρήστη, το αποτέλεσμα μοιάζει τεκμηριωμένο, παρότι μπορεί να είναι αρκετά παραπλανητικό.
Όπως και έγινε. Στην έρευνα των New York Times, η Oumi ανέλυσε 4.326 Google searches με βάση το SimpleQA, ένα benchmark που χρησιμοποιείται για να μετρηθεί η ακρίβεια AI συστημάτων. Με το Gemini 2, τα AI Overviews ήταν ακριβή στο 85% των περιπτώσεων. Με το Gemini 3, το ποσοστό ανέβηκε στο 91%. Όμως οι σωστές απαντήσεις που ήταν ungrounded αυξήθηκαν από 37% σε 56%.
Με απλά λόγια: η απάντηση στην κορυφή έγινε λίγο πιο σωστή, αλλά οι πηγές από κάτω έγιναν συχνότερα ανεπαρκείς ως τεκμηρίωση.
Για τον Κουκουμίδη, αυτό είναι ίσως πιο ύπουλο από ένα προφανές λάθος. «Όταν το αποτέλεσμα της Google σου λέει “να το statement, να και η πηγή”, ποιος θα κάτσει να διαβάσει ολόκληρες σελίδες για να δει αν πράγματι το statement προκύπτει;» λέει. «Και άμα δεν το δει, θα πει: μάλλον μου ξέφυγε».
Το πρόβλημα γίνεται μεγαλύτερο επειδή δεν συμβαίνει σε ένα chatbot που ο χρήστης αντιμετωπίζει με επιφυλακτικότητα, αλλά στην ίδια τη Google, στο πιο γνώριμο και έμπιστο interface της αναζήτησης. «Παλιά, όταν η Google σου έδινε μια απάντηση, ήταν σε μεγάλο βαθμό με βάση το Knowledge Graph, που ήταν curated από ανθρώπους», λέει. «Τώρα, αν αρχίσει να σου πετάει AI hallucinations, οι χρήστες μάλλον δεν έχουν συνειδητοποιήσει τι γίνεται».
Ο ίδιος, πάντως, αποφεύγει να παρουσιάσει την έρευνα ως επίθεση στη Google. «Είναι λίγο άβολο, γιατί δεν έφυγα από τη Google με κακούς όρους. Την εκτιμώ πάρα πολύ σαν εταιρεία», λέει. Θυμάται ότι έριξε «πολύ ιδρώτα και αίμα» στην προσπάθεια του PaLM 2 και εξακολουθεί να θεωρεί ότι η Google έχει τεράστια πλεονεκτήματα: talent, capital, GPUs, hardware, υποδομή.
«Από την άλλη, η έρευνα που έκανε το New York Times ήταν άξια να βγει προς τα έξω. Γιατί όσοι χρησιμοποιούν τη Google καθημερινά πρέπει να ξέρουν καλύτερα τι σημαίνει».
Μοντέλα ανοιχτά, επαληθεύσιμα, προσαρμοσμένα
Για τον άνθρωπο πίσω από την Oumi, η επόμενη φάση του AI δεν θα αφορά μόνο το αν τα μοντέλα γίνονται πιο ισχυρά, αλλά και πιο ελέγξιμα, πιο επαληθεύσιμα και πιο προσαρμοσμένα στα πραγματικά προβλήματα που καλούνται να λύσουν.
«Δεν είναι φιλοσοφικό το θέμα», λέει ο Κουκουμίδης. «Είναι πρακτικό. Όταν μια τεχνολογία γίνεται κρίσιμη για τη λειτουργία μιας εταιρείας, η εταιρεία θέλει καλύτερη ποιότητα, χαμηλότερο κόστος, δυνατότητα προσαρμογής και πλήρη έλεγχο».
Το παράδειγμα που χρησιμοποιεί για τη μετάβαση προς πιο ανοιχτές αρχιτεκτονικές είναι το Unix και το Linux. Οι εταιρείες ξεκίνησαν από το κλειστό προϊόν που ήταν πρώτο, ώριμο και εύκολο. Όμως, όταν οι υποδομές έγιναν κρίσιμες, το ανοιχτό οικοσύστημα κέρδισε. «Το internet, τα περισσότερα cloud services, τα περισσότερα συστήματα στηρίζονται στο Linux και όχι στο Unix», λέει.
Δεν πιστεύει, ωστόσο, ότι η OpenAI ή η Anthropic θα εξαφανιστούν. Για πολλούς χρήστες, ένα γενικό εργαλείο όπως το ChatGPT παραμένει ιδανικό. «Αν θέλεις κάτι που να κάνει λίγο απ’ όλα, χρειάζεσαι ένα γενικό μοντέλο», αναφέρει. Ωστόσο, στον enterprise κόσμο, πιστεύει ότι περισσότεροι οργανισμοί θα κινηθούν σε πιο ανοιχτές, πιο ευέλικτες και πιο εξειδικευμένες λύσεις.
Ίσως η επόμενη μεγάλη μάχη της τεχνητής νοημοσύνης να μην κριθεί μόνο από το ποιος έχει το μεγαλύτερο μοντέλο, αλλά από το ποιος μπορεί να χτίσει το πιο χρήσιμο, το πιο ελέγξιμο και το πιο αξιόπιστο σύστημα για μια συγκεκριμένη δουλειά — ειδικά σε μια εποχή όπου η πειστικότητα, ακόμα και στα πιο γνωστά μοντέλα, δεν ταυτίζεται πάντα με την αξιοπιστία.