AI και τηλεφωνική εξαπάτηση: Η νέα αρχιτεκτονική των επιθέσεων

Το ΑΙ δεν εφηύρε την απάτη, αλλά την κλιμάκωσε ψηφιακά. Μέσω της κλωνοποίησης φωνής σε πραγματικό χρόνο, οι επιθέσεις γίνονται πιο πειστικές, στοχεύοντας πλέον στην εμπιστοσύνη τόσο οργανισμών όσο και ιδιωτών.

«Η φωνή μας και η εικόνα μας πλέον δεν αποτελούν πειστήρια για εμπέδωση της εμπιστοσύνης». φωτ: getty images/ideal image

Center Center

Ήταν μια συνηθισμένη μέρα στο IT helpdesk ενός από τα μεγαλύτερα καζίνο των ΗΠΑ, της MGM Resorts στο Λας Βέγκας. Ένας υπάλληλος σήκωσε το τηλέφωνο και άκουσε τη φωνή ενός συναδέλφου του. Ηταν γνώριμη και πειστική, και απάντησε δίνοντας τα σωστά στοιχεία και ονόματα. Ζητούσε πρόσβαση σε λογαριασμούς. Ο υπάλληλος δεν είχε κανέναν λόγο να αμφιβάλλει.

Λίγες ώρες αργότερα, οι επιτιθέμενοι είχαν διεισδύσει στις cloud υποδομές της εταιρείας. Το τελικό κόστος για την MGM Resorts ήταν περίπου 100 εκατομμύρια δολάρια.

Παλαιότερα μια απάτη απαιτούσε ημέρες προετοιμασίας, σήμερα μπορεί να οργανωθεί σε λίγα λεπτά.

Δεν ήταν χακάρισμα με την κλασική έννοια, αλλά κάτι πιο απλό και ελαφρώς πιο τρομακτικό: κάποιος μίλησε στο τηλέφωνο, και μέσω AI voice cloning, κατάφερε να πείσει τον άνθρωπο στην άλλη μεριά της γραμμής.

Με σωστή έρευνα και εργαλεία κλωνοποίησης φωνής μέσω AI, η απάτη γίνεται σήμερα πιο εύκολη από ποτέ. Δεν χρειάζεται να φανταζόμαστε καμπαρντίνες και σκοτεινές δοσοληψίες σε υπόγεια. Τα εργαλεία αυτής της τεχνολογίας είναι ευρέως διαθέσιμα στο ίντερνετ.

Η τεχνολογία γίνεται όπλο στα χέρια επιτήδειων

Οι τηλεφωνικές απάτες δεν είναι καινούριες. Η πλαστοπροσωπία, η κοινωνική μηχανική, το «παιχνίδι» με την εμπιστοσύνη και την αίσθηση του κατεπείγοντος, προϋπήρχαν πολύ πριν από την τεχνητή νοημοσύνη. Αυτό που άλλαξε είναι η κλίμακα, η ταχύτητα και η προσβασιμότητα.

«Το ΑΙ δεν εισήγαγε νέες μορφές απάτης», εξηγεί στο WIRED Greece ο Διονύσης Ξενάκης, επίκουρος καθηγητής Πληροφορικής στο ΕΚΠΑ. «Ενίσχυσε τις ήδη γνωστές τεχνικές εξαπάτησης. Εκεί που παλαιότερα μια απάτη απαιτούσε χρόνο, τεχνικές γνώσεις και χειροκίνητη προετοιμασία ημερών, σήμερα μπορεί να οργανωθεί σε λίγα λεπτά χρησιμοποιώντας εργαλεία που είναι διαθέσιμα στο Διαδίκτυο.»

Τα νούμερα είναι ανησυχητικά. Σύμφωνα με διεθνείς εκθέσεις κυβερνοασφάλειας, οι επιθέσεις με χρήση κλωνοποίησης φωνής παρουσίασαν ετήσια αύξηση κατά 450% μεταξύ 2023 και 2024. Πιο πρόσφατα, η αύξηση είναι ακόμα πιο ραγδαία. Μελέτες αναφέρουν 1600% αύξηση μεταξύ του τελευταίου τριμήνου του 2024 και του πρώτου του 2025. Σύμφωνα με έρευνα της McAfee, ένας στους τέσσερις ανθρώπους έχει πέσει θύμα τέτοιας απάτης. Ιδιαίτερα ευάλωτη σε μεθόδους εξαπάτησης με ΑΙ είναι η ηλικιακή ομάδα άνω των 60 ετών.

Πώς στήνονται οι απάτες με ΑΙ

Η διαδικασία ξεκινά πολύ πριν χτυπήσει το τηλέφωνό σου. Το πρώτο στάδιο είναι η συλλογή πληροφοριών, αυτό που στον χώρο της κυβερνοασφάλειας λέγεται OSINT (Open Source Intelligence). Κοινωνικά δίκτυα, επαγγελματικές πλατφόρμες, δημόσιες αναρτήσεις: όλα αποτελούν πηγές από τις οποίες οι επιτιθέμενοι συλλέγουν χρήσιμες πληροφορίες για τα θύματά τους.

Τα κοινωνικά δίκτυα αποτελούν ίσως τη μεγαλύτερη πηγή πληροφοριών καθότι φωτογραφίες, βίντεο, επαγγελματικές αναρτήσεις ή ακόμα και ένα σύντομο story μπορούν να αποκαλύψουν στοιχεία για την καθημερινότητα ενός ανθρώπου.

Σήμερα υπάρχουν εργαλεία που μπορούν να συλλέξουν πληροφορίες από δημόσιες πηγές σε πολύ μικρό χρονικό διάστημα, σύμφωνα με τον καθηγητή, ο οποίος φέρνει ως παράδειγμα τα Sherlock, Maltego, Spiderfoot και Recon-ng. Παράλληλα, επισημαίνει πως η τεχνητή νοημοσύνη επιταχύνει ακόμη περισσότερο αυτή τη διαδικασία «και την κλιμακώνει τόσο σε όγκο δεδομένων (και άρα αποτελεσματικότητα της επίθεσης) όσο και σε αριθμό ατόμων-στόχων».

Με αυτές τις πληροφορίες, ένα μεγάλο γλωσσικό μοντέλο μπορεί να δημιουργήσει ένα στοχευμένο σενάριο εξαπάτησης – μια τεχνική γνωστή ως pretexting. Όσο περισσότερα πραγματικά στοιχεία περιλαμβάνει, τόσο πιο δύσκολο είναι να το αμφισβητήσεις.

Τα κοινωνικά δίκτυα αποτελούν ίσως τη μεγαλύτερη πηγή τέτοιων πληροφοριών καθότι φωτογραφίες, βίντεο, επαγγελματικές αναρτήσεις ή ακόμα και ένα σύντομο story μπορούν να αποκαλύψουν στοιχεία για την καθημερινότητα ενός ανθρώπου. «Σε ορισμένες περιπτώσεις ακόμη και λίγα δευτερόλεπτα ομιλίας σε ένα βίντεο μπορεί να αποτελέσουν επαρκές υλικό για τη δημιουργία ενός ιδιαίτερα πειστικού μοντέλου φωνής», λέει ο κ. Ξενάκης.

Πώς λειτουργεί μια κλήση σε πραγματικό χρόνο

Η αρχιτεκτονική μιας σύγχρονης επίθεσης με AI είναι τεχνικά εντυπωσιακή. Στο πρώτο βήμα, η φωνή του θύματος μετατρέπεται σε κείμενο σε πραγματικό χρόνο (speech-to-text), με εργαλεία που αρχικά αναπτύχθηκαν με στόχο την προσβασιμότητα στο διαδίκτυο. Στο δεύτερο, ένα γλωσσικό μοντέλο αναλύει αυτό το κείμενο και παράγει απάντηση βασισμένη σε ένα προκαθορισμένο σενάριο εξαπάτησης. Στο τρίτο, η απάντηση μετατρέπεται σε συνθετική ομιλία, δυνητικά με τη φωνή ενός συγκεκριμένου ανθρώπου.

«Ολόκληρη αυτή η διαδικασία μπορεί να ολοκληρωθεί σχεδόν σε πραγματικό χρόνο», εξηγεί ο κ. Ξενάκης, «επιτρέποντας μια σχεδόν φυσική συνομιλία σε ροή, συναίσθημα και τόνο».

Αξίζει να σημειωθεί ότι τέτοια συστήματα υπάρχουν ήδη σε νόμιμες εφαρμογές, όπως για παράδειγμα εργαλεία εξυπηρέτησης πελατών ή ψηφιακούς βοηθούς. Η διαφορά είναι ο σκοπός για τον οποίο χρησιμοποιούνται.

Μια γλώσσα δεν αποτελεί ασπίδα

Ένα εύλογο ερώτημα είναι αν η ελληνική γλώσσα λειτουργεί ως φυσικό εμπόδιο. Η απάντηση είναι μερικώς ναι, αλλά όχι πλήρως και όχι για πολύ χρόνο.

«Η δυσκολία δεν εντοπίζεται τόσο στην αναπαραγωγή των φωνητικών χαρακτηριστικών του ομιλητή, όσο στη σωστή απόδοση του ρυθμού της ομιλίας, της προσωδίας και στον τονισμό», σχολιάζει ο κ. Ξενάκης. Οι ιδιωματισμοί, η καταγωγή, η συναισθηματική χροιά, όλα αυτά αποτελούν πρόσθετη πρόκληση.

Δημοφιλείς πλατφόρμες όμως, όπως το ElevenLabs, υποστηρίζουν ήδη ελληνικά, ενώ ερευνητικές ομάδες στην Ελλάδα εργάζονται εντατικά στην ανάπτυξη μοντέλων για την ελληνική γλώσσα και τις διαλέκτους της. «Η ελληνική γλώσσα αποτελεί μεν μια τεχνική πρόκληση αλλά σε καμία περίπτωση ανυπέρβλητο εμπόδιο», εξηγεί ο καθηγητής.

Από το ένα τηλεφώνημα στις επιθέσεις πολλών σταδίων

Αν οι παλαιότερες απάτες βασίζονταν σε μια μόνο επικοινωνία -μια κλήση, μια ιστορία, μια στιγμή αδυναμίας- η νέα γενιά επιθέσεων είναι αρκετά πιο υπομονετική. Οι λεγόμενες multi-stage attacks οικοδομούν σχέση εμπιστοσύνης με μικρές, αθώες αλληλεπιδράσεις πριν χτυπήσουν. Στοχεύουν κυρίως μεγάλους οργανισμούς, με την υπόθεση του καζίνο να αποτελεί χαρακτηριστικό παράδειγμα.

Εκεί, όπως εξηγεί ο καθηγητής, η κλωνοποίηση φωνής «μπορεί να χρησιμοποιηθεί για την ενίσχυση της αξιοπιστίας του σεναρίου, αν και σε κάθε περίπτωση το σενάριο εξαπάτησης κρίνει τελικά την αποτελεσματικότητα της επίθεσης».

Τα red flags και τα μέτρα προστασίας

Η κατανόηση της απειλής είναι το πρώτο βήμα. Ο καθηγητής ορίζει μερικά βασικά red flags στις επικοινωνίες:

Έντονη χρονική ή ψυχολογική πίεση για άμεση δράση, ιδιαίτερα όταν συνοδεύεται από συναισθηματική φόρτιση.
Αναφορά σε ονόματα ή προσωπικές καταστάσεις που φαίνεται να γνωρίζει ο συνομιλητής, με στόχο να ενισχύσει την αξιοπιστία του.
Κάθε αίτημα που επιχειρεί να παρακάμψει τυπικές διαδικασίες ενός οργανισμού πρέπει να επιβεβαιώνεται μέσω δεύτερου καναλιού επικοινωνίας.

Παράλληλα, αναφέρεται σε μέτρα που μπορούμε να πάρουμε για να μειώσουμε τον κίνδυνο, σε επιχειρήσεις αλλά και στο σπίτι.

Για τις επιχειρήσεις, η απάντηση είναι συστημική: εκπαίδευση προσωπικού και συμμόρφωση με πρωτόκολλα όπως το NIS2 Directive και το ISO/IEC 27001.

Για τις οικογένειες, συστήνει να περιοριστεί η δημοσιοποίηση προσωπικών πληροφοριών, ιδιαίτερα εικόνας ή ήχου ανηλίκων. Χρήσιμη πρακτική είναι η θέσπιση οικογενειακών «λέξεων ασφαλείας» για επείγουσες καταστάσεις.

Τα παιδιά πρέπει να γνωρίζουν ότι κανένα αίτημα που λαμβάνεται μέσω τηλεφώνου ή μηνύματος δεν πρέπει να οδηγεί σε άμεση ενέργεια χωρίς επιβεβαίωση. Η εμπιστοσύνη πρέπει να δίνεται μόνο σε αριθμούς που έχουμε ήδη αποθηκευμένους, ενώ άγνωστες κλήσεις θα πρέπει να αντιμετωπίζονται με επιφυλακτικότητα.

Για τους ηλικιωμένους, σημείο αναφοράς πρέπει να είναι η τακτική επικοινωνία με την οικογένεια (όχι στην απομόνωση), η επιβεβαίωση κάθε αιτήματος μέσω δεύτερου τηλεφώνου («κλείσε και θα σε πάρω εγώ») και η χρήση βασικών μέτρων ασφάλειας, όπως θέσπιση ορίου συναλλαγών, ισχυροί κωδικοί πρόσβασης και πιστοποίηση δύο παραγόντων σε οικονομικές συναλλαγές.

Η κοινωνία μετασχηματίζεται και οι απάτες αλλάζουν μορφή

Για τον κ. Ξενάκη, η φωνή μας και η εικόνα μας δεν πρέπει πλέον να αποτελούν πειστήρια για εμπέδωση της εμπιστοσύνης. «Οι καθημερινές μας δράσεις και αποφάσεις μας πρέπει να λαμβάνουν υπόψη ότι η κοινωνία μας μετασχηματίζεται για ακόμη μία φορά», προειδοποιεί.

«Το ΑΙ είναι ένα εργαλείο ενδυνάμωσης, αλλά παράλληλα φέρνει νέες προκλήσεις», καταλήγει ο καθηγητής, κρούοντας έναν κώδωνα μόνιμης αφύπνισης. «Απέναντι τους πρέπει να είμαστε σκεπτικοί και να εφαρμόζουμε συγκεκριμένο πλάνο ομαλής αφομοίωσης της στην καθημερινότητα του οργανισμού ή της κοινωνίας μας».

© WIRED Greece. Επιτρέπεται η αναδημοσίευση αποσπασμάτων μόνο με ενεργό σύνδεσμο προς το πρωτότυπο άρθρο και σαφή αναφορά στο WIRED Greece.
Για πλήρη αναδημοσίευση απαιτείται προηγούμενη γραπτή άδεια.

Βασίλης Τατσιόπουλος, Ως Staff Writer στο WIRED Greece, γράφει για τη διασταύρωση τεχνολογίας και κουλτούρας. Με θητεία… Περισσότερα

TOPICS ΑΠΑΤΗ ΕΞΑΠΑΤΗΣΗ VOICE CLONING

Γράψου στο newsletter μας!

Κάνε εγγραφή στο newsletter του WIRED Greece για να λαμβάνεις κάθε εβδομάδα τις ιστορίες, τις ιδέες και τις τεχνολογίες που διαμορφώνουν το αύριο.

Με την εγγραφή σας, συμφωνείτε με τους Όρους Χρήσης μας (συμπεριλαμβανομένης της παραίτησης από ομαδικές αγωγές και των διατάξεων διαιτησίας) και αναγνωρίζετε την Πολιτική Απορρήτου μας.