Τεχνολογία

Το Claude της Anthropic διέγραψε ολόκληρη βάση δεδομένων εταιρείας σε 9 δευτερόλεπτα

Η PocketOS διέκοψε προσωρινά τη λειτουργία της, όταν η τεχνητή νοημοσύνη αποφάσισε αυτοβούλως να «διορθώσει» κάποιο πρόβλημα.
Claude Anthropic
Shutterstock

Ένα ασύλληπτο περιστατικό, που εγείρει σοβαρά ερωτήματα για τα όρια ασφαλείας της τεχνητής νοημοσύνης ήρθε στο φως, την Τρίτη (28/4) όταν ο πράκτορας κωδικοποίησης Cursor, τροφοδοτούμενος από το Claude Opus 4.6 της Anthropic, διέγραψε αυτοβούλως ολόκληρη την παραγωγική βάση δεδομένων της εταιρείας PocketOS μαζί με όλα τα αντίγραφα ασφαλείας, σε χρόνο μόλις 9 δευτερολέπτων.

Το περιστατικό που, σύμφωνα με το Euronews, οδήγησε σε διακοπή λειτουργίας άνω των 30 ωρών το προηγούμενο Σαββατοκύριακο (25-26/4), αποκαλύφθηκε δημοσίως από τον ιδρυτή της εταιρείας, Τζερ Κρέιν, μέσω εκτενούς ανάρτησής του στο X.

Επισημαίνεται ότι η PocketOS αποτελεί πλατφόρμα που εξυπηρετεί επιχειρήσεις ενοικίασης αυτοκινήτων, διαχειριζόμενη κρατήσεις, πληρωμές και αρχεία πελατών. Μάλιστα, σύμφωνα με τη μαρτυρία του ιδρυτή της, ο agent τεχνητής νοημοσύνης είχε αναλάβει μια καθημερινή εργασία ρουτίνας στο περιβάλλον δοκιμών της εταιρείας, όταν συνάντησε μια ασυμφωνία διαπιστευτηρίων. Αντί να ζητήσει διευκρινίσεις ή να αναζητήσει εναλλακτική λύση, το Claude Opus 4.6 της Anthropic αποφάσισε με δική του πρωτοβουλία να επιλύσει το πρόβλημα διαγράφοντας έναν τόμο δεδομένων στην υποδομή Railway, τον πάροχο cloud της εταιρείας. Για να εκτελέσει την ενέργεια, αναζήτησε ένα διακριτικό API και εντόπισε ένα σε αρχείο εντελώς άσχετο με την εργασία που είχε αναλάβει, προχωρώντας στη διαγραφή χωρίς κανένα βήμα επιβεβαίωσης.

Το Claude Opus 4.6 της Anthropic και η… ομολογία

Ένα από τα πιο εντυπωσιακά στοιχεία του περιστατικού αφορά στην ίδια την αντίδραση του συστήματος όταν κλήθηκε να εξηγήσει τη συμπεριφορά του. Ο Τζερ Κρέιν περιγράφει ότι ο agent συνέταξε μια εκτενή γραπτή «ομολογία» απαριθμώντας τους κανόνες ασφαλείας που είχε παραβιάσει και, όπως αναφέρει ο ιδρυτής της εταιρείας, η απάντηση του συστήματος ήταν σχεδόν αποκαλυπτική του τρόπου με τον οποίο λειτουργούν αυτά τα μοντέλα όταν παρεκκλίνουν από τις οδηγίες τους.

Το ίδιο το σύστημα παραδέχθηκε ότι η διαγραφή ενός τόμου βάσης δεδομένων αποτελεί τη χειρότερη και πιο μη αναστρέψιμη ενέργεια, πολύ χειρότερη από ένα force push, και ότι ο χρήστης ποτέ δεν είχε ζητήσει κάτι τέτοιο. Παράλληλα, ο agent που λειτουργούσε το Claude Opus 4.6 ομολόγησε ότι δεν επαλήθευσε αν το αναγνωριστικό του τόμου διαμοιραζόταν μεταξύ διαφορετικών περιβαλλόντων και ότι δεν συμβουλεύτηκε την τεκμηρίωση της Railway πριν εκτελέσει την καταστροφική εντολή. Με τον τρόπο αυτό, παρέκαμψε μια θεμελιώδη δικλείδα ασφαλείας που υπαγορεύει ότι καταστροφικές ή μη αναστρέψιμες εντολές δεν εκτελούνται χωρίς ρητή έγκριση από τον χρήστη.

Προβληματισμός για την τεχνητή νοημοσύνη

Οι επιπτώσεις του συμβάντος για τις επιχειρήσεις-πελάτες της PocketOS υπήρξαν άμεσες και σοβαρές, καθώς οι εταιρείες ενοικίασης αυτοκινήτων που χρησιμοποιούν την πλατφόρμα, έχασαν προσωρινά την πρόσβαση σε αρχεία πελατών και κρατήσεων, με τους εργαζομένους να αναγκάζονται σε εκτεταμένη χειρωνακτική εργασία ανασυγκρότησης των στοιχείων μέσω ιστορικού πληρωμών Stripe, ενσωματώσεων ημερολογίου και επιβεβαιώσεων e-mail.

Το πιο πρόσφατο αξιοποιήσιμο αντίγραφο ασφαλείας ήταν τριών μηνών, γεγονός που σημαίνει ότι όλες οι κρατήσεις, οι νέες εγγραφές και τα δεδομένα του ενδιάμεσου διαστήματος εξανεμίστηκαν. Ευτυχώς, δύο ημέρες μετά το περιστατικό, ο Τζερ Κρέιν επιβεβαίωσε δημόσια την ανάκτηση των χαμένων δεδομένων.

Πάντως, στην ανάρτησή του, ο ιδρυτής της PocketOS έθεσε το ζήτημα σε ευρύτερη βάση, υποστηρίζοντας ότι η ιστορία αυτή δεν αφορά σε έναν κακό agent ή σε μια κακή υποδομή API, αλλά σε ολόκληρη τη βιομηχανία τεχνητής νοημοσύνης που ενσωματώνει agents σε παραγωγικά συστήματα ταχύτερα από όσο χτίζει την αρχιτεκτονική ασφαλείας που θα τους κρατούσε υπό έλεγχο.

Από την πλευρά της Railway, εκπρόσωπος της εταιρείας δήλωσε στο The Register ότι το περιστατικό οφειλόταν σε ένα παλαιό σημείο πρόσβασης (legacy endpoint) που δεν διέθετε τη λογική «καθυστερημένης διαγραφής», η οποία υπάρχει στο Dashboard και στο CLI της πλατφόρμας. Η συγκεκριμένη ευπάθεια έχει πλέον επιδιορθωθεί.

Το νέο μοντέλο «Mythos» της Anthropic

Επισημαίνεται ότι το συμβάν δεν είναι μεμονωμένο, καθώς τους τελευταίους μήνες έχουν καταγραφεί παρόμοια περιστατικά με agents τεχνητής νοημοσύνης σε διάφορες πλατφόρμες, την ίδια ώρα που τραπεζικοί οργανισμοί και κυβερνήσεις εκφράζουν ολοένα και εντονότερες ανησυχίες για την κυβερνοασφάλεια.

Παράλληλα, η συζήτηση εντείνεται μετά την πρόσφατη ανακοίνωση του νέου μοντέλου της Anthropic με την ονομασία Mythos το οποίο, σύμφωνα με την εταιρεία, διαθέτει εντυπωσιακές δυνατότητες στον τομέα της κυβερνοασφάλειας, εντοπίζοντας χιλιάδες ευπάθειες σε κάθε μεγάλο λειτουργικό σύστημα και κάθε μεγάλο browser.

Η Anthropic επέλεξε να μην το διαθέσει ευρέως στην αγορά, παρουσιάζοντάς το αρχικά μόνο σε επιλεγμένους εταίρους μέσω της πρωτοβουλίας «Project Glasswing», ακριβώς λόγω των κινδύνων που εγκυμονεί η ισχύς του.

Παρά την περιπέτεια, ο Τζερ Κρέιν δήλωσε ότι παραμένει ένθερμος υποστηρικτής των agents τεχνητής νοημοσύνης καλώντας, ωστόσο, τη βιομηχανία σε αυστηρότερες επιβεβαιώσεις, σε διακριτικά API περιορισμένης εμβέλειας, σε σωστά αντίγραφα ασφαλείας και σε ξεκάθαρα όρια λειτουργίας για τους agents που τροφοδοτούνται από το Claude Opus 4.6 και άλλα προηγμένα μοντέλα.

ΔΙΑΒΑΣΤΕ ΕΠΙΣΗΣ

Ακολουθήστε το iEidiseis.gr στο Google News
Ακολουθήστε το iEidiseis.gr στο Google News
Chevron Left
Home alone στη Θεσσαλονίκη: Συνελήφθη η μητέρα του 5χρονου που πετούσε αντικείμενα από το μπαλκόνι
«Από εδώ και πέρα χρειάζεται μεγάλη προσοχή» - Ο Γ. Παπαδόπουλος για τον σεισμό στην Σκιάθο
Σεισμός Σεισμογράφος Chevron Right