Claude Mythos: Το «αόρατο» AI μοντέλο που τρομάζει τις τράπεζες και η απάντηση της Anthropic με το Opus 4.7

Σοβαρές ανησυχίες για το νέο πανίσχυρο μοντέλο τεχνητής νοημοσύνης Claude Mythos της Anthropic,  εξέφρασαν υπουργοί Οικονομικών,  κεντρικοί τραπεζίτες και κορυφαίοι χρηματοοικονομικοί παράγοντες, καθώς εντείνονται οι φόβοι ότι θα μπορούσε να υπονομεύσει την ασφάλεια των παγκόσμιων χρηματοπιστωτικών συστημάτων.

Η ανάπτυξη του AI μοντέλου Claude Mythos από την Anthropic οδήγησε σε έκτακτες συσκέψεις, καθώς εντοπίστηκαν τρωτά σημεία σε πολλά γνωστά λειτουργικά συστήματα που χρησιμοποιούμε.

Mythos: Πόσο επικίνδυνο είναι

Οι ειδικοί αναφέρουν ότι το Mythos διαθέτει μια άνευ προηγουμένου ικανότητα να εντοπίζει και να εκμεταλλεύεται αδυναμίες στον κυβερνοχώρο –  αν και ορισμένοι επισημαίνουν ότι απαιτούνται περαιτέρω δοκιμές για την πλήρη κατανόηση των δυνατοτήτων του.

Ο Καναδός υπουργός Οικονομικών, François-Philippe Champagne, δήλωσε στο BBC ότι το ζήτημα του Mythos συζητήθηκε εκτενώς στη σύνοδο του Διεθνούς Νομισματικού Ταμείου στην Ουάσινγκτον αυτή την εβδομάδα.

«Σίγουρα είναι αρκετά σοβαρό ώστε να δικαιολογεί την προσοχή όλων των υπουργών Οικονομικών», δήλωσε ο Champagne. Συγκρίνοντας την απειλή με γεωπολιτικούς κινδύνους, πρόσθεσε:  «Η διαφορά είναι ότι για τα Στενά του Ορμούζ, ξέρουμε πού βρίσκονται και πόσο μεγάλα είναι… το πρόβλημα που αντιμετωπίζουμε με την Anthropic είναι ότι πρόκειται για το “άγνωστο”. Αυτό απαιτεί μεγάλη προσοχή, ώστε να θεσπίσουμε δικλείδες ασφαλείας και διαδικασίες που θα διασφαλίσουν την ανθεκτικότητα των χρηματοπιστωτικών μας συστημάτων.»

Οι ανησυχίες για το Mythos υπερβαίνουν κάθε προηγούμενο μοντέλο Τεχνητής Νοημοσύνης, ωστόσο ορισμένοι ειδικοί σε θέματα κυβερνοασφάλειας αμφισβητούν το πόσο δικαιολογημένες είναι, δεδομένου ειδικά ότι το μοντέλο δεν έχει δοκιμαστεί από την ευρύτερη βιομηχανία ώστε να διαπιστωθεί πόσο ικανό είναι στην πραγματικότητα.

Το Ινστιτούτο Ασφάλειας AI του Ηνωμένου Βασιλείου απέκτησε πρόσβαση σε μια δοκιμαστική έκδοση αυτού και δημοσίευσε τη μοναδική ανεξάρτητη έκθεση σχετικά με τις δεξιότητες του μοντέλου στην κυβερνοασφάλεια.  Οι ερευνητές του σημείωσαν ότι πρόκειται για ένα ισχυρό εργαλείο ικανό να εντοπίσει πολλά κενά ασφαλείας σε μη προστατευμένα περιβάλλοντα, αλλά υπέδειξαν ότι το Mythos δεν ήταν δραματικά καλύτερο από τον προκάτοχο του Claude, το Opus 4.

«Οι δοκιμές μας δείχνουν ότι το Mythos Preview μπορεί να εκμεταλλευτεί συστήματα με ασθενή θωράκιση ασφαλείας, και είναι πιθανό να αναπτυχθούν περισσότερα μοντέλα με αυτές τις δυνατότητες», ανέφεραν οι συντάκτες της έκθεσης.

«Κατανόηση των τρωτών σημείων»

Κορυφαίοι τραπεζίτες πρόκειται να λάβουν πρόσβαση στο μοντέλο εκ των προτέρων για να δοκιμάσουν τα συστήματά τους.  Ο διευθύνων σύμβουλος της Barclays, CS Venkatakrishnan, δήλωσε στο BBC: «Είναι αρκετά σοβαρό ώστε οι άνθρωποι να πρέπει να ανησυχούν. Πρέπει να το κατανοήσουμε καλύτερα, και πρέπει να κατανοήσουμε τα τρωτά σημεία που αποκαλύπτονται και να τα διορθώσουμε γρήγορα».

Πρόσθεσε ότι «έτσι θα είναι ο νέος κόσμος» – αναφερόμενος σε ένα πολύ πιο διασυνδεδεμένο χρηματοπιστωτικό σύστημα, με ευκαιρίες αλλά και τρωτά σημεία.  Παρότι η εταιρεία ανάπτυξης Anthropic δήλωσε ότι το μοντέλο έχει ήδη εκθέσει πολλαπλά τρωτά σημεία ασφαλείας σε ορισμένα κρίσιμα λειτουργικά συστήματα, χρηματοπιστωτικά συστήματα και προγράμματα περιήγησης, προσφέρεται σε κυβερνήσεις και τράπεζες πρόσβαση πριν από τη δημόσια κυκλοφορία του (σ.σ. «Project Glasswing»), προκειμένου να βοηθηθούν στην προστασία των δικών τους συστημάτων.

Ο διοικητής της Τράπεζας της Αγγλίας, Andrew Bailey, δήλωσε στο BBC ότι η εξέλιξη αυτή πρέπει να ληφθεί πολύ σοβαρά υπόψη: «Πρέπει να εξετάσουμε πολύ προσεκτικά τώρα τι θα μπορούσε να σημαίνει αυτή η τελευταία εξέλιξη της AI για τον κίνδυνο του κυβερνοεγκλήματος. Η συνέπεια θα μπορούσε να είναι η ανάπτυξη μιας AI, ενός μοντέλου, που καθιστά ευκολότερο τον εντοπισμό υπαρχόντων τρωτών σημείων σε βασικά συστήματα πληροφορικής, και στη συνέχεια προφανώς οι κυβερνοεγκληματίες -οι κακόβουλοι δρώντες- θα μπορούσαν να επιδιώξουν να τα εκμεταλλευτούν».

Το Υπουργείο Οικονομικών των ΗΠΑ επιβεβαίωσε ότι έθεσε το ζήτημα στις μεγάλες τράπεζές του, ενθαρρύνοντάς τις να δοκιμάσουν τα συστήματά τους πριν από οποιαδήποτε δημόσια κυκλοφορία του Mythos από την Anthropic.

Πηγές του χρηματοπιστωτικού κλάδου ανέφεραν ότι μια άλλη γνωστή αμερικανική εταιρεία τεχνητής νοημοσύνης θα μπορούσε σύντομα να κυκλοφορήσει ένα παρομοίως ισχυρό μοντέλο, αλλά χωρίς τις ίδιες δικλείδες ασφαλείας.

Επενδύσεις στην «αμυντική» Τεχνητή Νοημοσύνη

Ο James Wise, εταίρος στην Balderton Capital, είναι πρόεδρος της μονάδας Sovereign AI, ενός ταμείου επιχειρηματικών συμμετοχών που θα επενδύσει σε βρετανικές εταιρείες τεχνητής νοημοσύνης, υποστηριζόμενο από κυβερνητική χρηματοδότηση ύψους 500 εκατομμυρίων λιρών.

Ανέφερε ότι το Mythos είναι «το πρώτο από τα πολλά ακόμη ισχυρότερα μοντέλα που θα ακολουθήσουν», τα οποία μπορούν να εκθέσουν τα τρωτά σημεία των συστημάτων.

Η μονάδα του «επενδύει σε βρετανικές εταιρείες τεχνητής νοημοσύνης που αντιμετωπίζουν αυτό ακριβώς το ζήτημα – εταιρείες που εργάζονται πάνω στην ασφάλεια και την προστασία της AI», δήλωσε στην εκπομπή Today του BBC.  «Ελπίζουμε ότι τα μοντέλα που εντοπίζουν τα τρωτά σημεία θα είναι επίσης τα ίδια μοντέλα που θα τα διορθώνουν», τόνισε.

Άνοιγμα Τραμπ στο νέο AI μοντέλο της Anthropic

Την ίδια ώρα, η κυβέρνηση των ΗΠΑ σχεδιάζει να καταστήσει την έκδοση του πρωτοποριακού μοντέλου τεχνητής νοημοσύνης Mythos της Anthropic διαθέσιμη σε σημαντικές ομοσπονδιακές υπηρεσίες, παρά τις ανησυχίες που υπάρχουν ότι μπορεί να αυξηθεί κατακόρυφα ο κίνδυνος κυβερνοασφάλειας, μετέδωσε το Bloomberg News την Πέμπτη.

Ο Gregory Barbaccia, ομοσπονδιακός επικεφαλής πληροφοριών στο Γραφείο Διαχείρισης και Προϋπολογισμού (OMB) του Λευκού Οίκου, ενημέρωσε αξιωματούχους των υπουργείων μέσω email την Τρίτη ότι θεσπίζουν προστατευτικά μέτρα προκειμένου να επιτραπεί στις υπηρεσίες τους να αρχίσουν να χρησιμοποιούν το Mythos.

«Συνεργαζόμαστε στενά με τους παρόχους του μοντέλου, άλλους εταίρους του κλάδου και την κοινότητα των υπηρεσιών πληροφοριών για να διασφαλίσουμε ότι υπάρχουν οι κατάλληλες δικλείδες ασφαλείας και προστασίας προτού διατεθεί ενδεχομένως μια τροποποιημένη έκδοση του μοντέλου στις υπηρεσίες», ανέφερε ο Barbaccia στο email, το οποίο είχε ως θέμα «Πρόσβαση στο Μοντέλο Mythos» (Mythos Model Access), σύμφωνα με το ρεπορτάζ του Bloomberg.

Το email του Barbaccia δεν αναφέρει ρητά ότι διάφορες υπηρεσίες θα λάβουν οριστικά πρόσβαση στο Mythos, ούτε παρέχει χρονοδιάγραμμα για το πότε θα μπορούσε να συμβεί αυτό ή πώς θα το χρησιμοποιήσουν.

Ένας αξιωματούχος δήλωσε ότι ο Λευκός Οίκος συνεργάζεται με κορυφαία εργαστήρια τεχνητής νοημοσύνης για να διασφαλίσει ότι τα μοντέλα τους βοηθούν στην προστασία κρίσιμων τρωτών σημείων λογισμικού, προσθέτοντας ότι κάθε νέα τεχνολογία απαιτεί μια τεχνική περίοδο αξιολόγησης για την πιστότητα και την ασφάλεια.

Η Anthropic συζητούσε για το Mythos με την κυβέρνηση Τραμπ, δήλωσε ο συνιδρυτής Jack Clark τη Δευτέρα, ακόμη και μετά τη διακοπή της συνεργασίας του Πενταγώνου με το αμερικανικό εργαστήριο τεχνητής νοημοσύνης έπειτα από μια συμβατική διαφορά.

Το Claude Opus 4.7

Η Anthropic παρουσίασε την Πέμπτη ένα νέο μοντέλο τεχνητής νοημοσύνης, το Claude Opus 4.7, το οποίο -όπως σημείωσε- αποτελεί βελτίωση σε σχέση με τις προηγούμενες εκδόσεις, αλλά είναι λιγότερο ισχυρό, άρα λιγότερο επικίνδυνο, από το πιο πρόσφατο μοντέλο της, το Claude Mythos, το οποίο είχε σημάνει συναγερμό σε κεντρικές τράπεζες και ρυθμιστικές αρχές για τον κίνδυνο να αυξήσει τα κρούσματα κυβερνοεπιθέσεων.

Το Claude Opus 4.7 είναι καλύτερο στη μηχανική λογισμικού, την τήρηση οδηγιών και την εκτέλεση εργασιών σε πραγματικές συνθήκες, αποτελώντας το ισχυρότερο γενικά διαθέσιμο μοντέλο της, ανέφερε η Anthropic. Ωστόσο, οι κυβερνο-ικανότητες του μοντέλου δεν είναι τόσο προηγμένες όσο του Claude Mythos Preview, το οποίο η Anthropic διέθεσε σε μια επιλεγμένη ομάδα εταιρειών στο πλαίσιο μιας νέας πρωτοβουλίας κυβερνοασφάλειας που ονομάζεται Project Glasswing, αναφέρει το CNBC.

«Κυκλοφορούμε το Opus 4.7 με δικλείδες ασφαλείας που εντοπίζουν και μπλοκάρουν αυτόματα αιτήματα που υποδηλώνουν απαγορευμένες ή υψηλού κινδύνου χρήσεις κυβερνοασφάλειας», τόνισε η Anthropic σε ανακοίνωσή της. «Όσα μάθουμε από την πραγματική εφαρμογή αυτών των δικλείδων θα μας βοηθήσουν να εργαστούμε προς τον τελικό μας στόχο για μια ευρεία κυκλοφορία μοντέλων κατηγορίας Mythos».

Από την ίδρυσή της το 2021, η Anthropic έχει αφιερώσει χρόνια χτίζοντας προσεκτικά τη φήμη της ως μια εταιρεία που είναι πιο προσηλωμένη στην ασφαλή και υπεύθυνη ανάπτυξη της Τεχνητής Νοημοσύνης σε σύγκριση με ανταγωνιστές όπως η OpenAI.

Η κυκλοφορία του Claude Opus 4.7 έρχεται μετά την κυκλοφορία του Claude Opus 4.6 τον Φεβρουάριο. Η Anthropic δήλωσε ότι το νέο μοντέλο υπερέχει του Claude Opus 4.6 σε πολλές περιπτώσεις, συμπεριλαμβανομένων των βιομηχανικών δεικτών αναφοράς (benchmarks) για τον αυτόνομο προγραμματισμό (agentic coding), τη διεπιστημονική συλλογιστική, τη χρήση εργαλείων σε κλίμακα και την αυτόνομη χρήση υπολογιστή.

Η Anthropic δήλωσε ότι πειραματίστηκε με προσπάθειες για τη «διαφορική μείωση» των δυνατοτήτων κυβερνοασφάλειας του Claude Opus 4.7 κατά τη διάρκεια της εκπαίδευσης. Η εταιρεία ενθάρρυνε τους επαγγελματίες ασφαλείας που ενδιαφέρονται να χρησιμοποιήσουν το μοντέλο για «νόμιμους σκοπούς κυβερνοασφάλειας» να υποβάλουν αίτηση μέσω ενός επίσημου προγράμματος επαλήθευσης.

Το Claude Opus 4.7 είναι διαθέσιμο σε όλα τα προϊόντα Claude της Anthropic, στη διεπαφή προγραμματισμού εφαρμογών της (API) και μέσω των παρόχων cloud Microsoft, Google και Amazon. Το νέο μοντέλο έχει την ίδια τιμή με το Claude Opus 4.6, σύμφωνα με την Anthropic.

 

 

 

Μοιράσου το:

σχολίασε κι εσύ

ENIKOS NETWORK