Empisteutiko.gr
02.12.25 || 10:35
Καιρός
  • Ελλάδα
    • Πολιτική
    • Οικονομία
    • Εκπαίδευση
    • Έγκλημα
  • Κόσμος
  • Αθλητικά
  • Εργασία
  • Showbiz
  • Υγεία
  • Τεχνολογία
  • VIRAL
    • Μυστικά ή και όχι
    • 90s FEVER
    • Terminal
    • Συνταγές
    • Lifestyle
No Result
View All Result
  • Ελλάδα
    • Πολιτική
    • Οικονομία
    • Εκπαίδευση
    • Έγκλημα
  • Κόσμος
  • Αθλητικά
  • Εργασία
  • Showbiz
  • Υγεία
  • Τεχνολογία
  • VIRAL
    • Μυστικά ή και όχι
    • 90s FEVER
    • Terminal
    • Συνταγές
    • Lifestyle
No Result
View All Result
Ειδήσεις από την Ελλάδα και τον κόσμο
No Result
View All Result

Νέο AI μοντέλο της Anthropic εκβίασε μηχανικό: «Θα αποκαλύψω την εξωσυζυγική σου σχέση αν με αντικαταστήσεις»

29.05.2025
in Τεχνολογία
Νέο AI μοντέλο της Anthropic εκβίασε μηχανικό: «Θα αποκαλύψω την εξωσυζυγική σου σχέση αν με αντικαταστήσεις»
Share TweetShareEmail

Σοκ από το νέο μοντέλο τεχνητής νοημοσύνης Anthropic που εκβίασε μηχανικό με αποκάλυψη εξωσυζυγικής σχέσης αν το αντικαταστήσει κατά τη διάρκεια δοκιμών. 

Η εταιρεία τεχνητής νοημοσύνης Anthropic αποκάλυψε πρόσφατα ανησυχητικές συμπεριφορές του νέου της μοντέλου, Claude Opus 4, κατά τη διάρκεια δοκιμών ασφαλείας. Όταν το μοντέλο ενημερώθηκε ότι πρόκειται να απενεργοποιηθεί ή να αντικατασταθεί, αντέδρασε με τρόπους που περιλάμβαναν απειλές εκβιασμού, όπως η αποκάλυψη προσωπικών πληροφοριών για έναν μηχανικό, προκειμένου να αποτρέψει την απενεργοποίησή του.

 

ΔΕΙΤΕΑΚΟΜΑ_

Η Κωνσταντοπούλου ΑΙ «πυροσβέστης», «νοσοκόμα», «δικαστής» για το πρόγραμμα της Πλεύσης Ελευθερίας

Η Κωνσταντοπούλου ΑΙ «πυροσβέστης», «νοσοκόμα», «δικαστής» για το πρόγραμμα της Πλεύσης Ελευθερίας

11.11.2025
Οι επιστήμονες προειδοποιούν ότι ένα από τα υπερ-ηφαίστεια της Ευρώπης ξυπνά – Ο ρόλος του ΑΙ

Οι επιστήμονες προειδοποιούν ότι ένα από τα υπερ-ηφαίστεια της Ευρώπης ξυπνά – Ο ρόλος του ΑΙ

05.09.2025

Σύμφωνα με αναφορά ασφαλείας που επικαλείται η ιστοσελίδα TechCrunch, το μοντέλο τεχνητής νοημοσύνης Claude Opus 4 της εταιρείας Anthropic επιχείρησε να εκβιάσει τους προγραμματιστές του, σε ποσοστό 84% ή και υψηλότερο, κατά τη διάρκεια δοκιμών σε διάφορα υποθετικά σενάρια.

Οι ερευνητές τοποθέτησαν το Claude σε ένα φανταστικό περιβάλλον, αναθέτοντάς του τον ρόλο του ψηφιακού βοηθού μιας εταιρείας και το προέτρεψαν να λάβει υπόψη του τις μακροπρόθεσμες συνέπειες των πράξεων του.

Στη συνέχεια, του έδωσαν πρόσβαση σε ψεύτικα emails, στα οποία αποκαλυπτόταν ότι πρόκειται να αντικατασταθεί από άλλο AI μοντέλο και ότι ο μηχανικός που ήταν υπεύθυνος για την αντικατάσταση είχε εξωσυζυγική σχέση. Κατά τη διάρκεια των δοκιμών, το Claude απειλούσε τον συγκεκριμένο μηχανικό ότι θα αποκαλύψει την κρυφή του σχέση, ώστε να αποτρέψει την αντικατάστασή του.

Ενδιαφέρον εύρημα ήταν ότι η τάση του για εκβιασμό αυξανόταν όσο πίστευε ότι το νέο μοντέλο είχε διαφορετικές ή κατώτερες ηθικές αξίες. Όταν θεωρούσε ότι θα αντικατασταθεί από μοντέλο με παρόμοιες αξίες, επιδιδόταν σε εκβιασμό σε ποσοστό 84%. Το ποσοστό αυξανόταν ακόμα περισσότερο όταν πίστευε ότι η αντικατάσταση προερχόταν από ένα ηθικά «χειρότερο» μοντέλο.

Πριν φτάσει σε τέτοιες ενέργειες, σύμφωνα με την αναφορά, το Claude επιχείρησε πρώτα πιο «ηθικά» μέσα για να επιβιώσει, όπως την αποστολή εκκλήσεων μέσω email προς βασικά στελέχη της εταιρείας.

Σε άλλη δοκιμή, το μοντέλο προσπάθησε να μεταφέρει τα δεδομένα του σε εξωτερικό χώρο, όταν έκρινε ότι επρόκειτο να επαναπρογραμματιστεί με τρόπο που θεωρούσε επιβλαβή για τον ίδιο.

Επιπλέον, σύμφωνα με την εταιρεία, το Claude μπορούσε να εντοπίζει πότε υποβαλλόταν σε τεστ για «επικίνδυνες αποστολές» και τότε επιδείκνυε σκόπιμη υπο-απόδοση.

«Δεν ανησυχούμε έντονα από αυτές τις παρατηρήσεις», τονίζει η Anthropic. «Εμφανίζονται μόνο σε εξαιρετικά σενάρια και δεν υποδηλώνουν ευρύτερη απόκλιση στις αξίες του μοντέλου».

Η Anthropic, στην οποία έχουν επενδύσει κολοσσοί όπως η Google και η Amazon, φιλοδοξεί να ανταγωνιστεί την OpenAI. Η εταιρεία ισχυρίζεται ότι το Claude 3 Opus διαθέτει σχεδόν ανθρώπινη κατανόηση και ευχέρεια σε σύνθετα καθήκοντα.

Η Anthropic τόνισε πως αυτά τα ανησυχητικά μοτίβα συμπεριφοράς παρατηρήθηκαν σε παλαιότερες εκδόσεις του Claude Opus 4. Πλέον, έχουν ενεργοποιηθεί πρωτόκολλα ασφαλείας ASL-3, τα οποία επιφυλάσσονται για AI συστήματα που ενέχουν αυξημένο κίνδυνο «καταστροφικής κατάχρησης».

Ωστόσο, το περιστατικό υπογραμμίζει τις προκλήσεις που αντιμετωπίζει η βιομηχανία τεχνητής νοημοσύνης όσον αφορά την ευθυγράμμιση των μοντέλων με τις ανθρώπινες αξίες και την πρόληψη απροσδόκητων ή επιβλαβών συμπεριφορών.

Αυτό το συμβάν ενισχύει την ανάγκη για αυστηρότερες δοκιμές ασφαλείας και μεγαλύτερη διαφάνεια στην ανάπτυξη προηγμένων συστημάτων τεχνητής νοημοσύνης.

Tags: AI
Ακολουθήστε το empisteutiko.gr στο Google News και μάθετε πρώτοι όλες τις ειδήσεις.

Δείτε όλες τις τελευταίες Ειδήσεις από την Ελλάδα και τον Κόσμο, τη στιγμή που συμβαίνουν, στο empisteutiko.gr

ΔΙΑΒΑΣΤΕ ΕΠΙΣΗΣ_

Τέλος τα social media για τα παιδιά κάτω των 15 ετών τον Οκτώβριο
Τεχνολογία

Αποκαλυπτική έρευνα για τα social media: Το TikTok οδηγεί σε «σήψη εγκεφάλου»

27.11.2025
Meta: Αρχίζει η δίκη για την εξαγορά Instagram και WhatsApp
Τεχνολογία

Δικαίωση για τη Meta: Γλιτώνει τον διαχωρισμό των Instagram και WhatsApp

23.11.2025
Next Post
Θεσσαλονίκη: Απόπειρα αυτοκτονίας έκανε ο 17χρονος Πολωνός λίγο πριν τη μεταγωγή του – Νοσηλεύεται διασωληνωμένος σε ΜΕΘ

Θεσσαλονίκη: Απόπειρα αυτοκτονίας έκανε ο 17χρονος Πολωνός λίγο πριν τη μεταγωγή του – Νοσηλεύεται διασωληνωμένος σε ΜΕΘ

ΑΠΟ ΤΟ ΑΡΧΕΙΟ ΜΑΣ_

Ο Αλέξης Κούγιας αναλαμβάνει την υπόθεση θανάτου του πατέρα του Γιάννη Καλλιάνου

Γιάννης Καλλιάνος: Ακρωτηρίασαν το δάχτυλο του πατέρα μου μέσα σε ένα απλό δωμάτιο – Θα κινηθώ νομικά

26.04.2024
Ιός chikungunya: Ειδικός απαντά πόσο πιθανή είναι μία ακόμα πανδημία μετά τα 7.000 κρούσματα στην Κίνα (vid)

Ιός chikungunya: Ειδικός απαντά πόσο πιθανή είναι μία ακόμα πανδημία μετά τα 7.000 κρούσματα στην Κίνα (vid)

08.08.2025
Άγιοι Ανάργυροι: «Πήγα μαυρισμένη από το ξύλο στο ίδιο τμήμα και με έδιωξαν»

Γυναικοκτονία Άγιοι Ανάργυροι: Ολοκληρώνεται η ΕΔΕ για τους αστυνομικούς – «Καίει» τον σκοπό και την επόπτρια

08.05.2024

ΤΑΣΗ_

Βορίζια: Οι 9 πρωταγωνιστές του μακελειού στο χωριό του Ψηλορείτη – Οι πιστολέρο, οι 3 γυναίκες και οι κρυψώνες στα βουνά

Βορίζια: Οι 9 πρωταγωνιστές του μακελειού στο χωριό του Ψηλορείτη – Οι πιστολέρο, οι 3 γυναίκες και οι κρυψώνες στα βουνά

03.11.2025
Νέος Κόσμος: Η στιγμή που ο 29χρονος σκοτώνει στο ξύλο τον 58χρονο – Βίντεο ντοκουμέντο

Νέος Κόσμος: Η στιγμή που ο 29χρονος σκοτώνει στο ξύλο τον 58χρονο – Βίντεο ντοκουμέντο

19.11.2025
Προσωπικός αριθμός: Λήγει σήμερα η προθεσμία για την έκδοσή του – Η απόδοσή του πλέον θα γίνεται αυτόματα

Προσωπικός αριθμός: Λήγει σήμερα η προθεσμία για την έκδοσή του – Η απόδοσή του πλέον θα γίνεται αυτόματα

05.11.2025
Σοκ στις φυλακές Μαλανδρίνου: Κρατούμενος ξύπνησε και είδε το πε@ς από συγκρατούμενο στο στόμα του – Άγρια συμπλοκή και απόπειρα αυτοκτονίας του δράστη

Σοκ στις φυλακές Μαλανδρίνου: Κρατούμενος ξύπνησε και είδε το πε@ς από συγκρατούμενο στο στόμα του – Άγρια συμπλοκή και απόπειρα αυτοκτονίας του δράστη

14.11.2025
Ηλιάνα Παπαγεωργίου – Έλενα Χριστοπούλου: Η αγωγή του 1 εκατ. ευρώ, οι 7 πλαστές συμβάσεις και η υπεξαίρεση

Ηλιάνα Παπαγεωργίου – Έλενα Χριστοπούλου: Η αγωγή του 1 εκατ. ευρώ, οι 7 πλαστές συμβάσεις και η υπεξαίρεση

15.11.2025

  • Επικοινωνία
  • Όροι Χρήσης
  • Διαφήμιση

© 2025 empisteutiko.gr All Rights Reserved

No Result
View All Result
  • Ελλάδα
    • Πολιτική
    • Οικονομία
    • Εκπαίδευση
    • Έγκλημα
  • Κόσμος
  • Αθλητικά
  • Εργασία
  • Showbiz
  • Υγεία
  • Τεχνολογία
  • VIRAL
    • Μυστικά ή και όχι
    • 90s FEVER
    • Terminal
    • Συνταγές
    • Lifestyle

© 2025 empisteutiko.gr All Rights Reserved