Η OpenAI παρουσίασε πρόσφατα το Atlas, έναν AI browser βασισμένο στο Chromium, που χρησιμοποιεί το ChatGPT για να αναλύει και να επεξεργάζεται περιεχόμενο ιστοσελίδων.
Ο στόχος του είναι να προσφέρει πιο φυσική και προσαρμοστική αλληλεπίδραση με το διαδίκτυο, όμως τα πρώτα αποτελέσματα δείχνουν ότι συνοδεύεται και από σοβαρoύς κινδύνους.
Οι κυβερνοεπιθέσεις σε συστήματα τεχνητής νοημοσύνης (prompt injection) αποτελούν μια από τις πιο επικίνδυνες απειλές στον χώρο της τεχνητής νοημοσύνης. Πρόκειται για επιθέσεις κατά τις οποίες κακόβουλες εντολές κρύβονται μέσα σε περιεχόμενο ιστοσελίδων ή εγγράφων.
Όταν ο AI agent, όπως το ChatGPT στο Atlas, διαβάζει αυτά τα δεδομένα, μπορεί να εκτελέσει τις εντολές χωρίς ο χρήστης να το αντιληφθεί.
Υπάρχουν δύο βασικοί τύποι τέτοιων επιθέσεων. Η Direct Prompt Injection αφορά περιπτώσεις όπου ο χρήστης εισάγει απευθείας μια κακόβουλη εντολή στο πεδίο εισαγωγής. Αντίθετα, η Indirect Prompt Injection συμβαίνει όταν οι εντολές είναι θαμμένες μέσα σε ιστοσελίδες, emails ή αρχεία όπως τα Google Docs, τα οποία ο AI πράκτορας αναλύει θεωρώντας τα κανονικό περιεχόμενο.
Ερευνητές της Brave Software δημοσίευσαν πρόσφατα μια μελέτη που δείχνει ότι η ευπάθεια αυτή είναι συστημικό πρόβλημα όλων των AI browsers. Παρόλο που η OpenAI υποστηρίζει ότι το Atlas διαθέτει προηγμένα φίλτρα και τεχνικές ασφαλείας, αρκετοί ερευνητές, όπως ο Johann Rehberger, απέδειξαν ότι το σύστημα μπορεί να ξεγελαστεί με καλά σχεδιασμένες κακόβουλες οδηγίες.
Ο Dane Stuckey, Chief Information Security Officer της OpenAI, αναγνώρισε δημόσια το πρόβλημα, δηλώνοντας ότι η εταιρεία εργάζεται εντατικά για να μειώσει τους κινδύνους prompt injection.
Σύμφωνα με τον ίδιο, η OpenAI έχει προχωρήσει σε εκτεταμένο red-teaming, έχει εφαρμόσει νέες μεθόδους εκπαίδευσης των μοντέλων ώστε να αγνοούν κακόβουλες εντολές, έχει προσθέσει πολλαπλά επίπεδα ασφαλείας και νέα συστήματα ανίχνευσης και αποκλεισμού τέτοιων επιθέσεων σε πραγματικό χρόνο.
Παρόλα αυτά, παραδέχθηκε ότι η απειλή δεν έχει εξαλειφθεί και ότι οι prompt injection επιθέσεις παραμένουν ένα ανοιχτό μέτωπο για ολόκληρο τον χώρο της τεχνητής νοημοσύνης.
Ο ερευνητής Johann Rehberger επισημαίνει την ανάγκη ανθρώπινης εποπτείας και την εφαρμογή πραγματικών ελέγχων ασφαλείας μετά την έξοδο των δεδομένων από το μοντέλο, και όχι μόνο την ύπαρξη ψηφιακών φραγμών στο ίδιο το σύστημα.



Latest News
Όλες οι anime σειρές & ταινίες που έρχονται τον Ιανουάριο του 202615 Δεκεμβρίου 2025 13:56
Pluribus: Αναδείχθηκε στη σειρά με τις περισσότερες προβολές στην ιστορία της Apple15 Δεκεμβρίου 2025 12:26
Η πρωθυπουργός της Ιαπωνίας παραθέτει φράση από το Attack on Titan3 Δεκεμβρίου 2025 17:31
Η Sony κυκλοφορεί νέο trailer για το 28 Years Later: The Bone Temple3 Δεκεμβρίου 2025 16:46
Η Marvel δείχνει το cast του Avengers: Doomsday σε επίσημο event3 Δεκεμβρίου 2025 16:23
The Boys: Ο Karl Urban προειδοποιεί για μεγάλους θανάτους από το 1o επεισόδιο της 5ης σεζόν3 Δεκεμβρίου 2025 15:35
Stranger Things 5: 59,6 εκατ. θεάσεις σε μόλις 5 μέρες3 Δεκεμβρίου 2025 14:53
Κυκλοφόρησε νέα αφίσα για το A Knight of the Seven Kingdoms3 Δεκεμβρίου 2025 14:33
O Tarantino σοκάρει με τα σχόλιά του: Στο στόχαστρο ο Paul Dano3 Δεκεμβρίου 2025 14:13
Η στοιχειωμένη σήραγγα Kiyotaki του όρους Matsuo2 Δεκεμβρίου 2025 20:28
Fire Force: Kυκλοφόρησε νέο trailer της 3ης σεζόν για το part 22 Δεκεμβρίου 2025 19:16
Return to Silent Hill: Δείτε το διεθνές trailer2 Δεκεμβρίου 2025 17:53
Τα πέντε anime με επεισόδια που άγγιξαν 9.9 στο IMDb2 Δεκεμβρίου 2025 16:57
Vanderhorstia supersaiyan: Το ψάρι που μοιάζει να βγήκε από το Dragon Ball Z2 Δεκεμβρίου 2025 15:54
Το Helldivers γίνεται ταινία από τον σκηνοθέτη του Fast & Furious2 Δεκεμβρίου 2025 15:26
Πρώτες αντιδράσεις για το Avatar: Fire and Ash: Το καλύτερο μέχρι σήμερα;2 Δεκεμβρίου 2025 14:23
Gotham Awards 2025: Guillermo del Toro κατακεραυνώνει το AI2 Δεκεμβρίου 2025 13:43
Samsung Galaxy Z TriFold: Ανακοίνωσε το τριπλά αναδιπλούμενο smartphone2 Δεκεμβρίου 2025 13:04
Το Netflix διεκδικεί την Warner Bros με τεράστια χρηματική προσφορά2 Δεκεμβρίου 2025 12:26
Η live-action σειρά God of War επιταχύνει την παραγωγή της2 Δεκεμβρίου 2025 11:50