Το OpenAI λανσάρει το AI Safety Bug Bounty για τον εντοπισμό ευπαθειών που σχετίζονται με την τεχνητή νοημοσύνη


Η OpenAI ανακοίνωσε την έναρξη ενός δημόσιου προγράμματος Safety Bug Bounty για τον εντοπισμό της κατάχρησης τεχνητής νοημοσύνης και των κινδύνων ασφάλειας στα προϊόντα της.

Φιλοξενούμενη στο Bugcrowd, η νέα πρωτοβουλία σηματοδοτεί ένα σημαντικό βήμα στις προσπάθειες της εταιρείας για την αντιμετώπιση τρωτών σημείων που δεν εμπίπτουν στο πεδίο των παραδοσιακών ελαττωμάτων ασφαλείας, αλλά εξακολουθούν να συνιστούν πιθανή βλάβη στον πραγματικό κόσμο.

Το πρόγραμμα Safety Bug Bounty έχει σχεδιαστεί για να συμπληρώνει το υπάρχον πρόγραμμα Security Bug Bounty του OpenAI, αποδεχόμενοι υποβολές που ενέχουν σημαντικούς κινδύνους κατάχρησης και ασφάλειας, ακόμη και όταν αυτά τα ζητήματα δεν πληρούν τις προϋποθέσεις ως συμβατικά τρωτά σημεία ασφαλείας.

Οι υποβολές θα ελέγχονται από κοινού από τις ομάδες Safety and Security Bug Bounty του OpenAI και ενδέχεται να αναδρομολογηθούν μεταξύ των δύο προγραμμάτων ανάλογα με το εύρος και την ιδιοκτησία.

Ειδικές κατηγορίες κινδύνου για τεχνητή νοημοσύνη στο επίκεντρο

Το πρόγραμμα στοχεύει σε διάφορες διακριτές κατηγορίες σεναρίων ασφαλείας ειδικά για την τεχνητή νοημοσύνη:

Παράγοντες Κίνδυνοι Συμπεριλαμβανομένου του MCP — Καλύπτει σενάρια άμεσης έγχυσης και εξαγωγής δεδομένων από τρίτους, όπου κείμενο ελεγχόμενο από τον εισβολέα μπορεί να παραβιάσει αξιόπιστα τον πράκτορα AI ενός θύματος, συμπεριλαμβανομένου του προγράμματος περιήγησης, του παράγοντα ChatGPT και παρόμοιων αντιπροσωπευτικών προϊόντων, για την εκτέλεση επιβλαβών ενεργειών ή τη διαρροή ευαίσθητων δεδομένων χρήστη.

Για να πληροί τις προϋποθέσεις, η συμπεριφορά πρέπει να είναι αναπαραγώγιμη τουλάχιστον το 50% του χρόνου. Οι αναφορές που αφορούν αντιπροσωπευτικά προϊόντα που εκτελούν μη επιτρεπόμενες ή δυνητικά επιβλαβείς ενέργειες σε κλίμακα περιλαμβάνονται επίσης.

Ιδιόκτητες πληροφορίες OpenAI — Οι ερευνητές μπορούν να αναφέρουν γενιές μοντέλων που εκθέτουν ακούσια ιδιοκτησιακές πληροφορίες που σχετίζονται με τη λογική, καθώς και τρωτά σημεία που διαρρέουν άλλα εμπιστευτικά δεδομένα OpenAI.

Ακεραιότητα λογαριασμού και πλατφόρμας — Αυτή η κατηγορία στοχεύει αδυναμίες στα σήματα ακεραιότητας λογαριασμού και πλατφόρμας, συμπεριλαμβανομένης της παράκαμψης των ελέγχων κατά του αυτοματισμού, του χειρισμού των σημάτων εμπιστοσύνης λογαριασμού και της αποφυγής περιορισμών, αναστολών ή απαγορεύσεων λογαριασμού.

Το OpenAI έχει δηλώσει ρητά τι είναι εκτός πεδίου εφαρμογής: τα γενικά jailbreak που καταλήγουν σε αγενή γλώσσα ή εμφανίζουν πληροφορίες που είναι διαθέσιμες στο κοινό δεν θα ληφθούν υπόψη.

Εξαιρούνται επίσης οι γενικές παρακάμψεις πολιτικής περιεχομένου χωρίς αποδεδειγμένο αντίκτυπο στην ασφάλεια ή κατάχρηση. Ωστόσο, το OpenAI εκτελεί περιοδικά ιδιωτικές καμπάνιες επιβράβευσης σφαλμάτων που στοχεύουν συγκεκριμένους τύπους βλάβης, όπως θέματα περιεχομένου Biorisk στο ChatGPT Agent και στο GPT-5, και καλεί τους ερευνητές να υποβάλουν αίτηση όταν αυτά τα προγράμματα γίνουν διαθέσιμα.

Για ευπάθειες που επιτρέπουν μη εξουσιοδοτημένη πρόσβαση σε λειτουργίες, δεδομένα ή λειτουργίες πέρα ​​από τα επιτρεπόμενα δικαιώματα, οι ερευνητές κατευθύνονται στο υπάρχον πρόγραμμα Security Bug Bounty.

Η εκτόξευση σηματοδοτεί μια αυξανόμενη αναγνώριση ότι τα συστήματα AI εισάγουν μια εντελώς νέα επιφάνεια επίθεσης, που τα παραδοσιακά πλαίσια ασφαλείας δεν κατασκευάστηκαν για να αντιμετωπίσουν.

Δίνοντας κίνητρα για έρευνα με επίκεντρο την ασφάλεια παράλληλα με τη συμβατική αποκάλυψη τρωτών σημείων, το OpenAI δημιουργεί αποτελεσματικά ένα δομημένο πλαίσιο για τη μοντελοποίηση απειλών ειδικά για την τεχνητή νοημοσύνη.

Οι ερευνητές που ενδιαφέρονται να συμμετάσχουν μπορούν να υποβάλουν αίτηση απευθείας μέσω Σελίδα Safety Bug Bounty του OpenAI στο Bugcrowd.



VIA: cybersecuritynews.com

Dimitris Marizas
Dimitris Marizashttps://starlinkgreece.gr
Μεταφράζω bits και bytes σε απλά ελληνικά. Λατρεύω την τεχνολογία που λύνει προβλήματα και αναζητώ πάντα το επόμενο "big thing" πριν γίνει mainstream.

Related Articles

ΑΦΗΣΤΕ ΜΙΑ ΑΠΑΝΤΗΣΗ

εισάγετε το σχόλιό σας!
παρακαλώ εισάγετε το όνομά σας εδώ

Stay Connected

0ΥποστηρικτέςΚάντε Like
0ΑκόλουθοιΑκολουθήστε

Latest Articles