Δεν είναι πλέον έκπληξη το γεγονός ότι οι εταιρείες τεχνητής νοημοσύνης βασίζονται σε πραγματικά ανθρώπινα δεδομένα για να εκπαιδεύσουν και να βελτιώσουν τα μοντέλα τους — αλλά πόσο μπορεί να είναι αυτό που χρησιμοποιούν.
Από τους τεχνολογικούς γίγαντες μέχρι τις καθημερινές εφαρμογές, η ζήτηση για δεδομένα που παράγονται από τον άνθρωπο εκτοξεύεται. Εταιρείες όπως το OpenAI δεν είναι μόνες. Οι επιχειρήσεις εκτός του χώρου της τεχνητής νοημοσύνης, συμπεριλαμβανομένου του DoorDash, αξιοποιούν επίσης τα δεδομένα χρηστών του πραγματικού κόσμου για να βελτιώσουν τα συστήματά τους και να παραμείνουν ανταγωνιστικές.
Το άρθρο συνεχίζεται παρακάτω
Τα πραγματικά ανθρώπινα δεδομένα γίνονται ένα από τα πιο πολύτιμα περιουσιακά στοιχεία στην τεχνητή νοημοσύνη
Η ζήτηση για βίντεο πραγματικού κόσμου, ειδικότερα, αυξάνεται. Σύμφωνα με τον CEO της Troveo, Marty Pesis, τα μοντέλα τεχνητής νοημοσύνης χρειάζονται περισσότερα από συνθετικές εισροές για να κατανοήσουν πραγματικά πώς συμπεριφέρονται οι άνθρωποι.
«Η ζήτηση για βίντεο πραγματικού κόσμου επιταχύνεται επειδή οι εταιρείες τεχνητής νοημοσύνης χρειάζονται βασισμένα παραδείγματα για το πώς οι άνθρωποι πραγματικά κινούνται, συμπεριφέρονται και αλληλεπιδρούν σε πραγματικά περιβάλλοντα», είπε. “Τα προσομοιωμένα και συνθετικά δεδομένα δεν αποτυπώνουν πλήρως το απρόβλεπτο της πραγματικής ζωής.”
Αυτή η ώθηση φαίνεται ήδη στον τρόπο με τον οποίο οι εταιρείες συλλέγουν δεδομένα. Το DoorDash παρουσίασε πρόσφατα ένα προαιρετικό πρόγραμμα που ονομάζεται “DoorDash Tasks”, η οποία πληρώνει τους οδηγούς παράδοσης για να καταγράφουν ότι ολοκληρώνουν καθημερινές δραστηριότητες. Ο στόχος είναι απλός: δώστε στην τεχνητή νοημοσύνη μια καλύτερη κατανόηση του φυσικού κόσμου μέσω της πραγματικής ανθρώπινης συμπεριφοράς.
Αλλά καθώς περισσότερες εταιρείες στρέφονται σε δεδομένα που παράγονται από τον άνθρωπο, η συναίνεση γίνεται μεγαλύτερο μέρος της συζήτησης.
«Η συναίνεση είναι κεντρική για δύο λόγους», εξήγησε ο Πέσις. «Οι εταιρείες πρέπει να γνωρίζουν ότι έχουν το νόμιμο δικαίωμα να χρησιμοποιούν τα δεδομένα για εκπαίδευση τεχνητής νοημοσύνης και χρειάζονται εμπιστοσύνη ότι προήλθαν πραγματικά από πραγματικούς ανθρώπους».
Αυτό το δεύτερο σημείο γίνεται ολοένα και πιο σημαντικό καθώς το περιεχόμενο που δημιουργείται από AI πλημμυρίζει το διαδίκτυο. Ορισμένες εκτιμήσεις υποδηλώνουν ότι σχεδόν το 75% των ιστοσελίδων που δημιουργήθηκαν πρόσφατα περιλαμβάνουν πλέον υλικό που δημιουργείται από τεχνητή νοημοσύνη — αριθμός που συνεχίζει να αυξάνεται.
Τι κάνει λοιπόν τα ανθρώπινα δεδομένα πραγματικά πολύτιμα;
Σύμφωνα με τον Pesis, εξαρτάται από την ποιότητα. «Τα δεδομένα εκπαίδευσης υψηλής αξίας επισημαίνονται με ακρίβεια, τεχνικά συνεπή και αντιπροσωπευτικά», είπε. Στην πράξη, αυτό σημαίνει ότι τα δεδομένα πρέπει να είναι τυποποιημένα ώστε να μπορούν να κλιμακωθούν — και αρκετά διαφορετικά ώστε να αντικατοπτρίζουν τις πραγματικές συνθήκες, από τον φωτισμό και τις γωνίες της κάμερας μέχρι τους πολλούς τρόπους με τους οποίους πραγματικά κινούνται και αλληλεπιδρούν οι άνθρωποι.
Η ανθρώπινη συναίνεση για εκπαίδευση τεχνητής νοημοσύνης θα πρέπει να βρίσκεται στο επίκεντρο αυτής της αυξανόμενης τάσης
Εταιρείες όπως η Anthropic, η Apple και η Superhuman (πρώην Grammarly) ξεχωρίζουν μεταξύ της μεγάλης ομάδας εταιρειών που χρησιμοποιούν τα δεδομένα κειμένου, ήχου και βίντεο που παράγονται από τους ανθρώπινους χρήστες τους για να εκπαιδεύσουν μοντέλα AI.
Είναι εύκολο να προβλέψουμε ότι περισσότερες εταιρείες που χρησιμοποιούμε τακτικά θα συμμετάσχουν σε αυτήν την τάση—η μεγαλύτερη ανησυχία είναι ότι αυτές οι εταιρείες θα το κάνουν χωρίς τη συγκατάθεσή μας. Ελπίζουμε ότι θα έχουμε τη δυνατότητα να εξαιρεθούμε από αυτές τις πρακτικές καθώς αρχίζουν να εμφανίζονται πιο τακτικά.
Ακολουθώ Οδηγός Tom’s στις Ειδήσεις Google και προσθέστε μας ως προτιμώμενη πηγή για να λαμβάνετε τα ενημερωμένα νέα, τις αναλύσεις και τις κριτικές μας στις ροές σας.
Περισσότερα από το Tom’s Guide
Επιστροφή στο MacBook
