Η OpenAI αποκαλύπτει τα μοντέλα GPT-5.4 Pro And Thinking


Το κυκλοφόρησε το GPT-5.4 την Πέμπτη, παρουσιάζοντας ένα νέο μοντέλο βάσης διαθέσιμο σε τυπικές εκδόσεις, Thinking και Pro.

Η κυκλοφορία εισάγει ένα μοντέλο με παράθυρο περιβάλλοντος 1 εκατομμυρίου διακριτικών και βελτιωμένη απόδοση διακριτικών, στοχεύοντας σε επαγγελματικούς φόρτους εργασίας. Η έκδοση περιλαμβάνει νέες εγγραφές αναφοράς και ένα σύστημα διαχείρισης της κλήσης εργαλείων εντός του API.

Το GPT-5.4 είναι διαθέσιμο σε τρεις εκδόσεις: στάνταρ, μοντέλο συλλογισμού (GPT-5.4 Thinking) και βελτιστοποιημένη έκδοση υψηλής απόδοσης (GPT-5.4 Pro). Η έκδοση API υποστηρίζει παράθυρα περιβάλλοντος τόσο μεγάλα όσο 1 εκατομμύριο διακριτικά, τα μεγαλύτερα διαθέσιμα από το OpenAI. Το OpenAI δήλωσε ότι το GPT-5.4 επιλύει τα ίδια προβλήματα με σημαντικά λιγότερα διακριτικά από τον προκάτοχό του.

Το μοντέλο πέτυχε βαθμολογίες ρεκόρ στα σημεία αναφοράς χρήσης υπολογιστή OSWorld-Verified και WebArena Verified. Σημείωσε ρεκόρ 83% στη δοκιμή GDPval του OpenAI για εργασίες γνώσης. Το GPT-5.4 ανέλαβε επίσης το προβάδισμα στο σημείο αναφοράς APEX-Agents της Mercor, το οποίο δοκιμάζει επαγγελματικές δεξιότητες στον τομέα του δικαίου και των οικονομικών.

Ο Διευθύνων Σύμβουλος της Mercor, Brendan Foody, δήλωσε ότι το GPT-5.4 διαπρέπει στη δημιουργία παραδοτέων μακροπρόθεσμου ορίζοντα, όπως slide decks, οικονομικά μοντέλα και νομικές αναλύσεις. Ο Foody είπε ότι το μοντέλο προσφέρει κορυφαίες επιδόσεις ενώ λειτουργεί πιο γρήγορα και με χαμηλότερο κόστος από τα ανταγωνιστικά μοντέλα συνόρων.

Το OpenAI ανέφερε ότι το GPT-5.4 είναι 33% λιγότερο πιθανό να κάνει σφάλματα σε μεμονωμένες αξιώσεις σε σύγκριση με το GPT 5.2. Οι συνολικές απαντήσεις είναι 18% λιγότερο πιθανό να περιέχουν σφάλματα. Το OpenAI παρουσίασε το Tool Search, ένα νέο σύστημα για τη διαχείριση της κλήσης εργαλείων στο API που επιτρέπει στα μοντέλα να αναζητούν ορισμούς εργαλείων όπως απαιτείται.

Η Αναζήτηση εργαλείων μειώνει τη χρήση διακριτικών και βελτιώνει την ταχύτητα και το κόστος σε συστήματα με πολλά εργαλεία. Το OpenAI πρόσθεσε μια νέα αξιολόγηση ασφάλειας για να δοκιμάσει την παρακολούθηση της αλυσίδας σκέψης, αντιμετωπίζοντας τις ανησυχίες ότι τα μοντέλα συλλογιστικής θα μπορούσαν να παραποιήσουν τη διαδικασία συλλογισμού τους.

Η νέα αξιολόγηση δείχνει ότι η εξαπάτηση είναι λιγότερο πιθανή στην έκδοση GPT-5.4 Thinking. Η OpenAI δήλωσε ότι αυτό υποδηλώνει ότι το μοντέλο δεν έχει την ικανότητα να κρύψει το σκεπτικό του και ότι η παρακολούθηση CoT παραμένει ένα αποτελεσματικό εργαλείο ασφάλειας.


Πίστωση επιλεγμένης εικόνας



VIA: DataConomy.com

Dimitris Marizas
Dimitris Marizashttps://starlinkgreece.gr
Μεταφράζω bits και bytes σε απλά ελληνικά. Λατρεύω την τεχνολογία που λύνει προβλήματα και αναζητώ πάντα το επόμενο "big thing" πριν γίνει mainstream.

ΑΦΗΣΤΕ ΜΙΑ ΑΠΑΝΤΗΣΗ

εισάγετε το σχόλιό σας!
παρακαλώ εισάγετε το όνομά σας εδώ