Το OpenAI λανσάρει το GPT-5.4 με προηγμένες δυνατότητες συλλογισμού, κωδικοποίησης και χρήσης υπολογιστή


Το GPT-5.4 κυκλοφόρησε

Το OpenAI στις 5 Μαρτίου 2026 κυκλοφόρησε το GPT-5.4, το πιο ικανό και αποτελεσματικό μοντέλο συνόρων μέχρι σήμερα, συνδυάζοντας προηγμένες συλλογιστικές σκέψεις, κωδικοποίηση και πρακτικές ροές εργασίας σε ένα ενιαίο ενοποιημένο σύστημα.

Το μοντέλο κυκλοφορεί σε ολόκληρο το (ως GPT-5.4 Thinking), το API και το Codex, με μια παραλλαγή GPT-5.4 Pro υψηλότερης απόδοσης διαθέσιμη για χρήστες που απαιτούν μέγιστο υπολογισμό σε περίπλοκες εργασίες.

Το GPT-5.4 ενοποιεί τις δυνατότητες που είχαν προηγουμένως διαδοθεί σε ξεχωριστά μοντέλα, ενσωματώνοντας τα κορυφαία στον κλάδο πλεονεκτήματα κωδικοποίησης του GPT-5.3-Codex με βελτιωμένη γενική λογική και εγγενείς δυνατότητες χρήσης υπολογιστή.

Το αποτέλεσμα είναι ένα μοντέλο σχεδιασμένο για επαγγελματικές ροές εργασίας από άκρο σε άκρο, από υπολογιστικά φύλλα και παρουσιάσεις έως σύνθετες εργασίες πολλαπλών βημάτων με πρακτορεία με λιγότερη αλληλεπίδραση από τους χρήστες.

Στο ChatGPT, το GPT-5.4 Thinking εισάγει ένα εκ των προτέρων σχέδιο συλλογιστικής που επιτρέπει στους χρήστες να διακόπτουν και να ανακατευθύνουν το μοντέλο στη μέση της απόκρισης χωρίς επανεκκίνηση, επιτρέποντας πιο στοχευμένες, ακριβείς εξόδους για το περιβάλλον. Αυτή η δυνατότητα διεύθυνσης σε πραγματικό χρόνο είναι μια αξιοσημείωτη αλλαγή από τα προηγούμενα μοντέλα συλλογιστικής, όπου απαιτούνταν οι διορθώσεις πορείας να ξεκινούν εντελώς από την αρχή.

Το GPT-5.4 κυκλοφόρησε

Το GPT-5.4 θέτει νέες βαθμολογίες τελευταίας τεχνολογίας σε διάφορα κρίσιμα σημεία αναφοράς του κλάδου:

Σημείο αναφοράς GPT-5.4 GPT-5.3-Codex GPT-5.2
GDPval (νίκες ή ισοπαλίες) 83,0% 70,9% 70,9%
SWE-Bench Pro (Δημόσιο) 57,7% 56,8% 55,6%
OSWorld-Verified 75,0% 74,0% 47,3%
Toolathlon 54,6% 51,9% 46,3%
BrowseComp 82,7% 77,3% 65,8%

Στο GDPval, το οποίο δοκιμάζει πράκτορες σε 44 επαγγέλματα που καλύπτουν τις 9 κορυφαίες βιομηχανίες ΑΕΠ των ΗΠΑ, το GPT-5.4 ταιριάζει ή ξεπερνά τους επαγγελματίες του κλάδου στο 83% των συγκρίσεων, από 70,9% με το GPT-5.2.

Στην αξιολόγηση του BigLaw Bench για εργασίες νομικών εγγράφων, το μοντέλο σημείωσε 91%, σύμφωνα με τον επικεφαλής Εφαρμοσμένης Έρευνας του Harvey, Niko Grupen.

Το GPT-5.4 είναι το πρώτο μοντέλο γενικής χρήσης του OpenAI με εγγενείς δυνατότητες χρήσης υπολογιστή, επιτρέποντας στους πράκτορες να αλληλεπιδρούν απευθείας με το λογισμικό μέσω στιγμιότυπων οθόνης, εντολών ποντικιού και εισόδων πληκτρολογίου.

Στο OSWorld-Verified, επιτυγχάνει ποσοστό επιτυχίας 75,0%, ξεπερνώντας τη συγκριτική αξιολόγηση της ανθρώπινης απόδοσης στο 72,4% και ξεπερνώντας κατά πολύ το 47,3% του GPT-5.2.

Στο WebArena-Verified, το GPT-5.4 επιτυγχάνει ποσοστό επιτυχίας του προγράμματος περιήγησης 67,3%, ενώ σημειώνει 92,8% στο -Mind2Web χρησιμοποιώντας μόνο παρατηρήσεις που βασίζονται σε στιγμιότυπα οθόνης.

Το μοντέλο υποστηρίζει επίσης 1 εκατομμύριο διακριτικά περιβάλλοντος στο API, επιτρέποντας την εκτέλεση εργασιών μεγάλου ορίζοντα σε μεγάλης κλίμακας ροές εργασίας αντιπροσώπων που ταιριάζουν με τις προσφορές παραθύρων περιβάλλοντος από την και την Anthropic.

Το OpenAI τόνισε ότι το GPT-5.4 είναι το πιο τεκμηριωμένο μοντέλο του μέχρι σήμερα, με μεμονωμένους ισχυρισμούς 33% λιγότερες πιθανότητες να είναι ψευδείς και πλήρεις απαντήσεις 18% λιγότερες πιθανότητες να περιέχουν σφάλματα σε σύγκριση με το GPT-5.2.

Το μοντέλο προσφέρει επίσης σημαντικά κέρδη απόδοσης διακριτικών, χρησιμοποιώντας σημαντικά λιγότερα διακριτικά για την επίλυση των ίδιων προβλημάτων συλλογιστικής, μεταφράζοντας απευθείας σε μειωμένο κόστος API και ταχύτερους χρόνους απόκρισης για τους προγραμματιστές επιχειρήσεων.

Σε περιβάλλοντα παραγωγής, ο Διευθύνων Σύμβουλος του Mainstay, Dod Fraser, ανέφερε ότι το GPT-5.4 πέτυχε ποσοστό επιτυχίας πρώτης προσπάθειας 95% σε ~30.000 πύλες ιδιοκτησίας, ολοκληρώνοντας τις συνεδρίες τρεις φορές γρηγορότερα ενώ χρησιμοποιούσε 70% λιγότερα διακριτικά σε σύγκριση με παλαιότερα μοντέλα χρήσης υπολογιστή.

Το GPT-5.4 Thinking είναι τώρα διαθέσιμο για συνδρομητές ChatGPT Plus, Team και Pro, αντικαθιστώντας το GPT-5.2 Thinking τους επόμενους τρεις μήνες. Οι προγραμματιστές μπορούν να έχουν πρόσβαση στα GPT-5.4 και GPT-5.4 Pro μέσω του OpenAI API, με ενεργοποιημένη την επεξεργασία προτεραιότητας για μεγαλύτερη ταχύτητα διακριτικών σε περιβάλλοντα παραγωγής.



VIA: cybersecuritynews.com

Dimitris Marizas
Dimitris Marizashttps://starlinkgreece.gr
Μεταφράζω bits και bytes σε απλά ελληνικά. Λατρεύω την τεχνολογία που λύνει προβλήματα και αναζητώ πάντα το επόμενο "big thing" πριν γίνει mainstream.

ΑΦΗΣΤΕ ΜΙΑ ΑΠΑΝΤΗΣΗ

εισάγετε το σχόλιό σας!
παρακαλώ εισάγετε το όνομά σας εδώ