Μαθαίνετε για τις τελευταίες τάσεις στον τομέα της τεχνολογίας και των τηλεπικοινωνιών μέσω Google News!
Ακολουθήστε το Infocom.gr για τις πιο σημαντικές ειδήσεις που αφορούν τη ψηφιακή αγορά.
Η Bryq εισάγει ένα νέο κεφάλαιο στην αξιολόγηση ταλέντου με τη δημοσίευση της μελέτης The AI Candidate, η οποία εξετάζει την απόδοση τριών από τα πιο γνωστά AI chatbots κατά την αξιολόγηση δεξιοτήτων ανάλογης με εκείνη που χρησιμοποιείται σε διαδικασίες πρόσληψης. Αυτή η σημαντική έρευνα είναι ιδιαίτερα επίκαιρη, καθώς τα AI εργαλεία αποκτούν ολοένα και μεγαλύτερη σημασία στην αγορά εργασίας.
Από τον Ιανουάριο μέχρι τον Μάρτιο του 2026, η Bryq υπέβαλε το OpenAI ChatGPT, το Anthropic Claude και το Google Gemini στην διαδικασία αξιολόγησης για τη θέση του Marketing Executive. Τα μοντέλα αξιολογήθηκαν μέσω γνωστικών ικανοτήτων, προσωπικότητας βασισμένης σε 16 παράγοντες, επαγγελματικών δεξιοτήτων και AI proficiency. Στη συνέχεια, τα αποτελέσματά τους συγκρίθηκαν με μια διεθνή βάση 10.000 ανθρώπινων υποψηφίων που πέρασαν το ίδιο test.
Το αποτέλεσμα; Το καθένα από τα τρία AI συστήματα έδειξε εντελώς διαφορετικά χαρακτηριστικά.
Κύρια ευρήματα
Διαφορετικές «προσωπικότητες». Το Claude παρουσιαζόταν ως ένας δυναμικός συνεργάτης με αυτοπεποίθηση και σαφήνεια. Αντιθέτως, το Gemini έδωσε μια εντύπωση υπερβολική θετικότητας, καταγράφοντας σχεδόν όλες τις κοινωνικές συμπεριφορές στο ανώτατο επίπεδο, υποδεικνύοντας την παρατηρούμενη τάση υπερεκτίμησης της κοινωνικής επιθυμητότητας ανάμεσα στα AI. Από την άλλη, το ChatGPT φάνηκε πιο αναλυτικός και συγκρατημένος στις απαντήσεις του.
Κοινή αδυναμία: η λογική σκέψη. Και τα τρία λοιπόν μοντέλα αξιολογήθηκαν στην κατώτερη 15% του δείγματος των ανθρώπινων υποψηφίων στην λογική σκέψη. Συναντήθηκαν με την αναλογία του 13ου εκατοστημορίου για το Claude και το ChatGPT, ενώ το Gemini βρέθηκε στο 3ο. Αυτό είναι σύμφωνο με άλλες έρευνες που αναδεικνύουν τους περιορισμούς των LLMs σε συνθήκες πίεσης.
Το Claude σημείωσε την καλύτερη καταλληλότητα για τη θέση. Ενώ το Gemini έφερε παρόμοια χαρακτηριστικά προσωπικότητας με το Claude, το Claude είχε σαφή υπεροχή στις γνωστικές αξιολογήσεις. Στη δοκιμή αριθμητικής λογικής, αξιολογήθηκε στο 98ο εκατοστημόριο, αποδεικνύοντας την ικανότητά του να σκέφτεται στρατηγικά.
Η κύρια αποκάλυψη ήταν οι μνημειώδεις διαφορές μεταξύ των μοντέλων. Οι αποκλίσεις στα χαρακτηριστικά που επηρεάζουν την εργασιακή απόδοση ήταν αρκετά μεγαλύτερες από εκείνες που υποδεικνύουν οι δημόσιες αξιολογήσεις. Αυτό σημαίνει πως η αντιμετώπιση των κορυφαίων AI ως ισοδύναμων καταστάσεων είναι ψυχομετρικά ατελής.
Δήλωση του CEO της Bryq, George Kalyvas
«Όταν οι ομάδες χρησιμοποιούν AI, η επιλογή τους δεν αφορά μόνο την τεχνολογία. Είναι και μια απόφαση που σχετίζεται με τον τρόπο εργασίας και τη συνεργασία.»
Γιατί έχει σημασία
Αυτή η μελέτη θέτει ουσιαστικά σε νέο πλαίσιο τα ερωτήματα που προκύπτουν στις διαδικασίες πρόσληψης: πλέον πρέπει να αναρωτηθούμε όχι μόνο αν ένα AI μπορεί να εκτελέσει μια εργασία, αλλά και ποιοι είναι οι συνεργατικοί του τρόποι, καθώς και αν αυτοί ταιριάζουν με τις ανάγκες της συγκεκριμένης θέσης.
Το assessment της Bryq είναι το εργαλείο που χρησιμοποιούν οι πελάτες της για να αξιολογήσουν υποψηφίους και σύμφωνα με την εμπειρία τους, η ποιότητα προσλήψεων έχει βελτιωθεί δραματικά, με μειωμένα ποσοστά πρόωρης αποχώρησης.
Σχετικά με τη μεθοδολογία
Κάθε AI μοντέλο αξιολογήθηκε με έναν ομοιόμορφο τρόπο, χωρίς την παρέμβαση πρόσθετων οδηγικών στοιχείων. Η ολοκλήρωση της αξιολόγησης έγινε σε μία συνεδρία, αντιστοίχως με έναν ανθρώπινο υποψήφιο.
Τα αποτελέσματα συγκρίθηκαν ακριβώς με το δείγμα υποψηφίων Marketing Executive της Bryq από πραγματικές διαδικασίες πρόσληψης σε διάφορες περιοχές του κόσμου.
Η πλήρη έρευνα «The AI Candidate» είναι διαθέσιμη για ανάγνωση χωρίς απαιτήσεις εγγραφής στον παρακάτω σύνδεσμο.
Μπορείτε επίσης να διαβάσετε το συνοδευτικό blog summary εδώ: https://www.bryq.com/blog/ai-models-job-interview-the-ai-candidate

