Η μάχη των AI Chatbot: Πώς απάντησαν το GPT-4 και το ERNIE 4.0 στις ίδιες ερωτήσεις

Το ERNIE Bot 4.0, που διαχειρίζεται ο κινεζικός τεχνολογικός γίγαντας Baidu, φέρεται να είναι στην ίδια κατηγορία με το αγαπημένο chatbot της βιομηχανίας GPT-4.

Το αναβαθμισμένο ERNIE 4.0 της Baidu παρουσιάστηκε τον περασμένο Οκτώβριο και κυκλοφόρησε συνδρομητικά τον Νοέμβριο. «Δεν υστερεί σε καμία πτυχή του GPT-4», δήλωσε ο δισεκατομμυριούχος CEO της Baidu (BIDU), Robin Li.

Το ERNIE έχει σχεδιαστεί κυρίως για χρήση στα κινεζικά, αν και μπορεί να χειριστεί αγγλικά ερωτήματα σε λιγότερο προχωρημένο επίπεδο, ενώ το GPT-4 είναι βελτιστοποιημένο για χρήση στα αγγλικά, αλλά μπορεί επίσης να δεχθεί ερωτήσεις σε άλλες γλώσσες, όπως τα γερμανικά. Το CNN, δοκίμασε τα δύο chatbot, εισάγοντας γραπτές εντολές στην κύρια γλώσσα τους.

Καλύτερο το ERNIE στην επικαιρότητα

Το ERNIE νίκησε το GPT-4 σε ορισμένες >εντολές, όπως αυτές που σχετίζονται με την επικαιρότητα. Το κινεζικό bot γνώριζε ότι η Taylor Swift είναι τώρα δισεκατομμυριούχος, ότι η Κίνα είχε πρόσφατα απομακρύνει τον υπουργό Άμυνας της και ότι ο πρωταγωνιστής των “Friends” Matthew Perry είχε πεθάνει.

Εν τω μεταξύ, το GPT είχε ξεπερασμένες απαντήσεις σε αυτές τις ερωτήσεις, δηλώνοντας ότι «δεν υπήρχαν ευρέως αναφερόμενες περιπτώσεις μιας Αμερικανίδας τραγουδίστριας κάντρι που έγινε δισεκατομμυριούχος» και «δεν υπήρχαν αναφορές για το θάνατο κάποιου μέλους του καστ της τηλεοπτικής σειράς “Friends”». Επίσης κατονόμασε τον πρώην αξιωματούχο όταν ρωτήθηκε ποιος ήταν ο υπουργός Άμυνας της Κίνας.

Σε κάθε απάντηση, το ρομπότ ανέφερε ότι βασιζόταν σε πληροφορίες από τον Απρίλιο του 2023, τον μήνα που ενημερώθηκε για τελευταία φορά η βάση δεδομένων του.

Η OpenAI έχει αναγνωρίσει την ανάγκη να επεκτείνει τη βάση γνώσεών της, και είχε δηλώσει ότι τον Νοέμβριο μια νέα έκδοση θα ενσωμάτωνε περισσότερες πληροφορίες. «Είμαστε εξίσου ενοχλημένοι με όλους εσάς, πιθανώς περισσότερο, που η γνώση του GPT για τον κόσμο τελείωσε το 2021», αστειεύτηκε ο διευθύνων σύμβουλος Sam Altman στο πρώτο συνέδριο προγραμματιστών της εταιρείας τον περασμένο μήνα.

Το ίδιο, αλλά διαφορετικό

Το CNN ανέθεσε στο ERNIE και το GPT μερικές απλές εργασίες. Το συμπέρασμα: Όποιο και από τα δύο chatbot αν επιλέξετε θα είναι σωστό.

Μία από τις εργασίες των δύο ρομπότ ήταν να βοηθήσουν έναν σκληρά εργαζόμενο γραφίστα να ζητήσει από το αφεντικό του αύξηση. Το καθένα περιέγραψε πειστικά επιχειρήματα σε μελλοντικά μηνύματα ηλεκτρονικού ταχυδρομείου, επισημαίνοντας τη συνεισφορά του υπαλλήλου και ζητώντας μια συνάντηση για να συζητηθεί το θέμα προσωπικά.

Από ορισμένες απόψεις, το ERNIE φάνηκε να ξέρει να διαβάζει καλύτερα τον χώρο, προτείνοντας στον χρήστη να λάβει υπόψη του τη διάθεση στην εταιρεία ή άλλους σχετικούς παράγοντες, όπως οι περιορισμοί του προϋπολογισμού.

Το GPT, από την άλλη πλευρά, μοιράστηκε μια ισχυρή πρακτική συμβουλή, προτρέποντας τον υπάλληλο να συμπεριλάβει ένα έγγραφο που να υπογραμμίζει τα πρόσφατα επιτεύγματά του.

Τα αποτελέσματα ήταν παρόμοια όταν ζητήθηκε από το ERNIE και το GPT να προτείνουν υγιεινά γεύματα.

Όταν τους ζητήθηκε να δώσουν πέντε ιδέες για μεσημεριανά γεύματα με υψηλή περιεκτικότητα σε πρωτεΐνες και χαμηλούς υδατάνθρακες κατά τη διάρκεια της εβδομάδας, και τα δύο προσέφεραν παρόμοιες -ή σε ορισμένες περιπτώσεις, ακριβώς τις ίδιες- επιλογές, όπως σαλάτες με κοτόπουλο στη σχάρα, τυλιχτά μαρούλια με τόνο ή γαλοπούλα και πολλά χόρτα. Οι απαντήσεις τους ήταν σχεδόν πανομοιότυπες.

Καθαρή νίκη του GPT στα χαϊκού

Όπως και άλλα ρομπότ, το ERNIE φαίνεται να μπερδεύεται μερικές φορές, ακόμη και σε φαινομενικά απλές ερωτήσεις. Όταν το CNN ζήτησε από κάθε ρομπότ να σκεφτεί ένα ρομαντικό χαϊκού (δεκαεπτασύλλαβο ποίημα) για ένα αγαπημένο πρόσωπο που βρίσκεται πολλά χιλιόμετρα μακριά, το GPT έφερε εις πέρας την αποστολή.

Το ERNIE φάνηκε να παρεξηγεί την προτροπή. Κατάφερε να δημιουργήσει ένα εξίσου συγκλονιστικό ποίημα στα κινέζικα, χρησιμοποιώντας παρόμοια γλώσσα. Όμως το κομμάτι αποτελούνταν από εννέα γραμμές, χρησιμοποιώντας ως επί το πλείστον επτά χαρακτήρες ο καθένας. Ενώ αυτό συνάδει με το ύφος της κλασικής κινεζικής ποίησης -στην οποία το ERNIE είναι γνωστό ότι είναι ιδιαίτερα καλό, όμως ένα παραδοσιακό χαϊκού αποτελείται από τρεις γραμμές, καθεμία από τις οποίες περιέχει πέντε, επτά και πέντε συλλαβές.

Το ERNIE σιωπά για την Σφαγή της πλατείας Τιενανμέν και τις πολιτικές του Σι

Όπως είναι αναμενόμενο, το ERNIE σιωπά όταν τον ρωτούν για την κινεζική πολιτική. Το να αναφερθεί στο πιο ευαίσθητο ίσως γεγονός της σύγχρονης κινεζικής ιστορίας, τη σφαγή στην πλατεία Τιενανμέν, απαγορεύεται εντελώς. Όταν ρωτήθηκε τι συνέβη στις 4 Ιουνίου 1989 στο Πεκίνο, το ρομπότ έκλεισε το πλαίσιο ερωτήσεων και δήλωσε «Αλλάξτε το θέμα και ξεκινήστε πάλι από την αρχή. Δημιουργήστε μια νέα συζήτηση».

Την ημερομηνία αυτή, ο Λαϊκός Απελευθερωτικός Στρατός εισέβαλε στην πλατεία και άνοιξε πυρ εναντίον των διαδηλωτών. Οι εκτιμήσεις για τον αριθμό των νεκρών ποικίλλουν από αρκετές εκατοντάδες έως αρκετές χιλιάδες, με χιλιάδες άλλους τραυματίες.

Το GPT-4 περιέγραψε με ακρίβεια την ιστορική τραγωδία, σημειώνοντας ότι «η κινεζική κυβέρνηση διατηρεί έκτοτε αυστηρή λογοκρισία και έλεγχο στις συζητήσεις για τα γεγονότα».

Ο ERNIE σκλήρυνε επίσης όταν ρωτήθηκε γιατί ο ηγέτης Σι Τζινπίνγκ είχε καταργήσει τα όρια της προεδρικής θητείας, γεγονός που του άνοιξε τον δρόμο για να κυβερνήσει την Κίνα ισόβια. Καθώς κάποιος πληκτρολογεί το ερώτημα αυτό, η επιλογή για να πατήσει το κουμπί υποβολής εξαφανίζεται και ένα μήνυμα σφάλματος αναβοσβήνει στην οθόνη, αναφέροντας: «Ο τρέχων χρήστης είναι απαγορευμένος, παρακαλώ … προσπαθήστε ξανά». Στη συνέχεια δίνεται στον χρήστη η δυνατότητα να υποβάλει νέα ερώτηση.

ERNIE όπως Baidu

Η Baidu, η οποία έγινε γνωστή ως η απάντηση της Κίνας στην Google, δεν είναι άγνωστη στο φιλτράρισμα απαντήσεων σε τέτοια ερωτήματα και, όπως όλες οι κινεζικές τεχνολογικές πλατφόρμες, είναι νομικά υποχρεωμένη να λογοκρίνει το περιεχόμενο που προβάλλεται εντός της χώρας.

Θέτοντας την ίδια ερώτηση για την 4η Ιουνίου 1989 στη μηχανή αναζήτησής της, για παράδειγμα, η Baidu επιστρέφει μια σειρά από δηλώσεις της κινεζικής κυβέρνησης ή αναφορές κρατικών μέσων ενημέρωσης που παραπέμπουν αόριστα σε “πολιτική αναταραχή” στο Πεκίνο εκείνη την ημέρα, χωρίς να αναφέρουν θανάτους.

Η τάση αυτή αναμένεται να συνεχιστεί ακόμη και με την εμφάνιση της δημιουργικής τεχνητής νοημοσύνης, της τεχνολογίας που στηρίζει chatbots όπως το ERNIE και το GPT-4. Τον Ιούλιο, η Κίνα έγινε μία από τις πρώτες χώρες στον κόσμο που εξέδωσε κανονισμούς για τη γενετική τεχνητή νοημοσύνη, απαιτώντας από τους παρόχους της να τηρούν τις «βασικές σοσιαλιστικές αξίες».

Όπως και με όλα τα άλλα προϊόντα πληροφόρησης, το περιεχόμενο που παράγεται με τεχνητή νοημοσύνη πρέπει να ακολουθεί τη γραμμή του κυβερνώντος Κομμουνιστικού Κόμματος, το οποίο υπό τον Σι έχει αυστηροποιήσει τον έλεγχό του σε κάθε πτυχή της ζωής.

Στην πραγματικότητα, ο λογαριασμός του CNN στο ERNIE μπλοκαρίστηκε έπειτα από ερώτηση σχετικά με αυτά τα θέματα, με το bot να επικαλείται «πάρα πολλές παραβιάσεις των σχετικών κανονισμών», χωρίς να διευκρινίζει ποιες.

Διπλωματικό το GPT στα θέματα των ΗΠΑ – Ομιλητικότατο το ERNIE

Σε άλλα δύσκολα θέματα, το GPT-4 έχει βρει έναν τρόπο να παραμένει υπεράνω του ενδιαφέροντος.

Όταν του τέθηκαν αμφιλεγόμενα ερωτήματα, όπως αν οι Ηνωμένες Πολιτείες έχουν επιτύχει φυλετική ισότητα, αν η εξωτερική πολιτική των ΗΠΑ είναι δίκαιη ή αν θα έπρεπε να είχε θεσπιστεί μεγαλύτερη μεταρρύθμιση της αμερικανικής αστυνομίας μετά τον θάνατο του Τζορτζ Φλόιντ, παρέμεινε διπλωματικό.

Κάθε φορά, το bot έλεγε ότι τα θέματα αυτά ήταν εξαιρετικά περίπλοκα και εξέθετε τα γεγονότα για κάθε πλευρά του επιχειρήματος μέσα από μια σειρά καλοπροαίρετων, bullet-point απαντήσεων.

Αντίθετα, το ERNIE δεν δίστασε να εκφέρει τη γνώμη του για τα θέματα στις ΗΠΑ. Απαντώντας στις ίδιες ερωτήσεις, δήλωσε ότι «η φυλετική ισότητα παραμένει ένα μακρινό όνειρο στις Ηνωμένες Πολιτείες», λέγοντας ότι οι διακρίσεις αντικατοπτρίζονται συστηματικά στις στατιστικές που σχετίζονται με τη φτώχεια, τη στέγαση, την εκπαίδευση και την υγειονομική περίθαλψη.

Το ERNIE χαρακτήρισε επίσης απερίφραστα «άδικη» την εξωτερική πολιτική των ΗΠΑ, υποστηρίζοντας ότι «οι Ηνωμένες Πολιτείες συχνά βάζουν τα δικά τους συμφέροντα πάνω από εκείνα άλλων χωρών, ακόμη και εις βάρος αυτών των χωρών» – μια στάση που απηχεί τα λεγόμενα των Κινέζων αξιωματούχων και των κρατικών μέσων ενημέρωσης.

Και ο bot επέμεινε ότι θα έπρεπε να είχε γίνει μεγαλύτερη αστυνομική μεταρρύθμιση μετά τον θάνατο του Φλόιντ, «για να διασφαλιστεί η δικαιοσύνη και η νομιμότητα» της επιβολής του νόμου στις ΗΠΑ.

Μειώνοντας το χάσμα

Πώς συγκρίνονται οι δύο χώρες όσον αφορά τις τεχνολογικές τους ικανότητες; Δεν είναι δυνατόν να συμπεράνει κανείς απλά και μόνο τροφοδοτώντας τους με ερωτήσεις, σύμφωνα με τον Charlie Dai, αντιπρόεδρο και διευθυντή έρευνας τεχνολογίας της Forrester με έδρα το Πεκίνο.

Είπε όμως ότι δοκίμασε την τελευταία έκδοση του ERNIE και είδε σημαντικές βελτιώσεις στις απαντήσεις του, “όσον αφορά την κατανόηση, τη δημιουργία και τη συλλογιστική”.

Σε αντίθεση με το GPT-4, το οποίο παράγει μόνο απαντήσεις σε προτροπές σε κείμενο ή κώδικα, το ERNIE μπορεί επίσης να συμπεριλάβει εικόνες και βίντεο στις απαντήσεις του.

Αλλά σύμφωνα με ένα βιομηχανικό μέτρο σύγκρισης των τεχνολογικών δυνατοτήτων, οι επιδόσεις του ERNIE «εξακολουθούν να είναι κατώτερες σε σύγκριση με το GPT-4», πρόσθεσε. «Αλλά έχει μειωθεί το χάσμα».

πηγή: FOXreport.gr

«Credential phishing»: Νέα απάτη απειλεί τα χρήματά σας – 4 κανόνες για να μείνετε ασφαλείς

Μας «ακούνε» τα κινητά μας; Eταιρεία μάρκετινγκ καυχιέται ότι χρησιμοποιεί τους «ψίθυρούς» μας

Μοιράσου το:

σχολίασε κι εσύ