Η OpenAI παρουσίασε μια νέα εκδοχή του δημοφιλούς chatbot της, σχεδιασμένη ειδικά για τις ανάγκες της αμερικανικής κυβέρνησης. Το νέο μοντέλο, ChatGPT Gov, διαφημίζεται πως θα έχει ενισχυμένα μέτρα κυβερνοασφάλειας που επιτρέπουν στους ομοσπονδιακούς υπαλλήλους να παρέχουν ευαίσθητες πληροφορίες με ασφάλεια, σύμφωνα με την ανακοίνωση της εταιρείας.
Η κυκλοφορία του νέου εργαλείου τεχνητής νοημοσύνης της OpenAI, σημειώνει το Reuters, σηματοδοτεί την ενίσχυση των δεσμών της εταιρείας με την κυβέρνηση Τραμπ και ήρθε σε μια κρίσιμη χρονική στιγμή, μόλις λίγες ώρες μετά την ανακοίνωση του CEO Σαμ Άλτμαν, ο οποίος δήλωσε σε μια ανάρτησή του στο X ότι η εταιρεία θα προχωρήσει σε «κάποιες νέες κυκλοφορίες».
Η δήλωση αυτή ακολούθησε τις αναταράξεις που προκάλεσε η εφαρμογή της DeepSeek, μιας νέας κινεζικής AI startup, η οποία ξεπέρασε το ChatGPT σε λήψεις από το App Store της Apple, προκαλώντας έτσι αναστάτωση στις τιμές των μετοχών στον τομέα της τεχνητής νοημοσύνης.
Η DeepSeek, που ο Άλτμαν αποκάλεσε «νέο ανταγωνιστή» της OpenAI, προκάλεσε μεγάλες αντιδράσεις στην αγορά, με τις μετοχές των εταιρειών AI και άλλων σχετικών επιχειρήσεων να χάνουν αξία άνω του 1 τρισεκατομμυρίου δολαρίων τη Δευτέρα.
deepseek’s r1 is an impressive model, particularly around what they’re able to deliver for the price.
we will obviously deliver much better models and also it’s legit invigorating to have a new competitor! we will pull up some releases.
— Sam Altman (@sama) January 28, 2025
Ωστόσο, ειδικοί σε θέματα τεχνητής νοημοσύνης είχαν ήδη συνειδητοποιήσει ότι η Κίνα βρίσκεται κοντά με τις ΗΠΑ στον τομέα της AI. Πολλές φορές είχε αναφερθεί ότι αν οι ΗΠΑ «κερδίσουν» τον αγώνα της τεχνητής νοημοσύνης, θα το κάνουν μόλις λίγο πριν από την Κίνα.
Η κυκλοφορία του μοντέλου R1 από τη DeepSeek ίσως να μην προκαλέσει μεγάλες αλλαγές στο τοπίο, αλλά ίσως να οδηγήσει σε πιο αυστηρούς περιορισμούς από την αμερικανική κυβέρνηση.

Οι ερευνητές της τεχνητής νοημοσύνης επισημαίνουν ότι ο ενθουσιασμός για την τεχνητή νοημοσύνη είναι «αχόρταγος», καθώς η ζήτηση για τη συγκεκριμένη τεχνολογία είναι τεράστια, ιδιαίτερα στον τομέα της ανάπτυξης λογισμικού, όπου τα μεγαλύτερα προβλήματα είναι τα «συμβολικά όρια» που περιορίζουν τα πιο σύνθετα έργα.
Όμως το πιο σημαντικό πρόβλημα παραμένει η ανικανότητα των μοντέλων τεχνητής νοημοσύνης να αποδειχθούν απαραίτητα και απόλυτα χρήσιμα για καθημερινή χρήση από τον μέσο άνθρωπο.
Για να φτάσουμε σε αυτό το σημείο, σχολιάζει το Semafor, απαιτούνται πολλές ακόμα ανακαλύψεις στον τομέα και εξαιρετικά μεγάλες επενδύσεις σε υποδομές.
Μερικές από τις ιδέες που παρουσίασε η DeepSeek για να βελτιώσει την αποδοτικότητα των μοντέλων AI ήδη χρησιμοποιούνται από κορυφαίες ερευνητικές εταιρείες, όπως η OpenAI και η Poolside, σύμφωνα με δηλώσεις ερευνητών και στελεχών από αυτούς τους οργανισμούς.
Η αντίδραση της αγοράς και η σύγχυση γύρω από το τι πραγματικά συμβαίνει στον τομέα της τεχνητής νοημοσύνης, ενδεχομένως αποκαλύπτει πόσο λίγο κατανοεί η αγορά τις πραγματικές δυνατότητες της τεχνητής νοημοσύνης και τις προκλήσεις που αντιμετωπίζει αυτή η βιομηχανία, σχολιάζει το Semafor.
Νέα εκδοχή του μοντέλου τεχνητής νοημοσύνης της Qwen 2.5
Η κινεζική τεχνολογική εταιρεία Alibaba παρουσίασε σήμερα μια νέα εκδοχή του μοντέλου τεχνητής νοημοσύνης της Qwen 2.5, για την οποία υποστηρίζει πως υπερτερεί του περίφημου DeepSeek-V3, μεταδίδει το ΑΠΕ-ΜΠΕ.
Ο ασυνήθιστος χρόνος της κυκλοφορίας του Qwen 2.5-Max, την πρώτη ημέρα του Σεληνιακού Νέου Έτους, όταν οι περισσότεροι Κινέζοι έχουν αργία και βρίσκονται με τις οικογένειές τους, σηματοδοτεί την πίεση που ασκεί η μετεωρική άνοδος τις τρεις τελευταίες εβδομάδες της κινεζικής εταιρείας τεχνητής νοημοσύνης DeepSeek, όχι μόνο στους ανταγωνιστές της στο εξωτερικό, αλλά και στον εγχώριο ανταγωνισμό.
«Το Qwen 2.5-Max ξεπερνάει … σχεδόν σε όλα τα GPT-4o, DeepSeek-V3 και Llama-3.1-405B», αναφέρει η μονάδα cloud της Alibaba σε ανακοίνωσή της την οποία ανήρτησε στον επίσημο λογαριασμό της στο WeChat, αναφερόμενη στα πιο εξελιγμένα μοντέλα τεχνητής νοημοσύνης ανοικτού κώδικα.

Η παρουσίαση στις 10 Ιανουαρίου του βοηθού τεχνητής νοημοσύνης της DeepSeek, με βάση το μοντέλο DeepSeek-V3, καθώς και η παρουσίαση στις 20 Ιανουαρίου του μοντέλου της R1, προκάλεσε σοκ στην Σίλικον Βάλεϊ και έριξε τις μετοχές των τεχνολογικών εταιρειών, καθώς τα χαμηλά κόστη ανάπτυξης και χρήσης της κινεζικής startup έκαναν τους επενδυτές να αμφισβητήσουν τα σχέδια για τεράστιες δαπάνες από τις κορυφαίες εταιρείες τεχνητής νοημοσύνης στις ΗΠΑ.
Ωστόσο η επιτυχία της DeepSeek έκανε επίσης τους εγχώριους ανταγωνιστές της να αναβαθμίσουν τα δικά τους μοντέλα τεχνητής νοημοσύνης.

Δύο ημέρες μετά την παρουσίαση του DeepSeek-R1, η ιδιοκτήτρια του TikTok, η ByteDance, παρουσίασε μια επικαιροποίηση του δικού της βασικού μοντέλου τεχνητής νοημοσύνης, για το οποίο ισχυρίστηκε πως έχει καλύτερες επιδόσεις από το υποστηριζόμενο από τη Microsoft o1 της OpenAI στο AIME, ένα τεστ που μετράει πόσο καλά τα μοντέλα τεχνητής νοημοσύνης κατανοούν περίπλοκες οδηγίες και ανταποκρίνονται σ’ αυτές.
Αυτό απηχεί τον ισχυρισμό της DeepSeek ότι το μοντέλο της R1 υπερτερεί σε αρκετά κριτήρια απόδοσης του o1 της OpenAI.