DeepSeek: Ποια είναι η «μπλε φάλαινα» που τρομάζει τους μεγάλους παίκτες της τεχνητής νοημοσύνης – Η κινεζική startup που εκθρονίζει τη Silicon Valley

Νίκος Παγουλάτος

1 έτος ago

Επιστήμη & τεχνολογία

ΗΠΑ ΚΙΝΑ ΤΕΧΝΗΤΗ ΝΟΗΜΟΣΥΝΗ

Η DeepSeek, μια κινεζική startup που δραστηριοποιείται στον τομέα της τεχνητής νοημοσύνης, έκανε την εμφάνισή της με μια νέα δωρεάν εφαρμογή AI, η οποία κατέκτησε την κορυφή του App Store της Apple στις ΗΠΑ το περασμένο Σαββατοκύριακο, προκάλεσε μεγάλη αναστάτωση στο χρηματιστήριο και ταρακούνησε συθέμελα την πρωτοκαθεδρία των αμερικανικών κολοσσών της τεχνολογίας.

Η επιτυχία αυτή προκάλεσε σοκ στη Silicon Valley, φέρνοντας σοβαρές συνέπειες για τις μεγάλες εταιρείες του κλάδου, με τις μετοχές τους να καταγράφουν σημαντική πτώση. Η Nvidia, συγκεκριμένα, υπέστη τη μεγαλύτερη πτώση στην ιστορία της αμερικανικής χρηματιστηριακής αγοράς, σύμφωνα με το Bloomberg, χάνοντας σχεδόν 600 δισεκατομμύρια δολάρια σε χρηματιστηριακή αξία.

To περιβάλλον χρήστη του chatbot της DeepSeek

Η εφαρμογή αυτή χρησιμοποιεί το νέο μοντέλο R1 της DeepSeek, το οποίο θεωρείται ικανό να ανταγωνιστεί τα μοντέλα της OpenAI, ενώ η στρατηγική της εταιρείας να προσφέρει δωρεάν την τεχνολογία της έχει προκαλέσει ανησυχία στις μεγάλες τεχνολογικές δυνάμεις και επηρεάζει την παγκόσμια αγορά τεχνητής νοημοσύνης.

Η επιτυχία της DeepSeek και η αντίδραση της Silicon Valley

Η εφαρμογή της DeepSeek, η οποία χρησιμοποιεί το μοντέλο R1, σημείωσε τα περισσότερα downloads στο App Store της Apple στις ΗΠΑ το περασμένο Σαββατοκύριακο, προκαλώντας αντιδράσεις στη Silicon Valley.

Η επιτυχία της DeepSeek είναι εντυπωσιακή, δεδομένου ότι η εφαρμογή είναι εντελώς δωρεάν για τους χρήστες, σε αντίθεση με τον βασικό ανταγωνιστή της, την OpenAI, που χρεώνει 20 δολάρια τον μήνα για την πρόσβαση στα πιο ισχυρά μεγάλα γλωσσικά μοντέλα (LLMs) της.

Το γεγονός αυτό, ότι η DeepSeek δεν επιβαρύνει τους χρήστες με συνδρομές, φαίνεται να της εξασφαλίζει μια ισχυρή θέση στην αγορά – τουλάχιστον προς το παρόν.

Ο CEO της OpenAI, Σαμ Άλτμαν, αναγνώρισε την πρόκληση -και την επιτυχία της DeepSeek- που δημιουργεί η εμφάνιση ενός νέου ανταγωνιστή στην αγορά. «Είναι προφανές ότι θα παραδώσουμε πολύ καλύτερα μοντέλα και επίσης είναι αναζωογονητικό να έχουμε έναν νέο ανταγωνιστή».

deepseek’s r1 is an impressive model, particularly around what they’re able to deliver for the price.

we will obviously deliver much better models and also it’s legit invigorating to have a new competitor! we will pull up some releases.

— Sam Altman (@sama) January 28, 2025

Η μείωση της αξίας της Nvidia ήρθε σε μια περίοδο που οι εταιρείες τεχνολογίας προγραμματίζουν επενδύσεις δισεκατομμυρίων σε υποδομές τεχνητής νοημοσύνης, όπως το φιλόδοξο πρότζεκτ Stargate, στο οποίο προβλέπεται να διατεθούν «τουλάχιστον 500 δισεκατομμύρια δολάρια» σε υποδομές τεχνητής νοημοσύνης στις Ηνωμένες Πολιτείες.

Στη Stargate μετέχουν η εταιρεία Oracle (εξειδικεύεται στο «cloud»), η γιγαντιαία ιαπωνική εταιρεία επενδύσεων SoftBank και η OpenAI (ChatGPT). Μεταξύ των χρηματοδοτών, είναι επίσης το επενδυτικό ταμείο MGX, που υποστηρίζεται από τα Ηνωμένα Αραβικά Εμιράτα.

«Αυτό το μοντέλο [της DeepSeek] αμφισβητεί την εντύπωση ότι οι AI εταιρείες της Δύσης έχουν σημαντικό πλεονέκτημα έναντι των κινεζικών», σημείωσε ο Jack Clark, συνιδρυτής της startup Anthropic.

Ο Marc Andreessen, σημαντική προσωπικότητα της Silicon Valley και πρωτοπόρος της έκρηξης του διαδικτύου τη δεκαετία του 1990, σχολίασε πως η εμφάνιση της DeepSeek είναι «η στιγμή “Σπούτνικ” της Τεχνητής Νοημοσύνης», παρομοιάζοντας την πρωτοφανή και σημαντική επιτυχία της με την αποστολή του πρώτου τεχνητού δορυφόρου της Γης στο διάστημα.

Τώρα, με την εμφάνιση της DeepSeek, οι επενδυτές νιώθουν ανασφάλεια για τα υπέρογκα χρηματικά πόσα που διαθέτουν στην αγορά και ανησυχούν για την αποτελεσματικότητα αυτών των επενδύσεων.

Οι δηλώσεις Τραμπ

Το θέμα σχολίασε και ο πρόεδρος των ΗΠΑ, Ντόναλντ Τραμπ, αποκαλώντας την άνοδο της κινεζικής εταιρείας DeepSeek καμπανάκι αφύπνισης για την αμερικανική βιομηχανία τεχνολογίας.

Ο Τραμπ δήλωσε ότι οι τελευταίες εξελίξεις στη βιομηχανία τεχνητής νοημοσύνης της Κίνας μπορεί να είναι θετικές για τις ΗΠΑ. «Αν μπορούσατε να το κάνετε φθηνότερα, αν μπορούσατε να το κάνετε [για] λιγότερα [και] να φτάσετε στο ίδιο τελικό αποτέλεσμα. Νομίζω ότι αυτό είναι καλό για εμάς», είπε σε δημοσιογράφους ο Αμερικανός Πρόεδρος.

Ποια είναι η DeepSeek

Η DeepSeek είναι μια κινεζική startup στον τομέα της τεχνητής νοημοσύνης, η οποία ιδρύθηκε το 2023 από τον 39χρονο Liang Wenfeng, συνιδρυτή του hedge fund «High-Flyer», το οποίο χρησιμοποιεί αλγορίθμους AI για να προβλέπει τις κινήσεις της αγοράς, σημειώνει η Washington Post.

O Liang Wenfeng της DeepSeek

Στο επίκεντρο της στρατηγικής της εταιρείας είναι η ανάπτυξη τεχνητής νοημοσύνης που είναι ανταγωνιστική με αυτή των αμερικανικών κολοσσών της τεχνολογίας, όπως η OpenAI και η Google, με το κόστος ανάπτυξης και συντήρησης να είναι σημαντικά χαμηλότερο.

Η DeepSeek πιστεύει ότι το λογισμικό της είναι σε θέση να εκτελεί μια ευρεία ποικιλία εργασιών, εξίσου καλά με τα LLMs των μεγάλων παικτών της αγοράς, αν και σε πολύ χαμηλότερο κόστος.

Το 2023, ο Liang αποφάσισε να στρέψει τους πόρους της Fire-Flyer προς την κατασκευή του DeepSeek, με στόχο την ανάπτυξη της τεχνητής γενικής νοημοσύνης (AGI). «Δεν θα μπορούσα να βρω έναν εμπορικό λόγο για την ίδρυση της DeepSeek», δήλωσε ο Liang στην κινεζική τεχνολογική έκδοση 36Kr. «Ωστόσο, το κάνουμε αυτό επειδή πιστεύουμε στην αποστολή μας».

Η ερευνητική ομάδα της DeepSeek, σύμφωνα με το Nairametrics, αποτελείται κυρίως από αποφοίτους κορυφαίων κινεζικών πανεπιστημίων, όπως το Πανεπιστήμιο του Πεκίνου και το Πανεπιστήμιο Tsinghua. Πολλοί από αυτούς τους νέους ερευνητές έχουν ήδη γίνει γνωστοί στους ακαδημαϊκούς κύκλους, δημοσιεύοντας σε κορυφαία περιοδικά και κερδίζοντας διεθνή βραβεία.

Λειτουργία και δυνατότητες της εφαρμογής DeepSeek

Η AI εφαρμογή της DeepSeek προσφέρει έναν ισχυρό και δωρεάν βοηθό (assistant) τεχνητής νοημοσύνης, αντίστοιχο με το ChatGPT. Η εταιρεία χρησιμοποίησε το μοντέλο R1, το οποίο έχει τη δυνατότητα να ανταγωνίζεται το «συλλογιστικό» μοντέλο o1 της OpenAI και βασίστηκε στο V3 LLM DeepSeek που κυκλοφόρησε τον Δεκέμβριο.

Σύμφωνα με το Tech Crunch, το R1 διαθέτει άδεια από το MIT και είναι διαθέσιμο από την πλατφόρμα ανάπτυξης τεχνητής νοημοσύνης Hugging Face, που σημαίνει ότι μπορεί να χρησιμοποιηθεί εμπορικά χωρίς περιορισμούς.

Η εταιρεία ισχυρίζεται ότι είναι εφάμιλλο του GPT-4o και του Claude 3.5 Sonnet της Anthropic, ενώ δήλωσε πως χρησιμοποίησε μόλις 2.000 εξειδικευμένα τσιπ από την Nvidia για την εκπαίδευση του μοντέλου V3, σε σύγκριση με τα 16.000 ή περισσότερα που απαιτούνται για την εκπαίδευση κορυφαίων LLMs άλλων εταιρειών, σύμφωνα με τους New York Times.

Η εφαρμογή της DeepSeek επιτρέπει στους χρήστες να θέτουν ερωτήσεις και να λαμβάνουν άμεσες και ακριβείς απαντήσεις, ενώ διαθέτει επίσης τη δυνατότητα αναζήτησης, που επιτρέπει στους χρήστες να ανακτούν πληροφορίες από το διαδίκτυο. Η κύρια καινοτομία του μοντέλου R1 είναι ότι περιλαμβάνει «ικανότητες λογικής σκέψης», επιτρέποντας στο chatbot της να εξηγεί βήμα προς βήμα πώς έφτασε σε ένα συγκεκριμένο συμπέρασμα, αναφέρει το Wired.

Η εφαρμογή ωστόσο δεν παράγει εικόνες, σε αντίθεση με άλλες ανταγωνιστικές πλατφόρμες, αλλά εστιάζει στις δυνατότητες επεξεργασίας κειμένου και την ικανότητα του μοντέλου να κατανοεί και να απαντά σε φυσική ανθρώπινη γλώσσα.

To περιβάλλον χρήστη του chatbot της DeepSeek

Παρ’ όλα αυτά, σύμφωνα με αναφορές, η DeepSeek έχει ήδη αναπτύξει τεχνικές που καθιστούν την εκπαίδευση και ανάπτυξη του μοντέλου της πολύ πιο αποδοτική σε σχέση με άλλες εταιρείες.

Το μοντέλο R1 της DeepSeek έχει εκπαιδευτεί σε διαθέσιμα δεδομένα μέχρι τον Ιούλιο του 2024, πράγμα που σημαίνει ότι δεν έχει ενημερωθεί για γεγονότα που συνέβησαν αργότερα, ωστόσο προσφέρει έναν μηχανισμό αναζήτησης για να φέρει τα πιο πρόσφατα δεδομένα στους χρήστες. Μια λειτουργία που ανησυχεί ιδιαίτερα την Google, αλλά κι άλλες αντίστοιχες εφαρμογές τεχνητής νοημοσύνης που αντλούν πληροφορίες από το διαδίκτυο, όπως το Perplexity.

Η στρατηγική του ανοιχτού κώδικα της DeepSeek

Μια ιδιαίτερη στρατηγική της DeepSeek, που της δίνει σημαντικό προβάδισμα στην κούρσα της τεχνητής νοημοσύνης, είναι ότι το λογισμικό της είναι «ανοιχτού κώδικα» (open source). Αυτό επιτρέπει σε άλλες εταιρείες και προγραμματιστές να κατεβάσουν, να τροποποιήσουν και να χρησιμοποιήσουν τον κώδικα της DeepSeek για τις δικές τους ανάγκες, συμβάλλοντας στην πρόοδο της εφαρμογής.

Ο ανοιχτός κώδικας δημιουργεί ουσιαστικά μια κοινότητα, όπου οι χρήστες μπορούν να συνεισφέρουν και να εξελίξουν την τεχνολογία, με αποτέλεσμα ταχύτερη καινοτομία και βελτιώσεις στο εκάστοτε λογισμικό.

Η DeepSeek επισημαίνει ότι, προσφέροντας το λογισμικό της δωρεάν, επιτρέπει σε μικρότερες εταιρείες και ανεξάρτητους προγραμματιστές να επωφεληθούν από τις δυνατότητες της τεχνητής νοημοσύνης χωρίς το κόστος των μεγάλων ανταγωνιστών.

Το γεγονός ότι η εταιρεία έχει αναπτύξει το μοντέλο R1 με κόστος κάτω των 6 εκατομμυρίων δολαρίων, σε αντίθεση με τα περισσότερα μοντέλα του ανταγωνισμού που απαιτούν εκατοντάδες εκατομμύρια, καθιστά την τεχνολογία της επαναστατική και πιο προσιτή για το ευρύ κοινό.

Η επιλογή να διατεθεί η εφαρμογή της DeepSeek σε περιβάλλον ανοιχτού κώδικα, μπορεί να αναδείξει νέους ηγέτες στον τομέα της τεχνητής νοημοσύνης -όχι μόνο την ίδια- και να ενισχύσει την καινοτομία μέσω της συνεργασίας και της ελεύθερης πρόσβασης στις AI τεχνολογίες. Ενδεχομένως βρισκόμαστε σε μια μεταβατική περίοδο, όπου το status quo της τεχνητής νοημοσύνης κλονίζεται στη βάση του, με την DeepSeek να αντλεί σημαντικό μερίδιο αγοράς από τις Big Tech εταιρείες.

Exit mobile version