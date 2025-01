Ενώ το chatbot της κινεζικής startup DeepSeek έχει συγκεντρώσει το ενδιαφέρον της βιομηχανίας της τεχνολογίας, και παράλληλα έχει στρέψει τα βλέμματα της διεθνούς κοινότητας επάνω της, λόγω της αναστάτωσης που προκάλεσε στον τομέα της τεχνητής νοημοσύνης και το χρηματιστήριο, ο επίσης κινεζικός κολοσσός Alibaba απαντά τώρα δυναμικά.

Την Τετάρτη, η εταιρεία κυκλοφόρησε το νέο μοντέλο τεχνητής νοημοσύνης της, το Qwen 2.5-Max, το οποίο, όπως ισχυρίζεται, ξεπερνά το πολυσυζητημένο μοντέλο R1 της DeepSeek, το οποίο με τη σειρά του ξεπερνά το «συλλογιστικό» μοντέλο o1 και το ChatGPT-4o της OpenAI, τα οποία αφήνουν πίσω τους το Llama της Meta και κονταροχτυπιούνται με το Claude 3.5 Sonnet της Anthropic.

Το Qwen 2.5-Max εκπαιδεύτηκε με περισσότερα από 20 τρισεκατομμύρια «tokens», δηλαδή τις μεμονωμένες πληροφορίες και τα νοήματα που επεξεργάζεται ένα μοντέλο, και βελτιστοποιήθηκε μέσω τεχνικών αιχμής, όπως το Supervised Fine-Tuning (SFT) και το Reinforcement Learning from Human Feedback (RLHF).

Η Alibaba σχεδιάζει να ενσωματώσει το Qwen 2.5-Max στις cloud υπηρεσίες της και σε επιχειρηματικές εφαρμογές, δίνοντας στις εταιρείες πρόσβαση σε εξελιγμένες δυνατότητες AI.

Με το API του Qwen 2.5-Max να είναι πλέον διαθέσιμο μέσω του Alibaba Cloud και το μοντέλο ανοιχτό προς εξερεύνηση και δοκιμές μέσω της πλατφόρμας Qwen Chat, το chatbot της εταιρείας, η Alibaba καλεί προγραμματιστές και μηχανικούς τεχνητής νοημοσύνης να διαπιστώσουν τις δυνατότητές του από πρώτο χέρι.

Η επιλογή της Alibaba να λανσάρει το νέο της μοντέλο την πρώτη ημέρα του Κινεζικού Νέου Έτους –όταν οι περισσότεροι Κινέζοι είναι σε άδεια- αποδεικνύει την πίεση που έχει δημιουργήσει η ραγδαία άνοδος της DeepSeek, όχι μόνο στους διεθνείς ανταγωνιστές της αλλά και στο εσωτερικό της Κίνας.

Οι επιδόσεις του Qwen 2.5-Max αξιολογήθηκαν έναντι κορυφαίων μοντέλων τεχνητής νοημοσύνης, με εντυπωσιακά αποτελέσματα.

Οι μετρήσεις περιλάμβαναν δημοφιλή benchmarks, όπως το MMLU-Pro για επίλυση προβλημάτων πανεπιστημιακού επιπέδου, το LiveCodeBench για αξιολόγηση δεξιοτήτων προγραμματισμού, το LiveBench για γενικές ικανότητες και το Arena-Hard για προτιμήσεις απλών χρηστών.

«Το Qwen 2.5-Max ξεπερνά σχεδόν σε όλους τους τομείς τα GPT-4o, DeepSeek-V3 και Llama-3.1-405B», ανακοίνωσε η cloud ομάδα της Alibaba στο επίσημο WeChat κανάλι της, αναφερόμενη στα πιο προηγμένα AI μοντέλα ανοιχτού κώδικα των OpenAI και Meta.

The burst of DeepSeek V3 has attracted attention from the whole AI community to large-scale MoE models. Concurrently, we have been building Qwen2.5-Max, a large MoE LLM pretrained on massive data and post-trained with curated SFT and RLHF recipes. It achieves competitive… pic.twitter.com/oHVl16vfje

— Qwen (@Alibaba_Qwen) January 28, 2025