أطلقت شركة DeepSeek الصينية النسخ التجريبية من نموذجها الجديد DeepSeek V4، وهو ما يمثل أقوى منصة مفتوحة المصدر تقدمها الشركة حتى الآن. هذه الخطوة تأتي رغم التحديات الكبيرة التي تواجهها الشركة بسبب قيود الوصول إلى تقنيات Nvidia المتقدمة. وبحسب تقارير بلومبرغ، فإن هذا الإطلاق يشعل حرب أسعار شرسة في قطاع الذكاء الاصطناعي الصيني، حيث تسعى DeepSeek لتقليل التكاليف لتحدي العمالقة في وادي السيليكون مثل OpenAI وAnthropic.
يتوفر DeepSeek V4 في إصدارين: الأول هو V4-Pro الضخم الذي يضم 1.6 تريليون Parameter (يعمل منها 49 ملياراً فقط عند الطلب)، والثاني هو V4-Flash الأخف بـ 284 مليار Parameter. الميزة الأبرز هنا هي 1-million-token context window، وهي قفزة هائلة مقارنة بالإصدارات السابقة. هذا الطول الاستثنائي للسياق، الذي تدعمه ابتكارات مثل Hybrid Attention Architecture وCompressed Sparse Attention وDynamic Sparse Attention، يسمح للنماذج بمعالجة كميات ضخمة من المعلومات في تفاعل واحد، مما يجعلها مثالية لمهام معقدة مثل تحليل الوثائق الطويلة أو مشاريع البرمجة الممتدة. وتوضح البيانات التقنية من مستندات DeepSeek أن هذه الميزات تخفض تكاليف Inference بشكل كبير، حيث يستهلك V4-Pro نحو 27% فقط من العمليات الحسابية FLOPs و10% من ذاكرة KV cache مقارنة بالإصدار السابق.
يرى الخبراء، ومنهم روبرت ليا من بلومبرغ إنتليجنس، أن ما يثير الإعجاب في V4 هو قدرته على تقديم أداء من الفئة الأولى دون الحاجة لـ "بهرجة" تقنية غير ضرورية. وبسبب قيود التصدير الأمريكية على رقائق Nvidia، ركزت DeepSeek على رفع الكفاءة عبر تصميم Mixture-of-Experts (MoE)، الذي يفعل جزءاً بسيطاً فقط من الـ Parameters لكل استعلام، إلى جانب تحسينات مثل Manifold-Constrained Hyper-Connections لضمان استقرار التدريب، وMuon Optimizer لتسريع عملية التعلم على أكثر من 32 تريليون Token. وتظهر اختبارات الأداء أن النموذج يقلص الفجوة مع الرواد في البرمجيات المغلقة في مجالات البرمجة والاستنتاج (Reasoning)، حيث يتأخر عنهم بفترة تتراوح بين 3 إلى 6 أشهر فقط، وبتكلفة لا تقارن.
يقدم النموذج أيضاً ثلاثة أنماط للتفكير: نمط Non-think للمهام السريعة، وThink High للتحليل الدقيق، وThink Max للأداء القصوى، مما يمنح المستخدمين تحكماً دقيقاً في السرعة والعمق. وتمتد قدرات Multimodal الأصلية لتشمل دعماً مؤكداً لتوليد النصوص، وفهم الصور والفيديو، وتوليد الصور وإنشاء الفيديو، مع إمكانات في معالجة الصوت لا تزال في طور الظهور. وبحسب تقارير DataCamp وHugging Face، فإن هذه الخصائص تجعل V4 أداة مرنة للمطورين والشركات على حد سواء.
تكتسب هذه الانطلاقة أهميتها من سعي الصين لمنافسة الهيمنة الأمريكية في مجال الذكاء الاصطناعي، وهو ما يؤثر على المنافسة العالمية عبر توفير نماذج مفتوحة المصدر وعالية الجودة بتكلفة منخفضة. المطورون حول العالم يمكنهم الآن الوصول للنموذج عبر منصات مثل Hugging Face، بينما تستفيد الشركات من عمليات Inference أرخص وأكثر كفاءة، وهو ما قد يعيد تشكيل أسعار الـ API ومعدلات تبني هذه التقنيات. الخطوات القادمة تشمل الإطلاق الكامل، وتوسيع تكامل الـ API، واختبار النموذج في سيناريوهات واقعية مثل Agentic workflows وتطوير التطبيقات، حيث تشير التقييمات الأولية إلى إمكانات قوية رغم وجود بعض المفايضات في الأداء مع السياقات الطويلة جداً. وتعد حرب الأسعار الحالية إشارة واضحة على تصاعد وتيرة الابتكار، مما يضع ضغوطاً حقيقية على الشركات الكبرى للرد على هذا التحدي.