كشفت Google Cloud عن الجيل الثامن من وحدات معالجة Tensor، وقدمت شريحتين متخصصتين في الذكاء الاصطناعي: TPU 8t المخصصة لتدريب النماذج الضخمة، و TPU 8i المصممة لعمليات الـ Inference السريعة. هذه الخطوة، التي أُعلن عنها في مؤتمر Google Cloud Next، تأتي لتلبية الاحتياجات المتزايدة لـ AI agents والمهام المعقدة، حيث تهدف جوجل من هذه الشرائح إلى تقديم أداء وكفاءة أعلى، مما يضعها في موقع المنافسة المباشرة مع هيمنة Nvidia في سوق الأجهزة، دون التخلي تماماً عن رائدة الصناعة. وبحسب TechCrunch، تصل سرعة هذه الوحدات الجديدة في تدريب نماذج الذكاء الاصطناعي إلى ثلاثة أضعاف الأجيال السابقة، مع تحسن بنسبة 80% في الأداء مقابل التكلفة، وقدرة على التوسع لتصل إلى أكثر من مليون شريحة في Cluster واحد.
تبرز TPU 8t كقوة ضاربة في عمليات التدريب، حيث جرى تحسينها للتعامل مع نماذج frontier الضخمة التي تحتوي على تريليونات من الـ parameters، مثل النماذج التي تشغل Gemini. توفر الشريحة قدرة حسابية تصل إلى 121 exaflops باستخدام دقة FP4 لتقليل اختناقات الـ memory bandwidth، وتضم ذاكرة HBM مشتركة بسعة 2 petabytes ضمن superpod يحتوي على 9,600 شريحة، وهو ما يمثل قفزة في الأداء بمقدار ثلاثة أضعاف عن الجيل السابق. وتوضح التفاصيل التقنية من جوجل كيف يمنع هذا التصميم توقف تدفق البيانات عبر ابتكارات مثل التخزين المدمج بسعة 10 terabytes في الثانية والوصول المباشر للشريحة، مع دمج معالجات Axion المبنية على معماري Arm لإزالة أي عوائق في الـ host. أما TPU 8i فهي مخصصة للـ inference، وهي المرحلة التي تستجيب فيها النماذج لطلبات المستخدمين في الوقت الفعلي، حيث تتميز بذاكرة SRAM أكبر بثلاث مرات لتحسين الـ KV caches، ومحرك جديد لتسريع العمليات الجماعية بهدف تقليل الـ latency في المهام ذات السياق الطويل، وهو أمر أساسي لـ AI agents التي تحتاج للتفكير والتخطيط وتنفيذ خطوات متعددة.
يعكس هذا الإطلاق تحولاً جذرياً في بنية الذكاء الاصطناعي التحتية، في وقت يخضع فيه استهلاك الكهرباء وموارد الحوسبة لعمليات تقنين مع تزايد الطلب من مختبرات الأبحاث. وبحسب تقرير VentureBeat، يدفع أغلب مطوري الذكاء الاصطناعي "هوامش ربح مرتفعة" لشركة Nvidia مقابل وحدات الـ GPU، وهو ما يرفع القيمة السوقية للشركة، لكن جوجل تحاول تجاوز هذه التكلفة الإضافية عبر تطوير وحدات TPU الخاصة بها. تعد هذه الشرائح بتقليل استهلاك الطاقة والتكاليف على العملاء، مما يتيح قدرة حوسبة أكبر لمهام مثل Agentic AI—وهي الأنظمة الذاتية التي تعمل بالنيابة عن المستخدمين—مع الحفاظ على التوافق مع معمارية AI Hypercomputer من جوجل. ويشير TechCrunch إلى أن جوجل لا تزال توفر أجهزة Nvidia في سحابتها حالياً، لتجمع بذلك بين كفاءة شرائحها الخاصة ومرونة الأنظمة المتاحة في السوق.
الرهان كبير اليوم لمزودي خدمات السحاب ومطوري الذكاء الاصطناعي حول العالم. هذه الوحدات قد تسرع الابتكار في مجالات مثل اكتشاف الأدوية ونمذجة المناخ والخدمات المخصصة، عبر جعل تدريب ونشر النماذج الضخمة أكثر استدامة وأقل تكلفة. الشركات التي تعتمد على Google Cloud، من الشركات الناشئة وحتى الشركات العملاقة، ستستفيد من خفض التكاليف وتسريع أداء الـ agents، مما قد يقلل الفجوة أمام المنافسين المعتمدين كلياً على Nvidia. من المقرر توفير الشرائح بشكل عام في وقت لاحق من هذا العام، ويمكن للمطورين الآن طلب التفاصيل للبدء في التجهيز. ومع تطور مهام الذكاء الاصطناعي نحو تعاون عدة agents معاً، يشير توجه جوجل نحو الأجهزة المتخصصة إلى اتجاه أوسع في الصناعة: تفضيل الشرائح المصممة لغرض محدد على الحلول العامة، مما يعد بكفاءة قد تغير اقتصاديات الحوسبة بالكامل.