في سباق شرائح الذكاء الاصطناعي، يصبح أكبر عملاء Nvidia منافسين
قد تكون قائمة الشركات التي تصنع التقنيات التي يمكن أن تقلل من اعتماد الصناعة على Nvidia أطول من قائمة التسوق لصنع mole poblano التقليدي.
ومن بين شركات التكنولوجيا الكبرى، تم طرح Meta أربعة جديدة شرائح الذكاء الاصطناعي التوليدية في مارس والتي قالت إنها ستؤدي إلى توفير التكاليف مع الاستمرار في التنافس على المستوى التكنولوجي مع وحدات معالجة الرسومات الخاصة بالمنافسين. قبل شهرين، مايكروسوفت أطلقت شريحة Maia 200 الخاصة بها، والتي تركز على الاستدلال (مهام مثل الإجابة على الاستفسارات وإنشاء صور شخصية بأسلوب Studio Ghibli). وفي الوقت نفسه، تخطط SpaceX لاستثمار ما بين 55 مليار دولار و119 مليار دولار في تصميم وتصنيع شرائح الذكاء الاصطناعي بمساعدة إنتل.
وهذا لا يشمل جوجل وأمازون؛ OpenAI وAnthropic، الشركتان اللتان أنشأتا أشهر روبوتات الدردشة في مجال الذكاء الاصطناعي؛ Cerebras، التي جمعت 5.5 مليار دولار في أكبر طرح عام أولي لهذا العام حتى الآن، والشركات الناشئة التي تحاول اقتحام السوق.
لديهم نقطة دخول قابلة للتطبيق: الآن بعد أن تم إيقاف تشغيل الذكاء الاصطناعي، فإن أنواع الرقائق التي ستحافظ على زخمه تختلف عن تلك التي أعطته الدفعة الأولى للأمام.
صرح شا ربيع، المؤسس المشارك والرئيس لشركة Majestic Labs، لصحيفة The Daily Upside أن الذكاء الاصطناعي وصل إلى نقطة تحول، مع تركيز المزيد من العمل على الاستدلال. تتخصص وحدات معالجة الرسوميات مثل Nvidia في تدريب الذكاء الاصطناعي، وتبحث الشركات عن خيارات جديدة يمكنها تشغيل الذكاء الاصطناعي بكفاءة أكبر بعد تدريب النماذج.
بالنسبة لشركة Majestic Labs، فإن أفضل طريقة لجعل الذكاء الاصطناعي أكثر كفاءة هي إيجاد طريقة فعالة من حيث التكلفة لزيادة سعة الذاكرة. أصبحت الذاكرة مشكلة باهظة الثمن بالنسبة لقطاع الذكاء الاصطناعي، الذي يواجه نقصًا في الذاكرة ذات النطاق الترددي العالي (HBM) اللازمة لتشغيل النماذج التي أنفق المليارات لإنشائها.
صنع الذاكرة
وأوضح ربيع أن وحدات معالجة الرسوميات من Nvidia تتمتع بقدرة حسابية مذهلة، ولكنها تحتوي على ذاكرة قليلة نسبيًا. وهذا يخلق عنق الزجاجة: “كل تلك الحوسبة تبقى خاملة، لأنك غير قادر على تغذية المحركات الحسابية بالبيانات التي تحتاجها للتشغيل،” كما قال. “لا يقوم الحساب بأي شيء لأنه ينتظر وصول البيانات من الذاكرة.”
يعتقد Majestic أن معظم شرائح الاستدلال الجديدة لا تكفي لحل مشكلة الذاكرة. نظام خادم بروميثيوس الخاص به، الاستفادة وقال ربي إن رقاقتها الخاصة توفر سعة ذاكرة أكبر بألف مرة من وحدات معالجة الرسوميات مثل وحدة Nvidia. يعتمد النظام على ذاكرة الوصول العشوائي الديناميكي (DRAM) الأقل تكلفة بدلاً من HBM.
وبينما عملت الشركات على إنشاء شرائح ثلاثية الأبعاد ذات طبقات مثل لازانيا السيليكون لتعبئة المزيد من الذاكرة وحل مشكلة الإمداد، يؤكد ربيع أن هذه الرقائق يمكن أن تعمل بحرارة شديدة، لأن التبريد يجب أن يخترق طبقات متعددة.
يعد الحفاظ على برودة الرقائق بندًا كبيرًا آخر في ميزانيات الشركات. عندما يتحدث الناس عن الذكاء الاصطناعي الذي يستخدم ملايين الجالونات من الماء، فإنهم يتحدثون عن تبريد مراكز البيانات، والذي يتم عادةً عن طريق تبخير الماء في الهواء. يأتي الجيل القادم من رقائق الذكاء الاصطناعي، بما في ذلك رقائق Nvidia، مزودًا بحلول تبريد مبتكرة لخفض التكاليف بشكل أكبر.
أفضل معًا
لن تصبح وحدات معالجة الرسوميات من Nvidia قديمة بين عشية وضحاها. معظم الرقائق التي يصنعها المنافسون ليست بدائل لهم، وهم لا يحاولون أن يكونوا كذلك. وبدلاً من ذلك، غالبًا ما تكمل الموجة الجديدة من الرقائق عروض Nvidia، بحيث تتمكن الشركات من شراء عدد أقل منها بدلاً من إلغاء ميزانيات GPU الخاصة بها تمامًا.
يبدو أن Google و Amazon هما الأقرب إلى الوقوف على أصابع Nvidia حيث يحققان عشرات المليارات من الإيرادات المرتبطة بالرقائق:
تعمل شركة Google على تصنيع معالجات الذكاء الاصطناعي منذ أكثر من عقد من الزمن، وفي الشهر الماضي، قالت إنها ستنشئ شرائح متخصصة تفصل بين العمل الاستدلالي والتدريب على نماذج الذكاء الاصطناعي. يتم استخدام وحدات معالجة Tensor الخاصة بها من قبل Citadel Securities بالإضافة إلى Anthropic، والتي قامت مؤخرًا وقعت صفقة موسعة للاستفادة من سعة حوسبة تصل إلى عدة جيجاوات منها. وقالت شركة Broadcom، التي تساعد Google في تصنيع الرقائق، إن المنتجات حققت إيرادات تقدر بعشرات المليارات من الدولارات.
وفي الوقت نفسه، تصنع أمازون مجموعة من رقائق الذكاء الاصطناعي، وتسوق إحداها كبديل لـ Nvidia بأسعار معقولة. تحتوي شريحة Trainium الخاصة بها على بتمشيط بالمليارات، وفقًا للرئيس التنفيذي آندي جاسي. وافقت شركة Meta الشهر الماضي على استخدام عشرات الملايين من وحدات المعالجة المركزية Graviton من Amazon.
وفي تطور ذي صلة، قامت كل من جوجل وأمازون أشار في أواخر أبريل، كانوا يفكرون في بيع رقائقهم مباشرة للعملاء. في السابق، لم يكن من الممكن الوصول إليها إلا من خلال الخدمات السحابية الخاصة بالشركات.
لقد انضمت OpenAI إلى المعركة من خلال تحضير رقائق مصممة خصيصًا بالتعاون مع Broadcom، وورد أن Anthropic الشهر الماضي تفكر في تصميم رقائقها الخاصة.
الصين تدخل
العقول، التي تبني شرائح تركز على الاستدلال والتي تستخدمها كل من Amazon Web Services و OpenAI، قفزت بنسبة 68٪ يوم الخميس في اليوم الأول من التداول. وفي الوقت نفسه، اجتذبت شركة Groq (التي لا علاقة لها ببرنامج Grok chatbot التابع لشركة Elon Musk)، صفقة بقيمة 17 مليار دولار مع شركة Nvidia لتكنولوجيا الرقائق الخاصة بها. نفيديا هي التحضير ذكرت رويترز أن نسخة من شريحة Groq يمكن بيعها في الصين، على الرغم من حظر رقائق Nvidia الأكثر تقدمًا من البلاد بسبب مخاوف دفاعية.
ويحاول المنافسون الصينيون، مثل هواوي وكامبريكون، القيام بذلك يعرض بدائل نفيديا، ولكن كريس ميلر، مؤلف حرب الرقائق: الكفاح من أجل التكنولوجيا الأكثر أهمية في العالم، قال لصحيفة Daily Upside إنهم متخلفون بأميال عن Nvidia في القدرات التقنية والإنتاجية. وقال ميلر إن المنافسة المحلية أقوى بكثير، من عمالقة التكنولوجيا الكبرى والشركات الناشئة ذات البنية الاستدلالية القوية. وبالتالي، نفيديا تلتقط Groq.
ومع ذلك، فإن معظم عمالقة التكنولوجيا في القائمة الكبيرة من الشركات التي تصنع شرائحهم الخاصة يواصلون شراء وحدات معالجة الرسومات من Nvidia، وهذا قد يجعل الذكاء الاصطناعي أفضل على المدى الطويل. لإنشاء مجموعة تقنية نهائية لمراكز البيانات، تجمع الشركات بين أنواع متعددة من الرقائق ذات قوى خارقة متميزة (زمن الوصول المنخفض، والإنتاجية العالية، وما إلى ذلك). وقال ربيع إنه إذا حاولت الشركات استخدام نظام واحد فقط، “فسوف ينتهي بك الأمر إلى تقديم تنازلات ولن تكون عظيماً في أي منها. فأنت نوعاً ما تقوم بالمتوسط”.
لذلك، في حين أن ربيع يتوقع تغييرًا جذريًا في مرحلة ما، فإنه يعتقد أنه لا يزال هناك مجال لأكثر من مجرد Nvidia.


