أخبار تقنيةتقنيةتكنولوجياشروحاتمراجعات تقنيةمقالات معلوماتية

عندما يتعلق الأمر بنماذج اللغة الكبيرة ، هل يجب عليك البناء أو الشراء؟

عندما يتعلق الأمر بنماذج اللغة الكبيرة ، هل يجب عليك البناء أو الشراء؟

الصيف الماضي يمكن يتم وصفه فقط بأنه “صيف الذكاء الاصطناعي” ، خاصة مع وجود نماذج لغوية كبيرة تؤدي إلى دخول متفجر. لقد رأينا شبكات عصبية ضخمة مدربة على مجموعة ضخمة من البيانات التي يمكنها إنجاز مهام مبهرة للغاية ، ولا شيء أكثر شهرة من OpenAI’s GPT-3 ونسلها الأحدث ، ChatGPT.

تسارع الشركات من جميع الأشكال والأحجام عبر الصناعات لمعرفة كيفية دمج واستخراج القيمة من هذه التكنولوجيا الجديدة. لكن نموذج أعمال OpenAI لم يكن أقل تحولية من مساهماته في معالجة اللغة الطبيعية. على عكس كل إصدار سابق تقريبًا من الطراز الرئيسي ، لا يأتي هذا الإصدار بأوزان مفتوحة المصدر محددة مسبقًا – أي أن فرق التعلم الآلي لا يمكنها ببساطة تنزيل النماذج وضبطها لحالات الاستخدام الخاصة بهم.

بدلاً من ذلك ، يجب عليهم إما الدفع لاستخدامها كما هي ، أو الدفع لضبط النماذج ثم دفع أربعة أضعاف معدل الاستخدام لتوظيفها. بالطبع ، لا يزال بإمكان الشركات اختيار نماذج أخرى مفتوحة المصدر.

أدى هذا إلى ظهور شركة قديمة – ولكنها جديدة تمامًا على ML – السؤال: هل سيكون من الأفضل شراء أو بناء هذه التكنولوجيا؟

من المهم ملاحظة أنه لا توجد إجابة واحدة تناسب الجميع على هذا السؤال ؛ لا أحاول تقديم إجابة شاملة. أعني تسليط الضوء على إيجابيات وسلبيات كلا المسارين وتقديم إطار عمل قد يساعد الشركات على تقييم ما يناسبها مع توفير بعض المسارات الوسطى التي تحاول تضمين مكونات كلا العالمين.

الشراء: سريع ولكن مع وجود مخاطر واضحة

في حين أن المبنى يبدو جذابًا على المدى الطويل ، إلا أنه يتطلب قيادة ذات شهية قوية للمخاطرة ، بالإضافة إلى خزائن عميقة لدعم الشهية المذكورة.

لنبدأ بالشراء. هناك مجموعة كاملة من مزودي خدمة النموذج كخدمة الذين يقدمون نماذج مخصصة مثل واجهات برمجة التطبيقات ، يتم فرض رسوم عليها لكل طلب. هذا النهج سريع وموثوق ولا يتطلب سوى القليل من الإنفاق الرأسمالي المسبق أو بدونه. بشكل فعال ، هذا النهج يزيل مخاطر مشاريع التعلم الآلي ، خاصة للشركات التي تدخل المجال ، ويتطلب خبرة داخلية محدودة تتجاوز مهندسي البرمجيات.

يمكن بدء المشاريع دون الحاجة إلى موظفين ذوي خبرة في التعلم الآلي ، ويمكن أن تكون نتائج النموذج قابلة للتنبؤ بشكل معقول ، نظرًا لأنه يتم شراء مكون ML مع مجموعة من الضمانات حول المخرجات.

لسوء الحظ ، يأتي هذا النهج مصحوبًا بمزالق واضحة جدًا ، من بينها قابلية الدفاع المحدودة للمنتج. إذا كنت تشتري نموذجًا يمكن لأي شخص شراؤه ودمجه في أنظمتك ، فليس من المستبعد جدًا افتراض أن منافسيك يمكنهم تحقيق التكافؤ في المنتج بنفس السرعة والموثوقية. سيكون هذا صحيحًا ما لم تتمكن من إنشاء خندق في المنبع من خلال تقنيات جمع البيانات غير القابلة للتكرار أو الخندق السفلي من خلال عمليات الدمج.

علاوة على ذلك ، بالنسبة للحلول عالية الإنتاجية ، يمكن أن يكون هذا النهج مكلفًا للغاية على نطاق واسع. بالنسبة للسياق ، تبلغ تكلفة DaVinci من OpenAI 0.02 دولارًا لكل ألف رمز مميز. بافتراض أن 250 رمزًا مميزًا لكل طلب وردود مماثلة الحجم ، فإنك تدفع 0.01 دولارًا لكل طلب. بالنسبة لمنتج يحتوي على 100000 طلب في اليوم ، ستدفع أكثر من 300000 دولار في السنة. من الواضح أن التطبيقات ذات النصوص الثقيلة (محاولة إنشاء مقال أو الدخول في محادثة) ستؤدي إلى تكاليف أعلى.

يجب عليك أيضًا مراعاة المرونة المحدودة المرتبطة بهذا النهج: إما أن تستخدم النماذج كما هي أو تدفع أكثر بكثير لضبطها. ومن الجدير بالذكر أن النهج الأخير قد ينطوي على فترة “قفل” غير معلن عنها مع الموفر ، حيث سيتم الاحتفاظ بالنماذج الدقيقة في عهدتهم الرقمية ، وليس ملكك.

البناء: مرن وقابل للدفاع ، لكنه مكلف ومحفوف بالمخاطر

من ناحية أخرى ، يتيح لك بناء التكنولوجيا الخاصة بك التحايل على بعض هذه التحديات.

 

عندما يتعلق الأمر بنماذج اللغة الكبيرة ، هل يجب عليك البناء أو الشراء؟

#عندما #يتعلق #الأمر #بنماذج #اللغة #الكبيرة #هل #يجب #عليك #البناء #أو #الشراء