تحديات تكلفة تطوير نماذج الذكاء الاصطناعي التوليدي.. من الرقائق إلى تصنيف البيانات
تُعتبر عملية تصميم وتطوير نماذج الذكاء الاصطناعي التوليدي مثل "تشات جي بي تي" من العمليات الضخمة التي تتطلب تكاليف ضخمة، قد تصل إلى مئات الملايين من الدولارات. وفقًا لتوقعات المحللين، من المتوقع أن تستمر هذه التكاليف في الارتفاع لتصل إلى مليار دولار في السنوات القليلة المقبلة. يأتي هذا الارتفاع نتيجة للحاجة المستمرة لتحديث النماذج وضمان مواكبتها لأحدث التطورات التقنية.
العبء المالي لاستخدام الرقائق الرسومية
يذهب جزء كبير من تكاليف تطوير نماذج الذكاء الاصطناعي التوليدي إلى النفقات المخصصة لشراء الرقائق الرسومية فائقة القوة. تُنتج هذه الرقائق من قبل شركات مثل إنفيديا، ويصل سعر الواحدة منها إلى ما يتجاوز 30 ألف دولار أميركي. نماذج مثل "تشات جي بي تي" قد تحتاج إلى عشرات الآلاف من هذه الرقائق لضمان تقديم أداء سريع ودقيق، مما يزيد من تكاليف العملية بشكل كبير.
وبجانب تكاليف الرقائق، تواجه الشركات التي تطور وتدرب نماذج الذكاء الاصطناعي التوليدي تكاليف باهظة أخرى تتعلق بمهمة "تصنيف البيانات". هذه المهمة تُعد شاقة، حيث تتطلب تدريب الذكاء الاصطناعي التوليدي على استخدام البيانات بمساعدة البشر. يتطلب هذا التصنيف ملاحظات نوعية من البشر لضمان تصنيف البيانات بشكل صحيح وتجنب الأخطاء.
تصنيف البيانات: عملية معقدة ومكلفة
تتضمن عملية تصنيف البيانات، التي يُعرف بها نماذج الذكاء الاصطناعي الكبيرة مثل "تشات جي بي تي" و"جيميني"، تمرينًا يسمى Reinforcement Learning Human Feedback. خلال هذا التمرين، يقدم البشر ملاحظات على البيانات التي تُزوَّد بها النماذج لضمان تصنيفها بشكل دقيق. وهذا يتطلب عمالة مكثفة، خاصة عندما يتعلق الأمر بـ "تصنيف البيانات الفنية للغاية"، مثل بيانات القانون والتمويل والرعاية الصحية.
تكاليف عالية للتصنيف المتخصص
تعتبر عملية "تصنيف البيانات" السبب الرئيسي لارتفاع تكاليف تطوير نماذج الذكاء الاصطناعي التوليدي. عندما يتطلب التصنيف وجود خبراء في مجالات متخصصة، مثل الطب أو القانون، فإن النفقات ترتفع بشكل كبير. الشركات تحتاج لتوظيف أطباء ومحامين وعلماء متخصصين، مما يساهم في زيادة التكاليف بشكل ملحوظ.
الأثر الكبير لتصنيف البيانات على الميزانية
وفقًا لما أوردته مجلة "فورتشن"، فإن تصنيف البيانات أمر صعب ومكلف، ولكنه ضروري نظرًا للعائد المرتفع الذي يمكن تحقيقه من هذه العملية. يشير الرئيس التنفيذي لمنصة Lightning AI إلى أن البيانات المرتبطة بأمور عالية المخاطر تتطلب تصنيفًا من مستوى الخبراء، بينما يكشف أليكس راتنر، الرئيس التنفيذي لشركة Snorkel AI، أن الشركات قد تنفق ملايين الدولارات على تصنيف البيانات، حيث يمكن أن تستهلك هذه المهمة 80 في المئة من وقت وميزانية الذكاء الاصطناعي.
أثر تصنيف البيانات على الشركات الناشئة
يشير نيل شاه، الرئيس التنفيذي لشركة CareYaya، إلى أن تصنيف البيانات يمكن أن يشكل عبئًا كبيرًا على الشركات الناشئة في مجال التكنولوجيا، وخاصة في مجالات مثل الرعاية الصحية. شركته حصلت على منحة لتطوير مدرب رعاية ذكي لمرضى الخرف، ولكن تكاليف تصنيف البيانات ارتفعت بنسبة 40 في المئة على مدار العام الماضي، مما أثر بشكل كبير على الميزانية.
عملية تصنيف البيانات: الأساسيات
وفقًا لمهندس الاتصالات عيسى سعد الدين، تعد عملية "تصنيف البيانات" من العناصر الأساسية في تطوير نماذج الذكاء الاصطناعي. تُشير هذه العملية إلى تنظيم البيانات ضمن فئات أو مجموعات محددة، وهو أمر حاسم لنجاح النماذج الذكية وتحسين أدائها. على الرغم من أن مهمة تصنيف البيانات قد تبدو تقنية، إلا أنها في جوهرها عملية تنظيمية.
التكاليف المرتفعة لتصنيف البيانات
يوضح سعد الدين أن "تصنيف البيانات" يساعد في تنظيم المعلومات الكبيرة والمعقدة لتصبح أسهل في الفهم من قبل الآلة. ومع ذلك، فإن تكلفة هذه العملية يمكن أن تكون مرتفعة، حيث تتراوح من 2 دولار في الساعة لتصل إلى مئات الدولارات في بعض الأحيان. تصنيف بيانات متخصصة، مثل تلك المرتبطة بالطب والأدوية، يتطلب توظيف مئات الآلاف من الخبراء، مما يزيد من التكلفة بشكل كبير.
وتشير الكاتبة باتريسيا جلاد إلى أن تكلفة تصنيف البيانات لا يمكن تحديدها بدقة بسبب عوامل متعددة، مثل حجم البيانات ونوعها والأدوات المستخدمة. حجم البيانات العالمية وصل إلى حوالي 175 زيتابايت في عام 2024، مما يعني أن تصنيف هذه البيانات يتطلب توظيف ملايين الأشخاص، وبالتالي فإن التكلفة الإجمالية ستكون باهظة.
البدائل للتصنيف البشري
تُشير جلاد إلى إمكانية الاعتماد على التصنيف الآلي للبيانات بدلاً من البشري باستخدام خوارزميات الذكاء الاصطناعي. رغم أن هذه الطريقة تتطلب استثمارًا في البرمجيات، إلا أنها تواجه مخاطر كبيرة، مثل عدم دقة التصنيف والأخطاء التي قد ترتكبها الآلة. لذلك، يظل التصنيف البشري هو الخيار الأفضل رغم تكلفته العالية.
وتؤكد جلاد أن التكلفة التي تدفعها الشركات لتصنيف البيانات يدويًا تساهم في تحسين دقة النماذج في التنبؤ واتخاذ القرارات، مما يعزز القدرة التنافسية للشركات. تصنيف البيانات بدقة يمكن أن يؤدي إلى تطوير منتجات وخدمات مبتكرة، ويحقق عوائد مالية مرتفعة على المدى الطويل.