كيفية اختيار أفضل بطاقة NVIDIA GPU للتعلم العميق
I. مقدمة في التعلم العميق وبطاقات NVIDIA GPU
A. أهمية بطاقات الرسوميات في التعلم العميق
أصبح التعلم العميق تقنية أساسية في مجال الذكاء الاصطناعي، حيث يمكن للآلات أن تتعلم وتنفذ المهام المعقدة بدقة تشبه البشر. في جوهر التعلم العميق، هناك شبكات عصبية اصطناعية تحتاج إلى كمية هائلة من القدرة الحسابية للتدريب والتنفيذ. في كثير من الأحيان، تواجه وحدات المعالجة المركزية (CPUs) صعوبة في مواكبة متطلبات التعلم العميق، مما أدى إلى ارتفاع استخدام وحدات معالجة الرسوميات (GPUs) كأجهزة مثلى لهذه الأعباء العمل.
تتفوق وحدات المعالجة الرسومية في الحسابات المتوازية العالية المطلوبة للتعلم العميق، مثل ضرب المصفوفات وعمليات التباين. من خلال استغلال عدد الأنوية الهائل والذاكرة عالية النقل المتاحة في الوحدات الحديثة لمعالجة الرسوميات، يمكن تدريب ونشر نماذج التعلم العميق بكفاءة أكبر بكثير مقارنةً بالحلول القائمة على CPUs فقط. كان ذلك هو الدافع الرئيسي وراء التقدم السريع والتبني الواسع النطاق للتعلم العميق في مجالات مختلفة، بما في ذلك رؤية الكمبيوتر ومعالجة اللغة الطبيعية والتعرف على الكلام.
B. نظرة عامة على تشكيلة بطاقات NVIDIA GPU المخصصة للتعلم العميق
كانت NVIDIA في طليعة تطوير بطاقات الرسوميات المستخدمة في التعلم العميق، حيث تقدم مجموعة شاملة من بطاقات الرسوميات المصممة لتلبية احتياجات التعلم العميق في المجتمع. من بطاقات الرسوميات عالية الأداء المخصصة لمحطات العمل إلى الخيارات الأكثر توفرًا للاستخدام الشخصي، توفر بطاقات الرسوميات الخاصة بـ NVIDIA مجموعة من الأداء والقدرات لتناسب متطلبات التعلم العميق المختلفة.
في هذا البرنامج التعليمي، سنتعرف على بنية وطرازات بطاقات NVIDIA GPU الرئيسية التي تناسب بشكل خاص تطبيقات التعلم العميق. سنستعرض التفاصيل الفنية والخصائص الأداء وحالات الاستخدام لهذه البطاقات، مما يساعدك على اتخاذ قرار مطّلع عند اختيار الأجهزة المثلى لمشاريع التعلم العميق الخاصة بك.
II. بنى بطاقات NVIDIA GPU المخصصة للتعلم العميق
A. بنية NVIDIA Volta
1. السمات الرئيسية والتحسينات عن البنى السابقة
تمثل بنية NVIDIA Volta ، التي ظهرت في عام 2017، قفزة هائلة في تصميم وحدات المعالجة الرسومية لأعباء العمل في التعلم العميق. تشمل بعض السمات الرئيسية والتحسينات عن البنى السابقة ما يلي:
- زيادة عدد أنوية CUDA: تتميز بطاقات Volta بعدد أنوية CUDA عالي بشكل كبير مقارنةً بالأجيال السابقة، مما يوفر قدرة حسابية أكبر.
- تحسين النظام الذاكرة: تستخدم بطاقات Volta ذاكرة HBM2 عالية النطاق العرض، مما يوفر نطاقًا أعلى بشكل كبير للذاكرة ووقت استجابة أقل مقارنةً بذاكرة GDDR5/X المستخدمة في البنى السابقة.
- تحسين الأداء في التعلم العميق: قدمت بنية Volta Tensor Core وحدة عتاد متخصصة مصممة لتسريع عمليات التعلم العميق مثل ضرب المصفوفات وعمليات التباين.
2. مكاسب الأداء والكفاءة لتطبيقات التعلم العميق
ترجمت التحسينات المعمارية في بنية Volta إلى تحسينات كبيرة في الأداء والكفاءة لأعباء العمل في التعلم العميق. أظهرت بطاقات الرسوميات المستندة إلى Volta، مثل NVIDIA V100 ، زيادات كبيرة في سرعة المهام التدريبية والمهام التوقعية مقارنةً بجيل الرسوميات السابقة.
على سبيل المثال، يمكن لبطاقة الرسوميات NVIDIA V100 تقديم أداء تعلم عميق يصل إلى 120 تيرافلوبس، وهو تحسين بنسبة أكثر من 5 أضعاف عن البنية السابقة Pascal من NVIDIA. يجعل هذا الزيادة في الأداء، جنبًا إلى جنب مع الكفاءة الحسابية المحسَّنة لبنية Volta، بطاقات Volta المستندة جذابة جدًا لكل من تدريب ونشر نماذج التعلم العميق.
3. Tensor Cores وتأثيرها في التعلم العميق
كانت مقدمة أنظمة Tensor Cores في بنية Volta نقلة نوعية في أداء التعلم العميق. تعد Tensor Cores وحدات عتاد متخصصة مصممة لتسريع عمليات ضرب المصفوفات والتجميع، وهي في جوهر العديد من خوارزميات التعلم العميق.
يمكن لـ Tensor Cores أن تنفذ هذه العمليات بدقة وكفاءة أعلى مقارنةً بأنوية CUDA التقليدية. تدعم نوعيات البيانات ذات الدقة المختلطة، مما يسمح باستخدام أنواع بيانات دقة أقل (مثل FP16 أو INT8) في حين الحفاظ على نتائج عالية الدقة، مما يعزز الأداء وكفاءة الطاقة بشكل إضافي.
يكون تأثير Tensor Cores على أعباء العمل في التعلم العميق كبيرًا. يمكن أن توفر زيادة في السرعة تصل إلى 12 مرة في التدريب وزيادة في السرعة تصل إلى 6 مرات في التوقع مقارنةً بالبنى السابقة من بطاقات الرسوميات بدون Tensor Cores.
B. بنية NVIDIA Turing
1. تقدم في تتبع الأشعة والرسوميات المعتمدة على الذكاء الاصطناعي
في حين كانت بنية Turing، التي ظهرت في عام 2018، مصممة أساسا لتعزيز تتبع الأشعة في الوقت الحقيقي وأداء الرسوميات، إلا أنها تضمنت أيضا عدة تحسينات ذات صلة بأعباء العمل في التعليم العميق.
قدمت بنية Turing وحدات RT Cores، وهي وحدات عتاد متخصصة مخصصة لتسريع عمليات تتبع الأشعة. بالإضافة إلى ذلك، قدمت بطاقات Turing Tensor Cores، مشابهة لتلك المقدمة في بنية Volta، لتوفير قدرات تسريع الذكاء الاصطناعي على مستوى العتاد.
2. Tensor Cores ودورها في التعلم العميق
تُعتبر Tensor Cores في بنية Turing تطورًا لـ Tensor Cores الموجودة في بنية Volta، مع العديد من التحسينات لتحسين أدائها وكفاءتها في مهام التعلم العميق.
تدعم Tensor Cores في Turing أنواع بيانات إضافية مثل INT8 و INT4، مما يوسع نطاق النماذج التعليم العميق التي يمكنها الاستفادة من تسريع العتاد. كما توفر أداءًا وموافرةً أفضل للبيانات عن بُعد مقارنةً بـ Tensor Cores الموجودة في بنية Volta.
3. مقارنة الأداء مع بنية Volta
في حين أن بنية Turing كانت تركز في المقام الأول على تحسينات الرسوميات وتتبع الأشعة، إلا أنها أظهرت زيادات في الأداء الملحوظة لأعباء العمل في التعلم العميق مقارنةً بالبنية السابقة من بنية Volta.
أظهرت تقييمات الأداء أن البطاقات القائمة على Turing، مثل NVIDIA RTX 2080 Ti، يمكنها تحقيق أداء أعلى بنسبة تصل إلى 50٪ في بعض المهام التعلم العميق مقارنةً ببطاقة NVIDIA V100 (قائمة على بنية Volta)، وخاصة في سيناريوهات الاستنتاج.
المزيج بين Tensor Cores وتحسين نظام الذاكرة وتحسينات معمارية أخرى في Turing يُساهم في تحسينات الأداء هذه، مما يجعل بطاقات Turing المبنية على الرسومات وتطبيقات التعلم العميق خيارًا مقنعًا لكل من الرسوميات في الوقت الحقيقي وتطبيقات التعلم العميق.
C. بنية NVIDIA Ampere
1. التغييرات المعمارية والتحسينات
تمثل بنية NVIDIA Ampere، التي ظهرت في عام 2020، الجيل الأحدث من تصميم بطاقات الرسوميات من NVIDIA، وتعمل على بناء نجاحات بنيتي Volta و Turing. تشمل بعض التغييرات المعمارية الرئيسية والتحسينات في Ampere ما يلي:
- زيادة عدد أنوية CUDA: تتميز بطاقات Ampere بعدد أنوية CUDA عالي بشكل كبير، مما يوفر قدرة حسابية أكبر.
- تحسين Tensor Cores: تم تحسين Tensor Cores في Ampere بتقديم معدل نقل أعلى ودعم موسّع لأنواع البيانات الإضافية، مثل BF16.
- تحسين النظام الذاكرة: تستخدم بطاقات Ampere ذاكرة HBM2E من الجيل التالي، وهي توفر عرض نطاق أعلى للذاكرة وقدرة أعلى مقارنةً بالأجيال السابقة.
- زيادة كفاءة الطاقة: تم تصميم بنية Ampere بتركيز على كفاءة الطاقة، مما يتيح أداءً أعلى مع الحفاظ على استهلاك الطاقة أو حتى تقليله.
2. Tensor Cores وقدراتها المحسَّنة
تمثل Tensor Cores في Ampere تقدمًا كبيرًا على Tensor Cores الموجودة في بنيتي Volta و Turing. بعض التحسينات الرئيسية تشمل:
- استمرارية أعلى: تتمكن Tensor Cores في Ampere من توفير معدل ناقلية أعلى يصل إلى ضعف ما كان موجودًا في الجيل السابق لعمليات التعلم العميق.
- دعم أنواع بيانات متعددة: بالإضافة إلى FP16 و INT8، تدعم Tensor Cores في Ampere أيضًا نوع البيانات BF16 (نقطة عائمة للدماغ)، والتي يمكن أن توفر فوائد أداء لبعض النماذج التعلم العميق.
- تحسين الكفاءة: يتعدى كفاءة Tensor Cores في Ampere مما يسمح بأداء أعلى ضمن نفس السعة الكهربائية.
هذه التحسينات لـ Tensor Cores، جنبًا إلى جنب مع التحسينات المعمارية الشاملة في Ampere، تُساهم في زيادات في الأداء الكبيرة في أعباء العمل في التعلم العميق.
3. زيادة في أداء تطبيقات التعلم العميق
أظهرت تقييمات الأداء أن بنية NVIDIA Ampere، الممثلة ببطاقة NVIDIA A100، يمكن أن تقدم تحسينًا في الأداء يصل إلى مرتين في مهام التدريب والتوقع للتعلم العميق مقارنةً بالبنية السابقة لبنية NVIDIA Volta.
يمكن أن يُنسب هذا الزيادة في الأداء إلى زيادة عدد أنوية CUDA وتعزيزات Tensor Cores وتحسين نظام الذاكرة والتحسينات المعمارية الأخرى في تصميم Ampere. هذه التحسينات تجعل بطاقات Ampere المبنية جذابة لمجموعة واسعة من تطبيقات التعلم العميق، من التدريب على نطاق واسع في مراكز البيانات إلى التوقعات في الوقت الحقيقي على الحواف.
III. طرازات بطاقات NVIDIA GPU للتعلم العميق
A. سلسلة NVIDIA Quadro RTX
1. نظرة عامة على سلسلة Quadro RTX
تعد سلسلة NVIDIA Quadro RTX سلسلة بطاقات الرسوميات الاحترافية التي يتم تصميمها من قبل الشركة للاستخدام في محطات العمل عالية الأداء وحالات الاستخدام في الشركات، بما في ذلك التعلم العميق وتطوير الذكاء الاصطناعي.
تتضمن سلسلة Quadro RTX عدة طرز، يتم توجيه كل منها لمتطلبات الأداء والميزات المختلفة. تم بناء هذه البطاقات على بنيتي Turing و Ampere، مما يقدم نطاقًا من القدرات ومستويات الأداء لتلبية الاحتياجات المتنوعة للسوق المهنية.
2. Quadro RTX 6000 و RTX 8000
a. المواصفات والقدرات
تعتبر بطاقات NVIDIA Quadro RTX 6000 و RTX 8000 الطرز الرئيسية في سلسلة Quadro RTX، حيث تم تصميمها لتوفير أداء استثنائي لأعباء العمل الأكثر تطلبًا في التعلم العميق وتطوير الذكاء الاصطناعي.
تشمل بعض المواصفات الرئيسية لهذه البطاقات:
- البنية التي تعتمد على Turing مع Tensor Cores
- ما يصل إلى 4,608 أنوية CUDA#حتى 48 جيجابايت من ذاكرة GDDR6 عالية النطاق دعم الميزات المتقدمة مثل عملية التتبع بالأشعة والرسومات الذكية المسرعة بواسطة الذكاء الاصطناعي
بإمكان هذه النماذج العالية المستوى من Quadro RTX تقديم أداء ممتاز لتدريب العمق واستدلاله، مما يجعل منها مناسبة تمامًا للاستخدام في محطات العمل المهنية ومعامل البحث والنشرة المستوى الأعمال.
ب- الحالات الاستخدام وتطبيقات الهدف
من بين الحالات الاستخدام المستهدفة بشكل أساسي Quadro RTX 6000 و RTX 8000 هي:
- تدريب وتطوير نماذج التعلم العميق
- تحليل وتصور البيانات المعتمدة على الذكاء الاصطناعي والذكاء الاصطناعي
- حوسبة ذات أداء عالي (HPC) والحوسبة العلمية
- الواقع الافتراضي (VR) وخلق محتوى الواقع المعزز (AR)
- تصور وتقديم الرسومات ثلاثية الأبعاد المهنية
تتم نشر هذه النماذج Quadro RTX غالبًا في محطات العمل المتخصصة ومزارع التقديم ومراكز البيانات حيث تكون الأداء الاستثنائي والميزات عالية المستوى مهمة لتطبيقات التعلم العميق والذكاء الاصطناعي الهامة.
ب. سلسلة NVIDIA GeForce RTX
1. نظرة عامة على تشكيلة GeForce RTX
تعد سلسلة NVIDIA GeForce RTX سلسلة بطاقات الرسومات الموجهة للمستهلك من الشركة ، التي توفر أيضًا قدرات مذهلة لأحمال العمل التعلم العميق والذكاء الاصطناعي. على الرغم من ألا تستهدف بشكل أساسي السوق المهنية ، إلا أن بطاقات GeForce RTX توفر توازنًا جذابًا بين الأداء والميزات والكفاءة من حيث التكلفة.
تتضمن تشكيلة GeForce RTX عدة نماذج ، تتراوح بين الخيارات متوسطة المدى المتوسطة إلى البطاقات المبتكرة عالية الأداءة. تتم بناء هذه وحدات المعالجة الرسومية على الهندسة المعمارية تورينج وأمبير ، مما يجلب الميزات المتقدمة والأداء إلى السوق المستهلك.
2. GeForce RTX 3080 و RTX 3090
أ- المواصفات والقدرات
تعتبر NVIDIA GeForce RTX 3080 و RTX 3090 هما النماذج الرئيسية الحالية في سلسلة GeForce RTX ، حيث توفر أداءً استثنائيًا لكلا أحمال العمل الألعاب وتعلم العمق.
تشمل بعض المواصفات الرئيسية لهذه وحدات معالجة الرسومات ما يلي:
- هندسة أمبير المستندة إلى التكامل مع محولات Tensor Cores المحسنة
- تصل إلى 10،496 (RTX 3090) و 8،704 (RTX 3080) موجة CUDA
- ما يصل إلى 24 جيجابايت (RTX 3090) و 10 جيجابايت (RTX 3080) من ذاكرة GDDR6X عالية النطاق
- دعم التعرف التلقائي على العصايا بالزمن الحقيقي والرسومات المسرعة بواسطة الذكاء الاصطناعي
تتمتع هذه النماذج القوية من GeForce RTX بقدرة مذهلة على تقديم أداء رائع لمهمات تدريب واستدلال التعلم العميق ، متنافسة وأحيانًا تفوق قدرات سلسلة Quadro RTX التي تكلف أكثر.
ب- مقارنة الموديلات مع نماذج Quadro RTX
على الرغم من أن سلسلة Quadro RTX مستهدفة بشكل رئيسي للحالات الاستخدام المهنية والمؤسسية ، إلا أن NVIDIA GeForce RTX 3080 و RTX 3090 توفر بديلا جذابا لأحمال العمل التعلم العميق.
بالمقارنة مع Quadro RTX 6000 و RTX 8000 ، يوفر GeForce RTX 3080 و RTX 3090 أداءً مماثلًا أو حتى أفضل في العديد من مقاييس التعلم العميق ، وغالبًا ما يكون بتكلفة أقل بكثير. هذا يجعلها خيارًا جذابًا للباحثين الفرديين والفرق الصغيرة والشركات الناشئة التي تعمل على مشاريع التعلم العميق.
ج- مناسبة النماذج للتعلم العميق
تعد NVIDIA GeForce RTX 3080 و RTX 3090 مناسبة للغاية لمجموعة واسعة من تطبيقات التعلم العميق ، بما في ذلك:
- تدريب نماذج الشبكة العصبية المعقدة
- نشر نماذج التعلم العميق للاستدلال في الوقت الحقيقي
- تسريع أنابيب معالجة وإغناء البيانات الجدولة
- التجربة والتصميم الأولي لهندسات التعلم العميق الجديدة
بأدائها المذهل وسعة ذاكرتها ودعمها لميزات متقدمة مثل Tensor Cores ، يمكن لنماذج GeForce RTX هذه أن توفر حلاً فعالاً من حيث التكلفة للعديد من أحمال العمل للتعلم العميق ، مما يجعلها خيارًا شائعًا بين مجتمع التعلم العميق.
C. وحدات معالجة الرسومات سلسلة A- (Ampere) من NVIDIA
1
شبكات التعلم العصبي التركيبية
شبكات التعلم العصبي التركيبية (CNNs) هي نوع متخصص من الشبكات العصبية التي تتناسب بشكل خاص مع معالجة وتحليل البيانات البصرية ، مثل الصور ومقاطع الفيديو. تستوحي CNNs من بنية القشرة المرئية في الدماغ البشري ، والتي تتألف من خلايا عصبية متصلة تستجيب لمناطق محددة في الحقل البصري.
وتتكون المكونات الرئيسية لـ CNN من:
-
الطبقات التباينية: تطبق هذه الطبقات مجموعة من الفلاتر القابلة للتعلم على صورة الإدخال ، حيث تستخرج كل فلترة خاصية محددة من الصورة. ناتج هذه العملية هو خريطة الميزة ، التي تمثل العلاقة المكانية بين هذه الميزات.
-
طبقات التجميع: تقلل هذه الطبقات من الحجم المكاني لخرائط الميزات ، مما يساعد على تقليل عدد المعلمات وكمية الحساب في الشبكة. التجميع الأكثر شيوعًا هو التجميع الأقصى ، الذي يختار القيمة القصوى من منطقة صغيرة في خريطة الميزات.
-
الطبقات الكاملة المتصلة: تشبه هذه الطبقات الطبقات في الشبكة العصبية التقليدية ، حيث يرتبط كل عصب في الطبقة بجميع الأعصاب في الطبقة السابقة. تستخدم هذه الطبقات لأداء المهمة النهائية للتصنيف أو التقدير.
إليك مثال لهندسة CNN بسيطة لتصنيف الصور:
import tensorflow as tf
from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import Conv2D, MaxPooling2D, Flatten, Dense
# اعرف النموذج
model = Sequential()
model.add(Conv2D(32, (3, 3), activation='relu', input_shape=(28, 28, 1)))
model.add(MaxPooling2D((2, 2)))
model.add(Conv2D(64, (3, 3), activation='relu'))
model.add(MaxPooling2D((2, 2)))
model.add(Conv2D(64, (3, 3), activation='relu'))
model.add(Flatten())
model.add(Dense(64, activation='relu'))
model.add(Dense(10, activation='softmax'))
# أجمع النموذج
model.compile(optimizer='adam',
loss='categorical_crossentropy',
metrics=['accuracy'])
في هذا المثال ، نعرف نموذجًا CNN يأخذ صورًا بالمقياس الرمادي 28x28 (شكل الإدخال هو (28، 28، 1)). يتكون النموذج من ثلاث طبقات تباينية ، يتبعها كل طبقة تجميع قصوى ، وطبقتين متصلتين بالكامل. تستخدم الطبقة النهائية وظيفة softmax لإنتاج توزيع احتمال عبر الفئات العشر الممكنة.
الشبكات العصبية المتكررة
شبكات العصبية المتكررة (RNNs) هي نوع من الشبكات العصبية التي تم تصميمها لمعالجة البيانات المتتابعة ، مثل النص والكلام أو بيانات التسلسل الزمني. على عكس الشبكات العصبية التقليدية للتغذية إلى الأمام ، يحتوي RNN على "ذاكرة" تسمح لها باستخدام المعلومات من المدخلات السابقة لمعلومات الإخراج الحالية.
تتكون المكونات الرئيسية لـ RNN من:
-
Hidden State: الحالة الخفية هي ناقلة تمثل الحالة الداخلية لـ RNN في الوقت المحدد. يتم تحديث هذه الحالة في كل خطوة زمنية بناءً على المدخل الحالي والحالة الخفية السابقة.
-
خلية: الخلية هي الجوهر الرئيسي للـ RNN ، حيث تأخذ المدخل الحالي والحالة الخفية السابقة كمدخلات ، وتنتج الحالة الخفية الحالية والإخراج.
-
Unrolling: غالبًا ما يتم "تمكين" الـ RNN مع مرور الوقت ، حيث يتم تطبيق نفس الخلية في كل خطوة زمنية ، والحالة الخفية تمر من خطوة زمنية إلى الأخرى.
إليك مثال على RNN بسيط لتكوين النص:
import tensorflow as tf
from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import Embedding, SimpleRNN, Dense
# اعرف النموذج
model = Sequential()
model.add(Embedding(input_dim=vocab_size, output_dim=256, input_length=sequence_length))
model.add(SimpleRNN(units=128))
model.add(Dense(vocab_size, activation='softmax'))
# أجمع النموذج
model.compile(optimizer='adam', loss='categorical_crossentropy', metrics=['accuracy'])
في هذا المثال ، نعرف نموذج RNN بسيط لتكوين النص. يتكون النموذج من طبقة تضمين ، طبقة SimpleRNN واحدة ، وطبقة إخراج كثيفة. تحول طبقة التضمين التسلسل الدخل لمؤشرات الكلمات إلى سلسلة من الأساليب الكثيفة ، التي يتم معالجتها بواسطة طبقة RNN. تستخدم الطبقة الكثيفة النهائية وظيفة softmax لإنتاج توزيع احتمال على مفردات اللغة.
ذاكرة LSTM القصيرة الأجل (LSTM)
ذاكرة LSTM (LSTM) هي نوع من شبكات العصبية المتكررة التي تهدف إلى معالجة مشكلة اختلاف التدرجات التي قد تحدث في RNNs التقليدية عندما يصبح طول التسلسل طويلًا جدًا. تقدم الذاكرة LSTM نوعًا جديدًا من الخلية يسمى خلية LSTM ، والتي لها بنية أكثر تعقيدًا من خلية RNN البسيطة.
تتكون المكونات الرئيسية لخلية LSTM من:
-
تحكم في النسيان: يحدد هذا البوابة المعلومات التي يجب نسيانها أو الاحتفاظ بها من الحالة الخفية السابقة والمدخل الحالي.
-
بوابة الإدخال: يحدد هذا البوابة المعلومات الجديدة التي يجب إضافتها إلى حالة الخلية الحالية من المدخل الحالي والحالة الخفية السابقة.
-
بوابة الإخراج: يحدد هذا البوابة المعلومات التي يجب استخدامها من المدخل الحالي والحالة الخفية السابقة وحالة الخلية الحالية لإنتاج الإخراج.
إليك مثالًا على نموذج LSTM لتصنيف التسلسل:
import tensorflow as tf
from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import Embedding, LSTM, Dense
# اعرف النموذج
model = Sequential()
model.add(Embedding(input_dim=vocab_size, output_dim=256, input_length=sequence_length))
model.add(LSTM(units=128))
model.add(Dense(num_classes, activation='softmax'))
# أجمع النموذج
model.compile(optimizer='adam', loss='categorical_crossentropy', metrics=['accuracy'])
في هذا المثال ، نعرف نموذج LSTM لتصنيف التسلسل. يتكون النموذج من طبقة تضمين ، طبقة LSTM واحدة ، وطبقة إخراج كثيفة. تحول طبقة التضمين التسلسل الدخل إلى سلسلة من البيانات الكثيفة ، التي يتم معالجتها بواسطة طبقة LSTM. تستخدم الطبقة الكثيفة النهائية وظيفة softmax لإنتاج توزيع احتمال على المفردات.
شبكات التصور العدائية (GANs)
شبكات التصور العدائية (GANs) هي نوع من نماذج التعلم العميق التي تستخدم لإنشاء بيانات جديدة ، مثل الصور أو النصوص ، التي تشبه البيانات التدريبية. تتكون GANs من شبكتين عصبيتين يتم تدريبهما في معارضة لبعضها البعض: شبكة مصدر وشبكة مميزة. مكونات جي آن الرئيسية هي:
- المُولّد: الشبكة المولّدة مسؤولة عن انتاج بيانات جديدة مشابهة لبيانات التدريب. وتأخذ متجه ضجيج طبقي عشوائي كإدخال وتخرج عينة مُولّدة.
- التمييز: الشبكة التمييزية مسؤولة عن تحديد ما إذا كانت العينة المعطاة حقيقية (من بيانات التدريب) أم مزيفة (تولّدت بواسطة المولّد). وتأخذ عينة كإدخال وتخرج احتمالية أن العينة حقيقية.
تتم تدريب شبكتي المولّد والتمييز بطريقة معادية، حيث يحاول المولّد خداع التمييز بالتفكير أن عيناته المُولَّدة حقيقية، في حين يحاول التمييز تصنيف العينات الحقيقية والمُولَّدة بدقة.
وفيما يلي مثال لـ GAN بسيطة لتوليد أرقام MNIST:
import tensorflow as tf
from tensorflow.keras.models import Sequential, Model
from tensorflow.keras.layers import Dense, Reshape, Flatten
from tensorflow.keras.optimizers import Adam
# تعريف المولّد
generator = Sequential()
generator.add(Dense(128, input_dim=100, activation='relu'))
generator.add(Dense(784, activation='tanh'))
generator.add(Reshape((28, 28, 1)))
# تعريف التمييز
discriminator = Sequential()
discriminator.add(Flatten(input_shape=(28, 28, 1)))
discriminator.add(Dense(128, activation='relu'))
discriminator.add(Dense(1, activation='sigmoid'))
# تعريف GAN
gan = Sequential()
gan.add(generator)
gan.add(discriminator)
discriminator.trainable = False
gan.compile(loss='binary_crossentropy', optimizer=Adam())
في هذا المثال، نعرّف GAN بسيطة لتوليد أرقام MNIST، حيث تأخذ شبكة المولّد متجه ضجيج 100 بعدية كإدخال وتخرج صورة رمادية 28x28. تأخذ شبكة التمييز صورة 28x28 كإدخال وتخرج احتمالية أن الصورة حقيقية (من بيانات التدريب). يتم تدريب نموذج GAN بشكل معاد على أن يحاول المولّد خداع التمييز بالتفكير أن عيناته المُولَّدة حقيقية.
الاستنتاج
في هذا البرنامج التعليمي، قمنا بشرح المفاهيم والهياكل الرئيسية لنماذج التعلم العميق المختلفة، بما في ذلك الشبكات العصبية التكرارية الحسابية (CNNs)، والشبكات العصبية المتتابعة (RNNs)، والذاكرة الطويلة القصيرة الأجل (LSTMs)، وشبكات الأعداء التوليدية (GANs). كما قدمنا أمثلة محددة وقصاصات الشفرة لتوضيح كيف يمكن تنفيذ هذه النماذج باستخدام مكتبات TensorFlow و Keras.
التعلم العميق هو مجال قوي ومتعدد الاستخدامات يمتلك تطبيقات عديدة في مجالات مثل الرؤية الحاسوبية ومعالجة اللغات الطبيعية وتعرف الكلام ونمذجة التوليد. ومع استمرار تطور هذا المجال، من المهم أن نبقى على اطلاع دائم باستخدامات وممارسات قياسية حديثة. نأمل أن يكون هذا البرنامج التعليمي قد قدم لك أساسًا راسخًا في التعلم العميق وألهمك لاستكشاف هذه التقنيات بشكل أعمق.