المرحلة الثالثة: البيانات وهندسة الميزات
أكثر من 70 وصفة عملية لهندسة الميزات في بايثون، دليل كامل يغطي المعالجة المسبقة للبيانات وإنشاء الميزات وتحويلها وتحسينها.
كتاب وصفات هندسة الميزات في بايثون: مقدمة تفصيلية
نظرة عامة
كتاب "Python Feature Engineering Cookbook" هو كتاب تقني متخصص صادر عن دار نشر Packt، يقدم أكثر من 70 وصفة عملية لإنشاء الميزات وهندستها وتحويلها، وذلك بهدف بناء نماذج التعلم الآلي. يستضيف مستودع الأكواد الخاص بالكتاب على GitHub، مما يوفر للمتعلمين أكوادًا عملية كاملة.
تعريف بالمؤلفة
سوليداد غالي هي كبيرة علماء بيانات ذات خبرة واسعة، تتمتع بأكثر من 10 سنوات من الخبرة في مؤسسات أكاديمية عالمية المستوى وشركات مرموقة. قامت ببحث وتطوير ونشر نماذج تعلم آلي تُستخدم في مطالبات التأمين، وتقييم مخاطر الائتمان، ومنع الاحتيال. حصلت سوليداد على جائزة قائد علوم البيانات في عام 2018، وتم اختيارها كواحدة من أصوات LinkedIn في مجال علوم البيانات والتحليلات في عام 2019.
أبرز مميزات المحتوى
تغطية المهارات الأساسية
يغطي هذا الكتاب الميزات المثيرة التالية:
- تبسيط مسار عمل هندسة الميزات: تبسيط عملية هندسة الميزات باستخدام حزم بايثون قوية.
- معالجة القيم المفقودة: إتقان تقنيات استيفاء القيم المفقودة.
- ترميز المتغيرات الفئوية: استخدام تقنيات متعددة لترميز المتغيرات الفئوية.
- استخراج ميزات النص: استخلاص رؤى بسرعة وكفاءة من النصوص.
- تطوير ميزات السلاسل الزمنية: تطوير ميزات من بيانات المعاملات وبيانات السلاسل الزمنية.
- تركيب الميزات: اشتقاق ميزات جديدة عن طريق دمج المتغيرات الموجودة.
- تحويل المتغيرات: فهم كيفية تحويل المتغيرات، وتقطيعها، وتحجيمها.
- إنشاء ميزات الوقت: إنشاء متغيرات معلوماتية من التواريخ والأوقات.
البنية التقنية
# هيكل الكود النموذجي
def get_first_cabin(row):
try:
return row.split()[0]
except:
return np.nan
المتطلبات التقنية
متطلبات البرمجيات
الفصل | البرمجيات المطلوبة | متطلبات نظام التشغيل |
---|---|---|
1-11 | Python 3.5+, توزيعة Anaconda, بيئة تطوير متكاملة (حسب التفضيل الشخصي) | Windows, Mac OS X, Linux (أي إصدار) |
المتطلبات المسبقة للتعلم
هذا الكتاب مناسب لمحترفي التعلم الآلي، ومهندسي الذكاء الاصطناعي، وعلماء البيانات، بالإضافة إلى مهندسي معالجة اللغة الطبيعية (NLP) والتعلم المعزز الذين يرغبون في تحسين وإثراء نماذج التعلم الآلي الخاصة بهم باستخدام أفضل الميزات. ستساعد المعرفة بالتعلم الآلي وبرمجة بايثون في فهم المفاهيم التي يغطيها الكتاب.
تنظيم المحتوى
هيكل الفصول
تم تنظيم جميع الأكواد في مجلدات، ويحتوي الكتاب على 11 فصلاً، مرتبة بترتيب طبيعي من الأساسي إلى المتقدم. يقدم كل فصل وصفات عملية مفصلة لمساعدة القارئ على إتقان جوانب هندسة الميزات خطوة بخطوة.
التوجه العملي
يعتمد الكتاب صيغة "كتاب الوصفات" (Cookbook)، حيث تمثل كل وصفة حالة عملية متكاملة، تتضمن:
- وصف المشكلة
- الحل
- تطبيق الكود
- شرح النتائج
القيمة التعليمية
التطبيق العملي
تعتبر هندسة الميزات ذات قيمة كبيرة لتطوير وإثراء نماذج التعلم الآلي. في هذا الكتاب، ستستخدم أفضل أدوات بايثون لتبسيط عملية هندسة الميزات، وإتقان تقنيات هندسة الميزات، وتبسيط وتحسين جودة الكود.
جاهز للإنتاج
لا يقدم هذا الكتاب المعرفة النظرية فحسب، بل الأهم من ذلك أنه يوفر مهارات وأكواد عملية يمكن تطبيقها مباشرة في بيئات الإنتاج، مما يساعد القراء على بناء مسار عمل شامل لهندسة الميزات.
مصادر إضافية
مواد تكميلية
يتوفر أيضًا ملف PDF يحتوي على صور ملونة للقطات الشاشة/الرسوم البيانية الموجودة في الكتاب، لتعزيز تجربة التعلم.
تحديثات الإصدارات
يحتوي هذا المشروع على عدة إصدارات:
- الإصدار الأول (الأصلي)
- الإصدار الثاني (المُحسّن)
- الإصدار الثالث (الأحدث)
لكل إصدار مستودع أكواد خاص به على GitHub، ويتم تحديثها وصيانتها باستمرار.
الملخص
يُعد كتاب "Python Feature Engineering Cookbook" كتابًا تقنيًا عمليًا للغاية، يقدم بشكل منهجي جميع جوانب هندسة الميزات في بايثون من خلال أكثر من 70 وصفة عملية. سيتمكن كل من المبتدئين وعلماء البيانات ذوي الخبرة من اكتساب خبرة عملية قيمة وتحسين مهاراتهم من خلال هذا الكتاب.