مكتبات علم البيانات في البايثون
يستعرض المقال أهم وأشهر مكتبات لغة البايثون التي تؤهلك في مجال علم البيانات وتعليم الالة
الرابط الأصلي للمقال من مدونة بايثونات : مكتبات علم البيانات بالبايثون | 5 مكتبات مشهورة
مما لا شك فيه أن لغة البرمجة البايثون أصبحت تتصدر لغات البرمجة في مجال علم البياناتوتعليم الالة, وأصبحت من اللغات المطلوبة كشرط في فرص العمل والوظائف التي لها علاقة بعلم البيانات وتحليلها.
الشكل التالي يمثل العلاقة بين لغات برمجة مشهورة ووظائف أعلن عنها في موقع indeed بحيث كانت هذه الوظائف تتعلق ب machine learning و data science، ومن الشكل يتضح لنا أنلغة البايثون تتصدر اللغات البرمجية في هذين المجالين.
البايثون واللغات الأخرى
ما سبق يعطي مؤشرا واضحا عن إتجاه المهارات واللغات المطلوبة في وظائف علم البياناتو تعليم الالة, وفي هذا المقال سوف أقدم لكم لمحة سريعة ومختصرة جدا عن أهم مكتبات البايثون في علم البيانات و تعليم الالة والتي لابد عليك أن تجيدها عند عملك في وظائف مثل محلل بيانات او عالم بيانات أو في مجال تعليم الالة.
المكتبة الأولى Numpy
تعتبر مكتبة Numpy من المكتبات الرياضية الأساسية في عمليات الحوسبة العلمية بالبايثون، حيث يعتمد عليها كثير من العلماء والباحثين في إجراء العمليات الحسابية الكبيرة والمعقدة على بياناتهم وفي اختباراتهم العلمية.
تتميز مكتبة Numpy بالتالي:
- دعم قوي لمصفوفات N-Dimensional
- عمليات سريعة وبكفاءة عالية عند التعامل مع المصفوفات, وإستخدام أمثل للمصادر عند المعالجة.
- دعم عمليات الجبر الخطي وال Fourier transform بشكل سهل وسريع.
- تعتمد عليها كثير من المكتبات الأخرى مثل Pandas و theanets وغيرهما.
بعض مصادر تعلم للمكتبة:
- https://www.datacamp.com/community/blog/python-numpy-cheat-sheet#gs.0_T9D90
- http://cs231n.github.io/python-numpy-tutorial/
- http://www.python-course.eu/numpy.php
- https://www.datacamp.com/community/tutorials/python-numpy-tutorial#gs.Ereixfc
- https://vimeo.com/77263537?utm_source=datafloq&utm_medium=ref&utm_campaign=datafloq
المكتبة الثانية Pandas
تقدم مكتبة Pandas الإمكانيات اللازمة لجعل تحليل ومعالجة البيانات أمرا سهلا وسريعا, عبر ما تقدمه من تراكيب وأدوات برمجية تعتمد بالأساس على Numpy.
مميزات وخصائص مكتبة Pandas:
- تقدم المكتبة ما يسمى ب إطار البيانات (Data Frame) والذي يسهل من إستيراد البيانات والتعامل معها بسهولة.
- تقدم المكتبة الإمكانات اللازمة لإستيراد البيانات من الملفات بصيغها المختلفة ونقلها للذاكرة العشوائية.
- تسهل المكتبة عمليات (Data Preprocessing ) مثل تنظيف البيانات, ومعالجة القيم الفارغة فيها, وإجراء العمليات الإستكشافية على البيانات.
- تقدم المكتبة إمكانية إعادة تشكيل هيكل البيانات (Reshaping).
- تسهل دمج البيانات ببعضها أو تجزيئها إلى إطارات متعددة.
وغيرها الكثير من الخصائص والمميزات.
بعض مصادر تعلم للمكتبة:
- http://pandas.pydata.org/pandas-docs/stable/10min.html
- https://www.datacamp.com/community/tutorials/pandas-tutorial-dataframe-python#gs.zMakrWo
- https://www.dataquest.io/blog/pandas-python-tutorial/
المكتبة الثالثة Scipy
تأتي هذه المكتبة على رأس هرم المكتبات العلمية في البايثون, وتخدم جانب تحليل البيانات وتعليم الالة بشكل قوي, ولا تقتصر على ذلك, حيث تقدم إمكانات هائلة في مجال معالجة الإشارات, ومعالجة الصور, والعمليات الحسابية المعقدة.
تتكون وتعتمد مكتبة Scipy على خليط من المكتبات المشهورة مثل Numpy, Pandas, Matplotlib, Sympy, IPython وغيرها.
تقدم المكتبة مجموعة واسعة من الخوارزميات والحزم العلمية التي لها علاقة بالأخص (ليس للحصر) بالعمليات الرياضية، الدوال الإحصائية وتعليم الألة.
تتميز مكتبة Scipy بما يلي:
- تقدم دوال واسعة في مجال الاحتمالات والإحصاء عبر موديول stats.
- إجراء التحليل المكاني (Spatial Analysis) عبر مجموعة من الخوارزميات المتخصصة الموجودة في موديول spatial.
- تقدم المكتبة أدوات خاصة بمعالجة الإشارات.
- تقدم المكتبة مجموعة من الدوال الخاصة بمعالجة المصفوفات متعددة الأبعاد لمعالجة الصور.
- دعم عمليات الجبر الخطي وال Fourier transform.
وغيرها الكثير من الخصائص والمميزات.
بعض مصادر تعلم للمكتبة:
- https://www.datacamp.com/community/tutorials/python-scipy-tutorial#gs.hGF3Hnw
- https://www.youtube.com/watch?v=oYTs9HwFGbY
- https://docs.scipy.org/doc/scipy/reference/tutorial/?utm_source=datafloq&utm_medium=ref&utm_campaign=datafloq
المكتبة الرابعة Matplotlib
هذه المكتبة أحد أشهر مكتبات البايثون في ال Visualization, وتمكنك من بناء رسوماتك البيانية والتوضيحية بشكل سهل ومرن, وترتبط هذه المكتبة بعدة مكتبات وأدوات أخرى منها مكتبةPandas وأداة Jupyter لتمكنك من استدعاء أوامر الرسومات بشكل مباشر على إطار البيانات وبطريقة تفاعلية.
كما أن المرونة الموجودة في المكتبة تمكنك من ترتيب الأشكال والرسومات بطريقة سهلة ومريحة, وتستطيع أيضا أن تصدر المخرجات على شكل ملفات بصيغ متعددة منها Pdf, Jpg, SVG, PNG, BMP, GIF وغيرها.
بعض مصادر تعلم للمكتبة:
- https://www.datacamp.com/community/tutorials/matplotlib-tutorial-python#gs.HdUg0vY
- https://www.labri.fr/perso/nrougier/teaching/matplotlib/
- https://pythonprogramming.net/matplotlib-python-3-basics-tutorial/
المكتبة الخامسة Scikit-learn
تعتبر هذه المكتبة أحد أهم مكتبات تعليم الالة في لغة البايثون وتعتمد على المكتبة السابقةScipy. تقدم هذه المكتبة للمستخدمين مجموعة من الخوارزميات الخاصة بتعليم الالة وتسهل عليهم تشغيل وتنفيذ هذه الخوارزميات على البيانات بشكل مباشر.
الرابط التالي يسرد الخوارزميات الخاصة بتعليم الألة والموجودة في المكتبة هنـــــــا
بعض مصادر تعلم للمكتبة:
- https://www.youtube.com/watch?utm_source=datafloq&utm_medium=ref&utm_campaign=datafloq&v=4ONBVNm3isI
- http://machinelearningmastery.com/a-gentle-introduction-to-scikit-learn-a-python-machine-learning-library/
- http://www.dataschool.io/machine-learning-with-scikit-learn/
- http://scikit-learn.org/stable/tutorial/index.html?utm_source=datafloq&utm_medium=ref&utm_campaign=datafloq
خلاصة
المكتبات السابقة ليست هي الوحيدة في علم البيانات و تعليم الالة بلغة البايثون, ولكنها المتميزة والمستخدمة بشكل واسع بين العلماء والباحثين في هذا المجال.
إذا كانت أساسيات لغة البايثون موجودة لديك, وتريد أن تبدأ بالتخصص في مجال علم البيانات وتحليلها أو تعليم الألة, فأنصحك أن تتقن إستخدام هذه المكتبات لقوتها ولإستخدامها الواسع.
سوف أبدأ إن شاء الله بتقديم مقالات أكثر تفصيلا عن المكتبات السابقة أبدأها إن شاء الله بمكتبةNumpy وسيكون هناك بعض الأمثلة والتطبيقات العملية.
مصدر المقالة:
http://bit.ly/2tpEU3P
التعليقات (0)
لايوجد لديك حساب في عالم البرمجة؟
تحب تنضم لعالم البرمجة؟ وتنشئ عالمك الخاص، تنشر المقالات، الدورات، تشارك المبرمجين وتساعد الآخرين، اشترك الآن بخطوات يسيرة !