عالم البيانات
هو من يستخدم البيانات بهدف انتاج أمور ذات نفع وقيمة وفائدة فهو يعمل جاهدا من اجل جلب البيانات والمعلومات من مصادر مختلفة وتحليللها بهدف فهم الاعمال والعمليات التي طرأت عليها وبعدها يقوم عالم البيانات ببناء ادوات الذكاء الاصطناعي
بهدف اتمتة بعض العمليات في الشركة حيث تعني الاتمتة هو تحويل العمليات التي تقوم بها الشركة يدويا الي عمليات يمكن انجازها بسرعة وسلاسة عن طريق الحاسوب مما يجعل مهنة مهندس البرمجيات متشابهه جدا مع عالم البيانات
يمكنك تعلم "علم البيانات" من خلال المصادر المتوفرة على الإنترنت بشكل أفضل من التعلم في الكثير من الجامعات حول العالم.
بداية يمكن تقسيم علم البيانات إلى فرعين: تحليل البيانات (data analysis) وتعلم الآلة (machine learning) ويوجد تداخل طبعاً بين هذين الفرعين.
أفضل دورة للدخول في مجال machine learning هي الدورة التي يقدمها الأستاذ في جامعة ستانفورد Andrew Ng وهي مجانية.
رابط الدورة: Machine Learning | Coursera.
هذه الدورة هي لفهم الأمور والأساسيات. تحتاج قبل دخول الدورة معلومات ابتدائية فقط في البرمجة ومستوى عادي في الرياضيات (الدورة لا تركز على جانب الرياضيات بل تركز أكثر على جانب فهم آلية عمل خوارزميات machine learning).
بعد ذلك ( أو مع ذلك ) يمكنك التعلم من كتـاب
اسم الكتـاب: Hands-On Machine Learning with Scikit-Learn, Keras, and TensorFlow, 2nd Edition
هذا الكـتاب ممتاز ورائع ويعلمك كيفية بناء برامج machine learning و deep learning باستخدام Python وأقوى المكـتبات في هذا المجال (Scikit-learn + TensorFlow).
لقراءة الكـتاب عليك أن تتعلم مبادئ Python وبعض المكـتبات الأساسية في مجال علم البيانات خاصة Pandas و Matplotlib (الكـتاب يحتوي على مصادر لتعلم هذه المكتـبات). والكـتاب متوفر على الشبكة كملف PDF.
وأفضل مكان لتـطبيق ما تتعلمه والتعلم من الخبراء هو Kaggle:
رابط الموقـع: Kaggle: Your Machine Learning and Data Science Community
على هذا الموقـع هناك قسم لمجموعات البيانات (datasets) ولكل منها تستطيع أن ترى تحليلات البيانات التي أجراها الآخرون. وهناك أيضاً قسم لمنافسات machine learning حيث يمكنك أن تتدرب بعد أن تتعلم من الكـتاب الذي ذكرته لك. ويحتوي الموقـع أيضاً على مصادر تعـليمية متعددة.