يقدم هذا المستوى وصفًا شاملاً لسمات البيانات المختلفة وأنواع مجموعات البيانات التي قد يواجهها عالم البيانات عادةً. يصف المستوى أيضًا مشكلات جودة البيانات المختلفة وكيفية التعامل معها. يتم أيضًا تغطية تقنيات إعداد البيانات المختلفة. أخيرًا، يتم إعطاء مقدمة للبيانات الضخمة ونظام Hadoop البيئي.
بنهاية هذا المستوى، ستكون قادرًا على: تحديد أنواع سمات البيانات المختلفة وأنواع مجموعات البيانات المختلفة، وفهم الاختلافات بين مشاكل جودة البيانات المختلفة بما في ذلك الضوضاء والقيم المفقودة والتكرارات.
وصف تقنيات إعداد البيانات المختلفة بما في ذلك أخذ العينات واختيار الميزات والتقدير وتحويل المتغيرات.
الحصول على فكرة ملموسة حول تطور البيانات الضخمة وهيكلية نظام Hadoop البيئي، وتنفيذ مشروعات باستخدام Python تغطي جوانب مختلفة من المستوى.
تمثيل البيانات هي عملية تحويل البيانات الأولية (نصوص أو أرقام أو رموز) إلى أشكال مرئية. تظهر هذه التمثيلات على هيئة مخططات ورسوم بيانية، ويتمثل الغرض منها في جعل البيانات أسهل وأسرع في الفهم. أما بالنسبة لمصطلح Power BI، فهي أداة ذكاء أعمال تعتمد على التكنولوجيا وتوفرها Microsoft لغرض تحليل وتمثيل هذه البيانات الأولية لتقديم معلومات قابلة للتنفيذ ومساعدة المؤسسات في اتخاذ قرارات حاسمة تعتمد على البيانات. في هذه الدورة التدريبية، ستتعرف على المبادئ الأساسية لتمثيل البيانات وأدوات ذكاء الأعمال وكيفية استخدامهما في اتخاذ قرارات تعتمد على هذه البيانات.
1. المقدمة
2. السياق
3. العناصر المرئية
4. جذب الانتباه
5. الداش بورد
6. Power BI
7. تصور التقارير
8. نمذجة البيانات
9. مقدمة إلى DAX
10. تصور للقياس
فهم مبادئ تحويل المعلومات والبيانات إلى لوحات تفاعلية، وتتمثل تلك المبادئ في الرسومات التوضيحية وفهم الجمهور المتلقي والتركيز على المعلومات المهمة داخل التقارير وترابطها.
استخدام أدوات ذكاء الأعمال الأكثر شهرة والتي يستخدمها المحللون المحترفون وعلماء البيانات، ومن ثم إنشاء التقارير بجودة عالية واحترافية من الألف إلى الياء.
فهم المقصود بنمذجة البيانات وكيفية التخلص من البيانات الزائدة عن الحاجة من مجموعة البيانات الكبيرة، عن طريق فصل الجداول إلى جداول الحقيقة وجداول الأبعاد.