Data Visualization
عبارة عن مجموعة تقنيات تساعدنا بتمثيل البيانات على شكل رسوميات حتى نفهم كيف يبدو مظهرها ، ترابطها Correlation بينها .لان اغلب البيانات تأتي بشكل جداول او صفوفلا نستطيع ان نفهم منها شي او ما هي التي العلاقة بينها .
يعني ممكن نقول عنها طرق لعرض البيانات بشكل رسومي حتى نرى السمات Features المرتبطة بالاخراجات .
تقنياتها يصنفوها على نوعين بالاعتماد على المتغيرات (الاعمدة بالجداول)
⁃ صنف ذات متغير واحد Univariate plots وهنا نقدر ان نفهم كل ميزة Attribute بصورة مستقلة عن البقية ، مثال عليها Histogram وهذة رسمها يكوت عباره عن bins وايضا تساعدنا على رؤية القيم المتطرفة Outlier values ، كذلك Density Plot و Box Plot.
⁃ صنف ذات متغيرات عديدة Multivariate Plots وهنا نقدر نمثل عدة ميزات Attributes والعلاقة بينهم ابرز انواعها Correlation Matrix plots و Scatter Matrix Plots.
المقصود بالقيم المتطرفة مثلا يكون عندك مجموعة من الارقام 7 , 8 , 4 , 300 هنا تكون 300 قيمة متطرفة يعني الفرق بينها وبقية القيم كبير جدا ولهذا فمن الضروري بمعالجة البيانات المسبقة نحل مشكلة القيم المتطرفة لان تسبب هواي مشاكل