أنواع البيانات والمتغيرات الإحصائية والفرق بينها
ما هي البيانات الإحصائية
يشير مصطلح البيانات إلى الملاحظات والقياسات التي تم جمعها بطريقة ما، وعادةً ما تكون جزءًا فرديًا من المعلومات الواقعية المسجلة والمستخدمة للتحليل، وهي المعلومات الأولية التي تستخدم لإنشاء الإحصائيات.
ما هي المتغيرات الإحصائية
تعني المتغيرات الخصائص أو السمات التي يتم رصدها وقياسها وتسجيلها، والمتغير الإحصائي هو المتغير الذي يحتوي على قيم منفصلة تختلف بسبب العوامل العشوائية، وعند ترتيب هذه القيم في ترتيب محدد يشكلون توزيعًا إحصائيًا أو مصفوفة إحصائية.
أنواع البيانات الإحصائية
تعد أنواع البيانات مفاهيم مهمة في مجال الإحصاء، حيث تمكننا من تطبيق القياسات الإحصائية بشكل صحيح على البيانات وتساعد في استنتاج بعض الافتراضات الصحيحة حولها. من الضروري أن نكتسب فهما شاملا لأنواع البيانات المختلفة لإجراء تحليل البيانات الاستكشافي. يمكن استخدام بعض القياسات الواقعية لأنواع محددة من البيانات فقط، لذا يجب أن نتعرف على نوع البيانات الذي نعمل عليه لتحديد النهج الصحيح للتحليل. يمكن اعتبار أنواع البيانات كأسلوب لتصنيف المتغيرات المختلفة. هناك فقط فئتين من البيانات في الإحصاء، وهما البيانات النوعية والكمية، وسيتم شرح النوعين بالتفصيل فيما يلي
البيانات النوعية
وهي عبارة عن مجموعة من المعلومات التي لا يمكن قياسها في شكل أرقام، وتُعرف أيضاً باسم البيانات الفئوية، وتقدم معلومات حول صفات الأشياء في البيانات، ويمكن أن تأتي نتيجة تحليل البيانات النوعية في نوع عرض الكلمات الرئيسية واستخراج البيانات وصياغة الأفكار، وهي تنقسم إلى نوعين وهما:
- البيانات الاسمية
تستخدم البيانات الاسمية لتسمية المتغيرات، حيث لا تحمل قيمة كمية وليست مرتبة، وتقوم بتسمية شيء ما دون تحديد أي ترتيب محدد، لذا إذا قمت بتغيير ترتيب القيم سيظل المعنى كما هو، وبالتالي تلاحظ البيانات الاسمية ولكن لا يتم قياسها، وهي غير مرتبة وغير متجانسة البعد، ولا تحمل صفرا ذو معنى
أمثلة على البيانات الاسمية:
- الجنس (النساء والرجال).
- لون الشعر (شقراء، بنية، سمراء، حمراء، وما إلى ذلك).
- الحالة الاجتماعية (متزوج، أعزب، أرمل).
- ما اللغات التي تجيدها؟ (إنجليزية، ألمانية، فرنسية).
- ما هو جنسيتك؟ (أمريكي، هندي، ياباني، ألماني).
في الأمثلة السابقة، لا يوجد ترتيب أساسي للمتغيرات. فعلى سبيل المثال، يعد لون العين متغيرا اسميا له مستويات أو فئات قليلة مثل الأزرق والأخضر والبني وما إلى ذلك، ولا يوجد طريقة ممكنة لترتيب هذه الفئات بطريقة مرتبة؛ أي من الأعلى إلى الأدنى أو العكس. وبما أنه لا يمكنك تنظيم البيانات الاسمية، فلا يمكنك فرزها. ويجب الإشارة إلى أنه لن تكون قادرا على القيام بأي مهام رقمية تستخدم البيانات الاسمية لحفظ البيانات الرقمية، والتي يمكن استخدامها في حساب التكرارات والنسب والنسب المئوية والنقاط المركزية
- البيانات الترتيبية
البيانات الترتيبية تشبه البيانات الاسمية تقريبا، ولكن تختلف فيما يتعلق بالترتيب، حيث يمكن ترتيب فئاتها مثل الأول والثاني وما إلى ذلك، ولكن لا توجد استمرارية في المسافات النسبية بين الفئات المتجاورة، وعلى الرغم من أن البيانات الترتيبية مرتبة، إلا أنها ليست متساوية البعد ولا تمتلك صفرا ذو معنى، وتستخدم المقاييس الترتيبية دائما لقياس السعادة والرضا وغيرها من المتغيرات
من خلال استخدام البيانات الترتيبية ومع البيانات الاسمية، يمكن تجميع المعلومات عن طريق تقييم ما إذا كانت مكافئة أو غير عادية. وعند ترتيب البيانات الترتيبية، يمكن ترتيبها عن طريق إجراء مقارنات أساسية بين الفئات، مثل أكبر أو أقل، أعلى أو أقل، وما إلى ذلك. لا يمكن أداء أي أنشطة عددية باستخدام البيانات الترتيبية.
يمكن حساب الإحصاءات المختلفة مثل الترددات والنسب والنسبة المئوية والنقطة المركزية باستخدام البيانات الترتيبية، ولكن هناك نقطة مضافة وهي الإحصاءات الموجزة والإحصاءات البايزية.
أمثلة على البيانات الترتيبية:
- ترتيب المستخدمين في المسابقة: الأول والثاني والثالث، إلخ.
- تصنيف المنتج الذي اتخذته الشركة على مقياس من 1-10.
- الوضع الاقتصادي: منخفض ومتوسط وعالي.
البيانات الكمية
البيانات الكمية هي مجموعة من المعلومات التي تم جمعها من مجموعة من الأفراد وتتضمن تحليل البيانات الإحصائية، وهي تعطي معلومات حول كميات العناصر في البيانات والعناصر التي يمكن تقديرها، ويمكن صياغتها بدلالة الأعداد، وهي تنقسم إلى:
- بيانات فاصلة
يتم قياس بيانات الفاصل الزمني وترتيبها باستخدام أقرب العناصر ولكن ليس لها صفر ذي معنى، وتكون النقطة المركزية لمقياس الفاصل الزمني هي أن كلمة “الفاصل الزمني” تشير إلى “المسافة بين”، وهو الشيء المهم الذي يجب تذكره، فالمقاييس الفاصلة لا تعلمنا بالترتيب فحسب، بل تعلِّمنا أيضاً القيمة بين كل عنصر.
يمكن أن تكون بيانات الفاصل الزمني سالبة، على الرغم من أن بيانات النسبة لا يمكن أن تكون، على الرغم من أن بيانات الفاصل الزمني يمكن أن تظهر بشكل أساسي مثل بيانات النسبة، فإن الشيء المهم هو في نقاط الصفر المميزة، إذا تم اختيار نقطة الصفر في المقياس بشكل شخصي، فلا يمكن أن تكون البيانات في هذه المرحلة بيانات نسبة ويجب أن تكون بيانات فاصل.
يمكن بسهولة ربط البيانات باستخدام الفاصل الزمني، ويمكن إضافة القيم أو طرحها باستخدام البيانات الزمنية. ويمكن حساب بعض الإحصائيات الوصفية للبيانات الزمنية، مثل النقطة المركزية (المتوسط، الوسيط، الوضع) والنطاق (الحد الأدنى، الحد الأقصى) والانتشار (النسب المئوية، النطاق الربيعي، الانحراف المعياري). كما يمكن استخدام تقنيات تحليل البيانات الإحصائية الأخرى للحصول على مزيد من المعلومات.
- بيانات النسبة
النسبة يتم قياس البيانات وترتيبها باستخدام عناصر متساوية البعد وصفر ذو مغزى ولا تكون أبداً سلبية مثل بيانات الفاصل الزمني، من الأمثلة البارزة لبيانات النسبة قياس الارتفاعات، يمكن قياسه بالسنتيمتر أو البوصة أو الأمتار أو القدمين وليس من الممكن عملياً أن يكون ارتفاعه سالباً.
تشير بيانات النسبة إلى ترتيب وتناقض المتغيرات، وتتيح مجموعة واسعة من التقديرات والتخمينات للبيانات، وعلى الرغم من أنها تحتوي على الصفر، فهي تماثل بيانات الفاصل الزمني، وتشمل الوسط الحسابي والوسيط والوسط الحسابي والحد الأدنى والحد الأقصى والنسب المئوية ومجموعة الشرائح الربعية والانحراف المعياري
أمثلة على بيانات النسبة:
- العمر (من 0 سنة إلى 100+).
- تُقاس درجة الحرارةبالكلفن ، وليس بالدرجات المئوية أو فهرنهايت.
- المسافة المقاسة باستخدام مسطرة أو أي جهاز تقييم آخر.
- الفاصل الزمني يقاس بساعات التوقف أو ما يشابه ذلك.
لذلك، فيما يتعلق بأمثلة النسبة، هناك نقطة صفر فعلية وذات مغزى مثل عمر الشخص، والصفر المطلق، والمسافة المحسوبة من نقطة أو وقت محدد، حيث تحتوي جميعها على أصفار حقيقية.
- بيانات منعزلة
يُظهر العدد الذي يتضمن أعداداً صحيحة فقط ولا يمكننا تقسيم القيم المنفصلة إلى أجزاء، على سبيل المثال عدد الطلاب في الفصل هو مثال على البيانات، يمكن أن تأخذ البيانات المنفصلة قيماً معينة فقط ولا يمكن تقسيم متغيرات البيانات إلى أجزاء أصغر، وتحتوي البيانات المنعزلة على عدد محدود من القيم المحتملة مثل أيام الشهر، مثل عدد العاملين في الشركة وعدد أسئلة الاختبار التي أجبت عليها بشكل صحيح.
- البيانات المستمرة
تمثل البيانات المستمرة قياسات لا يمكن حساب قيمتها، ولكن يمكن قياسها، ومثال على ذلك هو ارتفاع الشخص الذي يمكن وصفه باستخدام الفواصل الزمنية على خط الأعداد الحقيقي.
أمثلة على البيانات المستمرة:
- الزمن المطلوب لإكمال المشروع
- ارتفاع الأطفال.
- سرعة السيارات .
أنواع المتغيرات الإحصائية
المتغير الإحصائي هو مصطلح جبري يشير إلى قيمة غير معروفة وغير ثابتة بتنسيق رقمي، يتم استخدام هذا النوع من المتغيرات في أنواع مختلفة من البحوث لإجراء عمليات حسابية سهلة. ولذا، هناك العديد من الأنواع المتاحة من المتغيرات التي يمكن تطبيقها في مجالات متنوعة. وقد تم مناقشة العديد من المتغيرات الأخرى في الحد الأدنى وتم إدراجها في قائمة المتغيرات النشطة التي يقيمها الباحث. المتغير الذي يحدث قبل المتغير المستقل يسمى متغيرا سابقا. وهناك عدد كبير من المتغيرات الإحصائية المتاحة
- المتغير الفئوي: يمكن تصنيف المتغيرات في فئات مختلفة، فعلى سبيل المثال، يمكن أن تحتوي فئة `ماركات معجون الأسنان` على متغيرات مثل Colgate و Aquafresh
- متغير محير: هناك متغيرات إضافية لها تأثير خفي على نتائج التجربة
- المتغير المستمر: متغير له عدد لا نهائي من القيم، مثل `الزمن` أو `الوزن`
- متغير التحكم: يجب أن يظل العامل ثابتا في التجربة، على سبيل المثال في تجربة لتحديد ما إذا كان الضوء يؤدي إلى نمو النباتات بشكل أسرع، يجب التحكم في جودة التربة والمياه
- المتغير التابع: ستلاحظ نتيجة التجربة أثناء تغيير المتغير المستقل، ما يحدث للمتغير التابع
- المتغير المنفصل: المتغير هو عبارة عن قيمة تأخذ فقط عددا محددا من القيم، على سبيل المثال `عدد السيارات في ساحة الانتظار`، حيث يمكن لموقف السيارات استيعاب عدد كبير من السيارات فقط
- المتغير المستقل: المتغير الذي لا يتأثر بأي شيء تفعله أنت الباحث، يتم رسمه عادة على المحور الأفقي
- المتغير الكامن: هناك متغير غير مرئي يؤثر على العلاقة بين المتغير المستقل والمتغير التابع
- المتغير الاسمي: اسم آخر لمتغير فئوي.
- المتغير الترتيبي: يشبه المتغير الفئوي، ولكن يتم ترتيب القيم بطريقة محددة، على سبيل المثال، يمكن تصنيف مستويات الدخل على أنها ترتيبية بناء على مستوى الدخل المنخفض والمتوسط والعالي
- المتغير النوعي: تشمل هذه الفئة أي متغير لا يمكن حسابه (أي ليس له قيمة عددية)، وتشمل المتغيرات الاسمية والترتيبية في هذا المصطلح الشامل
- المتغير الكمي: المتغيرات هي فئة واسعة تشمل أي متغير يمكن عده أو له قيمة عددية مرتبطة به، وتشمل المتغيرات المنفصلة ومتغيرات النسبة
- متغيرات النسبة: تشابه مع متغيرات الفاصل الزمني، ولكنها تحتوي على صفر ذي مغزى
الفرق بين أنواع البيانات والمتغيرات الإحصائية
- تمثل البيانات مجموعة من القيم للمتغيرات النوعية أو الكمية، أما المتغير فهو كمية أو خاصية يمكن أن تختلف من شخص لآخر.
- البيانات هي الملاحظات والقياسات التي يتم جمعها بطريقة ما عادة من خلال البحث، بينما المتغيرات هي السمات أو الخصائص التي يتم مراقبتها وقياسها وتسجيلها.
- البيانات والمتغيرات غير دقيقة ولكنها تستخدم بشكل متكرر كمرادفات.
- تُصنف البيانات إلى بيانات نوعية وكمية، في حين يتم تصنيف المتغيرات إلى متغيرات كمية وفئوية وترتيبية ومتغيرات الفاصل الزمني.
- تتم معظم عمليات التحليل الإحصائي على المتغيرات.