تعليمدروس

قوانين الاحصاء الوصفي

يوجد ثلاثة جوانب مهمة تتعلق بالإحصاءات بوجه عام من حيث مفهوم المتغيرات والأهمية والجوانب العملية المتعلقة بالإحصاءات الوصفية والقضايا المتعلقة بأخذ العينات وأنواع أخذ العينات وتقدير حجم العينة. فما هي الإحصائيات الوصفية وكيف يمكن الاستفادة منها في المشروعات البحثية المختلفة؟

يستخدم الإحصاء الوصفي لتقديم السمات الكمية للبيانات بطريقة يمكن التحكم فيها، وتساعد الإحصائيات الوصفية على تبسيط كميات كبيرة من البيانات بطريقة معقولة، وتقلل كل إحصائية وصفية من البيانات إلى ملخص أبسط وكلمات أسهل، وهذا يعني وصف السمات الرئيسية للمحتوى المدروس في البيانات

تمثل جميع الإحصائيات الوصفية مقياس التباين أو قياس الاتجاه المركزي للمساعدة في فهم معنى البيانات التي تم تحليلها. وتعرض هذه الإحصائيات في الجداول والمناقشة العامة والرسوم البيانية. وهناك غرضان مفيدان عند إجراء إحصائيات وصفية وهما

  • الخطوة الأولى هي تسليط الضوء على العلاقة المحتملة بين المتغيرات.
  • والثانية هي المعلومات الأساسية حول المتغيرات في مجموعة البيانات.
  • توضح الإحصاءات الوصفية ملخصًا بسيطًا حول العينات المتنوعة ومجموعة البيانات وما إلى ذلك.

ما هي الإحصائيات الوصفية

الإحصائيات الوصفية هي معاملات وصفية موجزة تلخص مجموعة بيانات معينة، ويمكن أن تكون إما تمثيلا لكامل أو عينة من السكان، وتنقسم الإحصاءات الوصفية إلى مقاييس الاتجاه المركزي ومقاييس التقلب (الانتشار)، وتشمل مقاييس الاتجاه المركزي المتوسط والوسيط والوضع، بينما تشمل مقاييس التباين الانحراف المعياري والتباين والمتغيرات الدنيا والقصوى والتفرطح والانحراف. 

أهمية الإحصاء الوصفي

تساعد الإحصائيات الوصفية على وصف ميزات مجموعة بيانات محددة وفهمها، وذلك من خلال تقديم ملخصات قصيرة حول العينة ومقاييس البيانات، وتعد فهم الإحصائيات الوصفية ضروريًا لتحليل البيانات بشكل صحيح.

وأكثر أنواع الإحصائيات الوصفية المعترف بها هي مقاييس المركز: تُستخدم مصطلحات `الوسط` و `الوسيط` و `الوضع` في معظم مستويات الرياضيات والإحصاء.

ويتم حساب المتوسط ​​أو المتوسط ​​عن طريق إضافة كافة الأشكال الموجودة في مجموعة البيانات ثم القسمة على عدد الأشكال داخل المجموعة، فعلى سبيل المثال ، مجموع مجموعة البيانات التالية هو 20: (2 ، 3 ، 4 ، 5 ، 6). المتوسط ​​هو 4 (20/5).

يتم تمثيل مجموعة البيانات بقيمتين رئيسيتين، الأولى هي الوضع والتي تمثل القيمة الأكثر تكرارًا، والثانية هي الوسيط والذي يمثل الرقم الوسطي في مجموعة البيانات ويفصل بين الأرقام الأعلى والأرقام السفلية فيها.

ومع ذلك ، هناك أنواع أقل شيوعًا من الإحصائيات الوصفية التي لا تزال مهمة للغاية، حيث يستخدم الأشخاص إحصاءات وصفية لإعادة استخدام رؤى كمية يصعب فهمها عبر مجموعة كبيرة من البيانات في أوصاف صغيرة، فعلى سبيل المثال ، يوفر متوسط ​​درجات الطالب (GPA) فهمًا جيدًا للإحصاءات الوصفية.

تتمثل فكرة المعدل التراكمي في جمع نقاط البيانات من مجموعة واسعة من الاختبارات والفصول الدراسية والدرجات، وحسابها معًا لتوفير فهمًا عامًا لقدرات الطالب الأكاديمية العامة، ويعكس المعدل التراكمي أداء الطالب الأكاديمي المتوسط.

الفرق بين الإحصاء الوصفي والاستدلالي

تقوم الإحصائيات الوصفية بتلخيص وتنظيم البيانات بشكل يسهل فهمها، وعلى العكس من الإحصائيات الاستدلالية، تهدف الإحصائيات الوصفية إلى وصف البيانات دون محاولة إجراء استنتاجات عامة عن العينة.

نحن عادة وصف البيانات في عينة، والعينة هي الجزء المختار من المجتمع ، والذي يتم اختياره غالبًا من خلال عملية عشوائية (مثل أخذ العينات العشوائية البسيطة ، أو نهج أخذ العينات العشوائية الطبقية الأكثر تعقيدًا)، ويتكون السكان من تلك الكيانات أو الأفراد أو الأشياء ذات الاهتمام. على سبيل المثال ، قد نشعر بالقلق حيال قياس قطر صنوبر اللوبولي (شجرة صنوبرية شائعة في ولاية كارولينا الشمالية) في منطقة غابة في غابة ديوك – يشمل السكان المعنيون فصيصات اللوبولي في منطقة الغابات ، في حين أن العينة ستكون تلك الأشجار تم اختياره للقياس.

وقد تكون البيانات التي نجمعها إما نوعية (قد تسمى أيضًا فئوية أو اسمية) أو كمية (رقمية)، الجنس ، تركيز MEM ، دولة المنشأ كلها مقاييس نوعية أو فئوية ، في حين أن الطول ، المسافة ، عدد الطلاب في الفصل هي كمية، ولا يوجد ترتيب طبيعي في البيانات الفئوية ، مجرد فئات مميزة يمكن من خلالها وضع فرد / كائن، وقد تكون البيانات الكمية إما منفصلة (مثل تعداد الأنواع التي تحدث في قطعة الأرض) أو مستمرة (مثل الارتفاع).

المقاييس الوصفية في علم الإحصاء

تنقسم المقاييس الوصفية إلى نوعان وهم:

  1. مقاييس النزعة المركزية (Measures of Central Tendency): تشمل المقاييس الحسابية (الوسط الحسابي، الوسيط، والانحراف المعياري)
  2. مقاييس التشتت (Measures of Dispersion): تشمل هذه المقاييس عدة مؤشرات، بما في ذلك المدى والانحراف المعياري.

مقاييس النزعة المركزية (Measures of Central Tendency)

تمثل القيمة المركزية، أو ما يُعرف باللغة الإنجليزية (Central Value)، حيث يتم تمركز البيانات في الغالب حول قيمة محددة، وفي هذه الحالة نستخدم المقاييس المركزية لتمثيل وشرح البيانات، ومن أهم هذه المقاييس الخاصة بالنزعة المركزية:

  1. الوسط الحسابي (Mean) : يتم الحصول على هذه القيمة عن طريق قسمة مجموع البيانات الموجودة أمامنا على عددها.
    مثال: لدينا عشرون أسرة ونود معرفة الوسط الحسابي لعدد الأفراد في تلك الأسر، لذا نقوم بجمع عدد الأفراد في كل أسرة ومن ثم نقسم النتيجة على عدد الأسر العشرين الموجودة في عينة الدراسة.
  2. الوسيط (Median):  القيمة المركزية هي قيمة محورية لمجموعة بيانات، ويتم الحصول عليها بترتيب البيانات تصاعديًا أو تنازليًا، ومن ثم حساب القيمة الوسطية للبيانات
    إذا كان إجمالي عدد المشاهدات رقماً فرديًا: في هذه الحالة، الوسيط هو القيمة المتوسطة.
    وإذا كان عدد المشاهدات رقماً زوجيًا: هنا، يكون الوسيط هو القيمة المتوسطة للقيمتين الموجودتين في الوسط.
  3. المنوال (Mode): هي القيمة الشائعة أو الأكثر تكرارا بين جميع البيانات أو المشاهدات المتاحة لدينا.

مقاييس التشتت (Measures of Dispersion)

أما في بعض الأحيان نجد أن البيانات تكون قريبة جداً من القيمة المركزية (Central Value) و أحيانًا نجد أن البيانات تكون منتشرة ولكن في مدى أوسع من حولها، وحتى نتمكن من قياس مدى قرب أو بعد البيانات عن تلك القيمة المركزية فإننا نستخدم ما يعرف بمقاييس التشتت، ومن أشهر وأهم مقاييس التشتت ما يلي:

  1. المدى (Range): والمقصود بذلك هو الفرق بين القيمة الأعلى والقيمة الأدنى في مجموعة البيانات، وعلى سبيل المثال:
    مثال على ذلك هو درجات الطلاب وحساب المدى، حيث يتم طرح القيمة الأعلى من بين درجات الطلاب في المجموعة، والتي يتم افتراضها بـ (77)، من القيمة الأقل من بين درجات الطلاب في المجموعة، والتي يتم افتراضها بـ (50)، لتكون قيمة المدى تساوي 27 .
  2. الانحراف المعياري (Standard Deviation): يعد الانحراف المعياري واحدا من أهم وأشهر مقاييس التشتت وأكثرها استخداما وانتشارا، وذلك لأنه يعتمد في استنتاجاته على جميع القيم والبيانات المتاحة من العينة، وتحديدا على الانحرافات الخاصة بالمشاهدات الخاصة بالوسط الحسابي، ولكن يتطلب حساب الانحراف المعياري إلماما بجميع العمليات الرياضية الأخرى، وبالتالي يصبح الأمر معقدا جدا عندما يكون حجم العينة كبيرا، لذلك يتم اللجوء إلى حسابه بشكل إلكتروني باستخدام الدوال الحسابية الجاهزة التي تكون أكثر دقة من الحساب اليدوي.

قوانين الإحصاء الوصفي

الموقع والتشتت

الحاجة الإحصائية الأساسية هي تلك التي تصف مجموعة من القيم القليلة المحسوبة، وتشمل الإحصائيات الوصفية التي تتناول بشكل مختصر السمات الرئيسية للمتغيرات في مجموعة المراقبة.

بعض الإحصائيات الوصفية الشائعة هي متوسط ​​العينة والمتوسط ​​والانحراف المعياري ومعامل الارتباط. وبالطبع ، فإن المرء مهتم أيضًا بالكميات الوصفية المقابلة للسكان الأساسيين الذين تم استخلاص عينة الملاحظات منهم ؛ عادة ما يُنظر إلى هذه الإحصاءات الوصفية السكانية على أنها عينات وصفية عينة لعينات افتراضية كبيرة جدًا ، كبيرة جدًا بحيث يصبح تباين العينات ضئيلًا.

الوسيط أو المتوسط المعمم

معظم الإحصائيات الوصفية للموقع ، وإن لم يكن جميعها ، تتعامل مع متوسط ​​معمم – أي أن بعض وظائف الملاحظات التي تفي بالقيود الحدسية من النوع التالي: (ب) يجب أن تكون دون تغيير بموجب إعادة ترتيب الملاحظات ؛ (ج) إذا كانت جميع الملاحظات متساوية ، فيجب أن يكون للوسط المعمم قيمتهما المشتركة. هناك العديد من الوسائل المعممة المحتملة ؛ أولئك الذين تم اختيارهم للمناقشة هنا لديهم تفسيرات مفيدة ومعقولة من الناحية الحسابية ولديهم تقاليد في الاستخدام.

توفر الإحصائيات الوصفية لتوزيع التشتت معلومات حول تشتت الملاحظات الفردية، وعادةً ما يتم إنشاء هذه الإحصائيات بحيث تصبح أكبر كلما أصبحت العينة أقل تجانسًا.

تمثل عائلة مهمة من مقاييس الموقع ما يسمى الاتجاه المركزي لمجموعة من الملاحظات في إحدى الحواس المختلفة، نفترض أن الملاحظات تشير إلى xl ، X2 ، … ، xn. ثم يتم تعريف المتوسط العادي أو المتوسط الحسابي ومع ذلك ، إذا تم تحديد دالة ، f ، ونظرنا إلى متوسط f (x-i) ، فسيتم تحديد المتوسط المعمم المرتبط ، M ، بواسطة الجمع من 1 إلى n ، و f لها نفس المعنى على كلا الجانبين من المعادلة المحددة.

المتوسط الحسابي

بالنسبة للمتوسط ​​الحسابي ، f هي دالة الهوية. بالنسبة للمتوسط ​​الهندسي (عندما تكون جميع قيم x موجبة) ، فإن f هي دالة اللوغاريتم – أي log M = (1 / n) 2 logx¡ ، بحيث لكي يكون هذا الإجراء منطقيًا ، يجب أن توفر f علاقة رأس برأس بين القيم المحتملة لـ Xi والقيم المحتملة لـ f (x¡).

أحيانا، الاتفاقيات الخاصة ضرورية. بالنسبة لأي من هذه الأساليب العمومية، فإن القيود الحدسية الثلاثة المشار إليها سابقا تكون ملائمة بشكل واضح عند زيادة التتابع f، وبالإضافة إلى ذلك، أي تغيير في أي متغير x واحد، مع إصلاح المتغيرات الأخرى، يؤثر في قيمة M. وهناك أربعة أساليب عمومية متعددة تتضمن هذه الخصائص ومذكورة في الجدول بشكل واضح.

التوزيع الطبيعي

في بعض الأحيان يتعرض مجموعة البيانات لشكل معين يتوزع بالتساوي حول المتوسط. يسمى هذا التوزيع التوزيع الطبيعي، ويمكن أيضا تسميته التوزيع الغوسي أو منحنى الجرس. على الرغم من أن درجات الامتحان ليس دائما موزعة بهذه الطريقة ، إلا أن عبارة “التقدير على منحنى” تأتي من تطبيق منحنى الجرس لتقييم الدرجات بشكل طبيعي.

فإن متوسط ​​درجة الاختبار (61) سيحصل عادةً على D-minus – وليس درجة جيدة جدًا! ومع ذلك ، يمكن استخدام التوزيع الطبيعي من أجل “التقدير على منحنى” بحيث يحصل الطلاب في مركز التوزيع على درجة أفضل مثل C ، في حين يتم تعديل درجات الطلاب المتبقين أيضًا بناءً على بعدهم النسبي من المتوسط .

باختصار، فإن الإحصاء الوصفي يستخدم لوصف المعلومات الأولية لمجموعة من البيانات، ويوفر رؤى عامة، ومن خلال الجمع بين الإحصائيات الوصفية والإحصاءات الرسومية يمكن للقارئ فهم وتفسير مجموعة من البيانات بسهولة نسبية.

اترك تعليقاً

لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها بـ *

زر الذهاب إلى الأعلى