مفهوم معامل الارتباط
الارتباط هو طريقة إحصائية تُستخدم لتقييم وجود علاقة خطية محتملة بين متغيرين مستمرين، وهي سهلة الحساب والتفسير. وعلى الرغم من ذلك، فإن سوءاستخدام الارتباط شائع جدًا بين الباحثين لدرجة أن بعض الإحصائيين يفضلون عدم استخدام هذه الطريقة على الإطلاق.
يُستخدم الارتباط كطريقة إحصائية لتقييم احتمال وجود ارتباط خطي ثنائي الاتجاه بين متغيرين مستمرين، حيث يتم قياس الارتباط باستخدام إحصائية تُسمى معامل الارتباط، والذي يُمثل قوة الارتباط الخطي المفترض بين المتغيرات المعنية
خصائص معامل الارتباط
- هي كمية بلا أبعاد تتراوح قيمتها بين -1 و+1
- يشير معامل الارتباط صفر إلى عدم وجود علاقة خطية بين متغيرين مستمرين
- يشير معامل الارتباط بقيمة -1 أو +1 إلى وجود علاقة خطية مثالية بين المتغيرين
- يمكن أن تكون قوة العلاقة بين -1 و +1
- كلما زادت قوة الارتباط، كلما اقترب معامل الارتباط من ±1
- إذا كان المعامل رقمًا موجبًا، فإن العلاقة بين المتغيرات هي علاقة مباشرة
- إذا كانت المعاملة برقم سالب، فإن المتغيرات مرتبطة بشكل عكسي (على سبيل المثال، عند زيادة قيمة متغير واحد، تميل قيمة الآخر إلى الانخفاض)
- لا يعد أي شكل آخر من العلاقة بين متغيرين متواصلين غير خطية ارتباطاً إحصائياً
أنواع معامل الارتباط
يعتبر اختبار الارتباط أحد الإجراءات الإحصائية الأكثر شيوعًا ويستخدم كأساس في العديد من التطبيقات مثل تحليل البيانات الاستكشافية والنمذجة الهيكلية وهندسة البيانات وغيرها، وهنالك العديد من أنواع المعاملات المختلفة المتاحة
- ارتباط بيرسون : هذه هي واحدة من أكثر طرق الارتباط شيوعا، حيث يتوافق مع تباين المتغيرين المقاسين (أي مقسومين) على ناتج الانحرافات المعيارية.
- ارتباط سبيرمان: هو مقياس الارتباط اللا معلمي، وتساوي علاقة سبيرمان بين متغيرين درجات الارتباط بينهما، بينما يستخدم بيرسون علاقات خطية، ولكن يحتفظ سبيرمان بالعلاقات الرتيبة (خطية أم غير خطية).
- ارتباط كيندال: تفضل الارتباط بين كيندال وسبيرمان في الظروف العادية، وذلك لأنه يتميز بانخفاض حساسية الخطأ الكلي وتقارب منخفض، مما يزيد من قوته وكفاءته ويساعد في تحديد الفرق بين النسبة المئوية للأزواج المتوافقة والمتنافرة بين جميع أحداث الزواج المحتملة، وهو ما يختلف عن معامل الارتباط بيرسون وسبيرمان
- متوسط ارتباط الوزن البيولوجي : هذا المقياس يستخدم لقياس التشابه، وهو يعتمد على الوسيط وليس المتوسط التقليدي، وبالتالي فهو أقل حساسية للقيم المتطرفة. يمكن استخدامه بدلا من مقاييس التشابه الأخرى، مثل ارتباط بيرسون، ويعتبر بديلا قويا لها
- ارتباط المسافة: يتم قياس الارتباط بين متغيرين عشوائيين أو متجهات عشوائية باستخدام الارتباط الخطي وغير الخطي، وهذا يختلف عن الارتباط الخطي بيرسون الذي يكتشف فقط الارتباط الخطي بين متغيرين عشوائيين.
- ارتباط الانحناء المئوي: يعتمد على الوزن المنخفض لنسبة مئوية محددة من الملاحظات الهامشية المنحرفة عن المتوسط
- ارتباط بلومكفيست: الارتباط غير الحدودي الذي يعرف أيضا باسم الارتباط بيتا أو المتوسط بلومكفيست، هو نوع من الارتباطات الذي يستند إلى الوسيط ويتميز ببعض المزايا عن المقاييس الأخرى مثل تقديرات سبيرمان أو كيندال
- ارتباط جاما: إحصائية جاما جودمان-كروسكال مشابهة للارتباط الخاص بكيندال، إنها قوية نسبيا للقيم المتطرفة وتتعامل بشكل جيد مع البيانات التي تحتوي على العديد من الروابط.
- ارتباط الغاوسي: يعد مقدر ارتباط الرتبة الغاوسي بديلا بسيطا وفعالا للارتباطات القوية بين الرتب
- الارتباط الثنائي والنقطي: يتم استخدام معامل الارتباط عندما يكون أحد العوامل مستمرا والأخر ثنائي التفرع
- الارتباط المتجانس: يشير هذا المصطلح إلى ارتباط المتغيرات التي تم تحويلها للحد من القيم المتطرفة وتقليل تأثير القيم المتطرفة الزائفة المحتملة.
- الارتباط متعدد الألوان: هناك ارتباط مستمر وتوزيع طبيعي بين متغيرين مترتبين للاشارة اليهم.
- الارتباط التربيعي: حالة خاصة من الارتباط يطبق عندما يكون كلا المتغيرين الملاحظين ذو فرعين.
- الارتباط الجزئي: العلاقة بين متغيرين بعد تعديل تأثير متغير واحد أو أكثر، ويتم اختبار العلاقة بعد تقسيم مجموعة البيانات بشكل مستقل عنها.
- الارتباط متعدد المستويات: الارتباطات متعددة المستويات هي حالة خاصة من الارتباطات الجزئية، حيث يتم تضمين المتغير الذي يراد تعديله كعامل وتأثير عشوائي في نموذج مختلط
قانون معامل الارتباط
لا يوجد قاعدة محددة لتحديد قوة أو متوسط أو ضعيف الارتباط، ويتوقف تفسير معامل الارتباط على موضوع الدراسة. عند دراسة الأشياء التي يصعب قياسها، ينبغي توقع أن يكون معامل الارتباط أقل (على سبيل المثال، فإذا كانت قوة الارتباط أعلى من 0.4، فإن ذلك يشير إلى قوة الارتباط نسبيًا).
عند دراسة العوامل السهلة القياس مثل الحالة الاجتماعية والاقتصادية، نتوقع ارتباطات أعلى من 0.75 وهذا يدل على ارتباط قوي نسبياً.
في هذه الدراسات، نادرًا ما نرى ارتباطات تتجاوز 0.6. وفيما يتعلق بهذا النوع من البيانات، فإننا نعتبر الارتباطات التي تتجاوز 0.4 قوية نسبيًا، وتعتبر العلاقة بين 0.2 و 0.4 متوسطة، وتعتبرالعلاقات التي تقل عن 0.2 ضعيفة. وعندما ندرس أشياءً سهلة القياس، فإننا نتوقع ارتباطات تتجاوز القيم المذكورة
على سبيل المثال، نعتبر في العادة الارتباطات التي تزيد عن 0.75 قوية نسبياً من الارتباطات الضعيفة، وتعتبر الارتباطات بين 0.45 و 0.75 معتدلة، بينما تُعتبر الارتباطات التي تقل عن 0.45 ضعيفة.
معامل الارتباط في الاحصاء
تستخدم معاملات الارتباط في الإحصاء لقياس قوة العلاقة بين متغيرين، حيث يوجد عدة أنواع من معاملات الارتباط، ولكن المعامل الأكثر شيوعا هو معامل بيرسون، ويرتبط معامل بيرسون بشكل أساسي بالانحدار الخطي
إذا بدأت بالإحصائيات، فمن المرجح أن تسمع عن بيرسون، عندما يُشار إلى معامل الارتباط، فإن الكل يتحدث عادة عن بيرسون.
- مؤشر الارتباط 1 يعني أنه عند زيادة متغير واحد بمقدار معين، يحدث زيادة متوافقة بنسبة ثابتة في المتغير الآخر، على سبيل المثال، يرتبط حجم الأحذية بشكل تقريبي تمامًا مع طول القدم.
- الصفر يعني عدم وجود زيادة موجبة أو سلبية مع زيادة القيمة، حيث لا يوجد أي علاقة بين الاثنين.
ويعطينا قيمة مطلقة لمعامل الارتباط قوة العلاقة، حيث أن كلما زاد الرقم زادت قوة العلاقة.
اهمية معامل الارتباط بييرسون
- يُستخدم معامل ارتباط بيرسون كمقياس لقوة الارتباط بين المتغيرين، وتتمثل الخطوة الأولى في دراسة العلاقة بين المتغيرين المستمرين عن طريق رسم مخطط مبعثر للمتغيرات والتحقق من الخطية في العلاقة بينها
- لا ينبغي حساب معامل الارتباط إذا لم تكن العلاقة بين المتغيرين خطية.
- بالنسبة لأغراض الربط فقط، لا يهم في أي محور يتم رسم المتغيرات، حيث يتم رسم المتغير المستقل على المحور الأفقي (x) ويتم رسم المتغير التابع على المحور الرأسي (y).
- كلما اقترب توزيع النقاط من الخط المستقيم، زادت قوة الارتباط بين المتغيرات
تتطلب شروط استخدام معامل الارتباط بيرسون أن يتم تحديدها كما يلي:
- يجب أن يكون المقياس فترة زمنية أو نسبة
- يجب توزيع المتغيرات بشكل طبيعي
- يجب أن يكون الارتباط خطي
- يجب عدم وجود قيم متطرفة في البيانات
تعمل تقنية ارتباط بيرسون بشكل جيد مع العلاقات الخطية؛ فعندما يزيد أحد المتغيرات، يزداد الآخر (أو ينقص) بالتناسب المباشر، ولكنها لا تعمل بشكل جيد مع العلاقات المنحنية (حيث لا يتبع العلاقة خطًا مستقيمًا).