Phytopathology موقع علم أمراض النبات

Home

الارتباط والانحدار

 

الارتباط والانحدار

الارتباط والانحدار هما أداتان إحصائيتان قويتان تستخدمان لتحليل العلاقة بين متغيرين أو أكثر. على الرغم من أنهما غالبًا ما يستخدمان معًا، إلا أنهما يقيسان جوانب مختلفة من هذه العلاقة.

أ. الارتباط (Correlation):

  • المفهوم: يقيس قوة واتجاه العلاقة الخطية بين متغيرين كميين (quantitative variables). لا يفترض الارتباط وجود علاقة سببية بين المتغيرين، بل يصف فقط مدى تغيرهما معًا.
  • قياس الارتباط: يتم قياس الارتباط عادةً باستخدام معامل ارتباط بيرسون (Pearson correlation coefficient)، والذي يُرمز له بالرمز (r). تتراوح قيمة r بين -1 و +1:
    • r = +1: ارتباط إيجابي كامل. يعني أن زيادة قيمة أحد المتغيرين تؤدي إلى زيادة قيمة المتغير الآخر بنسبة ثابتة.
    • r = -1: ارتباط سلبي كامل. يعني أن زيادة قيمة أحد المتغيرين تؤدي إلى نقصان قيمة المتغير الآخر بنسبة ثابتة.
    • r = 0: لا يوجد ارتباط خطي. يعني أن المتغيرين لا يرتبطان ببعضهما البعض خطيًا.
    • قيم بين -1 و +1: تشير إلى قوة العلاقة. القيم الأقرب إلى +1 أو -1 تدل على علاقة أقوى، والقيم الأقرب إلى 0 تدل على علاقة أضعف.
  • أنواع الارتباط:
    • ارتباط إيجابي (Positive Correlation): كلما زادت قيمة المتغير الأول، زادت قيمة المتغير الثاني. مثال: العلاقة بين كمية السماد المستخدمة وإنتاجية المحصول (بشكل عام، حتى حد معين).
    • ارتباط سلبي (Negative Correlation): كلما زادت قيمة المتغير الأول، قلت قيمة المتغير الثاني. مثال: العلاقة بين كثافة الأعشاب الضارة وإنتاجية المحصول.
    • لا يوجد ارتباط (Zero Correlation): لا توجد علاقة خطية بين المتغيرين. مثال: قد لا يكون هناك ارتباط بين لون التربة ومعدل نمو النبات.
  • مثال تطبيقي:
    • السؤال البحثي: هل هناك علاقة بين كمية المياه المستخدمة في الري (بالمليمتر) وإنتاجية محصول الطماطم (بالكيلوجرام/المتر المربع)؟
    • البيانات: لنفترض أننا جمعنا البيانات التالية من 10 قطع أراضٍ:

قطعة الأرض

كمية المياه (مليمتر)

إنتاجية الطماطم (كيلوجرام/متر مربع)

1

100

5

2

120

6

3

140

7

4

160

8

5

180

9

6

200

10

7

220

11

8

240

12

9

260

13

10

280

14

    • حساب معامل ارتباط بيرسون (r):
      • لحساب r، نستخدم الصيغة التالية:
        • r = Σ[(xi - x̄)(yi - ȳ)] / √[Σ(xi - x̄)² Σ(yi - ȳ)²]
        • حيث:
          • xi: قيمة المتغير الأول (كمية المياه) للوحدة i.
          • yi: قيمة المتغير الثاني (إنتاجية الطماطم) للوحدة i.
          • x̄: متوسط قيم المتغير الأول.
          • ȳ: متوسط قيم المتغير الثاني.
          • Σ: علامة الجمع.
      • باستخدام البيانات أعلاه، نحسب:
        • x̄ = (100 + 120 + ... + 280) / 10 = 190
        • ȳ = (5 + 6 + ... + 14) / 10 = 9.5
        • Σ[(xi - x̄)(yi - ȳ)] = (100-190)(5-9.5) + (120-190)(6-9.5) + ... + (280-190)(14-9.5) = 825
        • Σ(xi - x̄)² = (100-190)² + (120-190)² + ... + (280-190)² = 82500
        • Σ(yi - ȳ)² = (5-9.5)² + (6-9.5)² + ... + (14-9.5)² = 82.5
        • r = 825 / √(82500 * 82.5) = 825 / √6806250 = 825 / 2608.88 = 0.9966
    • التفسير: قيمة معامل الارتباط (r = 0.9966) قريبة جدًا من +1، مما يشير إلى وجود ارتباط إيجابي قوي جدًا بين كمية المياه المستخدمة في الري وإنتاجية محصول الطماطم. بمعنى آخر، كلما زادت كمية المياه المستخدمة، زادت إنتاجية الطماطم.

ب. الانحدار (Regression):

  • المفهوم: يهدف إلى وصف العلاقة بين متغير تابع (dependent variable) ومتغير مستقل واحد أو أكثر (independent variables). على عكس الارتباط، يفترض الانحدار وجود علاقة سببية بين المتغيرات، ويستخدم لتقدير أو التنبؤ بقيمة المتغير التابع بناءً على قيم المتغيرات المستقلة.
  • أنواع الانحدار:
    • الانحدار الخطي البسيط (Simple Linear Regression): يستخدم لوصف العلاقة بين متغير تابع ومتغير مستقل واحد. يتم تمثيل العلاقة بخط مستقيم.
    • الانحدار الخطي المتعدد (Multiple Linear Regression): يستخدم لوصف العلاقة بين متغير تابع واثنين أو أكثر من المتغيرات المستقلة.
    • الانحدار غير الخطي (Non-linear Regression): يستخدم لوصف العلاقة بين متغير تابع ومتغير مستقل واحد أو أكثر، عندما تكون العلاقة غير خطية.
  • معادلة الانحدار الخطي البسيط:
    • y = a + bx
    • حيث:
      • y: المتغير التابع (القيمة التي نحاول التنبؤ بها).
      • x: المتغير المستقل (المتغير الذي نستخدمه للتنبؤ).
      • a: نقطة التقاطع مع المحور y (قيمة y عندما x = 0).
      • b: ميل الخط (مقدار التغير في y لكل وحدة تغير في x).
  • مثال تطبيقي:
    • السؤال البحثي: بناءً على البيانات الموجودة في المثال السابق (كمية المياه وإنتاجية الطماطم)، هل يمكننا استخدام الانحدار للتنبؤ بإنتاجية الطماطم بناءً على كمية المياه المستخدمة؟
    • البيانات: نفس البيانات المستخدمة في مثال الارتباط.
    • حساب معادلة الانحدار الخطي البسيط:
      • لحساب قيمتي a و b، نستخدم الصيغ التالية:
        • b = Σ[(xi - x̄)(yi - ȳ)] / Σ(xi - x̄)²
        • a = ȳ - b * x̄
      • باستخدام البيانات أعلاه، نحسب:
        • b = 825 / 82500 = 0.01
        • a = 9.5 - 0.01 * 190 = 9.5 - 1.9 = 7.6
      • إذن، معادلة الانحدار هي: y = 7.6 + 0.01x
    • التفسير:
      • a = 7.6: هذا يعني أنه إذا لم يتم استخدام أي ماء للري (x = 0)، فإننا نتوقع أن تكون إنتاجية الطماطم 7.6 كيلوجرام/المتر المربع. (هذا قد لا يكون منطقيًا في الواقع، ولكنه مجرد تفسير رياضي).
      • b = 0.01: هذا يعني أنه مقابل كل مليمتر إضافي من المياه المستخدمة في الري، نتوقع زيادة إنتاجية الطماطم بمقدار 0.01 كيلوجرام/المتر المربع.
    • التنبؤ:
      • إذا أردنا التنبؤ بإنتاجية الطماطم إذا استخدمنا 250 مليمتر من الماء، فإننا نعوض عن x في المعادلة:
        • y = 7.6 + 0.01 * 250 = 7.6 + 2.5 = 10.1
      • إذن، نتوقع أن تكون إنتاجية الطماطم 10.1 كيلوجرام/المتر المربع إذا استخدمنا 250 مليمتر من الماء.

ج. الفرق بين الارتباط والانحدار:

الميزة

الارتباط

الانحدار

الغرض

قياس قوة واتجاه العلاقة الخطية بين متغيرين.

وصف العلاقة بين متغير تابع ومتغير مستقل (أو أكثر)، والتنبؤ بقيمة المتغير التابع.

العلاقة السببية

لا يفترض وجود علاقة سببية.

يفترض وجود علاقة سببية (المتغير المستقل يؤثر على المتغير التابع).

المتغيرات

يتعامل مع كلا المتغيرين على قدم المساواة.

يميز بين متغير تابع ومتغير مستقل.

التنبؤ

لا يستخدم للتنبؤ.

يستخدم للتنبؤ بقيمة المتغير التابع.

القيمة

معامل ارتباط (r) يتراوح بين -1 و +1.

معادلة انحدار تحدد العلاقة بين المتغيرات.

د. استخدام البرامج الإحصائية:

لحسن الحظ، لا تحتاج إلى إجراء هذه الحسابات يدويًا. يمكن لبرامج الإحصاء مثل SPSS و R و SAS حساب معاملات الارتباط ومعادلات الانحدار بسهولة. كل ما عليك فعله هو إدخال البيانات واختيار الإجراءات الإحصائية المناسبة.

ه. اعتبارات هامة:

  • الارتباط لا يعني السببية: مجرد وجود ارتباط بين متغيرين لا يعني أن أحدهما يسبب الآخر. قد يكون هناك متغير ثالث يؤثر على كلا المتغيرين، أو قد تكون العلاقة مجرد صدفة.
  • العلاقة الخطية: يقيس الارتباط الخطي فقط العلاقات الخطية بين المتغيرات. إذا كانت العلاقة غير خطية، فقد يكون الارتباط منخفضًا، حتى لو كان هناك علاقة قوية بين المتغيرات.
  • القيم المتطرفة (Outliers): يمكن أن تؤثر القيم المتطرفة بشكل كبير على معاملات الارتباط ومعادلات الانحدار. من المهم تحديد القيم المتطرفة والتحقق من تأثيرها على النتائج.
  • افتراضات الانحدار: يتطلب الانحدار الخطي استيفاء بعض الافتراضات، مثل أن تكون الأخطاء موزعة طبيعيًا ومتساوية التباين. إذا لم يتم استيفاء هذه الافتراضات، فقد تكون النتائج غير موثوقة.

و. أمثلة إضافية:

  • الارتباط:
    • العلاقة بين كمية الأمطار السنوية وإنتاجية القمح في منطقة معينة.
    • العلاقة بين تركيز النيتروجين في التربة ونمو النبات.
    • العلاقة بين عدد الحشرات الضارة وشدة الإصابة بالأمراض النباتية.
  • الانحدار:
    • التنبؤ بمحصول الذرة بناءً على كمية السماد النيتروجيني المستخدمة.
    • تقدير وزن الحيوان بناءً على قياسات محيط الصدر والطول.
    • تحديد تأثير درجة الحرارة والرطوبة على معدل انتشار مرض نباتي معين.

باختصار، الارتباط والانحدار هما أداتان إحصائيتان قيمتان يمكن استخدامهما لتحليل العلاقات بين المتغيرات في المجالات الزراعية. يساعد الارتباط في تحديد قوة واتجاه العلاقة، بينما يساعد الانحدار في وصف العلاقة والتنبؤ بقيم المتغيرات. من المهم فهم المفاهيم الأساسية والافتراضات المرتبطة بهذه الأدوات لضمان الحصول على نتائج دقيقة وموثوقة.