دلالة الفـروق

 

    عادة مايكون الباحث أكثر اهتماما في سعيه إلى معرفة مدى الاتفاق أو الاختلاف بين بارامترات أصول كلية متعددة ، وكيف يؤدى به ذلك إلى اتخاذ قرار حول اعتبار العينات التي يدرسها تنتمى إلى اصل واحد أو إلى أصول مختلفة أو بعبارة أكثر دقة ، يسعى الباحث إلى معرفة ما إذا كانت احصاءتين ملاحظتين لعينتين (متوسطين مثلا) توجد بينهما  فروق فيما يقابلها من بارامترات الأصول التي سُحبتا منها . ويسمى ذلك في الإحصاء الاستدلالي بدلالة الفروق وهذه المسالة قد تكون لدى الباحث النفسي والتربوي والاجتماعي أكثر أهمية من مجرد تحديد الإحصاء الوصفى لبياناته .

 

اختبار الفـروض

 

    إن البحث العلمي يسعى دائما للإجابة على سؤال معين أو لاختبار فرض، أو فروض محددة ، ومن هنا يمكن القول بأن المنهج التجريبي هو المنهج الأساسي لاختبار الفروض بالمعنى الدقيق . صحيح أن أى منهج بحثي آخر يمكن أن تصاغ له فروض ويتم اختبارها بالطــرق الملائمة غير أن المنهج التجريبي بحكم طبيعته يسعى بالفعل إلى تحديد ما إذا كان  المتغير المستقل  يؤثر في المتغير التابع . وللوصول إلي هذا القرار لابد من المقارنة بين أداء المفحوصين في معالجتين أو أكثر . ويقصد بالمعالجة Treatment في التصميمات التجريبية مستويات المتغير المســتقل التي تقدم للمفحوصين أو الشــــروط والظروف المختلفة التي يتعرضــون لها . ويمكـن أن نلخص الخطــوات الأســاسية في إجراء التجـربة (التي قد تكون معملية أو ميدانــية) لمعالجتين على الأقل على النحو الآتي (kiess & Bloomquist, 1985) :

 

1- صياغة فرض البحث بحيث يعبر عن العلاقة بين المتغير المستقل والمتغير التابع.

2- توزيع المفحوصين على معالجتي البحث عشوائياً . وقد تسمى إحداهما المعالجة التجريبية والأخرى المعالجة الضابطة أو المعالجة القبلية

والمعالجة البعدية (قد تستخدم تسميات أخرى حسب التصميم التجريبي للبحث كما سنبين فيما بعد).

3- تقديم المتغير المستقل وقياس المفحوصين في المتغير التابع .

4- الحصول على وصف إحصائي لبيانات المتغير التابع المقيس وأهمها احصاءة متوسط درجات المفحوصين في المعالجتين.

5- استخدام احصاءة متوسط العينات في تقدير متوسطات الأصول الذي سحبت منها هذه العينات لاختبار الفروض حول دلالة الفروق.

 

    وقبل تناول مسألة اتخاذ القرار حول دلالة الفروق أو الحكم على فعالية أو اثر معالجة معينة في المتغير التابع لابد من الإشارة إلى أن بعض الفروض قد تعبر عن محض علاقة بين متغيرين كما هو الحال في البحوث الارتباطية وشبه التجريبية . كما لابد من التمييز بين الفرض التجريبي (أو فرض البحث) والفرض الإحصائي الذي في ضوئه يتخذ هذا القرار أو يتم التوصل إلى هذا الحكم ، وهو ما سنتناوله فيما يلي:

 

الفرض التجريبي وهو فرض البحث :

     يمكن  تعريف الفرض التجريبي أو فرض البحث   بأنه حدس  جيد أو توقع معقول للنتيجة التي سوف تتوصل إليها الدراسة . ولكي يكون الفرض كذلك لابد أن يتسم بالخصائص الآتية :

 

1-  أن يكون خلاصة تأمل وفهم جادين للعلاقة بين متغيرات البحث (المستقلة والتابعة) . وهذا التأمل والفهم هما نتاج الدراسة العميقة لنظرية معينة أو نتائج بحوث سابقة أو خبرة عملية رشيدة ، وهذه جميعا تؤلف الإطار النظري للبحث . ومعنى ذلك أن الفرض التجريبي يجب أن يكون ويثق الصلة بهذا الإطار.

2-  أن يصاغ صياغة واضحة في صورة خبرية أو عبارة تقديرية ، ومعنى ذلك أن صيغة السؤال لا تصلح لهذا الغرض . والسبب الجوهري في ذلك أن الصيغة الخبرية أو التقريرية هي وحدها التي تحكم عليها بالصحة أو الخطأ، أما صيغة السؤال فليست كذلك.  ولعل الباحثين المعاصرين يتنبهون إلى هذا التمييز الهام ويتوقفون عن صياغة فروضهم في صورة أسئلة ، وهى استراتيجية شاعت في السنوات الأخيرة.

3- أن يكون الفرض قابلا للاختبار من خلال الأدلة الأمبريقية التي يجمعها الباحث. ومعنى ذلك أن يكون الفرض صالحاً للتعبير عنه بالصيغة الإجرائية التي يمكن تقويمها في ضوء هذه الأدلة.

 

وإليك أمثلة على فروض تجريبية (تعبر عن علاقة أو أثر) تتوافر فيهبا الشروط السابقة :

1- يرتبط القلق والتحصيل ارتباط سالبا.

2- معدل التسرب في المدرسة الريفية أعلى منه في المدرسة الحضرية.

3- العلاج الدوائي أكثر فعالية في زوال الأعراض العرضية من التحليل النفسي.

4- لا يؤثر الحرمان الحسي في الحيوانات الغبية.

5- لا توجد علاقة بين المثابرة والذكاء.

6- التعزيز الفوري أكثر تفضيلا لدى الأطفال منه لدى المراهقين.

7- توجد علاقة بين القلق والذكاء.

8- توجد فروق بين الجنسين في القدرة الميكانيكية.

 

    ولعلك لاحظت أن جميع الفروض السابقة وأمثالها كثير تعبر عن توقع نتيجة معينة من البحث . وبعض هذه التوقعات لها وجهة معينة (في الفرضين 1 ، 2) أو أثر معين (في الفرضين 3 ، 6) ، وبعضها الآخر ليست له وجهة محددة . وهذه الفروض بدورها من فئتين . أولها يتوقع وجود علاقة ما (الفرض7) أو فروق ما ( الفرض 8) دون تحديد لاتجاه هذه العلاقة أو تلك الفروق ، وثانيها وتسمى الفروض الصفرية يتوقع عدم وجود علاقة (الفرض5) ، أو عدم وجود أثر (الفرض 4) . ويسمى النوع الأول من هذه الفروض التجريبية بالفروض الموجهة ، أما النوع الثاني بفئتيه فيسمى الفروض غير الموجهة .

 

    وفى جميع الحالات يجب أن يستند الفرض إلى إطار نظري محدد المعالم. وهنا يجب أن ننبه إلى أن بعض الباحثين يلجأون إلى الفروض غير الموجهة ومنها الفروض الصفرية كحيلة هروبية يتخلصون بها من الجهد المعرفي اللازم لبناء إطار نظري سليم للبحث ، ولعل مما يؤسف حقا أن كثيراً مما يطلق عليه الإطار النظري لبعض البحوث ليس إلا مجموعة أفكار متناثرة قد لا يربطها رباط ، وهذا في حد ذاته يفقد البحث الصلة بين نظريته وفروضه ، وبهذا يفتقد الوحدة الأساسية اللازمة له.

 

الفرض الإحصائي :

    من الوجهة الإحصائية نقول أن الفرض التجريبي على الرغم من أهميته في البناء الأساسي للبحث لا يكفى  وحدة لاختبار العلاقة (كما هو الحال في الفروض 1 ، 2 ، 5) أو الأثر (كما هو الحال في الفرض 3 ، 4 ، 6) . فالفرض التجريبي لا يحدد مقدار هذه العلاقة أو الأثر . وكل ما يعبر عنه كما أسلفنا هو توقع (أو عدم وجود) علاقة أو أثر. وبالتالي يصعب إن لم يستحيل اختبار الفرض التجريبي للحكم على صحته أو خطئه أو لاتخاذ قرار بالنسبة لتحققه أو عدم تحققه ، من خلال استنتاج وجود العلاقة (أو عدم وجودها) أو استخلاص حدوث الأثر (أو عدم حدوثه) وكذلك استنتاج ما إذا كانت العلاقة إن وجدت   سالبة أو موجبة ، والأثر أن حدث زيادة أو نقصاً.

 

    ولكي يتم تقويم الفرض في جميع هذه الحالات لابد من مقارنته بمحك (أو معيار أو مستوى) معين (وهذا هو المعنى الأساسي للتقويم في أى سياق) . والمحك في جميع الأحوال هو بارامتر الأصل المناظر لاحصاءة العينة التي توصل إليها الباحث وبينهما تتم المقارنة المشار إليها . وبالطبع فإن الفرض التجريبي لا يساعدنا على إجراء مثل هذه المقارنات ، ومن هنا كان لابد من التحول في عملية البحث عند صياغة الفرض من مرحلة الفرض التجريبي إلى مرحلة الفرض الإحصائي ، وهنا لابد من التمييز بين نوعين من الفروض الإحصائية هما الفرض البديل والفرض الصفري .

 

الفرض البديل :

    يقصد بالفرض الإحصائي البديل Alternative Hypothesis توقع أن تكون القيمة المحسوبة لاحصاءة العينة (المتوسط أو معامل الارتباط مثلا) تختلف عن البارامتر المناظر لها في الأصل ، أو أن البارامترين  الخاصين بأصول معالجتين في البحث (أو أكثر مما سنبين فيما بعد) مختلفان  (أى غير متساويين) على الرغم من عشوائية الاختيار  الأولى للعينات وحينئذ لامناص من افتراض أن ذلك يرجع إلى استقلال المتغيرات (في حالة بحوث العلاقة) أو إلى أثر المتغير المستقل في المعالجة (أو المعالجات) التجريبية في حالة بحوث الأثر.

 

    والفرض البديل قد يكون موجها أو غير موجهة . فإذا كان غير موجه فإننا نستخدم في هذه الحالة اختبارا لدلالة الفروق يسمى اختبار الطرفين  Two-Tailed (وهو الاختبار الأساسي لدلالة الفروق في معظم الحالات وسوف نشرحه بالتفصيل فيما بعد) . وحينئذ يمكن تحديد أى اختلاف بين القيمة الحقيقة والقيمة الفرضية للبرامتر بصرف النظر عن اتجاه هذا الاختلاف (بالزيادة أو النقص عنها) . وتفيد هذه الصيغة في حالة توقع الباحث في فرضه التجريبي (من نظرية البحث أو من نتائج البحوث السابقة) وجود أثر أو وجود علاقة إلا أنهما غير محددي الاتجاه . ومن أمثلة الفروض التجريبية غير الموجهة والتي قد توجه الباحث في الاختبار الإحصائي لدلالة الفروق إلى الفرض الإحصائي البديل غير الموجه الصيغ الآتية:

 

1- توجد فروق بين الذكور والإناث في القدرة اللغوية خلال مرحلة الطفولة المبكرة .

2- تختلف طريقة الاكتشاف في آثارها في التعلم عن طريقة التلقي .

3- توجد علاقة بين المثابرة والذكاء.

 

    أما إذا كانت نظرية البحث (أو نتائج البحوث السابقة) تحدد اتجاها معينا للعلاقة أو الأثر كما يحدده الفرض التجريبي فإن الفرض الإحصائي البديل يصبح حينئذ فرضا موجها أيضا . وحينئذ يستخدم الباحث اختبار للدلالة من نوع آخر يسمى اختبار الطرف الواحد One –Tailed  (وهو مفهوم سوف نشرحه بالتفصيل فيما بعد). وفى هذه الحالة يكون هناك اتجاه محدد للاختلاف بين القيمة الحقيقة والقيمة الفرضية للبرامتر . (زيادة أو نقص ، سلب أو إيجاب، الخ). ، ومن أمثلة الفروض التجريبية الموجهة والتي قد توجه الباحث في الاختبار الإحصائي لدلالة الفروق إلى الفرض الإحصائي البديل الموجه الصيغ الآتية :

 

1- تتفوق الإناث على الذكور في القدرة اللغوية خلال مرحلة الطفولة المبكرة.

2- طريقة الاكتشاف أكثر فعالية في التعلم من طريقة التلقي.

3- توجد علاقة سالبة بين المثابرة والذكاء.

 

الفرض الصفري :

    والسؤال الآن : هل الفرض التجريبي الذي يتوقع نتيجة معينة للبحث (في ضوء نظريته أو الدراسات السابقة حول مشكلته) ، سواء كان هذا التوقع موجها أو غير موجه يتكافأ تماما مع الفرض الإحصائي البديل ؟ الإجابة على هذا السؤال بالنفي . ولتوضيح ذلك لابد من بيان أن المقصود بمصطلح الفرض البديل أنه بديل لنوع آخر وأكثير أهمية من الفروض الإحصائية يسمى الفرض الصفري (أى عدم وجود فروق أو عدم وجود أثر أو عدم وجود علاقة ، كما سنبين فيما بعد). والفرض الصفري يفترض أن بارمترات الأصول متساوية أما الفرض البديل فإنه على العكس من ذلك يفترض أن بارامترات الأصول غير متساوية . وإذا تأملنا هذه المسألة بشيء من الأناة فسوف نكتشف أن هناك  في الواقع عدة فروض بديلة للفرض الصفري الذي يكون واحدا دائما . ولنتأمل مثال العلاقة بين الذكاء والمثابرة . أن الفرض الصفري في هذه الحالة أنه لا توجد علاقة بين المتغيرين (أى توقع استقلال المتغيرين وبالتالي أن يكون معامل الارتباط بينهما صفرا). أما الفروض البديلة لهذا الفرض الصفري فهي كما يلي :

 

1- توجد علاقة بين المثابرة والذكاء (فرض بديل غير موجه).

2- العلاقة بين المثابرة والذكاء سالبة (فرض بديل سالب وهو يتفق مع الفرض التجريبي).

3- العلاقة بين المثابرة والذكاء موجبة ( فرض بديل موجب وهو لا يتفق مع الفرض التجريبي).

 

    أما المثال الثاني فعن أثر طريقتي الاكتشاف والتلقي في التعلم . أن الفرض الصفري في هذه الحالة أنه لا توجد فروق بين متوسطي التعلم في الأصليين اللذين سحبت منهما مجموعتي الاكتشاف والتلقي ، أو بعبارة أخرى يتساوى المتوسطان ، أما الفروض البديلة لهذا الفرض الصفري فهي مرة أخرى ثلاثة على النحو الآتي :

 

1- تختلف طريقة الاكتشاف عن طريقة التلقي في أثرها في التعلم (فرض بديل غير موجه).

2- طريقة الاكتشاف أكثر فعالية في التعلم من طريقة التلقي (فرض بديل موجه لصالح طريقة الاكتشاف وهو يتفق مع فرض البحث).

3- طريقة التلقي أكثر فعالية في التعلم من طريقة الاكتشاف (فرض بديل موجه لصالح طريقة التلقي وهو لا يتفق مع الفرض التجريبي).

 

    ولعلك لاحظت أن الفرض البحثي هو أحد الفروض البديلة في كل من المثالين السابقين بالإضافة إلى أن صيغة الفرض الصفري فد تكون أيضا أحد الفروض البحثية ، والفيصل في جميع الحالات هو الإطار النظري للبحث.

 

    والسؤال الهام هو: كيف يمكن اختبار الفرض البديل ؟ للإجابة على هذا السؤال لابد من توسيع الافتراض الذي يقوم عليه هذا الفرض بالقول بأنه يفترض أيضا أن الاحصاءة المحسوبة لعينة واحدة (أو أكثر) تختلف عن بارامتر الأصل ( أى أن المتوسطان غير متساوين) ، وبالتالي يكون للمتغير المستقل اثر في المتغير التابع أو تكون هناك علاقة بين متغير البحث ، ومعنى ذلك أن الباحث إذا أراد استخدام استراتيجية الفرض البديل في الاختبار الإحصائي فإنه يقع في حيرة حقيقية لأنه لا يعلم قيمة البارامتر ، بينما في الفرض الصفري يعلم قيمته (حين يفترض أن الاحصاءة المحسوبة تساوى بارامتر الأصل في حالة المتوسط) . ولهذا فلا مناص أمامه من أن يكون اختباره للفرض البديل على نحو غير مباشر ، بينما الاستراتيجية  بطريقة غير مباشرة من خلال اختبارنا المباشر للفرض الصفري.

 

     ولكي نوضح فكرة أن الفرض الصفري لا يمكن اختباره على نحو مباشر نعطى المثال الآتي : نفرض أن أحد الباحثين يريد أن يثبت أن جميع الطلاب قادرين علي التعلم ، فإن هذا الفرض البديل في هذه الحالة يمكن صياغته على النحو الآتي :

 

جميع الطلاب قادرين علي التعلم

    أما الفرص الصفري فيمكن صياغته كما يلي :

 

جميع الطلاب ليسوا قادرين علي التعلم

    وهكذا فإن الفرض الصفري يقرر أنه لو وجد طالب واحد فقط ليس قادر علي التعلم فإن الفرض البديل لا يكون صحيحا . فإذا حاول الباحث اختبار الفرض البديل مباشرة فإنه حتى لو لاحظ مئات (بل آلاف) الطلاب قادرين علي التعلم فإن ذلك لا يثبت هذا الفرض البديل (أى جميع الطلاب قادرين علي التعلم) لأنه لو استمر في البحث والملاحظة فربما يكتشف أن طالبا واحدا غير قادر علي التعلم يؤدى إلى دحض فرضه البديل كله . وهكذا فإن دليلا سلبيا واحدا يكفى لرفض الفرض البديل بينما آلاف الأدلة الموجبة لا تدعمه . وهكذا لا يمكن التأكد من صحة الفرض البديل إلا إذا فعل الباحث المستحيل ، أى لاحظ جميع الطلاب وتأكد أنهما جميعاً قادرين علي التعلم .

 

    وبالطبع كما أسلفنا يستحيل على الباحث أى يلاحظ جميع الطلاب (أو يجمع جميع الأدلة) ، إلا أنه قد يلاحظ أعداداً كبيرة منهم (قد تكون بضعه آلاف) ويجد أن  أغلبية الأدلة  لصالح الفرض البديل ، فيستنتج من ذلك أن الفرض البديل قد يكون صحيحا ، ويرفض حينئذ الفرض الصفري . ولعلك لاحظت أنه قُبل الفرض البديل على أساس اتجاه معظم الأدلة لصالحة وليس لوجود دليل مباشر يؤيده (Christenson & stoup, 1986) .

 

أهمية الفرض الصفري :

    الفرض الصفري Null Hypothesis  كما اتضح من مناقشتنا السابقة يفترض مقدماً قيمة محددة لبارامتر الأصل ، كما يفترض أن أى فروق بين الاحصاءة المحسوبة وهذا البارامتر تكون ضئيلة للغاية بحيث يمكن اعتبارها من نوع أخطاء العينات . إن الاحصاءة والبارامتر يفترض فيهما التساوي (في حالة المتوسط) . أو أن الفرق بين الاحصاءة والبارامتر يؤول إلي الصفر الإحصائي (في حالة المتوسط أيضا) وهذا يعنى أيضا عدم الدلالة الإحصائية ، وفى هذه الحالة تستخدم الاحصاءة المحسوبة (المتوسط ، معامل الارتباط ، الخ) على أنها تقدير لبارامتر الأصل ، بافتراض أن هذه الاحصاءة المحسوبة لعينة معينة لن تختلف قيمتها جوهريا إذا حسبت لعينات كثيرة أخرى محسوبة من نفس الأصل ومتساوية في العدد ، وهذه القيم جميعا سوف لا تختلف جوهريا أيضا عن قيمة بارامتر الأصل . ومعنى ذلك أننا في الفرض الصفري تكون على بينه بقيمة بارامتر الأصل ، وهذا على عكس الفرض البديل الذي تكون قيمة البارامتر فيه غير معلومة .

 

    ولهذا السبب فإن استخدام الفرض الصفري هو الاستراتيجية المباشرة  الوحيدة لاتخاذ القرارات الإحصائية المقبولة منطقيا ، بل أن الباحث عند اختباره لفرض بديل (من احصاءة عينة) فلا مناص لديه من اللجوء أيضا إلى استراتيجية الفرض الصفري فهي وحدها التي تقوده مباشرة إلى قبول الفرض البديل أو رفضه (إلا إذا لجأ إلى الحل الصعب ، بل المستحيل ، في إجراء بحثه على آلاف العينات المشتقة من نفس الأصل وحينئذ قد يلجأ إلى ترجيح كفة الفرض البديل إذا كانت معظم الأدلة في صالحه).

 

   وقد اقترح مفهوم الفرض الصفري عالم الإحصاء البريطاني الشهير فيشر في سياق تأكيده المنطقي على طريقة التناقض Contradiction (أو طريقة البطلان Falsifiability  في مقابل طريقة الإثبات Conformability عند أصحاب المنطق الجديد) . فقد ذكر فيشر هذه الحقيقة وهى أننا لا نستطع أن نتثبت صحة الفرض البديل (من خلال حصر جميع الأدلة الموجبة عليه) لأن التحقق الكامل Verifiability  للفرض في هذه الحالة يكاد يكون مستحيلا ، بينما يسهل علينا كثيرا إثبات زيف الفرض الصفري ، فبضعة شواهد دالة تكفى لدحض الفرض الصفري في نطاق معين من الشك على نحو يؤدى لقبول الفرض البديل ، ولهذا السبب الفلسفي احتل الفرض الصفري مكانته البالغة الأهمية في علم الأصحاء الحديث .

 

    ويوجد سبب آخر ذو طبيعة عملية لأهمية الفرض الصفري يتلخص في أن هذا الفرض يزودنا بنقطة بداية ملائمة لأي اختبار إحصائي . ففي حالة الفرض البديل إذا كانت المتوسطات غير متساوية فأي فرض سوف نختبر ؟ إن الباحث لاشك لا يكون لديه فرض إحصائي محدد في ذهنه لاختباره ، وبدون ذلك لا يمكن له أن يتصور أن توزيع مفترض للعينات ، أما في حالة الفرض الصفري فإنه حينئذ يصبح لديه نقطة بداية لتصور توزيع العينات على أساس احصاءة العينة ، يعتمد عليها في اختبار هذا الفرض الصفري ، ومن نتائج عملية الاختبار الإحصائي هذه قد يتوصل الباحث إلى قبول هذا الفرض أو رفضه ، فما هي نتائج هذا القرار بالنسبة للفرض التجريبي.

 

    في حالة قبول الفرض الصفري فإن ذلك قد يعنى أن الفرض التجريبي صحيح إذا كان قد صيغ بالفعل في صورة صفرية (في ضوء الإطار النظري للبحث) . أما إذا كان الفرض التجريبي قد صيغ موجها (مرة أخرى في ضوء نظرية البحث) فإن قبول الفرض الصفري إحصائيا يعنى عدم صحة هذا الفرض التجريبي ، أما في حالة رفض الفرض الصفري فإن العكس يصبح صحيحاً. أى عدم صحة الفرض التجريبي أن كان صيغ في صورة صفرية ، وصحته ، أن كانت صياغته موجهة .

 

    ولكن هل نتائج اســتراتيجية الفرض الصــــفري حاسـمة ، يرى (Howell, 1987) أننا في حالة الرفض الإحصائي للفرض الصفري تكون النتائج عادة ذات اتجاه معين ، قد تتفق أو يختلف مع فرض البحث ، وحينئذ يسهل على الباحث تفسير نتائجه بتدعيم فرضه التجريبي أو تعديله أو حذفه وما يصاحب ذلك كله من تأكيد أو تطوير في نظرية البحث ، ولكن ماذا لو تم قبول الفرض الصفري إحصائيا ؟

 

    يمثل هذا السؤال إشكالية أخرى تكاد تكون عكس تلك التي تناولناها عند حديثنا عن الفرض البديل . فإذا كانت آلاف الأدلة الموجبة لا تدعم الفرض البديل بينما دليل واحد سالب يدحضه ، فإننا نقول مع الفرض الصفري أن إثبات عدم زيف الفرض الصفري لا يعني بالضرورة أنه صحيح ، أى بالفعل عدم وجود فروق أو عدم وجود علاقة أو عدم وجود أثر . فالواقع أن النتيجة غير الدالة ، والتي بها ندعم الفرض الصفري ، هي الواقع نتيجة احتمالية وبالتالي غير حاسمة . وعلى الباحث في هذه الحالة أن يختار بين قبول الفرض الصفري وتعليق الحكم . ويعنى تعليق الحكم هنا وجود ثلاثة احتمالات للوصول إلي هذه النتيجة (في حالة استخدام معالجتين إحداهما تجريبية والأخرى ضابطة مثلا) هي :

 

1- المجموعة التجريبية تعاملت مع المتغير المستقل بطريقة أفضل قليلا من المجموعة الضابطة.

2- المجموعة التجريبية تعاملت مع المتغير المستقل بطريقة أسوأ قليلا من المجموعة الضابطة.

3- لا يوجد أى فرق بين المجموعتين في التعامل مع المتغير المستقل.

 

    وقد رأى فيشر أن الفشل في رفض الفرض الصفري يعنى في الحقيقة أن بياناتنا لا تكفى للاختيار بين هذه البدائل الثلاثة  والأصح عندئذ تعليق الحكم.

 

    وقد اتخذ نيمان وبيرسون (Neyman & perarson, 1933) موقفا مختلفتا وأكثر عملية إزاء هذه المسألة ، فموقف تعليق الحكم يقول لنا (وخاصة لمتخذي القرار ت العلمية منا) انتظروا حتى يتم إجراء بحوث أخرى ومن نتائجها يمكن حسم المسالة ورفض الفرض الصفري ، بينما الفرض الصفري قد يكون أصيلا بالفعل في نظرية البحث ذاتها ، ناهيك أنه قد لا تتوافر للباحث الإمكانات لتكرار البحث عدة مرات ، بالإضافة إلي أن أى اختبار إحصائي لا يمكن أن يثبت ابدأ وبشكل يقيني ما إذا كان الفرض الصفري صحيح أو زائف . فالاختبار الإحصائي مؤشر فقط على مدى احتمال حدوث الفرض الصفري . وبدون دراسة الأصل الكلى يستحيل إثبات أى فرض (صفريا كان أم بديلا) (Welkowitz and Others, 1982) . ولذلك اقترح بيرسون وزميله على الباحث أن يختار بين قبول الفرض الصفري أو رفضه. وحين يقبل هذا الفرض الصفري فإن ذلك لا يعنى إثبات أنه صحيح ، وإنما ببساطة سوف نتصرف ولو مؤقتا حتى تتوافر لنا بيانات أكثر ملاءمة كما لو كان صحيحا . وفى حالتى القبول أو الرفض يجب أن يكون اهتمامنا أكثر تركيزاً على احتمال القبول الزائف أن الرفض الزائف للفرض الصفري. وقد أثار ذلك عند علماء الإحصاء الاهتمام بأخطاء الاستدلال الإحصائي التي سوف نعرضها فيما يلي:

 

 

أنواع القرارات الإحصائية :

    يمكن أن تصنف القرارات الإحصائية التي يتوصل إليها الباحث إلى أربعة فئات يلخصها الجدول التالي :

أنواع القرارات الإحصائية

 

 

وضع الفرض الصفري في الأصل الكلي

صحيح

خطأ

 
نتائج

البحث علي العينة تقرر بالنسبة للفرض الصفري

قبول

قرار صحيح

احتمال قبول الفرض الصفري وهو صحيح بالفعل .

خطأ من النمط الثاني

احتمال (أو المخاطرة) بقبول الفرض الصفري بينما هو خطأ

 
رفض
خطأ من النمط الأول

احتمال (أو المخاطرة) برفض الفرض الصفري بينما هو صحيح.

قرار صحيح

احتمال رفض الفرض الصفري وهو خطأ بالفعل.

 

     ومن هذا الجدول يتضح أن هناك أربع أنواع من القرارات الإحصائية التي قد يتخذها الباحثون ، بعضها صحيح وبعضها خطأ . ونبدأ بالقرارات الخاطئة لأنها الأكثر الأهمية على النحو الذي  بينه كارل بيرسون وزميله :

 

1- أن يكون بارامتر الأصل مساويا بالفعل لاحصاءة العينة ومعنى ذلك أن العينة مشتقة بالفعل من هذا الأصل (أى أن الفرض الصفري صحيح) ومع ذلك فان الباحث يرفض هذا الفرض الصفري ، واحتمال أو المخاطرة برفض الفرض الصفري بينما هو صحيح يسمى الخطأ من النمط الأول Type I ويشار إليه بالحرف اليوناني (ألفا  a ).

2- أن يكون بارامتر الأصل ليس مساويا بالفعل لاحصاءة العينة ، ومعنى ذلك أن العينة مشتقة من أصل مختلف (أى أن الفرض الصفري خطأ) ومع ذلك فإن الباحث يقبل هذا الفرض الصفري ، واحتمال أو المخاطرة بقبول الفرض الصفري بينما هو خطأ من النوع التي II Type  ويشار إليه بالحرف اليوناني (بيتا  b ).

3- أن يكون بارامتر الأصل ليس مساويا بالفعل لاحصاءة العينة (أى أن الفرض الصفري خطأ) ويرفض الباحث هذا الفرض الصفري بالفعل ، واحتمال رفض الفرض الصفري الخاطئ فعلا ، وهو قرار صحيح بالطبع ، يسمى قوة Power الاختبار الأساسي ، وهو يساوى (1-الخطأ من النوع الثاني)  أي   b 1 - .

4- أن يكون بارامتر الأصل مساويا بالفعل لاحصاءة العينة (أى أن الفرض الصفري صحيح) ويقبل الباحث هذا الفرض الصفري بالفعل . واحتمال قبول الفرض الصفري الصحيح فعلا ، وهو قرار صحيح بالطبع ، يساوى (1-الخطأ من النوع الأول) أى 1 - a  .

 

   وفى إجراء أى اختبار إحصائي يوجد في الواقع دائما النوعان المحتملان من المخاطرة بالخطأ : الخطأ من النوع الأول وفيه يرفض الباحث الفرض الصفري بينما هو صحيح ، أو الخطأ من النوع الثاني أى قبول الفرض الصفري بينما هو زائف .

 

      ويمكن تحديد احتمال الوقوع في الخطأ من النوع الأول ببساطة شديدة وعلى نحو مباشرة في ضوء مستوى الدلالة الذي يختاره الباحث لرفض الفرض الصفري . فحين يختار الباحث مستوى متشدداً للدلالة الإحصائية (مثلا مستوى 0.001 بدلا من 0.1 أو مستوى 0.01 بدلا من 0.5) فان احتمال الوقوع في هذا الخطأ قد يكون أكثر حدوثا . والمقصود بالتشدد هنا أن يختار الباحث نسبة اقل من الشك والتي تناظرها بالطبع نسبة أعلى من اليقين، والسؤال هنا لماذا لا نزداد تسامحا ونقبل مستويات أقل من الدلالة حتى نتجنب الوقوع في هذا الخطأ ؟

 

     يجيب جيلفورد وفرتشتر (Guilford & Fruchter, 1978) على هذا السؤال بأننا لو خفضنا مستوى الدلالة (أى زدنا من نسبة الشك) فإننا نزيد أوتوماتيكيا فرص الوقوع في النوع الآخر من الخطأ (أى قبول الفرض الصفري بينما هو خاطئ) . ومعنى ذلك أن نوعى الخطأ يرتبطان ارتباطا عكسيا ، فإذا زاد أحدهما يقل الآخر والعكس صحيح . وإذا كنا نستطيع التحكم المباشر في الخطأ من النوع الأول فإن الخطأ من النوع الثاني لا نتحكم فيه إلا على نحو غير مباشر من خلال هذه العلاقة العكسية التي تربطه بالخطأ من النوع الأول.

 

     ومن التقاليد الشائعة في البحث العلمي عدم رغبة الباحثين المخاطرة بالنوع الأول من الخطأ مقارنة بالنوع الثاني . فهم يريدون التأكد من أن نتائجهم لا ترجع إلى العشوائية أو المصادفة . ولعل المستويين الشائعين للدلالة (0.05، 0.01) يعبران عن هذا الحذر ضد الوقوع في الخطأ من النوع الأول ، بمعنى الوصول إلي عدد قليل نسبيا من النتائج التي لا ترجع إلي الخطأ ، وقبول عدد قليل من الفروق أو العلاقات على أنها دالة.

 

    إلا أن الأمر في البحث العلمي يحتاج إلى قدر من التوازن بين نوعى الخطأ ، ويعتمد ذلك على اعتبارات خارجية لها أهميتها ووزنها ، وقد تكون هناك أسباب نظرية أو عملية جادة تمنع الباحث من المغامرة  بالوقوع في أحد نوعى الخطأ أو تدفعه إلي ذلك ، ففي نظرية حديثة لا تزال في بدايتها يمكن للباحث الوقوع في النمط الثاني من الخطأ كنوع من الاستطلاع الأولى للنتائج ، أما بالنسبة لنظرية مدعمة ولها تاريخ طويل فيمكن الباحث اختيار المجازفة بالوقوع في النمط الأول سعيا لمزيد من التحقق واليقين والثقة وهذا القرار اكثر شيوعا في كثير من الحالات أيضا.

 

    وقد لا تكون المسالة مجرد اعتبارات نظرية ، فقد تلعب العوامل الثقافية والاجتماعية دورها في هذا القرار ، فإذا كان الباحث يجرى دراسة حول وراثة الذكاء ، مثلا ،  وهو موضوع خلافة إلى حد كبير ، أنه في هذه الحالة يفضل المجازفة بالوقوع في الخطأ من النوع الأول الذي يتطلب التشدد والصرامة  في اختيار مستوى الدلالة الإحصائية . وفى رأى جيلفورد وفرتشتر أنه في الممارسة  العلمية العامة حين تكون آثار المخاطرة غير خطيرة على القرار العلمي أو العملي فإن الاحتمال الثالث الذي اقترحه فيشر من قبل يمكن أن يكون مفيداً ، فبدلا من قبول الفرض الصفري أو رفضه ، يمكن للباحث أن يؤجل الحكم انتظارا للمزيد من نتائج البحوث التالية أو الأدلة المستقبلية ، وتأجيل الحكم يتضمن بالضرورة حاجة البحث إلى الاستعادة والتكرار . وهى إحدى الحاجات الهامة في البحث العلمي بصفة عامة.

 

    وتبقى ملاحظة أخيرة حول الفرض الصفري يجب إن يتنبه إليها الباحثون وخاصة المبتدئين منهم وهى أن هذا الفرض ليس إلا محض مفهوم إحصائي يصاغ في ضوء بارامترات الأصول ، وبعبارة أخرى فإن الفرض الصفري لا يعبر عن وجود أو عدم وجود فروق بالفعل كما تعبر عنه نظرية معينة للبحث أو نتائج الدراسات السابقة حول مشكلته . كما أنه لا صلة تربطه بصياغة الفرض التجريبي (أو فرض البحث) ذاته حتى ولو كانت صيغة فرض البحث تعبر عن عدم وجود علاقة أو عدم وجود فروق في ضوء الإطار المنطقي لهذا البحث . أضف إلى ذلك أنه ليس مجرد صيغة سلبية للصيغة الإيجابية التي يكون عليها فرض البحث ، كما أنه لا يستخدم في تنمية الفرض التجريبي  حول النتائج المتوقعة للدراسة . أنه باختصار جزء من الإجراءات الإحصائية لاتخاذ القرار الإحصائي . فهل تتوقف هذه الموضة الخاطئة التي شاعت في البحوث النفسية والتربوية والاجتماعية التي يصوغ فيها الباحثون فروضهم التجريبية في جميع الأحوال في صورة فروض صفرية حتى ولو كانت أطرهم النظرية أو معظم نتائج البحوث السابقة حول مشكلة بحثهم تشير إلى صياغتها في صورة موجهة.

 

دلالة الطرفين ودلالة الطرف الواحد :

 

    الفرض الصفري كما أسلفنا  هو جزء من الإجراءات الإحصائية اللازمة لاختبار فروض البحث التي قد تكون هي ذاتها صفرية أو موجهة وهو نوع من الافتراض الأساسي وراء جميع هذه الإجراءات الإحصائية . فهو الاستراتيجية الوحيدة التي يمكن استخدامها للحكم على دلالة الإحصاءات المحسوبة أو دلالة الفروق بين المعالجات أو دلالة العلاقات بين المتغيرات. وبالتالي لا يحتاج الباحث أن يصوغه  صوغا صريحا في بحثه . فالصياغة الصريحة الوحيدة المطلوبة في البحث هي صياغة الفرض التجريبي . ولعلنا بذلك ننبه إلى خطأ آخر شاع في بعض البحوث ، خلاصته أن بعض الباحثين يصوغون فروضهم الصفرية وفروضهم البديلة معاً في البحث الواحد . وهم بذلك لا يدركون معنى التناقض الذي يقعون فيه ، فالفرض الصفري هو نقيض الفرض البديل الموجه ، فكيف يمكن اختبار النقائض !.

 

    وإذا كان الفرض الصفري هو الافتراض الوحيد الذي يعين على اختبار الفروض . فإن قبوله يعنى رفض الفرض البديل (وقد يكون هو ذاته فرض البحث) ، أما إذا تم رفضه فإن ذلك يعنى قبول الفرض البديل ، وبهذا لا يمكن للفرض الصفري والفرض البديل أن يلتقيا لاختبارهما معاً في وقت واحد ، فبالإضافة إلى التناقض الذي أشرنا إليه فإن ذلك نوع من المستحيل الإحصائي .

 

يف يمكن للباحث أن يختبر الدلالة ؟

 

     أن الباحث عندما يختار محك الدلالة عند مستوى 0.05 مثلاً فإن بذلك يقول لنا أن النتيجة الإحصائية التي حصل عليها (سواء كان احصاءة منفردة أو علاقة بين متغيرين أو فرق بين احصائيتين أو أكثر) إذا تحولت إلى درجة معيارية فإن المساحة الصغرى في المنحنى الاعتدائى المقابلة لها تساوى 0.05 والمساحة الكبرى تساوى 0.95 ومعنى ذلك أنه لو أجريت بحوث عديدة مماثلة وعلى عينات من نفس الحجم فإن النتيجة التي يحصل عليها الباحث إذا وصلت إلى هذا المستوى من الدلالة أو تجاوزته فاحتمال تكرار حدوثها هو 0.95 بينما تكرار عدم حدوثها هو 0.05 وبنفس الطريقة يمكن فهم معنى أى محك آخر للدلالة مثل 0.01 أو 0.005 أو 0.001 الخ .

 

    ولكن ندرك العلاقة بين مفهوم مستوى الدلالة ومفهوم الفرض الصفري نقول أن الباحث حين يقرر استخدام مستوى الدلالة 0.05 أو غيره فإنه يستخدمه أيضاً كمحك لتقويم الفرض الصفري . ومعنى ذلك أن احصاءة العينة إذا كان الشك في احتمال تكرارها يصل إلى نسبة 0.05 أو أعلى من ذلك فإن الباحث يرفض حينئذ الفرض الصفري . ولأن ذلك قد يتضمن المخاطرة بالوقوع في النمط الأول (أو ألفا) من الخطأ ، وهو رفض الفرض الصفري بينما هو صحيح يطلق على مستوى الدلالة أحيانا نفس التسمية (مستوى ألفا) ، وهى تسمية أكثر شيوعاً في الكتب الإحصائية الحديثة.

 

    ولكن إذا كان مستوى الدلالة يحدد كلا من المساحة الصغرى لعدم اليقين (أو عدم الثقة) والمساحة الكبرى لليقين (أو الثقة) فكيف نحدد موضع هاتين المساحتين في المنحنى الاعتدائى ؟ بالطبع أن ما يحدد ذلك هو الإشارة الجبرية للدرجة المعيارية (التي يجب أن تحول إلى جميع الإحصاءات لتصبح قابلة للتعامل معها في المنحنى الاعتدائى) . ولعلنا نذكر أيضاً أن الدرجة المعيارية السالبة تدل على نقص الاحصاءة المحسوبة على متوسط الأصل ، بينما الدرجة المعيارية الموجبة تدل على زيادة هذه الاحصاءة عن هذا المتوسط . ولعلنا نذكر كذلك أن متوسط الأصل كدرجة معيارية يساوى صفراً.

 

    لنفرض أن الفرض التجريبي  للبحث صيغ بالفعل في صورة صفرية (في ضوء نظرية البحث ونتائج الدراسات السابقة) حيث يتوقع عدم وجود فروق بين المعالجتين أو عدم وجود ارتباط بين المتغيرين . فإن ذلك يعنى أنه يتوقع بالنسبة للإحصاءات المحسوبة أن تتساوى مع بارامترات الأصل ، وبالتالي فإن الدرجة المعيارية لهذه الاحصاءه تساوى الصفر (وهى الدرجة المعيارية المقابلة لمتوسط الأصل). أن الباحث في اختباره للفرض الصفري في هذه الحالة إذا وجد أن الدرجة المعيارية للإحصاء تقل عن 1.96 فإنه يتوقع لها ألا تختلف عن متوسط الأصل (بسبب عوامل المصادفة والعشوائية) إلا بنسبة 0.05 (المساحة الصغرى أو مساحة الرفض) بينما سوف تتطابق مع هذا المتوسط بنسبة 0.95 (المساحة الكبرى أو مساحة القبول) والسؤال حينئذ من أين جاءت هاتان النسبتان مع إننا نعلم من قراءتنا لجدول مساحات المنحنى الاعتدالى أمامه المساحة الصغرى عند الدرجة المعيارية 1.96 وهى 0.025 بينما المساحة الكبرى 0.975 فكيف أصبحت في حالتنا هذه 0.05 ، 0.95 على التوالي ؟

 

     للإجابة على هذا السؤال نقول أن الباحث في هذه الحالة لا يستطيع أن يحدد موضع المساحة الصغرى هل هي إلى يمين المنحنى الاعتدالى أو إلى يساره ، وحيث أن الدرجة المعمارية في هذه الحالة (أى في حالة الفرض الصفري) يتساوى احتمال أن تكون سالبة أو موجبة فأنه لامناص لنا من وضع المســـاحتين الصغريين المقابلتين للدرجة المعيارية 1.96 موضع الاعتبار، وبجمعهما معاً نحصل على مســـاحة صغرى كلية مقدارها 0.05 (0.025 + 0.025 = 0.05) وعندئذ تصبح المساحة الكبرى 0.95 (أى 1-0.05 = 0.95) . ويسمى اختبار الدلالة في هذه الحالة دلالة الطرفين كما بالشكل التالي :

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 


 

    ويطبق اختبار دلالة الطرفين أيضاً على الفروض البديلة غير الموجهة من نوع (توجد فروق بين المعالجات) أو (توجد علاقة بين المتغيرات) دون تحديد لوجهة الفروق أو العلاقة . ولو أن هذه الصيغة للفروض البحثية غير مستحبة ، فلا توجد نظرية في البحث تدعو الباحث إلى مثل ذلك ، ومن الأفضل عندئذ أن تصاغ الفروض التجريبية في صورة صفرية بشكل مباشر.

 

ماذا عن الفرض البديل الموجه ؟

 

    لنفرض أن الفرض التجريبي  للبحث يتوقع زيادة (أو نقص) درجات المجموعة التجريبية عن المجموعة الضابطة ، أو يتوقع لمعامل الارتباط بين المتغيرين أن يكون موجباً (أو سالباً) ، أنه في هاتين الحالتين ونظائرهما يتوقع للإشارة الجبرية للدرجة المعيارية أن تكون سالبة أو موجبة بالنسبة لمتوسط الأصل أو معامل ارتباط درجات الأصول . وفى هذه الحالة فإن الباحث في اختباره للفرض الصفري يرفقه إذا وجد أن الدرجة المعيارية للإحصاء التي حصل عليها تصل إلى 1.96 أو تزيد عليها لأنه يتوقع لهذه الإحصاء ألا تتكرر (بسبب عوامل المصادفة والعشوائية) بنسبة 0.05 وان تتكرر بنسبة 0.95 بسبب اختلاف الأصول . والسؤال هنا مرة أخرى من أين جاءت هذه النسبة ؟

       

    أن ما حدث في هذه الحالة كما ذكرنا من قبل أننا جمعنا طرفي المنحنى الاعتدالى (أى المساحتين الصغريين) عند هذه الدرجة المعيارية (ومقدار كل منهما كما أسلفنا هو 0.025) عند أحد الطرفين ، ولهذا يسمى هذا النوع من الدلالة الإحصائية اختبار الطرف الواحد كما بالشكل التالي :

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

   

 

     ومن المهم أن ننبه هنا أن الباحث في اختباره الإحصائي للفرض الصفري في حالة الفرض التجريبي  الموجه يمكن أن يستخدم اختبار دلالة الطرفين إذا كان افتراضه الأساسي أنه (من الوجهة الإحصائية) لا يهم أن يقبل الفرض الصفري أو أن يقبل الفرض البديل الموجه سواء أكان في الاتجاه الذي حدده الفرض التجريبي  أو عكس اتجاهه . أما قرار استخدام اختبار الطرف الواحد فيجب أن يستند إلى السؤال الجوهري للبحث . وعلينا أن ننبه على أن وقت القرار حول طبيعة الفرض البديل هو في بداية البحث وقبل جمع البيانات . وأخطر ما يمكن أن يقع فيه الباحث من أخطاء أن يجمع بياناته ثم يحدد مساحة الرفض (المساحة الصغرى) في أحد طرفي التوزيع دون الآخر في ضوء هذه البيانات التي حصل عليها بالفعل . أنه لو سار في هذا الاتجاه الخاطئ واختار مستوى الدلالة 0.05 مثلاً فإنه في الواقع يقوم باختبار دلالة الطرفين عند مستوى 0.01 كما لا يجب على الباحث أن يوقع نفسه في مصيدة اختبار دلالة الطرف الواحد في الاتجاه الذي يعتقد أن نتائجه يجب أن تكون فيه ثم يتحول إلى دلالة الطرفين إذا أظهرت بياناته الاتجاه العكسي . أنه لو سار على هذا النحو واستخدام مستوى دلالة 0.05 فإن ذلك في الواقع هو اختبار دلالة طرفين عند مستوى 0.075 بمساحة مقدارها 0.050 عند أحد الطرفين 0.025 عند الطرف الأخر ، حيث المساحة الأكبر تقع في الاتجاه الذي يحدده تحيز الباحث . وعلى ذلك فمن المهم للباحث أن يحدد مقدماً ماذا يريد من فرضه التجريبي الموجه والتي من فرضه الإحصائي البديل . فالأمر ليس مغامرة إحصائية غير محسوبة.

 

      وعلى الباحث أن يدرك بعد هذا التمييز بين نوعى الدلالة ، أن دلالة الطرف الواحد هي في الواقع نصف دلالة الطرفين . ويوضع الجدول التالي أمثلة توضح ذلك :

 

العلاقة بين دلالة الطرفين ودلالة الطرف الواحد

 

مستوى دلالة الطرفين

0.10

0.05

0.02

0.01

0.05

0.001

مستوى دلالة الطرف الواحد

0.05

0.025

0.01

0.005

0.0025

0.0005

الدرجة المعيارية

1.65

1.96

2.23

2.58

2.81

3.30

 

 

حساب دلالة الإحصاءات

المنفردة باستخدام مفهوم الفرض الصفري

 

    سوف نعرض هنا طرق اختبار الدلالة الإحصائية لهذه الإحصاءات باستخدام مفهوم الفرض الصفري تمهيداً لاستخدام هذا المفهوم أيضاً في اختبار دلالة الفروق . ولعل أهم هذه الاختبارات الإحصائية للفرض الصفري النسبة الحرجة Critical Ratio   واختبار (ت) .

 

(1) النسبة الحرجة لدلالة المتوسط :

 

    يرمز للنسبة الحرجة في الإحصاء بالرمز (Z) ، وهو نفس الرمز الذي نستخدمه للإشارة إلى الدرجة المعيارية ، لأن النسبة الحرجة ليست في الواقع إلا درجة معيارية بمعناها العام ، وهذا يتطلب من الباحث معرفة الانحراف المعياري للأصل إلا أننا في البحوث النفسية والتربوية والاجتماعية يندر أن يتوافر لنا هذا البارامتر . وفى كثير من الأحيان يضطر الباحث التي حساب الخطأ المعيارى للمتوسط من الانحراف المعياري للعينة كاحصاءة ويكون ذلك نوعا من التقدير لهذا الخطأ المعياري .

 

(2) اختبار (ت) لدلالة المتوسط :

 

    لقد كان العالم البحثي وليام جوست W.Gossett (الذي شاعت كتاباته الإحصائية باسمه المستعار تواضعا student  أى طالب) أول من تنبه منذ مطلع هذا القرن إلى نقصان الدقة في تقدير الانحراف المعيارى للأصل باستخدام الانحراف المعيارى للعينة مع قلة حجم العينة . فمع نقص عدد أفراد العينة يكون هذا التقدير اقل بكثير من الانحراف المعيارى للأصل ، والتي حين يستخدم الانحراف المعيارى للعينة في تقدير الخطأ المعيارى للمتوسط فإن هذا التقدير يكون أيضا اقل من الخطأ المعيارى للأصل ، وعندئذ يكون من باب عدم الدقة الإحصائية استخدام القيم الاحتمالية المعتادة للمنحنى الاعتدالى.

 

     ومعنى ذلك في رأى جوست أن الاستناد في هذا الحالة إلى افتراضات المنحنى الاعتدالى من حيث مساحاته وارتفاعاته ودرجاته المعيارية سوف يقدم لنا إجابات خاطئة ، وخاصة مع العينات الصغيرة . والأصح حينئذ أن يرجع الباحث إلى التوزيع الحقيقى للدرجة المعيارية المحسوبة ، وهو التوزيع الذي أطلق عليه جوست اسم توزيع المعيارية (ت) T-Distribution والذي ينسب إليه اختبار الدلالة الإحصائية المشهور (اختبار ت).

 

     وفى توزيع (ت) يلعب مفهوم درجات الحرية دوراً هاما ، حيث توجد توزيعات مختلفة لقيم (ت) كبدائل لقيم الدرجات المعيارية في النسبة الحرجة حسب حجم العينات ، ولعلك تذكر أن درجات الحرية للخطأ المعيارى للمتوسط المحسوب بهذه الطريقة عندها (ن-1).

 

     ولحسن الحظ فان الباحث ليس في حاجة إلى معرفة شكل كل توزيع من توزيعات (ت) مقدما ، ويمكنه أن يستخدم توزيع (ت) على نفس النحو الذي يستخدم فيه توزيع المنحنى الاعتدالى ، وحينئذ يحل اختبار (ت) محل النسبة الحرجة كمقياس للدلالة الإحصائية , ومن المهم أن ننبه هنا إلى انه في العينات الكبيرة يقترب توزيع (ت) من التوزيع الاعتدالى اقترابا شديداً ، وحينئذ يمكن أن يحل اختبار (ت) والنسبة الحرجة ، كل منهما محل الآخر.

 

     وبعد حساب (ت) يمكن للباحث اللجوء مباشرة إلى جدول مستويات دلالة (ت) التي أعدها جوست . وكل ما هو مطلوب من الباحث أن يحدد درجات الحربة في عينته وهى (ن 1) في حالة اختبار دلالة المتوسط ، ويكون ذلك مدخله إلى اختيار توزيع (ت) المناسب لعينته عند النسب المختلفة للاحتمال ( وخاصة 0.05 ، 0.01) . وعليه أن يقارن بين (ت) المحسوبة و (ت) الجدولية عند مستوى الدلالة المختار ، فإذا كانت تساوى أو تزيد على هذه القيمة فإنه يستنتج أن المتوسط دال أى يختلف جوهريا عن بارامتر الأصل (رفض الفرض الصفري) . والطبع توفر الحزمة الإحصائية SPSS كل ذلك .

 

دلالة الفروق بين المتوسطات

 

    لقد تحدثنا عن تقدير بارامترات الأصل من الإحصاءات المحسوبة للعينة والوصول من ذلك إلى استنتاجات حول دقة هذه التقديرات فيما يسمى الخطأ المعيارى Stander Error ، وفيما سبق كان اهتمامنا باحصاءة واحدة كالمتوسط أو الانحراف المعيارى أو معامل الارتباط إلا أننا هنا أكثر اهتماما بمعرفة اختلاف بارامترات اصل معين عن آخر أو بدقة أكثر بمعرفة ما إذا كانت احصاءتين ملاحظتين ، كأن تكونا متوسطين أو معاملي ارتباط ، تظهران فروقا فيما يقابلهما من بارامترات الأصل . وهذا ما يسمى دلالة الفروق . ودلالة الفروق قد تكون أحيانا أهم للباحث النفسي والتربوي والاجتماعي من مجرد تحديد الخطأ المعياري لاحصاءة واحدة أو الحكم علي دلالتها . وفي هذه الحالة يختبر الباحث فرضا صفريا محددا يصاغ في الصورة الآتية إذا كان الأمر يتصل بدلالة الفرق بين متوسطين : " لا يوجد بين متوسطي المقياسين أى فرق ذو دلالة " أو بعبارة أخرى " الفرق بين المتوسطين في المجتمع الأصلي يعادل صفراً " وفى هذه الحالة يقارن الباحث هذا الفرق بين المتوسطين بالخطأ المعيارى لهذا الفرق نفسه.

 

   وفى تحديد الخطأ المعيارى لفروق المتوسطات يجب أن نميز بين المتوسطات المرتبطة وغير المرتبطة ، ويقصد بالمتوسطات المرتبطة تلك التي تحسب لمجموعات بينها علاقة من نوع ما كالمجموعات التي أعيد عليها القياس في تجارب القياس القبلي البعدي أو مجموعات إعادة الاختبار وغيرها ، وتسمى القياسات التي يحصل عليها الباحث بهذه الطريقة القياسات المتكررة Repeated Measures أما المتوسطات غير المرتبطة فهي تلك المتوسطات المحسوبة لمجموعات مستقلة ، أى التي صنفت إلى المعالجات المختلفة بطريقة عشوائية تماما ولا تلعب فيها أى عوامل أخرى غير المصادفة أى دور. وعليه ينبغي أن يميز الباحث بين ثلاثة أنواع من إختبار (ت) وهي :

 

1- اختبار(ت) لتحديد دلالة الفروق بين

            متوسط العينة ومتوسط فرضي  One Sample t-test

2- اختبار(ت) لتحديد دلالة الفروق بين

            المتوسطات غير المرتبطة Independent Sample t-test

3- اختبار(ت) لتحديد دلالة الفروق بين

           المتوسطات المرتبطة Paired Sample t-test

 

    يميز علماء الإحصاء كما أشرنا آنفا بين الخطأ المعيارى للأصل والخطأ المعيارى للعينة ، وينشأ ذلك من أن الانحراف المعيارى في الحالة الأولى عادة ما يكون أكبر منه في الحالة الثانية ، وقد أشرنا أيضا إلى استخدام  جوست (ستودينت) لمفهوم درجات الحرية لتصحيح تقدير الخطأ المعيارى للأصل من الخطأ المعيارى لاحصاءة العينة.

 

    هذا وقد قام علماء الإحصاء بحساب نسب الاحتمالات لتوزيعات (ت) عند درجات الحرية المختلفة وأعدوا جدولا لهذا الفرض لا تكاد تخلو منه المؤلفات المتخصصة ، ويسمى جدول توزيع (ت) ثم شاع استخدام هذا الجدول بحيث لم يعد يقتصر على العينات الصغيرة وحدها واصبح صالحا للاستخدام مع العينات الكبيرة أيضا. حيث يستخدم الباحثين اختبار (ت) للحكم على دلالة الفروق بين متوسطين .

 

الافتراضات الأساسية لاختبار (ت) :

 

   توجد ثلاثة افتراضات أساسية اقترحها جوست (ستودينت) يقوم عليها اشتقاق توزيع (ت) ، أى توزيع أخطاء العينة للنسبة (ت) حين يكون الفرض الصفري صحيحاً ، وهذه الافتراضات الثلاثة هي :

 

(1) الاعتدالية : أى أن يكون توزيع الفروق بين المتوسطات للعينات المختارة اعتداليا ، ولا يتوافر هذا الشرط إلا إذا كان توزيع الدرجات الخام لهذه العينات اعتداليا أيضا.

     وهذا الافتراض ليس لأن المنحنى الاعتدالى هو النموذج الرياضي الذي يقترب منه توزيع كثير من المتغيرات فحسب وإنما لأن هذا المنحنى يتسم أيضا بخاصية رياضية هامة هي أن المتوسطات والتباينات للعينات ذات التوزيعات الاعتدالية تتسم بأنها مستقلة ، أى أن معاملات الارتباط بين هذه المتوسطات والتباينات لعينات متكررة من نفس التوزيع الاعتدالى تكون صفرية.

 

     وعلى الرغم من أهمية هذا الافتراض إلا أنه لا يتوافر كثيرا لأسباب عملية ؛ فليس من الممكن أن يكون اختيار المفحوصين عشوائيا دائما في كل تجربة يجريها الباحثون . ولهذا كان الباحث في الماضي إذا لم يتوافر  شرط الاعتدالية في توزيع بياناته يلجأ التي طرق مطولة للتغلب على هذه الصعوبة، ومن ذلك مثلا أنه إذا كان المتغير المستقل ملتويا التواء موجبا فإنه يحلل الجذور التربيعية للدرجات الخام بدلا من هذه الدرجات نفسها.

 

    ألا أنه من حسـن الحظ أثبتت بعض البحـوث الإحصـــائية الحديثة (Glass & Hopkins, 1984) أن انتهاك هذا الشرط ليس له نواتج عملية تذكر على استخدام اختبار (ت) وخاصة حين يكون عدد المفحوصين في العينة 15 أو أكثر . ومعنى ذلك أن الباحث الذي يستخدم عينات كبيرة العدد نسبيا فان الأصل الكلى الذي تنسب إليه الدرجات الخام المستخدمة في حساب اختبار (ت) لا يحتاج أن يتوافر فيه شرط الاعتدالية وتبقى المشكلة لها أهميتها في حالة استخدام عينات صغيرة العدد ( اقل من 15 في هذه الحالة).

 

(2) استقلالية الملاحظات : الافتراض الثاني لاختبار(ت) أن تكون ملاحظاتنا مستقلة ، والاستقلال يعنى هنا ببساطة أن البيانات التي نجمعها سواء بين المجموعات أو داخل المجموعات ليست متزاوجة أو متكررة أو متداخلة أو معتمدة بعضها على بعض على أى نحو . ولا يتوافر ذلك إلا إذا كان اختيار العينات عشوائيا تماما ، أى تحكمه عوامل المصادفة من ناحية ، وأن يكون الباحث قد استخدم وسائل الضبط التجريبي  من ناحية أخرى . فإذا تزاوجت الدرجات على نحو أو آخر ، سواء  أكان ذلك عن طريق تكافؤ المجموعات أو تكرار الملاحظات على نقس الأفراد فان المجموعات حينئذ تكون مرتبطة . وفى هذه الحالة لابد من استخدام اختبار (ت) للمجموعات المرتبطة أو للقياسات المتكررة كما بينا.

 

    وفى بعض المواقف التجريبية قد نفترض الاستقلال بينما ما يحدث بالفعل هو ارتباط البيانات ، ومن ذلك حين يلجأ المفحوصين إلى الغش في الاستجابة للمهام ، مثل أن ينقل المفحوصين أجابتهم بعضهم من بعض . أننا في هذه الحالة لا يمكن أن نفترض أن البيانات التي يحصل عليها الباحث في هذه الحالة مستقلة . ومثل وجود بعض المتغيرات الدخيلة التي تؤثر في المتغير التابع ولم يتم التحكم فيها مسبقا ، ويكون ذلك مثالا على فشل الضبط والتجريبى ، ولا يحل للباحث اللجوء إلى استخدام اختبار (ت) للمجموعات المرتبطة ، وإنما استخدام بعض الطرق الإحصائية الأكثر تقدما لوضع الاعتماد موضع الاعتبار في التحليل ، وأشهرها أسلوب تحليل التغاير Analysis of covariance  الذي سنشير إليه في جزء آخر من هذه السلسلة .

 

(3) تجانس التباينات : يبرر افتراض تجانس التباين في استخدام صيغة معادلة اختبار (ت) جمع تبايني المجموعتين للحصول على تقدير واحد لتباين الأصل ، وكذلك استخدام درجات حرية للمجموعتين معا. وبالطبع يصل تقدير التباين الذي نحصل عليه إلى أعلى درجات الدقة إذا صح افتراض أن تباين المجموعة الأولى مساويا لتباين المجموعة الثانية  للأصول ، لأن ذلك يعنى أن كلا من تباين المجموعتين كإحصائيتين للعينات يتطابق مع تباين الأصل كبارامتر ، وهذا يعنى مرة أخرى أن هاتين الإحصائيتين غير متحيزتين في تقديرهما البارامتر المشترك (التباين المشترك) . وإذا كان الأمر كذلك فانه من غير المنطقي عدم جمع المعلومات التي تتوافر للباحث  منهما معا للحصول على تقدير أفضل وأكثر دقة البارامتر (التباين المشترك) ، وحينئذ يتوافر لها أيضا تقدير أكثر دقة للخطأ المعيارى للفروق بين المتوسطين.

 

    وعلى الرغم من أهمية هذا الافتراض لتحقيق شروط استخدام اختبار (ت) إلا أنه يصعب على الباحث أن يتأكد من توافره في بياناته بمجرد النظر، أضف إلى ذلك أن الباحث يندر له أن يعرف تباينات الأصل ، والى أي حد تكون الاختلافات فيها كما هو متوقع ناجمة عن أخطاء العينة فحسب (أى العشوائية والمصادفة) . وبالمثل فان تقديرات الأصل المعتمدة على العينة قد تختلف أيضا ، ولا يعلم الباحث أيضا أن كان هذا الاختلاف يرجع إلى أخطاء العينة أو إلى اختلافات حقيقية بين تباين الأصل . وما دام الباحث لا يعلم مدى تتوافر هذا الشرط في أصول عيناته فيجب أن يهتم بصدى انتهاكه في بياناته. ولحسن الحظ فان الخبرة العملية تدلنا على أنه متوافر في معظم الحالات بالإضافة إلى أن البحوث الإحصائية الحديثة تؤكد أن اختبار (ت)  مرة أخرى على درجة من إهمال (أو المنع)  النسبة لهذا الشرط وخاصة حين تكون العينات كبيرة (30 فأكثر) وتكون أعداد الأفراد (أو الحالات) فيها متساوية ( أى ن1 = ن2) . بل أن الباحث لا يكاد يكون في حاجة إلى اختبار مدى توافر افتراض تجانس التباين حين تتساوى العينات. أما في غير ذلك من الحالات فهو في حاجة التي مثل هذا الاختبار .

 

    ولإثبات المزيد من منعه اختبار (ت) قام بوندكس بدراســة هامة في  (Guilford & Fruchter, 1978) للمقارنة بين أثر استخدام عينات مختارة من توزيعات غير اعتدالية بتباينات مختلفة وبأعداد مختلفة (أى بعدم الالتزام بالافتراضات الأساسية الثلاثة لاختبار ت) على حالات رفض الفرض الصفري عند مستوى دلالة 0.05 ، 0.01  فلاحظ بصفة عامة أن (ت) لم تتأثر تأثرا خطيراً بذلك إلا في حالات التطرف الشديد في كل حالة من الحالات الثلاث ، وإلا إذا كانت العينات صغيرة جداً . ومعنى ذلك أن اختبار (ت) على درجة كافية من المنعة ويمكن استخدامه في البحوث النفسية والتربوية والاجتماعية بدرجة كافية من الثقة.

 

التالى / السابق

1-2-3-4-5-6-7-8-9