آزمون رتبه ای علامت دار ويلكاكسون (در نمونه های وابسته) – بخش 2

15 آذر 1400

دقیقه

آزمون رتبه علامت دار ويلكاكسون آزموني ناپارامتري براي مقايسه دو گروه وابسته است كه با مثالي توضيح داده خواهد شد.

آخرین به‌روزرسانی: 24 دی 1401

در فصل سیزدهم مقاله آموزشی آمار به زبان ساده به تحليل ناپارامتری پرداختیم. در این فصل به آموزش آزمون رتبه ای علامت دار ويلكاكسون – بخش ۲  در ادامه سری مقالات آموزشی آمار به زبان ساده می پردازیم.

آزمون ويلكاكسون

آزمون رتبه علامت دار ويلكاكسون آزموني ناپارامتري براي مقايسه دو گروه وابسته است كه با مثالي توضيح داده خواهد شد. معلمي جهت تشويق كودكان به رياضيات قصد دارد اثر برنامه اي جديد را مورد بررسي قرار دهد. از گروهي نه نفره از كودكان (n = 9) خواسته شد تا قبل و بعد از برنامه مذكور به ميزان علاقه منديشان به رياضيات در بازه ي 0 تا 10 امتيازي بدهند. نتايج در جدول زير نمايش داده شده اند.

اغلب از آزمون ويلكاكسون با عنوان آزمون زوج هاي همسان (جور شده) ياد مي شود. به اين دليل كه هر نمره در يك نمونه همسان به نمره اي در نمونه ي ديگر است، كه در اين مثال در واقع كودكان با خودشان همسان گشته اند. جفت ها به منظور ايجاد تفاضل نمره بدين صورت با يكديگر همسان مي شوند. تصور اينكه بتوان نمرات يك زوج همسان را با وجود اينكه با روش و مقياسي متفاوت ميان كودكان امتياز داده شده اند مقايسه كرد معقول به نظر نمي رسد. اگر اثر برنامه تلويزيوني واقعاً مفيد واقع شود (با فرض اينكه آزمون يكطرفه است) انتظار مي رود امتيازهاي پس از برنامه نسبت به قبل از آن به طور قطع بالاتر باشند. اين قطعيت مي بايست از طريق مجموعه اي از تفاضل هاي منفي زماني كه امتياز بعد از برنامه را از قبل از آن كم مي كنيم جلوه يابد.

تركيبي مساوي از تفاضل هاي مثبت و منفي نشاندهنده ي عدم اين قطعيت مبني بر متفاوت بودن نمونه ها بوده و بدين معني است كه تعدادي از كودكان تمايل دارند امتياز قبل از برنامه بيشتر باشد و عده اي نيز امتياز بعد از آن را بالاتر مي دهند. اين چيزي است كه به عنوان فرض صفر انتظار مي رود. بنابراين جهت بررسي معني داري به دنبال نوعي سازگاري و قطعيت مي باشيم به گونه اي كه اكثريت تفاضل ها با يك علامت، يعني يا مثبت و يا منفي باشند .

تفاضل ها در جدول زير نشان داده شده اند. توجه كنيد كه در مورد كودك شماره 8 تفاضل نمره صفر است و نمي توان آن را به عنوان يك تفاضل مثبت و يا منفي در نظر گرفت و اثري در داده ها و يا نوع تصميم گيري نداشته بنابراين از چرخه ي داده ها حذف مي شود. در نهايت n به 8 تقليل مي يابد.

آزمون ويلكاكسون تنها علامت تفاضل ها را مقايسه نمي كند بلكه اندازه ي تفاضل را نيز در مقايسات در نظر مي گيرد. به طور واضحي علاوه بر عدم سازگاري در تفاضل ها (در اين مثال در مورد تفاضل هاي مثبت) مسئله ي ديگري كه ممكن است ذهن محقق را به خود مشغول كند در مورد بزرگ و يا كوچك بودن اين تفاضل هاست كه توضيح آن تاحدودي مشكل به نظر مي رسد. آزمون ويلكاكسون با رتبه دادن به مقدار واقعي اين تفاضل ها بدون در نظر گرفتن علامت آنها و رفتار با همه ي آنها به عنوان رتبه هاي مثبت درصدد رفع اين مسئله بر مي آيد. رتبه ها در ستون ششم جدول بالا نمايش داده شده اند.

دو رتبه ي مثبت ناسازگار با سايرين (+) برابر با 1 و  3.5 است. آيا اين مقدار به اندازه كافي كوچك است كه بتوان نتيجه گرفت كه نتيجه ي بدست آمده بسيار نامحتمل بوده و تنها بر اساس تصادف بدست آمده است؟ با چه احتمالي چنين رتبه هايي به صورت تصادفي حادث مي شوند؟ آنچه كه در آزمون ويلكاكسون صورت مي گيرد اين است كه مجموع رتبه هاي ناسازگار،1+3.5=4.5 ،  را به عنوان T در نظر مي گيرند. زماني كه فرض صفر درست است با چه احتمالي T مقداري به كوچكي 4.5 به خود اختصاص مي دهد؟ جهت معني داري علاقه منديم كه T مقداري كوچك داشته باشد همچنانكه اين مسئله نشاندهنده ي ميزان بالايي از سازگاري است. زماني كه T صفر باشد هيچگونه ناسازگاري در رتبه ها وجود نداشته و مقادير بزرگتري از هر كدام از زوج نمرات همیشه در همان نمونه وجود دارد.

به صورت تصادفي هر كدام از رتبه ها ممكن است مثبت (+)  و يا منفي (-) باشند، بنابراين زماني كه فرض صفر درست باشد براي هر كدام از شركت كنندگان دو احتمال مساوي وجود دارد. با وجود 8 شركت كننده تمام حالت ممكن براي تفاضل ها برابر با  خواهد بود. چگونه بسياري از اين احتمال ها رتبه ي مثبت كوچكي به اندازه ي 4.5 و يا كوچكتر از آن مي توانند داشته باشند؟ براي اينكه كل رتبه ي مثبت برابر با صفر شود (در اين حالت بايد كليه ي تفاضل ها منفي باشند) تنها به يك روش امكان پذير است كه در آن حالت احتمالي برابر با 1/256 يا 0.004 به خود اختصاص مي دهد. همچنين احتساب رتبه ي كل مثبت برابر با 1 تنها به يك طريقه امكانپذير است (حالتي كه كوچكترين تفاضل مثبت و بقيه ي تفاضل ها منفي باشند) و به همين صورت تنها به يك راه رتبه ي كل مثبت مقدار 2 را به خود اختصاص مي دهد (در صورتيكه دو تا از كوچكترين تفاضل ها مثبت و سايرين منفي باشند). احتساب رتبه ي كل مثبت 2 به دو طريق امكانپذير است: هر سه تا از كوچكترين رتبه ها مثبت باشند و يا دو تا از كوچكترين رتبه ها مثبت و ديگري منفي باشد. همچنانكه در جدول زير مشاهده مي كنيد مقادير بيشتري را نيز مي توان محاسبه كرد.

آزمون رتبه علامت دار ويلكاكسون

(تفاوت هاي جزئي موجود ميان ستون 3 و 4 از گرد كردن سومين رقم اعشار ناشي شده است).

بايد توجه كرد كه با احتمال بزرگتر از 0.05 با T برابر با 6 امكان پذير است اما احتمالي كه T مقدار 5 و يا كمتر را داشته باشد كمتر از 0.05 است. در مورد مثال مطرح شده با داشتن مقدار T برابر با 4.5 در سطح معني داري  p = 0.05 فرض صفر رد مي شود و نتيجه مي شود كه افزايش معني داري در امتياز هاي ميزان علاقه مندي به رياضيات بعد از پخش برنامه وجود دارد.

خوشبختانه نيازي به محاسبه ي مقادير احتمال تحت فرض صفر وجود ندارد. اين جدول به صورت جدولي آماده ساخته شده است. (جدول A.6 در ضميمه). در مثال ذكر شده آزموني يكطرفه داشتيم اما در صورتيكه آزمون دو طرفه باشد مي بايست هم به مجموع رتبه هاي منفي و هم رتبه هاي مثبت توجه شود و مقداري كوچكتر از T داشته باشد.

جهت معني داري مقدار بحراني T در دو طرف توزيع قرار بگيرد (بدين معني كه به صورت تصادفي يك T كوچك با يك مقدار مثبت و يا منفي) و از اينروست كه نسبت به آزمون يكطرفه محافظه كارانه تر عمل مي كند. بايد به خاطر داشت كه جهت معني داري بايد مقدار T از مقدار محاسبه شده ي جدول كمتر يا مساوي باشد.

توزيع T

براي مقادير كوچك n، يعني كوچك تر از 25، زماني كه فرض صفر صحيح است جدول مقادير بحراني T موجود است. اما در صورتيكه n (تعداد آزمودني ها) بزرگ باشد مي توان توزيع T را با يك توزيع نرمال تقريب زد:

در استفاده از T بايد دقت كرد كه زماني كه با داده هايي سروكار داريم كه بيش از اندازه رتبه هاي گره خورده در آنها وجود داشته باشد كاربرد اين روش در عمل ممكن است مفيد واقع نشود. در اين حال بايد متغير وابسته را مورد آزمون قرار داد و بررسي شود كه آيا مي توان از طريق ايجاد تمايزات بيشتري ميان تفاضل ها در نمرات و در نتيجه كاهش رتبه هاي گره خورده، آن را دقيقتر كرد.

مراحل انجام آزمون رتبه ای علامت ویلکاکسون

1 برای هر از آزمودنی تفاضل نمرات را حساب کنید. بدین معنی که امتیاز نمونه اول را از نمونه دوم کم کنید. زمانی که این تفاضل برابر با صفر شود این آزمودنی را از چرخه ی محاسبات خارج کرده و هر دفعه که این اتفاق رخ دهد از مقدار n، 1 واحد کاسته می شود.

2 بدون در نظر گرفتن علامت به  تفاضل نمرات از کمترین تا بیشترین رتبه بدهید.

4 با داشتن n و سطح معنی داری مورد نظر، T محاسبه شده را با مقدار بحرانی موجود در جدول مقایسه کنید(جدول A.6). برای اینکه مقدار T محاسبه شده معنی دار شود باید این مقدار از بحرانی جدول کمتر یا مساوی باشد.

 مثال کاربردی

از یک هیئت مصاحبه متشکل از ده مصاحبه کننده درخواست شد تا به دو نفر از کاندیدای نهایی نمره ای در مقیاس 1 تا 20 بر حسب میزان توانایی هایشان برای احراز جایگاهی خالی امتیاز بدهند. آیا مصاحبه  کننده ها به یک نفر از کاندیدها به طور معنی داری بیشتر از دیگری امتیاز می دهند؟

هیچ فرضی در مورد داده ها و یا توزیع جمعیت وجود ندارد جز اینکه از نوع ترتیبی ترتیبی هستند بنابراین برای بررسی فرضیه مورد نظر از آزمون رتبه ای علامت ویلکاکسون استفاده می شود. ابتدا برای هر کدام از شرکت کنندگان تفاضل نمرات را محاسبه می کنیم (کاندیدای2-کاندیدای 1) . 250  صفر را از مجموعه ی داده ها خارج کرده و به تفاضل ها مطابق جدول زیر رتبه داده می شود.

به دلیل در مورد مصاحبه گر 5 اینکه تفاضل نمره صفر از حذف شده و در نتیجه مقدار n برابر با 9 می شود. در ادامه به محاسبه ی مجموع رتبه های تفاضل های مثبت و منفی به صورت جداگانه پرداخته می شود.

آزمودن فرضیه ی خاصی در نظر گرفته نشده است بنابراین از آزمون دو طرفه استفاده می کنیم. مقدار کوچکتر محاسبه شده را به عنوان T در نظر گرفته، بنابراین T = 4. در مورد آزمون دو طرفه در سطح معنی داری p = 0.05 با n = 9 مقدار T برابر با 5 است. از آنجاییکه مقدار محاسبه شده از مقدار جدول کوچکتر است می توان گفت که امتیاز های داده شده توسط مصاحبه گران به صورت معنی داری به نفع کاندیدای 1 است.

مترجمین: دکتر هدی کامرانی فر – حسن اسکندری نیا

اشتراک گذاری در شبکه های اجتماعی

آمار به زبان ساده

loader

لطفا شکبیا باشید...