آمار به زبان ساده –انتخاب نمونهها برای مقایسه
23 شهریور 1400
دقیقه
فصل 7: انتخاب نمونهها برای مقایسه فهرست محتوا پنهان فصل 7: انتخاب نمونهها برای مقایسه طراحي آزمونها براي مقايسه نمونهها متغيرهاي آزمايش مشكل شرايط یکسان نمونههاي مستقل و وابسته تفسير تفاوتهاي نمونه آزمون فرض با یک نمونه وقتی به کار برده میشود که جمعیت ویژهای را بشناسیم و میخواهیم تصمیم بگیریم که آیا نمونه از...
آخرین بهروزرسانی: 24 دی 1401
فصل 7: انتخاب نمونهها برای مقایسه
آزمون فرض با یک نمونه وقتی به کار برده میشود که جمعیت ویژهای را بشناسیم و میخواهیم تصمیم بگیریم که آیا نمونه از یک جمعیت دیگر آمده است یا خیر، در اغلب تحقیقها بطورکلی ما هیچ جزئیاتی از جمعیت در دست نداریم. آنچه میدانیم نمونهای است که در دست داریم. در غالب موارد آزمون فرض درباره مقایسه نمونهها و نه مقایسه میانگین نمونه با توزیع نمونهگیری است. در مثال گاز سایدامین که در فصل قبل ملاحظه نمودید ما جزئیات وزن زمان تولد جمعیت کودکان آلوده نشده به گاز را داشتیم.
بیشتر اوقات معمولا ما چنین اطلاعاتی را نداریم و تنها میتوانیم جمعآوری کنیم. البته شکل انتخاب نمونه وقتی که دو تا باشند سختتر از یکی است زیرا نیاز است که هرکدام نمایانگر جمعیت باشند. مسلماً این واقعیتی است که ما میخواهیم نمونههایمان را برای برآورد جمعیتی به کار ببریم که این امر به خودی خود مسائلی را در انتخاب نمونه باعث می شود. به طوریکه نمیخواهیم اریبی ایجاد شود که باعث شود نمونههایمان، نماد جمعیتهایشان نباشند.
وقتی دو نمونه داریم تنها نمیخواهیم که نمایانگر جمعیتهای مربوطهشان باشند بلکه میخواهیم قابل مقایسه هم باشند. برای مثال اگر میزان سلامتی مردان و زنان چهل ساله را مقایسه میکنیم نباید زنان قهرمان ورزشی و مردان راننده تاکسی را انتخاب کنیم چون آنها قابل مقايسه نيستند. هر تفاوت در سلامتي به آساني ميتواند بدليل شغلي و نه جنسيتي باشد. اين مشكل قابل مقايسه بودن است كه اكنون مورد ملاحظه قرار ميدهيم.
طراحي آزمونها براي مقايسه نمونهها
دليل بر عهده گرفته آزمونها اين است كه ميخواهيم فرض را بيازمائيم علت مهم براي نگراني آن است كه آيا آزمون واقعاً فرضي را كه ميخواهيم ارزيابي شود ميآزمايد تا بقيه را محروم كنيم يا اينكه بطريقي اریبی را ایجاد کرده ایم. انتخاب ضعيف نمونهها ميتواند منجر به يك آزمايش مبهم گشته، اگر ما قادر نباشيم تصميم بگيريم كه آيا تفاوت در سلامتي مربوط به شغل است يا جنسيت.
متغيرهاي آزمايش
همه آزمايشات به اثرات متغيرها يا فاكتورها،به عنوان دو اصطلاح با كاربرد مترادف، نگاه ميكنند. متغيرها روشن است يعني چيزهائيكه تغيير ميكنند: دما، زمان پاسخ دهي، روشهاي تدريس، جنسيت، كلاس، عادات آشاميدن، كيفيت كارآيي، تنها چند نمونه كوچك هستند.
در سادهترين حالت آزمون فرض ميخواستيم بدانيم كه آيا يك نمره از يك توزيع شناخت شده ميآيد يا از توزيع جمعيت متفاوتي می آید. يك مثال مقايسه زمان پاسخدهي (یا عکس العمل) فردي پس از مجروحيت در ناحيه سر با جمعيت در زمانهاي پاسخ دهي افرادي از جمعيت سالم ميباشد. همچنین می توان میانگین نمونه را با با توزیع میانگین نمونه ها که از توزیعی شناخته شده آمده اند نیز مقایسه کرد. بعنوان مثال ممكن است ميانگين نمرات بهرههوشي كودكاني را كه با روش جديد درست خواندهاند با توزيع ميانگين نمونههايي با همان اندازه از كودكاني كه با روش سنتي آموزش ديدهاند را با هم مقايسه كنيم. در هر دوی اين حالتها ما به يك توزيع شناخته شده نياز داريم. معمولا دو یا چند نمونه را در مورد موضوعی که مد نظر ماست مقایسه می کنیم و تصمیم می گیریم که نمونه ها از یک جمعیت آمده اند یا نه. براي نمونه آيا حافظه زنان و مردان در مورد حافظه تصويري تغيير ميكند. توجه كنيد كه لغت گروه در اين شرايط خيلي ساده به عضوي از يك نمونه اشاره داردموضوع یا گروه ميتواند هر چيزي باشد. بيشتر اوقات ميتواند يك شخص بوده اما ميتواند يك حيوان هم باشد (اگر ما نرخ يادگيري راههاي پيچ در پيچ و يا شگردهاي آموزش به سگها را مطالعه ميكنيم)، يا به طور قطع هر چيزي را كه مورد مطالعه قرار ميدهيم. (گلولههاي ساخته شده با يك ماشين در يك نمونه و گلولههاي ساخته شده با ماشين ديگر در نمونه دوم).
استفاده از اصطلاح موضوع در مطالعات روانشناسي هنگاميكه اشخاصي موافقت ميكنند كه در تحقيق شركت نمايند مورد انتقاد قرار گرفته است. در واژگان شناسي جديد چنين شخصي مشاركت كننده (یا شرکت کننده)ناميده ميشد زيرا او به عنوان فرد محترم تري از افراد شركت كننده مفيد در نظر گرفته ميشود كه بدون آنها تحقيقات كمي در زمينه روانشناسي تحقق مييافت. بهر حال در تحليلهاي آماري براي نوعهاي خاصي از طراحي و محاسبات از عناوين « بین گروهی ها» و « درون گروه ها» ياد ميكنيم تا اصطلاحات در چنين شرايطي نيز جريان داشته باشند. آنجائيكه مشخص است كه افراد در مطالعه شركت كردهاند من از آنها به جاي موضوع به عنوان مشاركتكننده ياد ميكنم.
در مثالي كه تاكنون مورد ملاحظه قرار داديم هر آزموني حداقل دو فاكتور داشت. در مثال گاز سايدامین يك متغيير گاز سايدامين بود كه بين آلوده و غيرآلوده در نوسان بود و ديگري وزن زمان تولد، كه ميان افرادي كه وزن آنها را گرفته بوديم تغيير ميكرد. در مثال بالاي آزمون حافظه، جنس را داشتيم كه مرد بود يا زن و حافظه تصويري كه باندازه معیاری كه براي سنجيدن آن اختراع شده متغير بود.
در آزمايش ممكن است يك يا چند متغير مستقل وجود داشته باشد. اينها متغيرهايي هستند كه آزمون گيرنده آنها را بيشتر بخاطر مقاديرشان بر ميگزيند. در مورد متغير گاز سايدامين انتخاب ما اين بود كه به دو مقدار نظر بيفكنيم: آلوده و غيرآلوده (نه اينكه بگوئيم بشدت آلوده، آلوده متوسط، كمي آلوده) در مورد متغير جنس ، ما زن و مرد را برگزيديم ( و نه پسر و دختر). آزمون گيرنده مقادير متغيرهاي مستقل را كنترل ميكند و نمونهها جوري برگزيده ميشوند كه در اين مقادير متفاوت باشند.
همانند متغيرهاي مستقل، در یك آزمون متغيرهاي وابسته هم وجود دارند. در حاليكه محقق فاكتوري را بعنوان متغير مستقل بر ميگزيند (وزن ، زمان تولد ، زمان پاسخدهي، نمره بهرههوشي، حافظه تصويري) اما نميتواند مقادير آن متغير را كنترل كند.
ما پيشاپيش نميدانيم كه نمره اين متغير چه خواهد بود. اين دلیلی است كه برای آن آزمون انجام ميدهيد. اجازه دهيد مثالي از دو نمونه را مورد ملاحظه قراردهيم. دو گروه از كودكان با دو روش متفاوت مشغول آموزش زبان دوم هستند. آيا يك روش از روش ديگر بهتر است.
در اصطلاح آماري ما ميخواهيم متغير وابسته مناسب را بيابيم (مثلاً مقداري كه آموختهاند) كه به متغير مستقل وابسته است (يعني روش آموزش) تا ببينيم كه آيا مقدار متغير وابسته در دو نمونهها به شكلي متفاوتند كه بتوان نتيجه گرفت كه نمرات نمونه از توزيعهاي متفاوتي ميآيند و يك روش آموزش به بازده بيشتري از ديگري ميانجامد.
مشكل شرايط یکسان
آزمونها همه درباره پيشبيني رابطه بين متغيرهاي مستقل و وابسته هستند. فرض تحقيق يك پيشبيني است كه ميگويد متغير وابسته با تغيير در متغير مستقل تغيير ميكند در نظر بگيريد كه آزمايشي را براي اينكه ببينيم آيا دختران در خواندن نقشه بهتر از پسران هستند ترتيب دهيم. اولين مسئله آن است كه منظور ما از خواندن نقشه چيست، خواندن نقشه جادهها براي رسيدن به شهر؟ خواندن يك نقشه نظامي براي رفتن از یک سوی شكارگاه به سوی دیگر؟ جواب سادهاي براي پاسخ به اين سوال وجود ندارد. بايد انتخابي كرده و بوضوح آن را اظهار كنيم. همانگونه كه در فصل 4 ديديم بايد به صورت عملياتی قابليت خواندن نقشه را براي هدف آزمون خود تعريف كنيم مثل اينكه بگوئيم: زمانيكه طول ميكشد تا يك بچه از يك كليسا در دشت با استفاده از نقشه نظامي به يك اداره پست خاص برود. ميبايست شرايط را به صورت يكسان براي همه كودكان ترتيب دهيم مثلاً مطمئن شويم هيچ يك از آنها مسير را بلد نيست. و اين مسئله مشكل دوم را روشن ميكند.
اگر ما تفاوتي ميان پسران و دختران در قابليت نقشه خواني يافتيم: آيا ميتوانيم رابطهاي بين جنسيت و قابليت نقشه خواني استنتاج كنيم؟ لزوماً نه. علت آن ، مشكل بودن ترتيب شرايط مساوي براي پسران و دختران است. اگر دختران كار را در روشنايي روز انجام داده و پسران آن را در تاريكي، تعجبي نخواهيم كرد كه نتايج پسران ضعيفتر باشد در چنين حالتي متغير مستقل جنسيت با متغير روشنايي روز آميخته شده است.
همينطور اگر پسران از يك باشگاه صحرا نوردي با قطبنما بوده و دختران هرگز حتي پيش از آن نقشهاي را نديده با شند آنگاه يك تفاوت ميان آنان، لزوماً دلالت بر رابطهاي ميان قابليت نقشه خواني با جنسيت نخواهد داشت بلكه در اينجا رابطهاي ميان قابليت نقشه خواني و تجربه وجود دارد.
اختلاط يك مثال از خطای سيستماتيك است. شرايط آزمون به صورت يكساني براي هر دو نوع بدليل ديگر متغيرهاي مستقل همانند آني كه در حال آزمون است متفاوت است. افزون بر خطاهاي سيستماتيك تأثيرگذار بر آزمون، ما خطاهاي تصادفي هم داريم. اين خطاها به صورت غيرسيستماتيك رخ ميدهند. يك باد نابهنگام موقتاً خواندن نقشه را براي يك پسر سخت ميكند، جاده براي يك دختر هنگام عبور از آن شلوغ است ولي براي ديگري خلوت.
از آنجا که بنظر ميرسد هرگز نتوانيم شرايط مساوي براي همه شركتكنندگان در تحقيق فراهم كنيم آيا بايد همه آزمونهاي همگاني را رها كنيم؟ متأسفانه هيچ روش تحقيق بدون مشكلي وجود ندارد اما راههايي براي مقابله با اين مشكلات وجود دارد. خطاهاي سيستماتيك وقتيكه ما از وجود آنها آگاه هستيم اجتناب پذيرند و اين به مهارت محقق در مشخص نمودن آنها بستگي دارد. ميتوانيم متعمداً شركتكنندگان را جوري انتخاب كنيم كه با يك متغير اختلاط گر مطابقت داشته باشند. در مثال خودمان، هر پسري را كه تجربه نقشه خواني دارد با يك دختر كه او نيز چنين تجربهاي دارد مطابقت دهيم. بدين روش نمونهها در آزمايش تفاوتي نخواهند داشت و ديگر نتايج ما جانبداري نسبت به يك نمونه خاص نخواهد داشت. همچنين انجام آزمايش در روز را مراقبت كنيم و مطمئن شويد كه همه كودكان آزمايش خود را در شرايط مساوي روشنايي روز انجام دادهاند. با كمي پختهتر عمل كردن در طراحي و اجراي آزمايش، ميتوانيم خطاهاي سيستماتيك مربوط را از سر راه برداريم.
خيلي غير محتمل است كه بخواهيم كودكان در رنگ موهايشان هم مشابه باشند چون انتظار نميرود كه اين فاكتور در اين آزمايش موثر باشد. در مطابقت تنها فاكتورهايي را در نظر ميگيريم كه معتقديم مرتبط هستند. مجدداً ملاحظه ميفرمائيد كه دانش و خبرگي شخص در زمينه تحقيق است كه اين قضاوتها را هدايت ميكند و نه دانشآماري او بدين دليل است كه آزمايش بايد بدقت گزارش شود تا مشخص كند كه نمونهها چگونه مطابقت داده شدهاند زيرا محقق ديگري ممكن است ادعا كند كه يك فاكتور گيجكننده مهم در آزمايش كنترل نشده است
نميتوان خطاهاي تصادفي را كنترل نمود، ولي بهرحال آزمونهاي آماري ما، متعهداً به شكلي طراحي شدهاند كه به ما كمك كنند تا تصميم بگيريم كه آيا ميان نمونههايمان تحت تاثیر هرگونه «اغتشاش پنهان»اي كه بوسيله خطاهاي تصادفي ايجاد شده ، اختلافی وجود دارد يا خير؟ و براي اين كار يك سطح معنی داری مشخص ميكنيم. انتظار نداريم كه هر پسر و دختري نمره يكسان بگيرند. بلكه انتظار توزيع نمرات را داريم: هر پسري با يك سرعت مي دود و همه دخترها هم در جادهها مسافرت نميكنند. خطاهاي تصادفي توزيعی از نمرات در همه نمونهها ايجاد ميكنند آزمونهای آماري بدنبال تفاوتهاي سيستماتيك ميان نمونهها ميگردند که متغيرهاي مستقل تحت تاثیر تغييرات تصادفي در يك نمونه. ایجاد کرده اند.
نمونههاي مستقل و وابسته
گاهي اوقات همانند آزمايش نقشهخواني، شركتكنندگان متفاوتي در هر نمونه وجود دارند. در رابطه با متغير جنسيت تعجبآور نيست كه كودكان يا دختر هستند و يا پسر و نه هر دوي آن در بعضي آزمايشهاي ديگر ممكن است يك شركتكننده در همه نمونهها مشاركت داشتهباشد. يك مثال از اين نوع ميتواند يك آزمايش براي مشخص كردن تأثير دما براي ادراك خواندن باشد جائيكه ادراك شركتكنندگان را در دو درجه حرارت مختلف مورد آزمون قرار ميدهيم. وقتيكه يك شركتكننده تنها با يك نمره در يك نمونه مشاركت كند آنرا غير وابسته، مستقل يا طرح بين گروه ها ميناميم و هنگاميكه يك شركتكننده با يك نمره براي هر نمونه شركت كند آزمايش وابسته، سنجشهاي تكراري و يا طرح درون گروه ها ناميده ميشود. اكنون به آزمايشي توجه كنيد كه محقق تلاش ميكند دريابد آيا نوشته های جوزف كنرداد (مشهور به مشكل بودن نوشتههايش) در مقايسه با چارلز ديكنز مشكلتر است، محقق ممكن است قطعهاي از نوشتههاي هر دو نويسنده را (كه حداقل يك اندازه باشند) انتخاب كرده و آن را به گروهي از شركتكنندگان داده تا بخوانند و بدنبال آن يك آزمون درك مطلب بدهند.
اين يك طراح وابسته است زيرا هر شخص در هر دو نمونه حضور دارد. اين روش از جهت مطابقت شركتكنندگان با خودشان مزيت دارد. بنابراين خطاهاي ممكن ناشي از تفاوت بين افراد را كاهش ميدهد (مثلا همه آدمهاي متعصب روي زبان انگليسي را در يك نمونه نداريم) اما مشكلات ديگري وجود دارد كه بايد مراقبت آنها بود. اگر شركت كنندگان در ابتدا متن ديكنز و سپس متن كنرداد را بخوانند ممكن است در مورد متن ديكنز از لحاظ درك مطلب عملكرد ضعيفتري نشان بدهند، نه بدليل قابل درك نبودن ، بلكه چون آن را در ابتدا خواندهاند و اكنون در ذهن آنها نيست.
ما فاكتور اختلاط گری به نام مدت حافظه در اين آزمايش معرفي كردهايم. براي فائق آمدن بر اين مشكل، ميبايستي در ترتيب خواندن موازنه ايجاد كنيم. بنابراين نيمي از شركتكنندگان در ابتدا متن ديكنز را ميخوانند و نيمي ديگر متن كنرداد را ، با اين گونه موازنه برقرار كرد ن، فاكتورهاي اختلاط گری همچون مدت حافظه ، خستگي، كسالتآاور بودن، تجربه امتحان و غيره را كنترل ميكنيم.
مزيت طراح مستقل آن است كه اثر منتقل شوندهاي از يك نمونه به نمونه ديگر وجود ندارد، در حاليكه نكته منفي آن است كه ممكن است تفاوتهاي سيستماتيكي بين نمونهها وجود داشته باشد. بنابراين ما بايد در انتخاب نمونههايمان مراقب باشيم. در بسياري از حالات وقتيكه يك متغير مستقل مانند جنسيت يا شغل را ميآزمائيم يعني جائيكه شركتكنندگان تنها ميتوانند عضو يك نمونه باشند، مي بايستي طراحي مستقل را داشته باشيم. مردم يا به عنوان دكتر كار ميكنند و يا به عنوان پرستار و نه هر دوي آنها.
تفسير تفاوتهاي نمونه
اساساً در طراحي آزمايشها، مايليم كه موضوعات مورد آزمايش خود را از بزرگترين جمعيت ممكن انتخاب كنيم. اگر اين کار را انجام دهيم نتايج ما بيشترين قابليت عمومي شدن را دارا هستند. ولي به همان نسبت بزرگترين شانس ایجاد اختلاط را نيز داريم. محققين توافق ميكنند (زيرا آنها بايد هر روشي را به كار بگيرند) و مقداري از قابليت عمومي شدن را به خاطر كنترل بيشتر بر روي متغيرهاي در دست، از دست ميدهند. در مثال گاز سايدامين ما بچههائي را كه گاز در آن شهر پراكنده شده بود مورد آزمايش قرار داديم. اين مثال را نميتوان به همه بچههاي تحت تأثير گاز سايدامين تعميم داد. ممكن است چيزي مختص به اين موقعيت مكاني موجود باشد كه اثر گاز را به نحوي تشديد كرده باشد. اما اين موجب نميشود كه محققين آزمايش را متوقف كنند. هنوز اطلاعات مهمي را ميتوان يافت و البته نياز است كه تأثير موقعيت مكاني در افزايش اثرات گاز سايدامين روشن شود. در نهايت در اين بخش ما ميخواهيم آزمايشي را طراحي كنيم كه واقعاً فرضي را كه ما مايليم مورد بررسي قرار دهد. (جالب است بدانيد كه چقدر زياد اينگونه نميشود). اگر بخواهيم كه ببینیم كه يك الگوي مطالعه خواندن كودكان را بهبود ميبخشد يا خير؟ پس از اينكه در اين الگوی مطالعه مشاركت كردند به راحتي نميتوان آنها را قبل و بعد از مشارکت ، مورد آزمايش قرار داد. هر تفاوتي ممكن است مربوط به آن باشد كه كودكان شركتكننده در طرح سن بيشتري داشته باشند. و الگوي مطالعه علت آن نباشد در اينجا ما فاكتور اختلاط گر سن را داريم. براي غلبه بر اين مشكل دو گروه از كودكان را كه در قابليت خواندن مطابق باشند. انتخاب كرده، به يك گروه از آنها یعنی گروه آزمایشی الگو را داده و به گروه دیگر یعنی گروه کنترل نمی دهیم اگر خواندن گروه آزمايشي بيشتر از گروه كنترل بهبود يافت آنگاه ميتوانيم آن را به الگوي مطالعه ربط دهيم زيرا ما تأثير آن را با انتخاب گروه كنترل، مهار كردهايم.
در همه آزمايشها تلاش ميكنيم تا بين متغيرهاي مستقل و وابسته رابطه ايجاد كرده و متغيرهاي خارجي را كه ميتوانند بر اين رابطه تأثير بگذارند كنترل كنيم. بايد مراقب باشيم هنگاميكه رابطهاي را مييابيم تفسير ما دچار خطا نشود. آزمايشها روابط علی و معلولی را ايجاد نميكنند ، آنها تنها فرضهاي قابل آزمون را تائيد يا رد ميكنند. براي مثال ممكن است تفاوت مردان و زنان در يك فاكتور خاص را فرض قرار دهيم. اگر تفاوت معناداري يافتيم فرض ما را تائيد ميكند اما علت آنرا به ما نميگويم. دليل ممكن است ژنتيك، اجتماعي يا حتي يك فاكتور اختلاط گر باشد كه ما روي آن حساب نكرده بوديم.
علت انجام آزمونها اين است تا آنها به ما مقداري داده سيستماتيك بدهند كه پايه قضاوتها و تست ايدههايمان بشود. هر چه بيشتر درباره روشهاي آزمايش بياموزيم قضاوتهاي ما در ارزيابي يافتههايمان پختهتر خواهند شد. و اين تحليل آماري است كه به ما كمك ميكند تا تصميم بگيريد كه واقعاً چه يافتهايم.
مترجمین:دکتر هدی کامرانی فر – حسن اسکندری نیا