آمار به زبان ساده – مقدمهای بر آزمون فرضیه
22 مرداد 1400
دقیقه
فصل 4: مقدمهای بر آزمون فرضیه در این کتاب تاکنون دیدیم که توزیع فراوانی را میتوان با انتخاب قلم آماری مناسب یعنی معمولاً میانگین و انحراف استاندارد توصیف کرد. علاوه بر این میتوانیم نمرات توزیع فراوانیهای مختلف را با استفاده از نمرات استاندارد مقایسه کنیم. در نهایت اگر نمرات به صورت نرمال توزیع شده...
آخرین بهروزرسانی: 24 دی 1401
فصل 4: مقدمهای بر آزمون فرضیه
در این کتاب تاکنون دیدیم که توزیع فراوانی را میتوان با انتخاب قلم آماری مناسب یعنی معمولاً میانگین و انحراف استاندارد توصیف کرد. علاوه بر این میتوانیم نمرات توزیع فراوانیهای مختلف را با استفاده از نمرات استاندارد مقایسه کنیم. در نهایت اگر نمرات به صورت نرمال توزیع شده باشند میتوانیم از طریق توزیع نرمال استاندارد، اطلاعات افزونتری را درباره مقادیر احتمالی بدست آوریم. اکنون لازم است ببینیم چگونه میتوانیم از این اطلاعات برای کمک به پاسخ دادن به سوالاتی که امیدواریم تحقیق ما به آنها پاسخ دهد، استفاده کنیم. در این فصل ما از توصیف ساده دادهها به چگونگی استفاده از این دادهها برای آزمایش یک فرضیه منتقل میشویم.
آزمایش یک فرضیه
فرضیه یک پیشنهاد است: ما چیزی را که فرض میکنیم صحیح است بیان کرده سپس شواهد مربوط به آن را جمع آوری مینمائیم. برای مثال در جایی با گروهی از دوستان نشستهایم و درباره هوش صحبت میکنیم یکی از دوستان به نام پیتر ادعایی شگفتانگیز مطرح میکند که نبوغ او بدین دلیل است که در کودکی تحت تعالیم ویژه ای بوده است. همه به ادعای نبوغ او میخندند ولی او مصرانه بر ادعایش تأکید دارد. او تعالیم ویژه کودکی را تشریح میکند که به کودکان حتی پیش از آنکه سخن گفتن را آغاز کنند اطلاعات زیادی داده میشود. پیتر به ما میگوید مادرش در کودکی کارتهایی با تصاویری از ماشینها، ساختمانها و حتی سیاستمداران را به او نشان میداده و وقتی او غرغر میکرده آنها را برایش توضیح میداده است. او ادعا میکند کودکان در آن سن پتانسیل استفاده نشدهای برای یادگیری دارند که از آن بهرهبرداری نمیشود. او حتی تا جایی پیش میرود که بعضی از شکاکان کمکم به نظرات او در مورد توسعه هوش متمایل میشوند. اکنون توجه همه جلب شده است بدین علت ما تصمیم گرفتیم تا ادعای پیتر را بیازمائیم.
برای این کار به کاربرد رویهای نیاز داریم که به آن آزمون فرضیه گفته میشود. این رویه پایه و اساس همه آزمونهای آماری است که ما در این کتاب به آنها نظر خواهیم افکند. آزمون فرضیه یک روال منطقی مرحلهای از پیشنهاد فرضیه تا تصمیم درباره پذیرفتن یا رد کردن آن را دنبال میکند.
اولین مشکلی که با آن روبرو میشویم قرار دادن فرضیه به شکلی است که بتوان آن را آزمود. هوشسنجی وجود ندارد تا به پیتر وصل کنیم و ببینیم نمره هوش او چند است. باید راهی برای بیان فرضیهمان به شکلی که بتوان آن را آزمود پیدا کنیم. ممکن است تصمیم بگیریم که هوش را میتوان با اندازهگیری قابلیت حل مسائل ریاضی یا نوشتن مقالهای درباره وضعیت سیاسی کنونی سنجید. در این مورد ما تصمیم میگیریم به صورت عملیاتی هوش را به عنوان آزمون بهره هوشی یا تست IQ تعریف کنیم. تعریف عملیاتی ما، تعریف مجددی از مفهوم اولیه در قالب چیزی است که می توان آن را اندازهگیری کرد. یعنی نابغه افرادی هستند که در آزمون بهره هوشی نمره خیلی بالایی بگیرند. ممکن است اعتقاد شما این باشد که این تعریف خوبی از نبوغ نیست (بخاطر انتقادهایی که از تست بهره هوش دارید) و البته ممکن است نظر شما درست باشد. در آن صورت باید درخواست معیار سنجش مناسبتری برای ادامه کار کنیم. این مشکل اغلب اتفاق میافتد زیرا تجارب متفاوت ، اقتضای تعاریف عملیاتی متفاوتی را دارد. واضح است که باید قضاوت خود را برای تولید یک تعریف متناسب به کار ببریم. در این مورد، پیتر میپذیرد که آزمون بهرههوشی، معیار قابل قبولی برای تشخیص نبوغ اوست.
پیتر ادعا دارد که تعالیم ويژه دوران کودکی هوش او را رشد داده است و بدون آنها او نمیتوانست این چنین باهوش باشد. بطور مشابه بقیه ما هم که چنین تعالیم ویژهای در دوران کودکی نداشتهایم باید کم هوشتر از حالتی باشیم که این تعالیم را دیده بودیم. بنابراین فرضیه که میخواهیم به آزمون بگذاریم این است که تعالیم ویژه دوران کودکی (همانند آنچه پیتر دیده است) بهره هوشی یا IQ را افزایش میدهد. این را فرضیه تحقیق مینامند. توجه کنید که ما در اینجا خیلی خاص عمل میکنیم چون ممکن است تعالیم ویژه دوران کودکی متفاوتی وجود داشته باشد ولی مورد نظر ما فقط نوعی است که پیتر در آن شرکت کرده است.
همه چیزی که برای تصمیم درباره درستی یا نادرستی این فرضیه نیازمندیم آن است که دو توزیع را با هم مقایسه کنیم. توزیع نمرات آزمون بهره هوشی افرادی که تعالیم ویژه دوران کودکی را ندیدهاند با توزیع نمرات آزمون بهره هوشی افرادی که این تعالیم را در دوره کودکی دیدهاند. ما اولی را توزیع بهره هوشی معمول و دومی را توزیع بهره هوشی تعالیم ویژه مینامیم. اگر در یابیم که توزیع بهره هوشی تعالیم ویژه بالاتر از توزیع بهره هوشی معمول بوده و میانگین بالاتری دارد آنگاه میتوانیم بگوئیم که تعالیم ویژه دوران کودکی نمره آزمون بهره هوشی را افزایش میدهد. (ممکن است که علت این مسئله را ندانیم اما نشان دادهایم که اینکار را میکند) در تصویر 4.1 دو تصویر به شکلی نشان داده شدهاند که تأثیر تعالیم ویژه را در افزایش بهره هوشی باندازه 30 نقطه را مشخص کند، بنابراین در این مثال تحقیق تأثیر تعالیم ویژه را در انتقال توزیع بهرههوشی معمول به نقطهای بالاتر ، را تائید میکند.
اگر تعالیم ویژه دوران کودکی تأثیری در بهره هوشی نداشته باشد توزیع تعالیم ویژه باید همانند توزیع معمول باشد. به عنوان آخرین احتمال اگر تعالیم ویژه واقعاً نتیجه این کاهش بهره هوشی بوده باشد در آنصورت توزیع تعالیم ویژه باید کمتر از توزیع معمول باشد (که در نتیجه در تصویر 401به سمت چپ توزیع معمول منتقل خواهد شد و نه سمت راست آن). توجه کنید ما سه احتمال را مطرح کردیم: توزیع تعالیم ویژه بالاتر، مساوی و یا کمتر از توزیع معمول، تنها در صورتی که مورد اول را بیابیم فرضیه پیتر را قبول خواهیم کرد، از سوی دیگر اگر یکی از دو مورد دیگر اتفاق بیفتد فرضیه پیتر رد خواهد شد.
تصویر 4.1 تأثیر 30 نقطهای تعالیم ویژه
این بنظر خیلی آسان میآید ولی البته محال است؛ چگونه میخواهیم توزیع بهره هوشی افراد تعالیم ویژه را بیابیم تا بگوئیم این امتیاز بهره هوشی هر فرد پس از دیدن آموزشهایی مثل پیتر است. پاسخ آن است که ما نمیتوانیم چنین چیزی را بیابیم. این چیزی نیست که بتوان آن را به سادگی پیدا کرد. در واقع ما فقط نمره یک نفر از این توزیع را میتوانیم پیدا کنیم و آنهم نمره پیتر پس از گرفتن آزمون و دادن نمره به اوست.
آیا میتوانیم توزیع بهره هوشی معمول را بیابیم؟ واضح است که خیلی دشوار است که از همه آزمون بهره هوشی بگیریم، پس چه باید کرد؟ فرضی که میتوانیم بکنیم آن است که نمرات آزمون بهره هوشی به صورت نرمال توزیع شدهاند. اگر این کار را بکنیم توزیعی داریم که اطلاعات زیادی راجع به آن وجود دارد. میتوانیم فرض توزیع نرمال را به صورت زیر موجه نشان دهیم. اولا بسیاری از آمارهای انسانی به صورت نرمال توزیع شدهاند پس چرا توزیع هوش به صورت نرمال نباشد و ثانیا با اعتقاد به این مطلب، تولیدکنندگان آزمونهای بهره هوشی عمداً آنها را به شکلی بنا کردهاند که توزیع آنها به صورت نرمال با میانگین 100 و انحراف استاندارد 15 باشد.
توجه کنید ما یا باید از هرکس که مایلیم نمره او را یک توزیع خاص بیابیم آزمون بگیریم (مثل آزمون مثال فصل 2) یا در مورد شکل توزیع، فرضی را بپذیریم. در مثال آزمون دانشجویان تنها 100 نمره داشتیم اما در بسیاری حالت ما توزیعهایی با تعداد بسیار زیادی از نمرات را در نظر میگیرید که بدست آوردن هم آنها غیرممکن است. مثل نمره آزمون بهره هوشی همه افراد بالغ در کشور. بنابراین یا باید در مورد توزیع فرضی را بپذیریم و الا نمیتوانیم ادامه دهیم. همانطور که در فصل 5 خواهیم دید فرض یک توزیع نرمال اغلب کاملاً معتبر است.
اکنون ما یک توزیع داریم که درباره آن اطلاع داریم و یکی که درباره آن چیزی نمیدانیم. متأسفانه بدون توزیع بهره هوشی تعالیم ویژه قادر به آزمون فرضیه تحقیقمان نیستیم. ولی میتوانیم فرضیه دیگری عرضه کنیم که فرضیه صفر نامیده میشود. فرضیه صفر پیشبینی میکند که هر دو توزیع یکسان هستند و بنابراین تعالیم ویژه تأثیری بر روی نمرات بهره هوشی ندارد. با این فرض که می دانیم توزیع معمول به چه شکل است میتوانیم حدس بزنیم که توزیع تعالیم ویژه نیز همان است. اگر فرضیه صفر درست باشد آنگاه نمره آزمون بهره هوشی پیتر از همان توزیع که مثل توزیع معمول است میآید.
ما از پیتر آزمون میگیریم و نمره او 120 میشود. میتوانیم با پیدا کردن نمره z این نمره جای آن را در توزیع پیدا کنیم.
از آنجائیکه فرض کردهایم توزیع نرمال است میتوانیم به دنبال نمره Z در جدول توزیع نرمال استاندارد بگردیم (جدول A.1 در ضمیمه) تا احتمال نمره هوشی بالاتر از نمره پیتر را پیدا کنیم. نمره Z 33/1 به ما احتمال 0918/0 را میدهد. با این مفروض که توزیعها هر دو یک شکل هستند. معنایش آن است که 18/9 درصد از توزیع معمول که تحت آموزش تعالیم ویژه قرار نگرفتهاند امتیازی بالاتر از پیتر دارند. آیا میتوان این شواهد را برای حمایت از فرضیه صفر که میگوید هر دو توزیع یک شکل هستند به کار ببریم یا شواهد دیدگاهی را که میگوید دو توزیع متفاوتند و پیتر از توزیعی بالاتر از توزیع معمول است تائید میکنند؟ این حقیقت که بالاتر از 9 درصد افراد با بهره هوشی معمول نمرهای بالاتر از نمره پیتر دارند نمیتواند مرا در مورد تأثیر تعالیم ویژه دوران کودکی قانع کند. من انتظار داشتم که نخبگان بسیار کمتر از 18/9 درصد یعنی معادل 1 نفر از هر 11 نفر از توزیع بهره هوشی معمول که نمره بالاتری از پیتر دارند باشند. براساس این شواهد فرضیه صفر را میپذیریم و میگوئیم هیچ دلیلی بر تائید مدعای پیتر نیافتهایم.
حال بیائید تصور کنیم پیتر به جای نمره 120، نمره 145 گرفته بود. این به ما نمره Z 3 و احتمال 0013/0 نمره بالاتر از پیتر را به ما میدهد. این بدان معناست که تنها نمره 13/0 جامعه با بهره هوشی معمول از نمره پیتر بیشتر است. این درصد کم یعنی 13/0 درصد به ما میگوید که فقط 1 نفر از میان هر 769 نفر از توزیع بهرههوشی معمول نمرهای بالاتر از نمره پیتر دارد. براساس این شواهد اگر هر دو توزیع یکسان باشند به طور قطع پیتر بسیار غیرمعمولی است. یک نمره عالی همانند نمره پیتر در توزیع بهره هوشی معمول آنقدر نادرست است که بنظر میآید بیشتر محتمل است که متعلق به یک توزیع سطح بالاتر متفاوت باشد. اینجا احتمالات دال برخطا بودن فرضیه صفر است. بنابراین من فرضیه صفر را رد کرده و فرضی را که میگوید نمره پیتر از یک توزیع بهره هوشی تعالیم ویژه که سطحی بالاتر از توزیع معمول دارد میآید را تائید می کنم.
بنابراین آزمون فرضیه یک قمار براساس احتمالات است. اگر احتمال نمره پیتر از یک توزیع که همان توزیع معمول بوده خیلی پائین باشد من فرضیه صفر را رد کرده و اگر نمره پائین نباشد آن را میپذیرم.
وقتیکه در احتمال 0918/0 فرضیه صفر را پذیرفته و در احتمال 0013/0 آن را رد میکنیم، خط جداکننده کجاست؟ یعنی در چه احتمالی من باید از قبول به رد تغییر نظر دهم؟ پاسخ این است هرکجا که من بخواهم، بهرحال، بدلایلی که در فصل 9 تشریح خواهد شد توافق شده است که به صورت متعارف وقتی احتمال کمتر یا مساوی 05/0 باشد (که به صورت 05/0 P< یا معنیدار است در 05/0 = P) فرضیه صفر مردود خواهد بود. این بدان معناست که وقتی یک نمره از توزیع ناشناختهای، با شانس کمتر از 5 در 100، تنها میتواند از توزیع شناخته شدهای ظاهر شود (یعنی توزیعها یکی باشند) فرضیه صفر را رد کرده و میگوئیم که آن نمره واقعاً از یک توزیع متفاوت میآید. اساساً ما بر روی احتمال آنکه یک نمره (مثل نمره بهره هوشی پیتر) از یک توزیع ناشناخته (توزیع تعالیم ویژه کودکی) مشابه یک توزیع شناخته شده (توزیع معمول بهره هوشی) آمده، ریسک میکنیم. وقتیکه شانس 1 از 20 یا کمتر باشد (که احتمال 05/0 یا کمتر بوده زیرا من 1 را بر 20 تقسیم کرده مساوی 05/0 میشود) ما قمار خود را عوض کرده و شرط میبندیم که توزیعها متفاوت است. بنابراین احتمال 05/0 “سطح معنادار بودن” نامیده میشود. اگر احتمال نمره پیتر بزرگتر یا مساوی سطح معنادار بود فرضیه صفر را پذیرفته و اگر کمتر بود فرضیه صفر را رد میکنیم.
سطح معنادار بودن 05/0 بدین معناست که ما بیش از 95 درصد حتم داریم که پذیرفتن متفاوت بودن توزیع صحیح است. ما به خود اجازه میدهیم تا فرضیه صفر را خطا بدانیم و ادعا کنیم در حالاتی که احتمال 5 درصد یا کمتر از آن باشد توزیع متفاوت دیگری وجود دارد. زیرا چنین نمره بالایی تنها میتواند با شانس در 5 درصد از زمانها یا کمتر از آن بدست آمده باشد (منظور اینکه از توزیعی مشابه توزیع شناخته شده بیاید). بعضی اوقات میخواهیم در درست بودن ادعای یک تفاوت بین توزیعها از اینهم مطمئنتر باشیم، در این حالات سطح معنادار بودن را 01/0 = P گرفته و 1 احتمال از 100 یا کمتر را پذیرفته، که احتمال دارد ما خطا کرده باشیم. با این سطح معنادار بودن میتوانیم 99 درصد یا بیشتر مطمئن باشیم که در ادعای وجود یک توزیع متفاوت، انتخاب درستی کردهایم.
خلاصه ای از آزمون فرضیه
ما فرضیه اینکه تعالیم ویژه پیتر نبوغ او را ایجاد کرده طبق مراحل زیر آزمودیم:
- بهره هوشی (IQ) را به عنوان معیار کارآیی که هوش براساس آن مورد قضاوت قرار گیرد انتخاب کردیم. این تعریف عملیاتی ماست.
- یک فرضیه برای تحقیق ترتیب دادیم : تعالیم ويژه مانند آنچه پیتر در کودکی تجربه کرده، بهره هوشی فرد را افزایش میدهد.
- یک فرضیه صفر ترتیب دادیم : تعالیم ویژه مانند آنچه پیتر در کودکی تجربه کرده، تأثیری در بهره هوشی یک فرد ندارد.
- از آنجائیکه دو توزیع را نمیدانیم فرضیه تحقیق را نمیتوانیم بیازمائیم. اما میتوانیم فرضیه صفر را آزموده زیرا که توزیع معمول بهره هوشی را میدانیم و فرضیه صفر حدس میزند توزیع بهره هوشی تعالیم ویژه مثل همان توزیع معمول بهره هوشی است.
- از پیتر آزمون بهره هوشی گرفته و نمره آن را بدست آوردیم.
- با نگاه کردن در نمره Z جدول توزیع نرمال استاندارد، احتمال یک نمره به اندازه نمره پیتر یا بزرگتر از آن از توزیع بهره هوشی معمول را بدست آوردیم. این کار را فقط به این دلیل میتوانیم انجام دهیم چون فرض کردهایم که نمرات بهره هوشی معمول به صورت نرمال توزیع شدهاند.
- اگر احتمال یک نمره بالا به اندازه نمره پیتر یا بالاتر از آن، خیلی کوچک باشد، کوچکتر از سطح معنادار بودن آنگاه خواهیم گفت که برای چنین نمرهای آمدن از توزیعی همانند توزیع بهره هوشی معمول بسیار نادر است و فرضیه صفر را رد میکنیم و نتیجه میگیریم که توزیع تعالم ویژه، توزیعی متفاوت و در سطح بالاتری از توزیع بهره هوشی معمول میباشد. اگر احتمال کوچکتر از سطح معنادار بودن نباشد آنگاه فرضیه صفر را پذیرفته و نتیجه نمیگیریم که تفاوتی در توزیعها وجود دارد.
منطق آزمون فرضیه
علیرغم متفاوت بودن آزمونهای آماری که در این کتاب انجام می دهیم همه آنها یک منطق پایه را دنبال می کنند. فرضیه تحقیق پیشبینی میکند که توزیعها متفاوتند درحالیکه فرضیه صفر پیشبینی میکند که آنها یکسانند. اگر جزئیات دو توزیع را داشته باشیم به آسانی آنها را با هم مقایسه میکنیم. معمولاً این جزئیات موجود نیستند. ولی بهرحال وقتی یکی از توزیعها شناخته شده و دیگری ناشناخته باشد میتوان تحلیل را ادامه داد. شناخته شده ، زیرا ما قادریم که فرض کنیم به صورت نرمال توزیع شده است و جزئیات توزیع نرمال را هم می دانیم. یک سطح معنادار بودن را برمی گزینیم. زیرا معیار تصمیم ما برای پذیرفتن یا رد فرضیه صفر است. بطور مرسوم این سطح معادل 05/0= P یا 01/0 = P قرار داده میشود. سطح معنادار بودن را پیش از جمعآوری دادهها انتخاب میکنیم این کار مثل شرطبندی در مسابقه اسب دوانی است. در آنجا تا زمانیکه شرایط شرطبندی مشخص نباشد شرطی نمیبندیم. دادههایی را جمعآوری میکنیم که نمرهای از یک توزیع ناشناخته به ما میدهد. ما احتمال این نمره را که از یک توزیع ناشناخته برخاسته شده بررسی میکنیم تا ببینیم که آیا فرضیه صفر را پذیرفته و نتیجهگیری کنیم که توزیعها یکسانند. اگر احتمال کمتر از سطح معنادار بودن باشد فرضیه صفر را رد کرده و میگوئیم که شانس اینکه این نمره از توزیع متفاوتی از توزیع شناخته شده آمده باشد برتری دارد. اما اگر احتمال کمتر از سطح معنادار بودن نباشد فرضیه صفر را خواهیم پذیرفت.
پیشبینیهای یک دُمی و دو دُمی
آزمون فرضیه درباره تصمیمگیری همسان بودن یا نبودن یک توزیع ناشناخته با یک توزیع شناخته شده است. برای دو توزیع سه حالت وجود دارد:
- توزیع ناشناخته همانند توزیع شناخته شده باشد.
- رتبه توزیع ناشناخته از توزیع شناخته شده برتر است.
- رتبه توزیع ناشناخته از توزیع شناخته شده کمتر است.
ما همیشه فرضیه صفر (مورد 1) را که هر دو توزیع یکسان هستند میآزمائیم اما آزمون فرضیه تحقیق می تواند شکلهای متفاوتی داشته باشد. آزمون فرضیه تحقیق می تواند مورد 2 را پیش بینی کند. مثل پیشبینی توزیع تعالیم ویژه که رتبه بالاتری از توزیع بهره هوشی معمول داشت. برعکس آن ممکن است انتظار مورد 3 را داشته باشیم که رتبه توزیع ناشناخته پائینتر از رتبه توزیع شناخته شده باشد. فرض کنید دوست دیگرمان دیوید جراحتی ناشی از تصادف اتومبیل داشته باشد. در این حالت ممکن است انتظار داشته باشیم که این نوع جراحت منجر به بهره هوشی پائینتر برای افرادی که این نوع جراحت را دارند شود. در نهایت حالاتی وجود دارد که ما انتظار هم مورد 2 و هم مورد 3 را داریم. در چنین حالتی انتظار داریم که توزیع ناشناخته متفاوت از توزیع شناخته شده باشد اما احتمال اینکه رتبه آن بالاتر یا پائینتر باشد را باز میگذاریم. دوست سوم ما سوزان، با رژیم خاص غذائی مادر بزرگش رشد کرده است. ممکن است انتظار داشته باشیم این رژیم خاص غذایی بر کارآیی هوش او تأثیر گذاشته باشد. اگرچه ممکن است مطمئن نباشیم که پیشبینی کنیم این رژیم خاص بهره هوشی او را بهبود داده (چون شاید سوزان مخلوط درستی از غذاهای مناسب رشد هوش خورده) یا بهره هوشی او را کاسته است (شاید سوزان در رژیم خود ویتامینهای مهم را از دست داده باشد).
در مثالهای تعالیم ویژه کودکی و جراحت مغزی ناشی از تصادف، پیشبینیها جهت تفاوت در توزیعها را مشخص کرده زیرا فرض تحقیق مقرر میکند که توزیع ناشناخته به نسبت توزیع شناخته شده در کدام جهت منتقل میشود. این نوع پیشبینیها را، پیشبینی یک دُمی مینامند. اگر برگشته و به تصویر 4.1 نظری بیفکنید میتوانید ببینید که انتظار میرود توزیع تعالیم ویژه دوران کودکی، روی قسمت بالای توزیع بهره هوشی معمول یعنی یک دُم از توزیع شناخته شده را بپوشاند. اگر توزیع تعالیم ویژه همانند توزیع معمول یا در رتبه پائینتر از آن باشد آنگاه فرضیه ما تائید نخواهد شد. تنها در صورتیکه توزیع در دُمی که ما به آن علاقهمندیم یعنی انتهای بالای توزیع معمول بهره هوشی باشد، فرضیه ما تائید خواهد شد (همانگونه که در تصویر 4.1 نشان داده شده است) این نتیجه را میتوان با مشاهده نمره بالای پیتر که در انتهای دم بالایی (5 درصد بالا) توزیع بهره هوشی معمول قرار میگیرد گرفت و ادعا کرد که نمره او از توزیع دیگر با رتبه بالاتر آمده است.
مثال جراحت مغزی هم یک پیشبینی یک دُمی است زیرا همان منطق مثال تعالیم ویژه را دنبال میکند. با این تفاوت که ما به دم پائینتر توزیع شناخته شده علاقمندیم. تنها در صورتیکه بهره هوشی دیوید در 5 درصد بخش پائین توزیع بهرههوشی معمول باشد و فرضیه اینکه توزیع جراحت مغزی رتبه پائینتری از توزیع بهرههوشی معمول را دارد پذیرفته خواهد شد.
مثال رژیم خاص غذایی یک پیشبینی دو دُمی است، زیرا ما شرط خود را متعادل کردهایم وگفتهایم که رژیم غذایی سوزان ممکن است بهرههوشی او را کاهش یا افزایش داده باشد. توزیع بهرههوشی رژیم غذایی خاص میتواند دم پائینی یا دم بالایی توزیع بهرههوشی معمول را بپوشاند، خروجی هرکدام که باشد فرضیه ما در متفاوت بودن توزیعها را تائید خواهد کرد. تنها اگر هر دو توزیع یکسان باشند ما فرضیه صفر را خواهیم پذیرفت.
مثالهای زیادی وجود دارد که نمیتوان یک جهت خاص را مشخص کرده و پیشبینی یک دُمی انجام داد. برای نمونه تأثیر استرس بر رضایت شغلی، ممکن است پیشبینی کنیم نوع خاصی از استرس که اضطراب تولید میکند رضایت شغلی را کاهش میدهد. ولی اگر منجر به جذبه و هیجان شود میتواند باعث افزایش رضایت شغلی گردد. آنجائیکه شواهد کلی برای تصمیمگیری در مورد دنبال کردن یکی از فرضیهها موجود نباشد، آزمایشکننده ممکن است تصمیم بگیرد که پیش از هرچیز یک آزمون دو دُمی انجام دهد تا ببیند آیا این نوع استرس اصلا اثری چه منفی و چه مثبت دارد یا خیر. در این مورد هر تفاوتی در توزیعها فرضیه را تأیید خواهد کرد.
سطح معنادار بودن و پیشبینی دو دُمی
وقتیکه یک آزمون یک دُمی انجام میدهیم ادعا میکنیم که نتیجه آزمون اگر احتمالی کمتر از سطح معنادار بودن داشته باشد آنگاه در انتهای دُم توزیع شناخته شده که موردنظر ماست قرار خواهد گرفت. ما این را به عنوان نشانهای از آنکه نمره موردنظر بعید است از توزیعی مشابه توزیع شناخته شده تفسیر میکنیم و میگوئیم که از توزیع متفاوتی آمده است.
تصویر 4.2 یک پیشبینی یک دُمی و سطح معنادار بودن
اگر نمره موردنظر از جایی به جز بخشی از دم که بوسیله سطح معنادار بودن جدا شده، آمده باشد فرضیه تحقیق را رد خواهیم کرد. این مسئله در تصویر 4.2 نشان داده شده است.
تصویر 4.2 : یک پیش بینی یک دمی و سطح معنادار بودن
توجه کنید که این تصویر یک پیشبینی یک دُمی را نشان میدهد که در آن رتبه توزیع ناشناخته بالاتر از رتبه توزیع شناخته شده است. بعنوان یک تمرین، تلاش کنید یک تصویر برای یک پیشبینی یک دُمی که در آن توزیع ناشناخته پائینتر از رتبه توزیع شناخته شده باشد، رسم کنید (وقتی این کار را انجام دادید به تصویر 6.1 که یک پیشبینی از این نوع را نشان میدهد نگاه کنید).
با پیشبینی دو دُمی، هر دو دنباله توزیع مورد علاقه ما هستند زیرا توزیع ناشناخته میتواند در هر کدام از دو سو باشد. بهرحال اگر ما سطح معنادار بودن را باندازه 5 درصد در انتهای هر دنباله قرار دهیم ریسک به خطا افتادن را افزایش دادهایم. به یاد آورید که استدلال کردیم وقتیکه احتمال کمتر از 05/0 باشد نمره از یک توزیع ناشناخته آمده و نتیجه گرفتیم که توزیعها متفاوت هستند. در این حالت شانس اشتباه ما و اینکه توزیعها یکسان بوده باشند کمتر از 5 درصد بود. اگر هر دم توزیع را 5 درصد در نظر بگیریم همانگونه که وسوسه شدیم این کار را برای آزمون دو دمی انجام دهیم، کار را با شانس 10 درصد خطا به پایان برده و شانس خطا کردن را افزایش دادهایم. ما میخواهیم که ریسک افتادن در خطا را به صورت کلی در سطح 5 درصد حفظ کنیم (مقدار ثابت ریسک ما) زیرا در غیر اینصورت ادعاهای خطای ما در متفاوت بودن توزیعها افزون شده و باعث آسیب دیدن اعتبار ما نزد دیگر محققینی میگردد که ممکن است به طور جدی از پذیرفتن یافتههای ما دست بردارند (شخص نباید ادعای دروغ بکند و مثل چوپان دروغگو شود).
تصویر 4.3 : یک پیش بینی دو دمی و سطح معنادار بودن
وقتیکه بر روی یک توزیع ناشناخته که روی هرکدام از دمهای توزیع شناخته شده است ریسک میکنیم، برای اینکه بخواهیم مجموع ریسک خطا را در حد 5 درصد حفظ کنیم باید 5 درصد را بین دو دم توزیع شناخته شده تقسیم کنیم، بنابراین سطح معنادار بودن را برای هر دنباله 5/2 درصد قرار میدهیم. اگر نمره در یکی از دو 5/2 درصد دمها قرار گرفت میتوانم بگوئیم که از توزیع متفاوتی میآید. بنابراین وقتیکه یک پیشبینی دو دمی را به دست میگیریم، نتایج باید در ناحیهای کوچکتر از دم به نسبت یک پیشبینی یک دمی واقع شوند. این کار را باید برای جبران ریسک شرطبندی ما در پیشبینیمان، پیش از آنکه ادعا کنیم که توزیعها متفاوتند انجام دهیم. این مسئله در تصویر 4.3 نشان داده شده است.
آزمون فرضیه، به شکلی که در اینجا توصیف شد ،که برای گرفتن تصمیم، سطح معنادار بودن برمیگزینیم ، از آن اغلب به عنوان “آزمون معنادار بودن” یاد میشود. چه آزمون یک دمی و چه آزمون دو دمی انجام دهیم، تصمیم بر رد (یا قبول) فرضیه صفر بستگی به آن دارد که نمره ما در کدام سمت سطح معنادار بودن واقع میشود. آزمون معنادار بودن در تحلیل یافتههای تحقیق بینهایت مفید است و امیدوارم که ارزش آنرا از مثال نبوغ پیتر در بالا درک کرده باشید. بهرحال ما باید از مزایا و محدودیتهای آن آگاه باشیم؛ این مباحث در فصل 7 مورد بررسی قرار خواهد گرفت.
مترجمین: دکتر هدی کامرانی فر – حسن اسکندری نیا