آمار به زبان ساده – مقدمه‌ای بر آزمون فرضیه

22 مرداد 1400

دقیقه

فصل 4: مقدمه‌ای بر آزمون فرضیه   در این کتاب تاکنون دیدیم که توزیع فراوانی را می‌توان با انتخاب قلم آماری مناسب یعنی معمولاً میانگین و انحراف استاندارد توصیف کرد. علاوه بر این می‌توانیم نمرات توزیع فراوانی‌های مختلف را با استفاده از نمرات استاندارد مقایسه کنیم. در نهایت اگر نمرات به صورت نرمال توزیع شده...

آخرین به‌روزرسانی: 24 دی 1401

فصل 4: مقدمه‌ای بر آزمون فرضیه

 

در این کتاب تاکنون دیدیم که توزیع فراوانی را می‌توان با انتخاب قلم آماری مناسب یعنی معمولاً میانگین و انحراف استاندارد توصیف کرد. علاوه بر این می‌توانیم نمرات توزیع فراوانی‌های مختلف را با استفاده از نمرات استاندارد مقایسه کنیم. در نهایت اگر نمرات به صورت نرمال توزیع شده باشند می‌توانیم از طریق توزیع نرمال استاندارد، اطلاعات افزونتری را درباره مقادیر احتمالی بدست آوریم. اکنون لازم است ببینیم چگونه می‌توانیم از این اطلاعات برای کمک به پاسخ دادن به سوالاتی که امیدواریم تحقیق ما به آنها پاسخ دهد، استفاده کنیم. در این فصل ما از توصیف ساده داده‌ها به چگونگی استفاده از این داده‌ها برای آزمایش یک فرضیه منتقل می‌شویم.

 

آزمایش یک فرضیه

فرضیه یک پیشنهاد است: ما چیزی را که فرض می‌کنیم صحیح است بیان کرده  سپس شواهد مربوط به آن را جمع ‌آوری می‌نمائیم. برای مثال در جایی با گروهی از دوستان نشسته‌ایم و درباره هوش صحبت می‌کنیم یکی از دوستان به نام پیتر ادعایی شگفت‌انگیز مطرح می‌کند که نبوغ او بدین دلیل است که در کودکی تحت تعالیم ویژه ای بوده است. همه به ادعای نبوغ او می‌خندند ولی او مصرانه بر ادعایش تأکید دارد. او تعالیم ویژه کودکی را تشریح می‌کند که به کودکان حتی پیش از آنکه سخن گفتن را آغاز کنند اطلاعات زیادی داده می‌شود. پیتر به ما می‌گوید مادرش در کودکی کارتهایی با تصاویری از ماشینها، ساختمانها و حتی سیاستمداران را به او نشان میداده و وقتی او غرغر می‌کرده آنها را برایش توضیح میداده است. او ادعا می‌کند کودکان در آن سن پتانسیل استفاده نشده‌ای برای یادگیری دارند که از آن بهره‌برداری نمی‌شود. او حتی تا جایی پیش می‌رود که بعضی از شکاکان کم‌کم به نظرات او در مورد توسعه هوش متمایل می‌شوند. اکنون توجه همه جلب شده است بدین علت ما تصمیم گرفتیم تا ادعای پیتر را بیازمائیم.

برای این کار به کاربرد رویه‌ای نیاز داریم که به آن آزمون فرضیه گفته می‌شود. این رویه پایه و اساس همه آزمونهای آماری است که ما در این کتاب به آنها نظر خواهیم افکند. آزمون فرضیه یک روال منطقی مرحله‌ای از پیشنهاد فرضیه تا تصمیم درباره پذیرفتن یا رد کردن آن را دنبال می‌کند.

اولین مشکلی که با آن روبرو می‌شویم قرار دادن فرضیه به شکلی است که بتوان آن را آزمود. هوش‌سنجی وجود ندارد تا به پیتر وصل کنیم و ببینیم نمره هوش او چند است. باید راهی برای بیان فرضیه‌مان به شکلی که بتوان آن را آزمود پیدا کنیم. ممکن است تصمیم بگیریم که هوش را می‌توان با اندازه‌گیری قابلیت حل مسائل ریاضی یا نوشتن مقاله‌ای درباره وضعیت سیاسی کنونی سنجید. در این مورد ما تصمیم می‌گیریم به صورت عملیاتی هوش را به عنوان آزمون بهره هوشی یا تست IQ تعریف کنیم. تعریف عملیاتی ما، تعریف مجددی از مفهوم اولیه در قالب چیزی است که می توان آن را اندازه‌گیری کرد. یعنی نابغه افرادی هستند که در آزمون بهره هوشی نمره خیلی بالایی بگیرند. ممکن است اعتقاد شما این باشد که این تعریف خوبی از نبوغ نیست (بخاطر انتقادهایی که از تست بهره هوش دارید) و البته ممکن است نظر شما درست باشد. در آن صورت باید درخواست معیار سنجش مناسب‌تری برای ادامه کار ‌کنیم. این مشکل اغلب اتفاق می‌افتد زیرا تجارب متفاوت ، اقتضای تعاریف عملیاتی متفاوتی را دارد. واضح است که باید قضاوت خود را برای تولید یک تعریف متناسب به کار ببریم. در این مورد، پیتر می‌پذیرد که آزمون بهره‌هوشی، معیار قابل قبولی برای تشخیص نبوغ اوست.

پیتر ادعا دارد که تعالیم ويژه دوران کودکی هوش او را رشد داده است و بدون آنها او نمی‌توانست این چنین باهوش باشد. بطور مشابه بقیه ما هم که چنین تعالیم ویژه‌ای در دوران کودکی نداشته‌ایم باید کم هوش‌تر از حالتی باشیم که این تعالیم را دیده بودیم. بنابراین فرضیه که می‌خواهیم به آزمون بگذاریم این است که تعالیم ویژه دوران کودکی (همانند آنچه پیتر دیده است) بهره هوشی یا IQ را افزایش می‌دهد. این را فرضیه تحقیق می‌نامند. توجه کنید که ما در اینجا خیلی خاص عمل می‌کنیم چون ممکن است تعالیم ویژه دوران کودکی متفاوتی وجود داشته باشد ولی مورد نظر ما فقط نوعی است که پیتر در آن شرکت کرده است.

همه چیزی که برای تصمیم درباره درستی یا نادرستی این فرضیه نیازمندیم آن است که دو توزیع را با هم مقایسه کنیم. توزیع نمرات آزمون بهره هوشی افرادی که تعالیم ویژه دوران کودکی را ندیده‌اند با توزیع نمرات آزمون بهره هوشی افرادی که این تعالیم را در دوره کودکی دیده‌اند. ما اولی را توزیع بهره هوشی معمول و دومی را توزیع بهره هوشی تعالیم ویژه می‌نامیم. اگر در یابیم که توزیع بهره هوشی تعالیم ویژه بالاتر از توزیع بهره هوشی معمول بوده و میانگین بالاتری دارد آنگاه می‌توانیم بگوئیم که تعالیم ویژه دوران کودکی نمره آزمون بهره هوشی  را افزایش می‌دهد. (ممکن است که علت این مسئله را ندانیم اما نشان داده‌ایم که اینکار را می‌کند) در تصویر 4.1 دو تصویر به شکلی نشان داده شده‌اند که تأثیر تعالیم ویژه را در افزایش بهره هوشی باندازه 30 نقطه را مشخص کند، بنابراین در این مثال تحقیق تأثیر تعالیم ویژه را در انتقال توزیع بهره‌هوشی معمول به نقطه‌ای بالاتر ، را تائید می‌کند.

اگر تعالیم ویژه دوران کودکی تأثیری در بهره هوشی نداشته باشد توزیع تعالیم ویژه باید همانند توزیع معمول باشد. به عنوان آخرین احتمال اگر تعالیم ویژه واقعاً نتیجه این کاهش بهره هوشی بوده باشد در آنصورت توزیع تعالیم ویژه باید کمتر از توزیع معمول باشد (که در نتیجه در تصویر 401به سمت چپ توزیع معمول منتقل خواهد شد و نه سمت راست آن). توجه کنید ما سه احتمال را مطرح کردیم: توزیع تعالیم ویژه بالاتر، مساوی و یا کمتر از توزیع معمول، تنها در صورتی که مورد اول را بیابیم فرضیه پیتر را قبول خواهیم کرد، از سوی دیگر اگر یکی از دو مورد دیگر اتفاق بیفتد فرضیه پیتر رد خواهد شد.

 

تصویر 4.1 تأثیر 30 نقطه‌ای تعالیم ویژه

این بنظر خیلی آسان می‌آید ولی البته محال است؛ چگونه می‌‌خواهیم توزیع بهره هوشی افراد تعالیم ویژه را بیابیم تا بگوئیم این امتیاز بهره هوشی هر فرد پس از دیدن آموزشهایی مثل پیتر است. پاسخ آن است که ما نمی‌توانیم چنین چیزی را بیابیم. این چیزی نیست که بتوان آن را به سادگی پیدا کرد. در واقع ما فقط نمره یک نفر از این توزیع را می‌توانیم پیدا کنیم و آنهم نمره پیتر پس از گرفتن آزمون و دادن نمره به اوست.

آیا می‌توانیم توزیع بهره هوشی معمول را بیابیم؟ واضح است که خیلی دشوار است که از همه آزمون بهره هوشی بگیریم، پس چه باید کرد؟ فرضی که می‌توانیم بکنیم آن است که نمرات آزمون بهره هوشی به صورت نرمال توزیع شده‌اند. اگر این کار را بکنیم توزیعی داریم که اطلاعات زیادی راجع به آن وجود دارد. می‌توانیم فرض توزیع نرمال را به صورت زیر موجه نشان دهیم. اولا بسیاری از آمارهای انسانی به صورت نرمال توزیع شده‌اند پس چرا توزیع هوش به صورت نرمال نباشد و ثانیا با اعتقاد به این مطلب، تولیدکنندگان آزمونهای بهره هوشی عمداً آنها را به شکلی بنا کرده‌اند که توزیع آنها به صورت نرمال با میانگین 100 و انحراف استاندارد 15 باشد.

توجه کنید ما یا باید از هرکس که مایلیم نمره او را یک توزیع خاص بیابیم آزمون بگیریم (مثل آزمون مثال فصل 2) یا در مورد شکل توزیع، فرضی را بپذیریم. در مثال آزمون دانشجویان تنها 100 نمره داشتیم اما در بسیاری حالت ما توزیعهایی با تعداد بسیار زیادی از نمرات را در نظر می‌گیرید که بدست آوردن هم آنها غیرممکن است. مثل نمره آزمون بهره هوشی همه افراد بالغ در کشور. بنابراین یا باید در مورد توزیع فرضی را بپذیریم و الا نمی‌توانیم ادامه دهیم. همانطور که در فصل 5 خواهیم دید فرض یک توزیع نرمال اغلب کاملاً معتبر است.

اکنون ما یک توزیع داریم که درباره آن اطلاع داریم و یکی که درباره آن چیزی نمی‌دانیم. متأسفانه بدون توزیع بهره هوشی تعالیم ویژه قادر به آزمون فرضیه تحقیق‌مان نیستیم. ولی می‌توانیم فرضیه دیگری عرضه کنیم که فرضیه صفر نامیده می‌شود. فرضیه صفر پیش‌بینی می‌کند که هر دو توزیع یکسان هستند و بنابراین تعالیم ویژه تأثیری بر روی نمرات بهره هوشی ندارد. با این فرض که می دانیم توزیع معمول به چه شکل است می‌توانیم حدس بزنیم که توزیع تعالیم ویژه نیز همان است. اگر فرضیه صفر درست باشد آنگاه نمره آزمون بهره هوشی پیتر از همان توزیع که مثل توزیع معمول است می‌آید.

ما از پیتر آزمون می‌گیریم و نمره او 120 می‌شود. می‌توانیم با پیدا کردن نمره z این نمره جای آن را در توزیع پیدا کنیم.

  

از آنجائیکه فرض کرده‌ایم توزیع نرمال است می‌توانیم به دنبال نمره Z در جدول توزیع نرمال استاندارد بگردیم (جدول A.1 در ضمیمه) تا احتمال نمره هوشی بالاتر از نمره پیتر را پیدا کنیم. نمره Z 33/1 به ما احتمال 0918/0 را میدهد. با این مفروض که توزیع‌ها هر دو یک شکل هستند. معنایش آن است که 18/9 درصد از توزیع معمول که تحت آموزش تعالیم ویژه قرار نگرفته‌اند امتیازی بالاتر از پیتر دارند. آیا می‌توان این شواهد را برای حمایت از فرضیه صفر که می‌گوید هر دو توزیع یک شکل هستند به کار ببریم یا شواهد دیدگاهی را که می‌گوید دو توزیع متفاوتند و پیتر از توزیعی بالاتر از توزیع معمول است تائید می‌کنند؟ این حقیقت که بالاتر از 9 درصد افراد با بهره هوشی معمول نمره‌ای بالاتر از نمره پیتر دارند نمی‌تواند مرا در مورد تأثیر تعالیم ویژه دوران کودکی قانع کند. من انتظار داشتم که نخبگان بسیار کمتر از 18/9 درصد یعنی معادل 1 نفر از هر 11 نفر از توزیع بهره هوشی معمول که نمره بالاتری از پیتر دارند باشند. براساس این شواهد فرضیه صفر را می‌پذیریم و می‌گوئیم هیچ دلیلی بر تائید مدعای پیتر نیافته‌ایم.

حال بیائید تصور کنیم پیتر به جای نمره 120، نمره 145 گرفته بود. این به ما نمره Z 3 و احتمال 0013/0 نمره بالاتر از پیتر را به ما می‌دهد. این بدان معناست که تنها نمره 13/0 جامعه با بهره هوشی معمول از نمره پیتر بیشتر است. این درصد کم یعنی 13/0 درصد به ما می‌گوید که فقط 1 نفر از میان هر 769 نفر از توزیع بهره‌هوشی معمول نمره‌ای بالاتر از نمره پیتر دارد. براساس این شواهد اگر هر دو توزیع یکسان باشند به طور قطع پیتر بسیار غیرمعمولی است. یک نمره عالی همانند نمره پیتر در توزیع بهره هوشی معمول آنقدر نادرست است که بنظر می‌آید بیشتر محتمل است که متعلق به یک توزیع سطح بالاتر متفاوت باشد. اینجا احتمالات دال برخطا بودن فرضیه صفر است. بنابراین من فرضیه صفر را رد کرده و فرضی را که می‌گوید نمره پیتر از یک توزیع بهره هوشی تعالیم ویژه که سطحی بالاتر از توزیع معمول دارد می‌آید را تائید می کنم.

بنابراین آزمون فرضیه یک قمار براساس احتمالات است. اگر احتمال نمره پیتر از یک توزیع که همان توزیع معمول بوده خیلی پائین باشد من فرضیه صفر را رد کرده و اگر نمره پائین نباشد آن را می‌پذیرم.

وقتیکه در احتمال 0918/0 فرضیه صفر را پذیرفته و در احتمال 0013/0 آن را رد می‌کنیم، خط جداکننده کجاست؟ یعنی در چه احتمالی من باید از قبول به رد تغییر نظر دهم؟ پاسخ این است هرکجا که من بخواهم، بهرحال، بدلایلی که در فصل 9 تشریح خواهد شد توافق شده است که به صورت متعارف وقتی احتمال کمتر یا مساوی 05/0 باشد (که به صورت 05/0 P< یا معنی‌دار است در 05/0 = P) فرضیه صفر مردود خواهد بود. این بدان معناست که وقتی یک نمره از توزیع ناشناخته‌ای، با شانس کمتر از 5 در 100، تنها می‌تواند از توزیع شناخته‌ شده‌ای ظاهر شود (یعنی توزیعها یکی باشند) فرضیه صفر را رد کرده و می‌گوئیم که آن نمره واقعاً از یک توزیع متفاوت می‌آید. اساساً ما بر روی احتمال آنکه یک نمره (مثل نمره بهره هوشی پیتر) از یک توزیع ناشناخته (توزیع تعالیم ویژه کودکی) مشابه یک توزیع شناخته شده (توزیع معمول بهره هوشی) آمده، ریسک می‌کنیم. وقتیکه شانس 1 از 20 یا کمتر باشد (که احتمال 05/0 یا کمتر بوده زیرا من 1 را بر 20 تقسیم کرده مساوی 05/0 می‌شود) ما قمار خود را عوض کرده و شرط می‌بندیم که توزیع‌ها متفاوت است. بنابراین احتمال 05/0 “سطح معنادار بودن” نامیده می‌شود. اگر احتمال نمره پیتر بزرگتر یا مساوی سطح معنادار بود فرضیه صفر را پذیرفته و اگر کمتر بود فرضیه صفر را رد می‌کنیم.

سطح معنادار بودن 05/0 بدین معناست که ما بیش از 95 درصد حتم داریم که پذیرفتن متفاوت بودن توزیع صحیح است. ما به خود اجازه می‌دهیم تا فرضیه صفر را خطا بدانیم و ادعا کنیم در حالاتی که احتمال 5 درصد یا کمتر از آن باشد توزیع متفاوت دیگری وجود دارد. زیرا چنین نمره بالایی تنها می‌تواند با شانس در 5 درصد از زمانها یا کمتر از آن بدست آمده باشد (منظور اینکه از توزیعی مشابه توزیع شناخته شده بیاید). بعضی اوقات می‌خواهیم در درست بودن ادعای یک تفاوت بین توزیع‌ها از اینهم مطمئن‌تر باشیم، در این حالات سطح معنادار بودن را 01/0 = P گرفته و 1 احتمال از 100 یا کمتر را پذیرفته، که احتمال دارد ما خطا کرده باشیم. با این سطح معنادار بودن می‌توانیم 99 درصد یا بیشتر مطمئن باشیم که در ادعای وجود یک توزیع متفاوت، انتخاب درستی کرده‌ایم.

خلاصه ای از آزمون فرضیه

ما فرضیه اینکه تعالیم ویژه پیتر نبوغ او را ایجاد کرده طبق مراحل زیر آزمودیم:

  • بهره هوشی (IQ) را به عنوان معیار کارآیی که هوش براساس آن مورد قضاوت قرار گیرد انتخاب کردیم. این تعریف عملیاتی ماست.
  • یک فرضیه برای تحقیق ترتیب دادیم : تعالیم ويژه مانند آنچه پیتر در کودکی تجربه کرده، بهره هوشی فرد را افزایش می‌دهد.
  • یک فرضیه صفر ترتیب دادیم : تعالیم ویژه مانند آنچه پیتر در کودکی تجربه کرده، تأثیری در بهره هوشی یک فرد ندارد.
  • از آنجائیکه دو توزیع را نمی‌دانیم فرضیه تحقیق را نمی‌توانیم بیازمائیم. اما می‌توانیم فرضیه صفر را آزموده زیرا که توزیع معمول بهره هوشی را میدانیم و فرضیه صفر حدس می‌زند توزیع بهره هوشی تعالیم ویژه مثل همان توزیع معمول بهره هوشی است.
  • از پیتر آزمون بهره هوشی گرفته و نمره آن را بدست ‌آوردیم.
  • با نگاه کردن در نمره Z جدول توزیع نرمال استاندارد، احتمال یک نمره به اندازه نمره پیتر یا بزرگتر از آن از توزیع بهره هوشی معمول را بدست آوردیم. این کار را فقط به این دلیل می‌توانیم انجام دهیم چون فرض کرده‌ایم که نمرات بهره هوشی معمول به صورت نرمال توزیع شده‌اند.
  • اگر احتمال یک نمره بالا به اندازه نمره پیتر یا بالاتر از آن، خیلی کوچک باشد، کوچکتر از سطح معنادار بودن آنگاه خواهیم گفت که برای چنین نمره‌ای آمدن از توزیعی همانند توزیع بهره هوشی معمول بسیار نادر است و فرضیه صفر را رد می‌کنیم و نتیجه می‌گیریم که توزیع تعالم ویژه، توزیعی متفاوت و در سطح بالاتری از توزیع بهره هوشی معمول می‌باشد. اگر احتمال کوچکتر از سطح معنادار بودن نباشد آنگاه فرضیه صفر را پذیرفته و نتیجه نمی‌گیریم که تفاوتی در توزیعها وجود دارد.

منطق آزمون فرضیه

علیرغم متفاوت بودن آزمونهای آماری که در این کتاب انجام می دهیم همه آنها یک منطق پایه را دنبال می کنند. فرضیه تحقیق پیش‌بینی می‌کند که توزیع‌ها متفاوتند درحالیکه فرضیه صفر پیش‌بینی می‌کند که آنها یکسانند. اگر جزئیات دو توزیع را داشته باشیم به آسانی آنها را با هم مقایسه می‌کنیم. معمولاً این جزئیات موجود نیستند. ولی بهرحال وقتی یکی از توزیع‌ها شناخته شده و دیگری ناشناخته باشد می‌توان تحلیل را ادامه داد. شناخته شده ، زیرا ما قادریم که فرض کنیم به صورت نرمال توزیع شده است و جزئیات توزیع نرمال را هم می دانیم. یک  سطح معنادار بودن را برمی گزینیم. زیرا معیار تصمیم ما برای پذیرفتن یا رد فرضیه صفر است. بطور مرسوم این سطح معادل 05/0= P یا 01/0 = P قرار داده می‌شود. سطح معنادار بودن را پیش از جمع‌آوری داده‌ها انتخاب می‌کنیم این کار مثل شرط‌بندی در مسابقه اسب دوانی است. در آنجا تا زمانیکه شرایط شرط‌بندی مشخص نباشد شرطی نمی‌بندیم. داده‌هایی را جمع‌آوری می‌کنیم که نمره‌ای از یک توزیع ناشناخته به ما میدهد. ما احتمال این نمره را که از یک توزیع ناشناخته برخاسته شده بررسی می‌کنیم تا ببینیم که آیا فرضیه صفر را پذیرفته و نتیجه‌گیری کنیم که توزیع‌ها یکسانند. اگر احتمال کمتر از سطح معنادار بودن باشد فرضیه صفر را رد کرده و می‌گوئیم که شانس اینکه این نمره از توزیع متفاوتی از توزیع شناخته شده آمده باشد برتری دارد. اما اگر احتمال کمتر از سطح معنادار بودن نباشد فرضیه صفر را خواهیم پذیرفت.

پیش‌بینی‌های یک دُمی و دو دُمی

آزمون فرضیه درباره تصمیم‌گیری همسان بودن یا نبودن یک توزیع ناشناخته‌ با یک توزیع شناخته شده است. برای دو توزیع سه حالت وجود دارد:

  • توزیع ناشناخته همانند توزیع شناخته شده باشد.
  • رتبه توزیع ناشناخته از توزیع شناخته شده برتر است.
  • رتبه توزیع ناشناخته از توزیع شناخته شده کمتر است.

ما همیشه فرضیه صفر (مورد 1) را که هر دو توزیع یکسان هستند می‌آزمائیم اما آزمون فرضیه تحقیق می تواند شکلهای متفاوتی داشته باشد. آزمون فرضیه تحقیق  می تواند مورد 2 را پیش بینی کند. مثل پیش‌بینی توزیع تعالیم ویژه که رتبه بالاتری از توزیع بهره هوشی معمول داشت. برعکس آن ممکن است انتظار مورد 3 را داشته باشیم که رتبه توزیع ناشناخته پائین‌تر از رتبه توزیع شناخته شده باشد. فرض کنید دوست دیگرمان دیوید جراحتی ناشی از تصادف اتومبیل داشته باشد. در این حالت ممکن است انتظار داشته باشیم که این نوع جراحت منجر به بهره هوشی پائین‌تر برای افرادی که این نوع جراحت را دارند شود. در نهایت حالاتی وجود دارد که ما انتظار هم مورد 2 و هم مورد 3 را داریم. در چنین حالتی انتظار داریم که توزیع ناشناخته متفاوت از توزیع شناخته شده باشد اما احتمال اینکه رتبه آن بالاتر یا پائین‌تر باشد را باز می‌گذاریم. دوست سوم ما سوزان، با رژیم خاص غذائی مادر بزرگش رشد کرده است. ممکن است انتظار داشته باشیم این رژیم خاص غذایی بر کارآیی هوش او تأثیر گذاشته باشد. اگرچه ممکن است مطمئن نباشیم که پیش‌بینی کنیم این رژیم خاص بهره هوشی او را بهبود داده (چون شاید سوزان مخلوط درستی از غذاهای مناسب رشد هوش خورده) یا بهره هوشی او را کاسته است (شاید سوزان  در رژیم خود ویتامین‌های مهم را از دست داده باشد).

در مثالهای تعالیم ویژه کودکی و جراحت مغزی ناشی از تصادف، پیش‌بینی‌ها جهت تفاوت در توزیع‌ها را مشخص کرده زیرا فرض تحقیق مقرر می‌کند که توزیع ناشناخته به نسبت توزیع شناخته شده در کدام جهت منتقل می‌شود. این نوع پیش‌بینی‌ها را، پیش‌بینی یک دُمی می‌نامند. اگر برگشته و به تصویر 4.1 نظری بیفکنید می‌توانید ببینید که انتظار می‌رود توزیع تعالیم ویژه دوران کودکی، روی قسمت بالای توزیع بهره هوشی معمول یعنی یک دُم از توزیع شناخته شده را بپوشاند. اگر توزیع تعالیم ویژه‌ همانند توزیع معمول یا در رتبه پائین‌تر از آن باشد آنگاه فرضیه ما تائید نخواهد شد. تنها در صورتیکه توزیع در دُمی که ما به آن علاقه‌مندیم یعنی انتهای بالای توزیع معمول بهره هوشی باشد، فرضیه ما تائید خواهد شد (همانگونه که در تصویر 4.1 نشان داده شده است) این نتیجه را می‌توان با مشاهده نمره بالای پیتر که در انتهای دم بالایی (5 درصد بالا) توزیع بهره هوشی معمول قرار می‌گیرد گرفت و ادعا کرد که نمره او از توزیع دیگر با رتبه بالاتر آمده است.

مثال جراحت مغزی هم یک پیش‌بینی یک دُمی است زیرا همان منطق مثال تعالیم ویژه را دنبال می‌کند. با این تفاوت که ما به دم پائین‌تر توزیع شناخته شده علاقمندیم.  تنها در صورتیکه بهره هوشی دیوید در 5 درصد بخش پائین توزیع بهره‌هوشی معمول باشد و فرضیه اینکه توزیع جراحت مغزی رتبه پائین‌تری از توزیع بهره‌هوشی معمول را دارد پذیرفته خواهد شد.

مثال رژیم خاص غذایی یک پیش‌بینی دو دُمی است، زیرا ما شرط خود را متعادل کرده‌ایم وگفته‌ایم که رژیم غذایی سوزان ممکن است بهره‌هوشی او را کاهش یا افزایش داده باشد. توزیع بهره‌هوشی رژیم غذایی خاص می‌تواند دم پائینی یا دم بالایی توزیع بهره‌هوشی معمول را بپوشاند، خروجی هرکدام که باشد فرضیه ما در متفاوت بودن توزیع‌ها را تائید خواهد کرد. تنها اگر هر دو توزیع یکسان باشند ما فرضیه صفر را خواهیم پذیرفت.

مثالهای زیادی وجود دارد که نمی‌توان یک جهت خاص را مشخص کرده و پیش‌بینی یک دُمی انجام داد. برای نمونه تأثیر استرس بر رضایت شغلی، ممکن است پیش‌بینی کنیم نوع خاصی از استرس که اضطراب تولید می‌کند رضایت شغلی را کاهش میدهد. ولی اگر منجر به جذبه و هیجان شود می‌تواند باعث افزایش رضایت شغلی گردد. آنجائیکه شواهد کلی برای تصمیم‌گیری در مورد دنبال کردن یکی از فرضیه‌ها موجود نباشد، آزمایش‌کننده ممکن است تصمیم بگیرد که پیش از هرچیز یک آزمون دو دُمی انجام دهد تا ببیند آیا این نوع استرس اصلا اثری چه منفی و چه مثبت دارد یا خیر. در این مورد هر تفاوتی در توزیع‌ها فرضیه را تأیید خواهد کرد.

سطح معنادار بودن و پیش‌بینی دو دُمی

وقتیکه یک آزمون یک دُمی انجام میدهیم ادعا می‌کنیم که نتیجه آزمون اگر احتمالی کمتر از سطح معنادار بودن داشته باشد آنگاه در انتهای دُم توزیع شناخته شده که موردنظر ماست قرار خواهد گرفت. ما این را به عنوان نشانه‌ای از آنکه نمره موردنظر بعید است از توزیعی مشابه توزیع شناخته شده تفسیر می‌کنیم و می‌گوئیم که از توزیع متفاوتی آمده است.

تصویر 4.2 یک پیش‌بینی یک دُمی و سطح معنادار بودن

اگر نمره موردنظر از جایی به جز بخشی از دم که بوسیله سطح معنادار بودن جدا شده، آمده باشد فرضیه تحقیق را رد خواهیم کرد. این مسئله در تصویر 4.2 نشان داده شده است.

 

تصویر 4.2 : یک پیش بینی یک دمی و سطح معنادار بودن

توجه کنید که این تصویر یک پیش‌بینی یک دُمی را نشان میدهد که در آن رتبه توزیع ناشناخته بالاتر از رتبه توزیع شناخته شده است. بعنوان یک تمرین، تلاش کنید یک تصویر برای یک پیش‌بینی یک دُمی که در آن توزیع ناشناخته پائین‌تر از رتبه توزیع شناخته شده باشد، رسم کنید (وقتی این کار را انجام دادید به تصویر 6.1 که یک پیش‌بینی از این نوع را نشان می‌دهد نگاه کنید).

با پیش‌بینی دو دُمی، هر دو دنباله توزیع مورد علاقه ما هستند زیرا توزیع ناشناخته می‌تواند در هر کدام از دو سو باشد. بهرحال اگر ما سطح معنادار بودن را باندازه‌ 5 درصد در انتهای هر دنباله قرار دهیم ریسک به خطا افتادن را افزایش داده‌ایم. به یاد آورید که استدلال کردیم وقتیکه احتمال کمتر از 05/0 باشد نمره از یک توزیع ناشناخته آمده و نتیجه گرفتیم که توزیع‌ها متفاوت هستند. در این حالت شانس اشتباه ما و اینکه توزیع‌ها یکسان بوده باشند کمتر از 5 درصد بود. اگر هر دم توزیع را 5 درصد در نظر بگیریم همانگونه که وسوسه شدیم این کار را برای آزمون دو دمی انجام دهیم، کار را با شانس 10 درصد خطا به پایان برده و شانس خطا کردن را افزایش داده‌ایم. ما می‌خواهیم که ریسک افتادن در خطا را به صورت کلی در سطح 5 درصد حفظ کنیم (مقدار ثابت ریسک ما) زیرا در غیر اینصورت ادعاهای خطای ما در متفاوت بودن توزیع‌ها افزون شده و باعث آسیب دیدن اعتبار ما نزد دیگر محققینی می‌گردد که ممکن است به طور جدی از پذیرفتن یافته‌های ما دست بردارند (شخص نباید ادعای دروغ بکند و مثل چوپان دروغگو شود).

                 

تصویر 4.3 : یک پیش بینی دو دمی و سطح معنادار بودن

وقتیکه بر روی یک توزیع ناشناخته که روی هرکدام از دمهای توزیع شناخته شده است ریسک می‌کنیم، برای اینکه بخواهیم مجموع ریسک خطا را در حد 5 درصد حفظ کنیم باید 5 درصد را بین دو دم توزیع شناخته شده تقسیم کنیم، بنابراین سطح معنادار بودن را برای هر دنباله 5/2 درصد قرار میدهیم. اگر نمره در یکی از دو 5/2 درصد دمها قرار گرفت می‌توانم بگوئیم که از توزیع متفاوتی می‌آید. بنابراین وقتیکه یک پیش‌بینی دو دمی را به دست می‌گیریم، نتایج باید در‌ ناحیه‌ای کوچکتر از دم به نسبت یک پیش‌بینی یک دمی واقع شوند. این کار را باید برای جبران ریسک شرط‌بندی ما در پیش‌بینی‌مان، پیش از آنکه ادعا کنیم که توزیع‌ها متفاوتند انجام دهیم. این مسئله در تصویر 4.3 نشان داده شده است.

آزمون فرضیه، به شکلی که در اینجا توصیف شد ،که برای گرفتن تصمیم، سطح معنادار بودن برمی‌گزینیم ، از آن اغلب به عنوان “آزمون معنادار بودن” یاد می‌شود. چه آزمون یک دمی و چه آزمون دو دمی انجام دهیم، تصمیم بر رد (یا قبول) فرضیه صفر بستگی به آن دارد که نمره ما در کدام سمت سطح معنادار بودن واقع می‌شود. آزمون معنادار بودن در تحلیل یافته‌های تحقیق بی‌نهایت مفید است و امیدوارم که ارزش آنرا از مثال نبوغ پیتر در بالا درک کرده باشید. بهرحال ما باید از مزایا و محدودیتهای آن آگاه باشیم؛ این مباحث در فصل 7 مورد بررسی قرار خواهد گرفت.

 

مترجمین: دکتر هدی کامرانی فر – حسن اسکندری نیا

اشتراک گذاری در شبکه های اجتماعی

آمار به زبان ساده

loader

لطفا شکبیا باشید...