آمار به زبان ساده – نمرات استاندارد
21 مرداد 1400
دقیقه
اگر در آزمونی نمره 58 گرفته باشید، آیا در کلاس بهترین بودهاید یا بدترین؟ بوضوح روشن بوده در این حالت نیاز به اطلاعات بیشتری وجود دارد. با استفاده از میانگین و انحراف استاندارد میتوانید شروع به پاسخ دادن به این سوالها کنید.
آخرین بهروزرسانی: 24 دی 1401
اگر در آزمونی نمره 58 گرفته باشید آیا میدانید عملکرد شما نسبت به بقیه چقدر خوب بوده است؟
مقایسه نمرات در توزیعهای مختلف – نمرات استاندارد
آیا در کلاس بهترین بودهاید یا بدترین؟ بوضوح روشن بوده در این حالت نیاز به اطلاعات بیشتری وجود دارد. با استفاده از میانگین و انحراف استاندارد میتوانید شروع به پاسخ دادن به این سوالها کنید. اگر میانگین 52 باشد و انحراف استاندارد 5، نمره شما یکی از بهترینها خواهد بود. اما اگر میانگین 59 باشد و انحراف استاندارد 3، شما کمی زیر متوسط کلاس هستید. از تجمع نمرات اطراف 59 (میانگین) می توان دریافت که احتمالاً بسیاری از دانشجویان نمرات مشابهی گرفتهاند.
اگر دو امتحان داده اید و در روانشناسی 58 و در آمار 49 گرفته باشید کدامیک بیشتر شما را خوشحال خواهد کرد؟ ممکن است بخواهید از نتیجه این دو امتحان، برای تصمیمگیری درباره انتخاب رشته تحصیلی خود از میان این دو کمک بگیرید. ممکن است 58 را انتخاب کنید چون از لحاظ عددی بزرگتر است. اما اگر دریابید بقیه دانشجویانی که در آزمون روانشناسی شرکت کردهاند بالای 60 و همه آنهایی که در امتحان آمار شرکت کردهاند زیر 45 نمره گرفتهاند شاید نظرتان عوض شود.
اگرچه نمره شما در روانشناسی بیشتر است ولی توزیع نمرات در دو آزمون متفاوت است. علت میتواند آن باشد که آزمون آمار بسیار سخت بوده و 49 نسبت به بقیه افراد کلاس، نمره خیلی بالایی است در حالیکه نمره 58 کلاس روانشناسی به نسبت نمره پائینی است.
پس از آن در مییابید که در آزمون آمار نمره میانگین 45 و انحراف استاندارد 4 بوده و در روانشناسی نمره میانگین 55 و انحراف استاندارد 6 است. حداقل این اطلاعات به شما میگوید که در هر دو آزمون نمره شما بالای متوسط بوده است ولی نمیتواند به شما بگوید که در کدام رتبه بالاتری کسب کردهاید.
برای مقایسه دو نمره که از دو توزیع متفاوت هستند باید آنها را استاندارد کنیم. برای این کار از یک آماره که آن را نمره استاندارد (یا نمره Z) مینامیم استفاده میکنیم.
این آماره نمره را نسبت به میانگین برحسب انحراف استاندارد بیان می کند. بنابراین نمره 58 باندازه 3 از نمره میانگین یعنی 55 بالاتر است. با داشتن انحراف استاندارد 6، این فاصله انحراف استاندارد است. نمره ما نصف انحراف استاندارد از میانگین است. اساساً نمره استاندارد به ما میگوید نمره موردنظر چند برابر انحراف استاندارد، از میانگین توزیع نمرات فاصله دارد. نمره استاندارد را با استفاده از این فرمول محاسبه میکنیم:
که در آن X نمرهای که باید استاندارد شود، میانگین و انحراف استاندارد توزیع است. نمرات استاندارد را میتوان مقایسه کرد زیرا مهم نیست که توزیع شما دوست دارد از کجا شروع شود، چون در تبدیل نمرات به نمره استاندارد، نتیجه همیشه توزیعی با میانگین صفر و انحراف استاندارد 1 خواهد بود. اگر نمرات آزمونها را به نمرات استاندارد تبدیل کنیم آنگاه میتوانیم آنها را با هم مقایسه کرده و ببینیم در کدام آزمون جایگاه بالاتری در کلاس داریم.
در روانشناسی شما به اندازه نصف انحراف استاندارد بالای میانگین بوده و در آمار به اندازه یک انحراف استاندارد بالای میانگین می باشید. نمره استاندارد بالاتر در کلاس آمار معنایش آن است که شما در کلاس آمار رتبه بالاتری از کلاس روانشناسی دارید.
در فصل گذشته مجموع نتایج امتحان دو گروه را در امسال و سال گذشته مقایسه کردیم. توجه کنید نمره 59 امسال به ما نمره استاندارد زیر را میدهد.
و توزیع نمرات سال گذشته، نمره استاندارد زیر را تولید میکند.
از مقایسه این دو نمره استاندارد (Z) میبینیم که نمره 59 در توزیع نمرات امسال (Z=0/48) از توزیع نمرات پارسال (Z=0/36) جایگاه بالاتری دارد.
بنابراین نمره 59 امسال بهتر از سال گذشته است احتمالاً بدلیل سخت تر بودن امتحان امسال (یا یکی از دلایل دیگری که پیش از این ذکر شد).
توزیع نرمال
اگر من تصمیم به جمعآوری دادهها در مورد چیزی مثل قد خانمها بگیرم ممکن است ابتدا قد تعداد زیادی از آنها را اندازه بگیرم و نتایج توزیع فراوانی را به صورت هیستوگرام رسم کنم. این نمودار شبیه چه چیزی خواهد بود؟
کار را با انتخاب پلههای هیستوگرام آغاز کرده و تصمیم میگیرم که محدوده مقادیر برای هر میله چه مقدار باید باشد. 5 سانتیمتر را برای هر مرحله برگزیده و همه زنانی را که قدشان در یک محدوده نوار 5 سانتیمتری خاص قرار دارند در یک میله میگنجانیم.
برای جلوگیری از روی هم افتادن نوارها، نوار را از کمترین مقدار شروع کرده اما بیشترین مقدار را در نوار نمیگنجانم: برای مثال در نوار 160 تا 165 سانتیمتر زنانی را که قدی بین 160 تا 165 دارند پوشش میدهد اما خود 165 در این نوارها گنجانیده نمیشود و در باند بالایی 165 تا 170 گنجانیده میشود.
وقتی دادهها را جمع کردم و زنانی را که در یک باند 5 سانتی به هم اضافه کردم، زنان زیادی را خواهم یافت که قدشان بین 160 تا 165 سانتیمتر یا 165 تا 170 سانتیمتر است. اما ممکن است زنان زیادی را با قد بین 135 تا 140 یا 185 تا 190 سانتیمتر نیابیم. در مقایسه با زنان میان قد، زنان قدبلند یا قدکوتاه زیادی وجود ندارد. در واقع توزیع محتملاً شبیه هیستوگرام تصویر 3.1 به نظر خواهد رسید. توجه کنید توزیع برآمدگی کوهان شکل در میانه دارد که به صورت متقارن در دو طرف کم میشود.
اگر در ادامه قد زنان زیادتری را اندازهگیری کرده و پلهها را کوچکتر کنم (به جای 5 سانتیمتر باندهای 2 سانتیمتری را برگزینم و بعد 1 سانتیمتری و بعد از آن 5/0 سانتیمتری و بهمین ترتیب تا جائیکه باندها فوقالعاده کوچک شوند). در نهایت کار را با تعداد زیادی اندازه قد خانمها که روی هیستوگرام در فواصل خیلی کوچک رسم شده به پایان میرسانم. بتدریج هیستوگرام تبدیل به یک منحنی صاف همانند آنچه در شکل 3.2 آمده، خواهد شد.
فارغ از آنکه مشغول مطالعه چه متغیری باشیم بلندی قد خانمها باشد یا اندازه پای پسران ده ساله و یا دوره بارداری نوزادان، جالب توجه است که در موارد بسیاری کار به همین منحنی زنگوله شکل ختم می گردد. از آنجائیکه این منحنی اغلب اوقات در موارد طبیعی تولید میشود، آن را توزیع نرمال مینامند.
خاصیت جالب و بسیار مفید این منحنی آن است که برای توصیف ریاضی بسیار ساده است و میتواند تنها با استفاده از میانگین و انحراف استاندارد محاسبه شود. یعنی میتوانیم فرمولی برای توزیع نرمال به صورت دقیق بسازیم که تنها نیاز به دانستن میانگین و انحراف استاندارد دارد. توزیع نرمال به دلایل زیر برای تحلیل آماری بسیار مهم است.
در بسیاری از مواردی که ما در تحقیقهایمان مطالعه کرده و اندازهگیری میکنیم (اگرچه نه همه آنها) فرض بر این گذاشته میشود که از جامعههایی میآیند که نمرات آنها به صورت نرمال توزیع شدهاند (مثل قد خانمها)، اگر همه مردهای جامعه را در نظر بگیریم باید انتظار داشته باشیم که برای قد، وزن، اندازه پا و غیره، توزیع نرمال داشته باشند. برای دادههای خانمها هم بهمین ترتیب باید توزیع نرمال را انتظار داشته باشیم.
بسیاری از آزمایشهای آماری که در طول این کتاب مورد بررسی قرار میدهیم بر این فرض بنا شدهاند که توزیع مورد تحقیق قرار گرفته شده، توزیع نرمال است. بطور قطع این آزمایشها بر این فرض بنا شدهاند، بدون این مسئله منطق این آزمایشها خطاست.
جالب است که حتی اگر توزیعی، توزیع نرمال نباشد، وقتی که تعداد زیادی نمونه از همان اندازه میگیریم و میانگین آنها را روی توزیع فراوانی رسم میکنیم. این توزیع به یک توزیع نرمال متمایل میشود. این امر مجددا برای تحلیلهای آماری بینهایت مفید است.
در فصل 5 وقتی نمونهها را مورد ملاحظه قرار میدهیم این نکات را میآزمائیم. مهمترین چیزی که باید به آن توجه کنیم آن است که وقتی میانگین و انحراف استاندارد یک مجموعه از دادهها را داشته باشیم که توزیع آن توزیع نرمال باشد، اطلاعات سودمند بسیار زیادی داریم.
توزیع نرمال استاندارد
از آنجائیکه توزیع نرمال، توزیع بسیار مفیدی است جداول زیادی درباره توزیع نرمال ترسیم شده است. اما چون مقادیر برای میانگینها و انحراف استانداردهای مختلف، متفاوت خواهد بود در پایان جداول متفاوت زیادی درست خواهد شد. بنابر این داده های جدول برای توزیع نرمالی است که میانگین آن صفر و انحراف استاندارد یک داشته باشد. این توزیع نرمال، توزیع نرمال استاندارد نامیده می شود.
اگر داده ها از توزیع نرمالی آمده باشند (مانند قد، وزن) آنگاه آنها را به نمرات استاندارد تبدیل کنیم (Z scores) در آن صورت توزیع ما به توزیع نرمال استاندارد تبدیل خواهد شد. وقتیکه نمرات را از توزیع نرمال به نمرات استاندارد (Z scores) تبدیل کنیم آنگاه میتوانیم به نمرات استاندارد در جداول توزیع نرمال استاندارد مراجعه کنیم. این جدول در ضمیمه 1 کتاب آمده است. این اطلاعات میتواند بطور قابل ملاحظهای در تحلیلهای آماری مفید باشد.
این جدول به ما میگوید چه تعداد نمره در توزیع بزرگتر از نمراتی است که ما میآزمائیم. جدول این کار را با ارائه رقمی برای مساحت زیر منحنی استاندارد در مقابل نمره z که در شکل 3.3 نشان داده شده، انجام میدهد. مساحت زیر منحنی برابر یک است (ما یک مساحت داریم مثل یک کیک پیش از آنکه او را به قسمتهای مختلف برش دهیم) و نمره z (مثل چاقویی که کیک را میبرد) آن را به دو بخش تقسیم میکند و جدول به ما میگوید مساحت برش داده شده مقابل نمره z چه نسبتی از کل مساحت زیر منحنی دارد.
اگر این مقدار را از یک کم کنیم میفهمیم چقدر از مساحت، زیر نمره Z است. همچنین، از آنجائیکه منحنی متقارن است میانگین آن را به دو بخش مساوی تقسیم میکند (و بنابراین نیمی از مساحت بالای میانگین و نیمی دیگر زیر میانگین است).
در این حالت نسبتها به احتمالات پیوند میخورد. قد من 180 سانتیمتر است. بخاطر این مثال بیائید فرض کنیم نسبت مردان بلندقدتر از من در جامعه یک پنجم است. اکنون یک پنجم، یعنی یک تقسیم بر 5 که مساوی2/0 میشود. بنابراین میتوانیم بگوئیم نسبت مردان بلندقدتر از من در جامعه 2/0 کل است. از این اطلاعات همچنین، میفهمیم که شانس یا احتمال پیدا کردن یک مرد بلندقدتر از من در جامعه یک به پنج یا 2/0 است. از این طریق است که ناحیه زیر منحنی با شانس و احتمالات پیوند میخورد.
مساحت کل منحنی (1) با احتمال 1 پیوند میخورد. مقادیر محتمل دامنهای بین صفر تا 1 دارند. شانس 1 یعنی موردی قطعاً در این حالت وجود دارد. قطعی است که هر مردی که من بیابم قدی دارد که در جایی در توزیع قد مردان جای میگیرد بنابراین کل مساحت بطور قطع شامل او خواهد شد. شانس صفر، یعنی قطعی است که چیزی در این حالت وجود ندارد. شانس یافتن مردی با قد دوبرابر من (360 سانتیمتر) آنقدر کوچک است که مجازاً صفر فرض میشود. همانطور که از شانس صفر به سوی شانس یک حرکت میکنیم مساحت ما از صفر بزرگتر و بزرگتر شده تا کل مساحت زیر منحنی را در بر گیرد.
وقتی افراد از شانس اتفاق افتادن چیزی صحبت میکنند، اغلب اصطلاحات علم آمار و احتمالات را به کار نمیبرند. (شانس قبول شدن من در امتحان 5/0 است). برعکس آنها استفاده از درصد را ترجیح میدهند (من برای قبول شدن در امتحان 50 درصد شانس دارم). رابطه سادهای بین احتمال و درصد وجود دارد، درصد برابر است با احتمال ضربدر 100 . بنابراین احتمال 3/0 مساوی با 30 درصد است.
با نظر کردن به مساحت منحنی توزیع نرمال استاندارد، در بالا یا زیر نمره z میتوانیم احتمال یافتن یک نمره بزرگتر یا کوچکتر از توزیع را، از نمرهای که ما انتخاب کردهایم بدست آوریم. با این روش قادر خواهیم بود که دامنه کامل احتمالات جالب مربوط به نمرات را در یک توزیع نرمال به دست آوریم.
یک مثال از کاربرد جدول توزیع نرمال استاندارد
توزیع نمرات در یک امتحان آمار نرمال بوده، میانگین نمرات 45 و انحراف استاندارد 4 است. شما در این آزمون نمره 49 گرفتهاید.
الف) چقدر احتمال میرود که کسی نمره بالاتر از شما بگیرد.
ب) چند درصد از افراد نمره بالای میانگین و زیر نمره شما دارند.
از آنجائیکه ما یک توزیع نرمال داریم محاسبه نمره z توزیع ما را به توزیع نرمال استاندارد تبدیل خواهد کرد. نمره 49، نمره z به شرح زیر میدهد.
جدول توزیع نرمال استاندارد (جدول A.1 در ضمیمه کتاب) احتمال نمرهای بزرگتر از نمره z شما که برابر یک است را به ما نشان میدهد. به دنبال نمره Z در جدول گشته و رقم 1587/0 را بدست میآوریم، بنابراین احتمال نمرهای بالاتر از 49 برابر 1587/0 است (این بدین معناست که شما جزء 16 درصد بالای کلاس هستید زیرا 87/15%= 100 × 1587/0 درصد از نمرات بهتر از شما هستند).
میدانیم که مساحت بالای میانگین 5/0 (نصف مساحت) بوده و احتمال نمرهای بزرگتر از نمره z شما یعنی یک، عدد 1587/0 است. بنابراین اگر این عدد را از 5/0 کم کنیم احتمال نمرات بالای میانگین وزیر نمره 49 را خواهیم یافت. 3413/0 = 1587/0 – 5/0 که اگر این نمره را در صد ضرب کنیم 13/34 درصد را به دست خواهیم آورد. یعنی 13/34 درصد از نمرات بالاتر از میانگین و زیر نمره شما هستند.
نمره Z کمتر از صفر
اگر نمره Z را محاسبه کرده و عددی منفی بدست آوریم معنایش این است که این نمره زیر میانگین است. همانطور که از جدول توزیع نرمال استاندارد میتوان دید در آنجا نمره منفی برای z وجود ندارد. بهرحال همانطور که دیدهایم توزیع نرمال متقارن بوده بنابراین نسبت نمرات بزرگتر از میانگین مثلا 52/1 +، همان نسبت نمرات کوچکتر از آن یعنی 52/1- است.
اگر به دنبال نمرهای منفی در جدول میگردید علامت منفی را حذف کرده و عدد را بیابید. عددی که شما از جدول میگیرید به شما احتمال یک نمره کمتر از نمره Z را میدهد. برای یافتن احتمال نمرات بزرگتر از نمره Z، عدد بدست آمده از جدول را از یک کم کنید.
برای مثال اگر نمره Z ما برابر 1- شد. این بدین معناست که نمره ما زیر میانگین است. در جدول 1- نداریم. علامت منفی را نادیده گرفته و بدنبال 1 میگردیم. مقدار احتمال 1587/0 است. این به ما میگوید که احتمال نمرهای کمتر از نمره Z، یعنی 1- برابر 1587/0 است و احتمال نمره Z بالاتر از 1- برابر 8413/0 = 1587/0 – 1 است.
مترجمین: دکتر هدی کامرانی فر – حسن اسکندری نیا