جمع بندی داده ها با استفاده از نمودار های هیستوگرام و پارتو

28 تیر 1401

دقیقه

توانایی جمع‌بندی و خلاصه کردن مجموعه بزرگی از داده‌ها امری بسیار با اهمیت است. سه ابزاری که معمولاً برای جمع‌بندی داده‌ها در مایکروسافت اکسل مورداستفاده قرار می‌گیرد نمودارهای هیستوگرام، آمار توصیفی و جداول پیوت یا تحلیلی هستند. در این فصل استفاده از نمودارهای هیستوگرام برای جمع‌بندی داده‌ها را موردبحث قرار می‌دهیم.

آخرین به‌روزرسانی: 27 دی 1401

در سری مقاله های آموزش اکسل، در فصل گذشته به ارزیابی داده ها در اکسل پرداختیم، در این مقاله به بررسی ارزیابی داده ها در اکسل می‌پردازیم.

توانایی جمع‌بندی و خلاصه کردن مجموعه بزرگی از داده ها امری بسیار با اهمیت است. سه ابزاری که معمولاً برای جمع‌بندی داده ها در مایکروسافت اکسل مورداستفاده قرار می‌گیرد نمودارهای هیستوگرام، آمار توصیفی و جداول پیوت یا تحلیلی هستند. در این فصل استفاده از نمودارهای هیستوگرام برای جمع‌بندی داده ها را موردبحث قرار می‌دهیم.

سؤال‌هایی که در این فصل پاسخ داده شده اند:

  • اشخاص اغلب بر این باورند که تصویر ارزشی برابر با هزاران کلمه دارد. آیا می‌توان از اکسل برای ایجاد تصویری (به نام نمودار هیستوگرام) استفاده کرد که مقادیر یک مجموعه از داده ها را جمع‌بندی کند؟
  • برخی از اشکال معمول نمودار هیستوگرام کدام هستند؟
  • با مقایسه نمودارهای هیستوگرام از چندین مجموعه‌داده چه می‌توان یاد گرفت؟
  • چگونه می‌توان نمودار پارتو ایجاد کرد؟

پیش از اکسل 2016 از افزونه Data Analysis برای ایجاد نمودارهای هیستوگرام استفاده می‌کردیم. اما این نمودارهای هیستوگرام ایجاد شده با افزونه Data Analysis وقتی که داده های جدید اضافه می‌شدند به‌روز نمی‌شدند. با بروز نسخه 2016 از اکسل، قابلیت‌های جدیدی برای ایجاد نمودارهای زیبای هیستوگرام به اکسل اضافه شد که به شکلی خودکار دادهای جدید را به‌روز می‌کرد. ما قابلیت آمار توصیفی را در فصل 44 بنام “جمع‌بندی داده ها با استفاده از آمار توصیفی” و جداول پیوت را در فصل 45 بنام “استفاده از جداول پیوت و تفکیک‌کننده‌ها برای توصیف داده ها” توضیح داده‌ایم.

پاسخ به سؤالات این فصل:

آیا می‌توان از اکسل برای ایجاد تصویری (به نام نمودار هیستوگرام) استفاده کرد که مقادیر یک مجموعه از داده ها را جمع‌بندی کند؟

نمودار هیستوگرام ابزاری معمول برای جمع‌بندی داده ها است. اساساً یک نمودار هیستوگرام به شما می‌گوید چند نقطه رصد (نام دیگری برای نقاط داده) در محدوده‌های مختلف مقادیر قرار می‌گیرد. مثلاً یک نمودار هیستوگرام تهیه شده از سود سهام ماهیانه شرکت سیسکو نشان می‌دهد که این شرکت در محدوده‌های صفر تا ده درصد، 11 تا 20 درصد و غیره چند سود ماهیانه داشته است. محدوده‌ای که داده ها را گروه‌بندی می‌کنید را به نام محدوده مقادیر (Bin Range) می‌نامیم.

اکنون بیاید ببینیم چگونه نمودارهای اینستاگرامی را ایجاد و تفسیر کنیم تا بتوانیم به کمک آنها مقادیر سود ماهیانه سهام شرکت‌های سیسکو و جی‌ام را در سال‌های 1990 تا 2000 جمع‌بندی کنیم. این داده ها (و سود سایر سهام) را در فایلی به نام Stock. lsx خواهید یافت. تصویر 1-43 به شما مجموعه‌ای از داده ها را (در کاربرگ Stockprice) نشان می‌دهد. مثلاً در طول ماه مارس سال 1990(ردیف 52) ارزش سهام شرکت سیسکو به میزان 1.075 درصد افزایش پیدا کرده است.

تصویر 1-43 سود ماهیانه سهام
تصویر 1-43 سود ماهیانه سهام

وقتی با اکسل نمودارهای هیستوگرام ایجاد می‌کنید می‌توانید اجازه دهید که برنامه اکسل محدوده مقادیر را تعیین کند و یا اینکه خود آن را تعیین کنید. اگر اکسل محدوده مقادیر را تعیین کند احتمالاً با محدوده‌هایی عجیب‌وغریب مثل 12.53- درصد الی 4.52 روبرو خواهید شد. به همین دلیل است که بهتر است خود محدوده مقادیر را تعیین کنیم.

راهی مناسب برای تعیین محدوده مقادیر یک نمودار هیستوگرام (می‌توانید این کار را به‌عنوان محدوده گذاری در نظر بگیرید) تقسیم محدوده مقادیر (بین کوچک‌ترین و بزرگ‌ترین) به هشت یا پانزده رده‌بندی با فضای مساوی است. تمامی مقادیر سود ماهیانه شرکت سیسکو از 30 درصد تا 40 درصد است بنابراین محدوده مقادیر 30 درصد،20 درصد، 10 درصد، صفر درصد و به همین منوال تا 40 درصد هستند.

برای ایجاد این محدوده مقادیر CSCO.0.4,0.3,0.2,…,-0.2,-0.3 (حدود محدوده ارقام) را در سلول‌های H54:H62 وارد می‌کنیم. در تب Data در گروه Analysis روی گزینه Data Analysis کلیک می‌کنیم تا کادر محاوره‌ای Data Analysis باز شود. این کادر محاوره‌ای توابع Analystic ToolPak را در خود فهرست کرده که حاوی بسیاری از قابلیت‌های آماری در اکسل هستند.

یادداشت:

چنانچه فرمان Data Analysis در تب Data ظاهر نشده باشد، روی تب File کلیک و سپس گزینه Options را انتخاب کنید و در صفحه سمت چپ، روی گزینه Add-Ins کلیک کنید. در کادر Manage روی گزینه Excel Add-Ins کلیک کرده و سپس روی گزینه Go کلیک کنید. در کادر محاوره‌ای Add-ins گزینه Analysis ToolPak(اولین انتخاب و نه گزینه Analysis Toolpak-VBA) را انتخاب کرده و سپس روی دکمه OK کلیک کنید. حالا با کلیک بر گزینه Data Analysis در گروه گزینه‌های Analysis در تب Data می‌توانید به توابع Analysis Toolpak دسترسی داشته باشید.

 

با کلیک بر گزینه Histogram در کادر محاوره‌ای Data Analysis (و سپس کلیک بر روی گزینه OK) کادر محاوره‌ای Histogram همان‌طور که در تصویر 2-43 نشان‌داده‌شده باز می‌شود.

تصویر 2-43 کادر محاوره‌ای Histogram برای ایجاد نمودار هیستوگرام شرکت سیسکو
تصویر 2-43 کادر محاوره‌ای Histogram برای ایجاد نمودار هیستوگرام شرکت سیسکو

این کادر محاوره‌ای را به ترتیبی که در زیر گفته شده تکمیل می‌کنیم:

  • محدوده ورودی را انتخاب کرده (F51:F181) (برای انتخاب این محدوده می‌توانید در ابتدا سلول F51 را انتخاب کرده و سپس کلیدهای Ctrl+Shift و کلید جهت پایین را فشار دهید. این عمل شما را به انتهای ستون می‌برد) این محدوده شامل تمام داده هایی است که برای ایجاد نمودار هیستوگرام از آنها استفاده می‌کنید. ما در اینجا عنوان CSCO از سلول F51 را انتخاب کردیم چرا که وقتی به‌ردیف اول عنوانی اضافه نکنید، محور X از نمودار هیستوگرام معمولاً با عددی عنوان‌گذاری می‌شود که ممکن است کمی گیج‌کننده باشد.
  • محدوده مقادیر (H54:H62) را که حاوی حدود مربوط به محدوده‌های مقادیر است را انتخاب کنید. اکسل محدوده‌های 30- درصد تا 20- درصد، 20- درصد تا 10- درصد و به همین منوال تا 30درصد تا 40 درصد را ایجاد می‌کند.
  • گزینه Lables (عناوین) را حتماً بررسی کنید چرا که اولین ردیف از هر دو محدوده مقادیر و محدوده ورودی‌ها حاوی عناوین هستند.
  • در بخش گزینه‌های Output عبارت New Worksheet Ply را انتخاب کنید تا نمودار هیستوگرام را در کاربرگی جدید (به نام histo) ایجاد کند.
  • گزینه Chart Output را انتخاب کنید وگرنه اکسل نمودار هیستوگرام ایجاد نخواهد کرد.

اکنون روی دکمه Ok در کادر محاوره‌ای Histogram کلیک کنید. نمودار هیستوگرام شرکت سیسکو همانند نمونه نشان‌داده‌شده در تصویر 3-43 خواهد بود.

تصویر 3-43 نمودار هیستوگرام شرکت سیسکو که با استفاده از گزینه Excel Analysis Toolpak Histogram ایجاد شده است.
تصویر 3-43 نمودار هیستوگرام شرکت سیسکو که با استفاده از گزینه Excel Analysis Toolpak Histogram ایجاد شده است.

وقتی که نمودار هیستوگرام را ایجاد می‌کنید، فاصله هایی میان ستون‌های آن می بینید. برای ازبین‌بردن این فاصله‌ها می‌توانید روی یکی از ستون ها در نمودار راست کلیک کرده و گزینه Format Data Series (قالب‌بندی سری داده ها) را انتخاب کنید. در بخش Format Data Series در قسمت Series Options اندازه Gap Width (عرض بخش خالی) را به 0% تغییر دهید. ممکن است در اینجا ببینید که هیچ عنوانی روی ستون های نمودار ظاهر نشده است.

اگر این اتفاق رخ بدهد می‌توانید نمودار را با انتخاب کردن آن و کشیدن دستگیره‌های کناری (به شکل دایره هستند) که وقتی نشانگر ماوس را روی آنها قرار می‌دهید به شکل کمان چهارگوش تغییر می‌کنند عریض‌تر کنید. از سوی دیگر می‌توانید اندازه فونت نمودار را کاهش دهید تا عنوان پنهان شده را نمایان کنید. برای کاهش اندازه فونت روی محور نمودار (متنی که می‌خواهید تغییر دهید) راست کلیک کرده و سپس روی گزینه Font کلیک کنید.

در کادر محاوره‌ای Font اندازه فونت را به 5 تغییر دهید و روی Ok کلیک کنید. شما همچنین، می‌توانید عنوان نمودار را با انتخاب متن مربوطه و واردکردن عنوان دلخواهتان تغییر دهید. پس ازآنکه تغییرات لازم را انجام دادیم، نمودار به شکل تصویر 3-43 نمایش داده می‌شود.

تصویر 4-43 فاصله میان ستون‌های نمودار حذف شده است.
تصویر 4-43 فاصله میان ستون‌های نمودار حذف شده است.

توجه کنید که سود شرکت سیسکو هر ماه احتمالاً بین 0 تا 10 درصد است و هرچه از بلندترین ستون نمودار دور می‌شویم اندازه ستون‌ها کاهش پیدا می‌کند. وقتی نمودار هیستوگرام ایجاد می‌کنید، خلاصه‌ای از فراوانی محدوده مقادیر را به دست می‌آورید که در تصویر 5-43 نمایش‌داده‌شده است.

به‌عنوان‌مثال می‌توانید از این فراوانی محدوده مقادیر بیاموزید که سود شرکت سیسکو در دو ماه بیشتر از 30 درصد و کمتر یا برابر از 20- درصد بوده؛ و یا اینکه سود ماهانه در 13 ماه بیشتر از 20- درصد و کمتر یا مساوی 10- درصد بوده است.

تصویر 4-43 فاصله میان ستون‌های نمودار حذف شده است.
تصویر 4-43 فاصله میان ستون‌های نمودار حذف شده است.

توجه کنید که سود شرکت سیسکو هر ماه احتمالاً بین 0 تا 10 درصد است و هرچه از بلندترین ستون نمودار دور می‌شویم اندازه ستون‌ها کاهش پیدا می‌کند. وقتی نمودار هیستوگرام ایجاد می‌کنید، خلاصه‌ای از فراوانی محدوده مقادیر را به دست می‌آورید که در تصویر 5-43 نمایش‌داده‌شده است.

به‌عنوان‌مثال می‌توانید از این فراوانی محدوده مقادیر بیاموزید که سود شرکت سیسکو در دو ماه بیشتر از 30 درصد و کمتر یا برابر از 20- درصد بوده؛ و یا اینکه سود ماهانه در 13 ماه بیشتر از 20- درصد و کمتر یا مساوی 10- درصد بوده است.

تصویر 5-43 فراوانی محدوده مقادیر شرکت سیسکو
تصویر 5-43 فراوانی محدوده مقادیر شرکت سیسکو

اگر برای شرکت سیسکو سود ماهیانه جدیدی وارد کنید و یا حتی تنها سود ماهیانه موجود را تغییردهنده نمودار تا وقتی که روند Data Analysis هیستوگرام را دوباره اجرا نکنید تغییر نمی‌کند.

نرم‌افزار اکسل از ابتدای عرضه نسخه Excel 2016 گزینه آسانی برای خلق نمودارهای هیستوگرامی با ظاهری مناسب‌تر که با واردکردن داده های جدید به شکل خودکار به‌روز می‌شوند ارائه کرده است. برای نمایش نحوه استفاده از این قابلیت نمودار هیستوگرام، لطفاً فایلی را به نام Iqtemp.xlsx (در پوشه Templates این فصل) که حاوی نمونه‌هایی از بهره هوشی( آی کیو) 1173 دانش‌آموز کلاس ششمی است را باز کنید

تصویر 6-43 داده‌های مربوط به بهره هوشی دانش آموزان
تصویر 6-43 داده های مربوط به بهره هوشی دانش آموزان

پس از انتخاب محدوده E4:E1177 از کلید های Ctrl+T استفاده کنید تا داده های جدید را به شکل جدول تنظیم کنیم در کادر محاوره‌ای Create Table گزینه My Table Has Headres (جدول دارای سرعنوان است) را انتخاب می‌کنیم. این کار ما را مطمئن می‌سازد که در صورت اضافه‌کردن داده های جدید، نمودار هیستوگرام ما تغییر می‌کند. سپس تمامی داده ها (شامل سلول E4) را انتخاب می‌کنیم و پس از آن در تب Insert در گروه گزینه‌های Charts روی کمان کشویی کلیک می‌کنیم تا به گزینه‌های Insert Statistic Chart (قراردادن نمودار آماری) دسترسی پیدا کنیم (تصویر 7-43 را ببینید) و بعد همان‌طور که در تصویر 8-43 نشان‌داده‌شده Histogram را انتخاب می‌کنیم.

تصویر 7-43 آیکون Insert Statistic Chart
تصویر 7-43 آیکون Insert Statistic Chart
تصویر 8-43 گزینه‌های نمودارهای آماری (Statistical Chart)
تصویر 8-43 گزینه‌های نمودارهای آماری (Statistical Chart)

اکنون نمودار هیستوگرام بسیار شکیلی به دست آورده‌اید. می‌توان از تب Design برای استفاده از گزینه‌های فراوانی جهت تغییر ظاهر این نمودار هیستوگرام استفاده کنید. در گروه گزینه‌های Chart Style گزینه‌ای را انتخاب می‌کنیم (سومین از سمت چپ) که نشان می‌دهد در هر محدوده چند نقطه داده قرار می‌گیرد. (تصویر 9-43 را نگاه کنید)

تصویر 9-43 نمودار هیستوگرام داده‌های IQ
تصویر 9-43 نمودار هیستوگرام داده های IQ

با راست کلیک بر محور و انتخاب گزینه Format Axis (قالب‌بندی محور) می‌توانید تعریف محدوده مقادیر را (همان‌طور که در تصویر 10-43 نشان‌داده‌شده) تغییر داده و محدودیت پایین‌تری برای اولین حد و محدودیت بالاتری برای آخرین حد تعریف کنید.

 

تصویر 10-43 تغییر محدوده مقادیر
تصویر 10-43 تغییر محدوده مقادیر

گزینه Underflow Bin را انتخاب کرده و کمترین حد اولین محدوده را به مقدار 50 درج می‌کنیم. در قسمت Oweflow Bin حد بالای آخرین محدوده را به میزان 150 درج می‌کنیم. ما همچنین قسمت Bin Width را انتخاب کرده و وسعت هریک از محدوده‌ها را برابر با 10 قرار می‌دهیم. (شاید نیاز داشته باشید به سمت راست پیمایش کنید) با کلیک بر عبارت Number (برای باز کردن این قسمت) می‌توان قالب‌بندی اعداد محور را تغییر داد (مثلاً جهت داده های پولی به واحد پول) پس از انجام همه این تغییرات، نمودار همان‌طور که در تصویر 11-43 نشان‌داده‌شده ظاهر می‌شود.

تصویر 11-43 نمودار هیستوگرام با محدوده مقادیر به‌روز شده دارای دامنه 10 که میان مقادیر 50 تا 150 تفکیک شده‌اند.
تصویر 11-43 نمودار هیستوگرام با محدوده مقادیر به‌روز شده دارای دامنه 10 که میان مقادیر 50 تا 150 تفکیک شده‌اند.

به این شکل مثلاً درمی‌یابیم که 90 دانش‌آموز دارای بهره هوشی بیشتر از 150 هستند. واقعاً که گروه باهوشی هستند. توجه کنید که اگر داده های بیشتری (مثلاً 20 نفر دارای بهره هوشی بالاتر از 55) اضافه کنید، می‌بینید که نمودار هیستوگرام به شکل خودکار با واردکردن داده های جدید خود را به‌روز می‌کند.

برخی از اشکال معمول نمودار هیستوگرام کدام می باشند؟

نمودار هیستوگرام برای بیشتر مجموعه‌داده ها شکلی از داده ها را ایجاد می‌کند که در یکی از اشکال زیر طبقه‌بندی می‌شوند:

  • نوع متقارن
  • قله منحرف به سمت راست (تمایل مثبت)
  • نوع منحرف به سمت چپ (تمایل منفی)
  • نمودار چند قله‌ای

بیایید هریک از این انواع را با جزئیات بیشتری بررسی کنیم. فایلی به نام Skewexamples.xlsx را مشاهده کنید.

  • توزیع متقارن. یک نمودار هیستوگرام وقتی متقارن است که تنها یک قله داشته باشد و سمت چپ قله تقریباً همانند سمت راست آن باشد. نمرات آزمایشی (مثل آزمایش آی‌کیو) معمولاً نمودارهایی متقارن ارائه می‌دهند. مثلاً نمودار هیستوگرام آی‌کیوها (سلول Z42 را ببینید) ممکن است شبیه به تصویر 12-43 باشد. توجه کنید که بلندای ستون‌ها، یک ستون بعد از ستون قله تقریباً هم اندازه است، بلندای ستون‌ها دوستان پس از قله تقریباً هم اندازه است و الی‌آخر. ستونی که عنوان 105 دارد نمایانگر تمامی اشخاص با بهره هوشی بیشتر از 95 و کمتر و یا برابر با 105 است، ستون که عنوان 65 دارد نمایانگر تمامی افرادی است که دارای بهره هوشی کمتر یا برابر با 65 هستند است و الی‌آخر. همچنین، توجه کنید که نمودار هیستوگرام سود ماهیانه شرکت سیسکو احتمالاً نموداری متقارن است.

 

تصویر 12-43 نمودار هیستوگرام متقارن
تصویر 12-43 نمودار هیستوگرام متقارن
  • نمودار منحرف به سمت راست (تمایل مثبت). یک نمودار هیستوگرام وقتی منحرف به راست (دارای تمایل مثبت) است که تنها یک قله داشته باشد و مقادیر مجموعه‌داده ها بیشتر در سمت راست قله تا سمت چپ آن گستردگی داشته باشند. بسیاری از مجموعه‌داده های اقتصادی (مثل درآمد خانوادگی یا فردی) معمولاً تمایل مثبت نشان می‌دهند. تصویر 13-43(سلول T24 را ببینید) نمونه‌ای از هیستوگرام دارای تمایل مثبت را از نمونه درآمدهای یک خانواده را نشان می‌دهد.
تصویر 13-43 نمودار هیستوگرام دارای تمایل مثبت که از داده‌های درآمد خانواده ایجاد شده است.
تصویر 13-43 نمودار هیستوگرام دارای تمایل مثبت که از داده های درآمد خانواده ایجاد شده است.
  • نمودار منحرف به سمت چپ (تمایل منفی) یک نمودار هیستوگرام وقتی منحرف به سمت چپ (تمایل منفی) است که دارای تنها یک قله و مقادیر مجموعه‌داده ها بیشتر به سمت چپ قله متمایل باشند تا به سمت راست آن. روزهای مربوط به بارداری تا تولد معمولاً نمودارهای با تمایل منفی نشان می‌دهند. مثالی از این مورد در سلول Q7 و تصویر 14-43 نشان‌داده‌شده است. بلندی هر یک از ستون‌ها نمایشگر تعداد زنان بارداری است که زمان شروع بارداری تا تولد فرزندانشان در محدوده مقادیر مشخص قرار گرفته. مثلاً دو نفر از زنان در زمانی کمتر از 180 روز پس از باردار شدن نوزادانشان را بدنیا آورده اند.

    تصویر 14-43 یک نمودار هیستوگرام با تمایل منفی از داده‌های مرتبط با روزهای شروع بارداری تا تولد فرزندان.
    تصویر 14-43 یک نمودار هیستوگرام با تمایل منفی از داده های مرتبط با روزهای شروع بارداری تا تولد فرزندان.

  • نمودار چند قله‌ای. وقتی که نمودار هیستوگرام چندین قله نشان می‌دهد معمولاً به آن معناست که داده ها از دو یا چند جمعیت با یکدیگر ترکیب شده‌اند تا نمودار را تشکیل دهند. مثلاً فرض کنید قطر ریل‌های آسانسور تولید شده با دو ماشین نمودار نشان‌داده‌شده در تصویر 15-43 را به ما داده است. (سلول Q11 در فایلی به نام xlsx را مشاهده کنید)

    تصویر 15-43 نمودار هیستوگرام چند قله‌ای
    تصویر 15-43 نمودار هیستوگرام چند قله‌ای

در این نمودار هیستوگرام، داده ها در دو گروه جداگانه دسته‌بندی می‌شوند. به‌احتمال زیاد هر گروه از داده ها مرتبط به ریل‌های آسانسور تولید شده توسط هریک از ماشین‌ها هستند. اگر فرض کنید که قطر ریل آسانسور دلخواهتان 0.55 اینچ باشد، می‌توانید نتیجه بگیرید که ریل‌های آسانسورتولید شده توسط یکی از ماشین‌ها زیاده از حد نازک است. درحالی‌که ماشین دیگر ریل آسانسوری تولید می‌کند که زیادی از حد عریض است. می‌بایست تفسیر خود از این نمودار را با ایجاد نمودارهای هیستوگرامی که ریل‌های آسانسور تولید شده توسط هر ماشین را (جداگانه) نمایش می‌دهند دنبال کنید. این مثال نشان می‌دهد که نمودارهای اینستاگرام ابزاری قدرتمند در کنترل کیفیت هستند.

با مقایسه نمودارهای هیستوگرام از چندین مجموعه‌داده چه می‌توان یاد گرفت؟

اغلب از تحلیل گران درخواست می‌شود مجموعه‌های متفاوتی از داده ها را با یکدیگر مقایسه کنند. مثلاً ممکن است از شما بخواهند تا تفاوت میان سود ماهیانه شرکت‌های جی‌ام و سیسکو را نشان دهید. برای پاسخ به سؤالاتی ازاین‌قبیل نمودارهای هیستوگرامی با محدوده مقادیری برابر برای شرکت‌های جی‌ام و همچنین، سیسکو ایجاد می‌کنید و یک نمودار را همان‌طور که در تصویر 43-16 نشان‌داده‌شده در بالای دیگری قرار می‌دهید. کاربرگ‌های حاوی نمودار هیستوگرام در فایلی به نام Stock.xlsx را مشاهده کنید.

تصویر 16-43 استفاده از نمودار هیستوگرام دارای محدوده مقادیر یکسان برای مقایسه مجموعه‌داده‌های متفاوت
تصویر 16-43 استفاده از نمودار هیستوگرام دارای محدوده مقادیر یکسان برای مقایسه مجموعه‌داده های متفاوت

با مقایسه کردن این دو نمودار هیستوگرام می‌توانید دو نتیجه‌گیری مهم به دست آورید:

  • شرکت سیسکو در حالت معمول بهتر از جی‌ام عمل کرده است. این موضوع از آنجا برایتان مشخص شده که بالاترین ستون نمودار سیسکو یک ستون در سمت راست ‌بالاترین ستون شرکت جی‌ام است؛ بنابراین ستون‌های سیسکو بیشتر از ستون‌های جی‌ام تمایل به راست دارند.
  • سیسکو دارای تغییرپذیری بیشتری است و یا اینکه بیشتر از جی‌ام در میانه گسترده شده. توجه کنید که ستون قله داده های شرکت جی‌ام شامل 59 ماه است درحالی‌که ستون قله سیسکو حاوی 42 ماه است. این نشان می‌دهد که برای شرکت سیسکو، بیشتر سودها خارج از محدوده‌ای است که نمایانگر بیشترین سود احتمالی سیسکو است. سودهای شرکت سیسکو بیشتر از سودهای شرکت جی‌ام گسترده‌اند.

در فصل 44 از آمار توصیفی و نمودارهای جعبه‌ای (BoxPlot) برای نگاهی دقیق‌تر به تفاوت‌های میان سود ماهیانه شرکت‌های سیسکو و جی‌ام استفاده خواهیم کرد.

چگونه می‌توان نمودار پارتو ایجاد کرد؟

نمودار پارتو (Parto Chart) نوعی از نمودار است که شامل ستون‌ها و خطوط گرافیکی است. مقادیر فردی به شکل نزولی توسط ستون‌های نمودار مشخص شده و مقادیر تجمعی توسط خطوط نمایش داده می‌شوند. از نمودارهای پارتو اغلب برای نمایش اصل معروف 20-80(اصل پارتو یا قانون اقلیت‌های حیاتی) که توسط اقتصاددان معروف ایتالیایی بنام ویلفردو پارتو (1923-1848) کشف شد استفاده می‌شود. اصل پارتو بر اهمیت اقلام حداقل در توصیف یک حجم کل تاکید می‌کند. مثلاً:

  • 20 درصد از تولیدات 80 درصد از سود را ایجاد می‌کنند.
  • 20 درصد از اشخاص، 80 درصد از درآمد را دارا هستند.
  • 80 درصد از تمامی تماس‌ها برای پشتیبانی فنی نتیجه تنها 20 درصد از تمامی مشکلات ممکن است.
  • 20 درصد از تمامی وب‌سایت‌ها 80 درصد از بازدیدکننده‌ها را به دست می‌آورند.

برای نمایش ایجاد یک نمودار پارتو با اکسل 2019 فایلی به نام Paretotemp.xlsx (از پوشه Templates این فصل) که درآمد ناشی از هریک از 100 محصول این شرکت را به ما می‌دهد را باز کنید. (تصویر 17-43 را ببینید)

تصویر 17-43 داده‌های نمودار پارتو
تصویر 17-43 داده های نمودار پارتو

پس از انتخاب دادها (محدوده سلول E3:F103) آیکون گزینه Insert Statistic Chart را از تب Insert انتخاب می‌کنیم (در گروه گزینه‌های Chart) و سپس نمودار Parto که دومین گزینه نمودار هیستوگرام است را انتخاب می‌کنیم. (تصویر 8-43 قبلی را ببینید) اکنون نمودار پارتو نمایش‌داده‌شده در تصویر 18-43 را به دست می‌آوریم. می‌بینیم که محصولات حالا به نظم نزولی فروش نمایش داده شده‌اند. خط موجود نمایشگر درصد تجمعی فروش‌های ایجاد شده توسط محصولات است. مشاهده می‌کنیم که ده محصول پرفروش ما حدود 80 درصد از فروش را تولید کرده‌اند. البته اگر برای منبع داده هایمان جدولی درست کرده بودیم داده های جدید به‌صورت خودکار در نمودار وارد می‌شدند.

تصویر 18-43 نمودار پارتو
تصویر 18-43 نمودار پارتو

پس از کلیک کردن بر نمودار پارتو برای انتخاب آن، گزینه پنجم را از تب Design انتخاب می‌کنیم (گزینه‌ای که دارای پس‌زمینه تیره است) و نمودار نشان‌داده‌شده در تصویر 19-43 را به دست می‌آوریم.

تصویر 19-43 نمودار پارتو که با استفاده از تب Design ایجاد شده
تصویر 19-43 نمودار پارتو که با استفاده از تب Design ایجاد شده

مسئله‌های این فصل:

از داده های فایلی به نام Stock.xlsx برای ایجاد نمودارهای هیستوگرام برای سود ماهیانه شرکت‌های جی‌ای و اینتل استفاده کنید.

از داده های فایلی به نام Historicalinvest2009.xlsx برای ایجاد نمودارهای هیستوگرامی از سود سالیانه سهام و اوراق بهادار استفاده کنید. سپس سود سالیانه این سهام و اوراق بهادار را باهم مقایسه کنید.

به شما (در فایلی به نامDemin.xlsx) قطر اندازه‌گیری شده (به اینچ) 500 میله تولید شده توسط شرکت رودکو داده شده است. میله‌هایی قابل‌قبول هستند که حداقل یک اینچ قطر داشته باشند. درگذشته قطر میله های تولید شده توسط شرکت رودکو نمودار همواره نمودار هیستوگرامی متقارن ایجاد کرده. کارهای زیر را انجام دهید:

  1. نمودار هیستوگرامی از این اندازه‌ها ایجاد کنید.
  2. در باره هر نوع جنبه نامعمول این نمودار هیستوگرام توضیحی ارائه کنید.

آیا می‌توانید حدس بزنید چه عاملی باعث به‌وجودآمدن جنبه‌های نامعمول این نمودار هیستوگرام شده؟ راهنمایی: یکی از 14 نکته پیشوای کیفیت به نام ادوارد دمینگ عبارت: “ترس را از خود بران” است.

فایلی به نام Unimployment.xlsx حاوی نرخ بیکاری ایالات متحده است. نمودار هیستوگرامی از آن ایجاد کنید. آیا نرخ بیکاری متقارن است یا متمایل؟

فایلی به نام Terms.xlsx حاوی امتیازهای دورزدن زمین توسط تیم‌های بیسبال لیگ اصلی در طول یک‌فصل است. از آن نمودار هیستوگرامی ایجاد کنید. آیا این امتیازهای دورزدن متقارن هستند یا متمایل؟

فایلی به نام NFLpoints.xlsx حاوی امتیازهای کسب شده توسط تیم‌های NFL (لیگ ملی فوتبال) در طول یک‌فصل بازی است. از آن نمودار هیستوگرامی ایجاد کنید. آیا امتیازها نموداری متقارن نشان می‌دهند یا متمایل؟

با استفاده از داده های فایلی به نام Problem7data.xlsx نمودار هیستوگرامی ایجاد کنید که یک جمع‌بندی از قد مردان آمریکایی نشان دهد.

داده های فایلی به نام Problem8Data.xlsx حاوی امتیازهای کسب شده توسط هر تیم فوتبال Division I NCCA در طول فصل بازی 2015 است. نمودار هیستوگرامی ایجاد کنید که این داده ها را خلاصه بندی کنند. آیا این داده ها در نمودار حالتی متقارن نشان می‌دهند؟

داده ها در فایلی به نام Problem9data.xlsx حاوی درآمد خانواده‌ها در شهر Smaltown در ایالات متحده است. نمودار پارتویی ایجاد کنید که یک جمع‌بندی از درآمدهای این خانواده‌ها را نشان دهد.

فایل ها جانبی:
دانلود فایل نمونه
اشتراک گذاری در شبکه های اجتماعی

مایکروسافت اکسل (Excel)

loader

لطفا شکبیا باشید...