اندازه گیری پراکندگی، که گاهی به آن معیار پراکندگی نیز می گویند، برای توصیف تنوع در یک نمونه یا جمعیت استفاده می شود. معمولاً همراه با معیاری از تمایل مرکزی، مانند میانگین یا میانه، برای ارائه یک توصیف کلی از مجموعه ای از داده ها استفاده می شود.
چرا اندازه گیری گسترش داده ها مهم است؟
دلایل زیادی وجود دارد که چرا اندازه گیری پراکندگی مقادیر داده مهم است، اما یکی از دلایل اصلی ارتباط آن با معیارهای گرایش مرکزی است. اندازه گیری گسترش به ما این ایده را می دهد که مثلاً میانگین چقدر خوب داده ها را نشان می دهد. اگر گستردگی مقادیر در مجموعه داده زیاد باشد، میانگین آنقدر معرف داده نیست که گویی پراکندگی داده ها کم است. این به این دلیل است که گسترش زیاد نشان می دهد که احتمالاً تفاوت های زیادی بین نمرات فردی وجود دارد. علاوه بر این، در تحقیقات، اگر تفاوت کمی در هر گروه داده وجود داشته باشد، اغلب مثبت تلقی می شود زیرا نشان می دهد که مشابه هستند.
ما محدوده، چارک ها، واریانس، انحراف مطلق و انحراف معیار را بررسی خواهیم کرد.
دامنه
محدوده، تفاوت بین بالاترین و کمترین امتیاز در یک مجموعه داده است و ساده ترین اندازه گیری گسترش است. بنابراین ما محدوده را به صورت زیر محاسبه می کنیم:
محدوده = حداکثر مقدار - حداقل مقدار
به عنوان مثال، اجازه دهید مجموعه داده های زیر را در نظر بگیریم:
23 | 56 | 45 | 65 | 59 | 55 | 62 | 54 | 85 | 25 |
حداکثر مقدار 85 و حداقل مقدار 23 است. این منجر به یک محدوده 62 می شود که 85 منهای 23 است. در حالی که استفاده از محدوده به عنوان معیار گسترش محدود است، مرزهای امتیازها را تعیین می کند. این می تواند مفید باشد اگر متغیری را اندازه گیری می کنید که دارای آستانه بحرانی پایین یا بالا (یا هر دو) است که نباید از آنها عبور کرد. محدوده فوراً به شما اطلاع می دهد که آیا حداقل یک مقدار این آستانه های بحرانی را شکسته است یا خیر. علاوه بر این، محدوده می تواند برای تشخیص هر گونه خطا در هنگام وارد کردن داده استفاده شود. به عنوان مثال، اگر سن دانش آموزان مدرسه ای را در مطالعه خود ثبت کرده اید و محدوده سنی شما بین 7 تا 123 سال است، می دانید که اشتباه کرده اید!
به 10000 دانشجو، دانشگاهی و متخصصی بپیوندید که بر آمار Laerd تکیه دارند. از تور پلن ها و قیمت ها استفاده کنید
ربع ها و محدوده بین چارکی
ربع ها با تقسیم کردن مجموعه داده ها به ربع، در مورد گسترش یک مجموعه داده به ما می گویند، درست مانند میانه آن را به نصف تقسیم می کند. به عنوان مثال، نمرات 100 دانش آموز زیر را در نظر بگیرید که از پایین ترین تا بالاترین نمره مرتب شده اند و ربع ها با رنگ قرمز برجسته شده اند.
سفارش | نمره | سفارش | نمره | سفارش | نمره | سفارش | نمره | سفارش | نمره |
یکم | 35 | بیست و یکم | 42 | 41 | 53 | 61 ام | 64 | 81 ام | 74 |
2 | 37 | بیست و دومین | 42 | 42 ام | 53 | 62 ام | 64 | 82 ام | 74 |
3 | 37 | 23 | 44 | 43 | 54 | 63 | 65 | 83 | 74 |
چهارم | 38 | 24 | 44 | 44 ام | 55 | 64 ام | 66 | 84 ام | 75 |
پنجم | 39 | 25 | 45 | 45 ام | 55 | 65 ام | 67 | 85 ام | 75 |
ششمین | 39 | 26 | 45 | 46th | 56 | 66th | 67 | 86th | 76 |
هفتم | 39 | 27 | 45 | 47 | 57 | 67 ام | 67 | 87 ام | 77 |
هشتم | 39 | 28 | 45 | 48 ام | 57 | 68 ام | 67 | 88 ام | 77 |
نهم | 39 | 29 ام | 47 | 49th | 58 | 69th | 68 | 89 ام | 79 |
10 | 40 | سی ام | 48 | 50 | 58 | هفتادم | 69 | 90 ام | 80 |
یازدهم | 40 | 31 | 49 | 51 ام | 59 | 71 | 69 | 91 | 81 |
دوازدهم | 40 | سی و دومین | 49 | 52 | 60 | 72 | 69 | 92 | 81 |
سیزدهم | 40 | 33 | 49 | 53 | 61 | 73 | 70 | 93 | 81 |
چهاردهم | 40 | 34 ام | 49 | 54 ام | 62 | 74 ام | 70 | 94 ام | 81 |
پانزدهم | 40 | 35 | 51 | 55 ام | 62 | 75 ام | 71 | 95 ام | 81 |
شانزدهم | 41 | 36 | 51 | 56th | 62 | 76th | 71 | 96th | 81 |
هفدهم | 41 | 37 | 51 | 57 ام | 63 | 77 | 71 | 97 | 83 |
هجدهم | 42 | 38 | 51 | 58 ام | 63 | 78 ام | 72 | 98 | 84 |
19 | 42 | 39 ام | 52 | 59 ام | 64 | 79 ام | 74 | 99 ام | 84 |
20 | 42 | 40 | 52 | 60th | 64 | 80 | 74 | صدمین | 85 |
اولین کوارتیل (Q1) بین علائم دانشجویی 25 و 26 قرار دارد ، دومین کوارتیل (Q2) بین علائم دانشجویی 50 و 51 و کوارتیل سوم (Q3) بین نمرات دانشجویی 75 و 76. از این رو:
کوارتیل اول (Q1) = (45 + 45) ÷ 2 = 45 کوارتیل دوم (Q2) = (58 + 59) ÷ 2 = 58. 5 کوارتیل سوم (Q3) = (71 + 71) ÷ 2 = 71
در مثال بالا ، ما تعداد حتی تعداد نمرات (100 دانش آموز ، به جای تعداد عجیب و غریب ، مانند 99 دانش آموز) را داریم. این بدان معنی است که وقتی کوارتل ها را محاسبه می کنیم ، جمع دو امتیاز را در اطراف هر کوارتیل و سپس نیمی از آنها می گیریم (از این رو Q1 = (45 + 45) ÷ 2 = 45). با این حال ، اگر تعداد عجیب و غریب نمرات (مثلاً 99 دانش آموز) داشتیم ، فقط برای هر کوارتیل (یعنی نمرات 25 ، 50 و 75) باید یک امتیاز کسب کنیم. باید تشخیص دهید که کوارتیل دوم نیز میانه است.
کوارتل ها یک اندازه گیری مفید برای گسترش هستند زیرا آنها بسیار کمتر تحت تأثیر قرار گرفتن در خارج از کشور یا مجموعه داده های کم نظیر از اقدامات معادل انحراف متوسط و استاندارد قرار می گیرند. به همین دلیل ، کوارتل ها اغلب به همراه میانگین به عنوان بهترین انتخاب اندازه گیری گسترش و گرایش مرکزی ، به ترتیب ، هنگام برخورد با داده های اسکی و/یا با خارج از کشور گزارش می شوند. یک روش مشترک برای بیان کوارتل ها به عنوان یک محدوده بین قشر است. محدوده بین قشر تفاوت بین کوارتیل سوم (Q3) و اولین کوارتیل (Q1) را توصیف می کند ، و در مورد دامنه نیمه میانی نمرات در توزیع به ما می گوید. از این رو ، برای 100 دانش آموز ما:
دامنه interquartile = q3 - q1 = 71 - 45 = 26
با این حال ، لازم به ذکر است که در مجلات و سایر نشریات معمولاً محدوده interquartile را به جای محدوده محاسبه شده به عنوان 45 تا 71 گزارش می کنید.
یک تغییر جزئی در این مورد ، محدوده نیمه Interquartile است که نیمی از محدوده بین قشر = ½ (Q3 - Q1) است. از این رو ، برای 100 دانش آموز ما ، این 26 ÷ 2 = 13 خواهد بود.