توزیع های آماری

برای تعیین توزیعهای آماری لازم است دو نوع فضای احتمال تعریف شود:
1- فضای نمونه‌ای را که تعداد عنالصر آن متناهی یا بطور شمارش پذیر نامتناهی باشد، فضای نمونه گسسته گوییم.
2- وقتی فضای نمونه شامل تمام اعداد متعلق به یک فاصله باشد، آن را فضای نمونه پیوسته گوییم.

انواع توزیعهای احتمال

1- توزیع احتمال یک متغیر تصادفی گسته ، یا بطور خلاصه ، توزیع یک متغر تصادفی عبارت است از فهرست مقادیر Xi از متغیر تصادفی X همراه با احتمال منسوب به هر یک از این مقادیر ، f(xi) = P(X=Xi). اغلب می توان به جای استفاده از یک فهرست مفصل، از یک فرمول استفاده کرد.
2- تابع چگالی احتمال f(x) ، توزیع احتمال یک متغیر تصادفی پیوسته را توصیف می‌کند و دارای خواص زیر است.
الف) مساحت کل زیر منحنی چگالی برابر با یک است.
ب) مساحت زیر منحنی چگالی بین b,a مساوی است با P(a≤x≤b)
ج f(x) مثبت یا صفر است.

انواع توزیعهای احتمال گسسته

امتحان برنولی (موفقیت شکست)

در اینجا تکرارهای متوالی یک آزمایش یا مشاهده را مورد بررسی قرار می‌دهیم و هر تکرار را یک امتحان می‌نامیم.
به علاوه فرض می‌کنیم که برای هر امتحان فقط دو برآمد ممکن وجود دارد. که یکی از آنها را موفقیت و دیگری را شکست می‌نامند بر این تاکید شده باشد که آنها تنها برآمدهای ممکن‌اند.

ویژگیهای امتحان برنولی

الف) هر امتحان به یکی از دو برآمد ممکن می‌انجامد که در اصطلاح فنی موقعیت و شکسیت نامیده می‌شوند.
ب) برای تمام امتحانها ، احتمال موفقیت p ، یکی است. بنابراین احتمال شکست برای هر امتحان q=1-p است که آن را با q نشان می‌دهید، بطوری که p+q=1
ج) امتحانها مستقل از یکدیگرند. احتمال موفقیت در یک احتمال با داشتن هر مقدار اطلاعات از برآمدهای سایر احتمالها ، تغییر نمی‌کند.
د) احتمالهای برنولی به صورت P(X=x) = pxq1-x تعریف می شود. دارای میانگین) p احتمال موفقیت) و واریانس pq )احتمال موفقیت در احتمال شکست( می‌باشد.

توزیع دو جمله‌ای

در حالتی که n امتحان مرکدر برنولی)n عدد ثابت( انجام می‌شوند و احتمال موفقیت در هر امتحان p است. توزیع دو جمله‌ای عبارت است از تعداد موفقیتهای در n امتحان.
توزیع دو جمله‌ای را به صورت px(1-p)1-x ترکیب x شیء از n شیء (P(X=x) = b(x;n;p) برای تمایز n,…,2,1,0 تعریف می‌شود. اصطلاح توزیع دو جمله‌ای از قضیه مهمی در جبر به نام قضیه بسط دو جمله‌ای ، که مربوط است به فرمول بسط a+b)n )گرفته شده است توزیع دو جمله‌ای دارای میانگین np تعداد موفقیتهای در n امتحان و واریانس npq )تعداد موفقیتها در n امتحان ضرب در احتمال شکستها) می‌باشد.

توزیع فوق هندسی

فرض کنید می‌خواهیم نمونه گیری را از یک جامعه N عنصری انجام دهیم که خود می‌تواند به دو گروه تقسیم شود، گروهی که مشخصه معینی دارند و بقیه که دارای چنین مشخصه‌ای نیستند. این دو گروه می‌توانند مثلا ، نر به ماده ، شاغل- بیکار ، سالم- معیوب و نظایر اینها باشند. با پذیرش اصطلاحات سالم و معیوب برای توصیف این دو گروه ، تعداد معیوبها در جامعه را با D نشان می‌دهیم، بنابراین تعداد عناصر سالم N-D خواهد بود. سپس فرض می‌کنیم X ، نشاندهنده تعداد معیوبها در نمونه تصادفی n عنصری باشد. توزیع فوق هندسی به صورت x=0,1,…,n و
)ترکیبn از N شی)/(ترکیب n-x از N-D شی) (ترکیب x از D شی) = P(X=x) تعریف می‌شود. دارای میانگین np ، که در آن P=D/N (نسبت معیوبهای جامعه) ، و واریانس (ndq(N-n)/N-1) می‌باشد.

توزیع هندسی یا زمان انتظار

توزیع هندسی ، توزیع گسسته دیگری است که در مبحث امتحانهای برنولی پیش می‌آید. وقتی تعداد امتحانها معین باشد، تعداد موفقیتها متغیری با توزیع دو جمله‌ای (b(n,p است. اگر به جای اینکه تعداد امتحانها از قبل معین باشد، بخواهیم امتحانهای برنولی را تا به دست آوردن اولین موفقیت تکرار کنیم، تعداد موفقیتهای عدد معین 1 است ولی تعداد احتمالها متغیر تصادفی است. X عبارت است از تعداد امتحان های برنولی تا به دست آوردن اولین موفقیت. توزیع هندسی به صورت p(X=x)=q1-xp , X=0,1,…,nتعریف می‌شود. دارای میانگین p-1 و واریانس q/p2 می‌باشد.
توزیع هندسی را گاهی توزیع زمان انتظار گسسته می‌گویند. این امر ناشی از این واقعیت است که اگر انجام یک امتحان برنولی یک واحد زمان طول بکشد، زمان انتظار برای به دست آوردن اولین موفقیت ، دقیقا عبارت است از متغیر تصادفی x که دارای توزیع هندسی است. توزیع هندسی اغلب برای مطالعه یک مشخصه کمیاب جامعه ، نظیر وجود نوعی بیماری خونی کمیاب ، مفید است.

پیامدهای کمیاب و توزیع پواسن

توزیع پواسن برای ساختن مدل بسیاری از پدیده‌های شانسی مفید است. همچنین تقریبی از احتمالهای دو جمله‌ای را به دست می‌دهد. توزیع پواسن علاوه بر نقشی که به عنوان یک توزیع تقریب کننده دارد، مدل احتمال مفیدی است برای پیشامدهایی که بطور تصادفی در زمان یا مکان رخ می‌دهند، هنگامی که دانسته‌ها منحصر به متوسط تعداد رخدادهای آنها در واحد زمان یک مکان باشد. برای پیشامدی که در زمان اتفاق می‌افتد، هر لحظه از زمان را می‌توان احتمال بالقوه‌ای دانست که در آن ، پیشامد ممکن است رخ بدهد یا رخ ندهد. در یک واحد زمان، بطور بالقوه تعداد متناهی احتمال وجود دارد، ولی معمولا پیشامدها به دفعات اندکی اتفاق می‌افتد.
توزیع پواسن به صورت x=0,1,…,n و !P(X=x) = e-mmx/x تعریف می‌شود که e عدد نمایی و برابر 71828/2 است.

توزیعهای احتمال پیوسته

توزیع نرمال یا توزیع گوس

توزیع نرمال ، که ممکن است بعضی از خوانندگان نمودار آن را به عنوان منحنی زنگدیس بشناسند، گاهی با نامهای پیر لاپلا س و کارل گاوس که در تاریخ پیدایش آن نقش چشمگیری داشته‌اند، همراه است. گاوس توزیع نرمال را با روش ریاضی به عنوان توزیع احتمال خطای اندازه‌گیریها به دست آورد و آن را “قانون نرمال خطاها” نامید. توزیع نرمال نقشی اساسی در آمار بازی می‌کند، و روشهای استنباطی که از آن به دست می‌آیند، دارای قلمرو کاربرد وسیعی هستند و ستون فقرات روشهای جاری تجزیه و تحلیل آماری را تشکیل می‌دهند.
توزیع نرمال دارای چگالی e-(x-µ)2/2σ2/σ√2π می‌باشد. که در آن µ میانگین و σ انحراف معیار است به صورت (N(µ,σ2 ))نشان داده می‌شود. اگر انحراف معیار با میانگین 0 و انحراف معیار 1 باشد آن را توزیع نرمال استاندارد می‌گویند و به صورت (N(0,1 نشان می‌دهند، دارای توزیع Z = (x-µ)/σ می‌باشد.
قضیه حد مرکزی: برای توزیع میانگین نمونه مبتنی بر نمونه‌ای تصادفی به حجم n ، میانگین (X) برابر µ ، واریانس (X) برای σ2/n یا (n/ واریانس جامعه) ، انحراف معیار (X) برابر σ/√n یا (n√/انحراف معیار جامعه) می‌باشد. طبق قضیه حد مرکزی توزیع نرمال به صورت Z = (X- µ) / σ/√n تقریبا (N(0,1 است.

منبع

توزیع های آماری

By ابتهاج عبیدی

بیشتر درین زمینه....

برخی جنبه‌های مثبت و منفی «شش سیگما»

آمار و مفاهيم اوليه

تاریخچه احتمال و خوان اول

دیدگاهتان را بنویسید لغو پاسخ

بیشتر بخوانید...

پیام سردبیر دانش‌نامه

مزایای آموزش ارز دیجیتال | چرا سرمایه گذاری در بازار کریپتوکارنسی خوب است؟

مطلوبیت نگارش – چرا اقتصاددانان به سنت وبلاگ‌نویسی علاقه‌مندند؟

آب پاکی فریدمن – چگونه پاکی را گسترش داد؟