برای تعیین توزیعهای آماری لازم است دو نوع فضای احتمال تعریف شود:
1- فضای نمونهای را که تعداد عنالصر آن متناهی یا بطور شمارش پذیر نامتناهی باشد، فضای نمونه گسسته گوییم.
2- وقتی فضای نمونه شامل تمام اعداد متعلق به یک فاصله باشد، آن را فضای نمونه پیوسته گوییم.
انواع توزیعهای احتمال
1- توزیع احتمال یک متغیر تصادفی گسته ، یا بطور خلاصه ، توزیع یک متغر تصادفی عبارت است از فهرست مقادیر Xi از متغیر تصادفی X همراه با احتمال منسوب به هر یک از این مقادیر ، f(xi) = P(X=Xi). اغلب می توان به جای استفاده از یک فهرست مفصل، از یک فرمول استفاده کرد.
2- تابع چگالی احتمال f(x) ، توزیع احتمال یک متغیر تصادفی پیوسته را توصیف میکند و دارای خواص زیر است.
الف) مساحت کل زیر منحنی چگالی برابر با یک است.
ب) مساحت زیر منحنی چگالی بین b,a مساوی است با P(a≤x≤b)
ج f(x) مثبت یا صفر است.
انواع توزیعهای احتمال گسسته
امتحان برنولی (موفقیت شکست)
در اینجا تکرارهای متوالی یک آزمایش یا مشاهده را مورد بررسی قرار میدهیم و هر تکرار را یک امتحان مینامیم.
به علاوه فرض میکنیم که برای هر امتحان فقط دو برآمد ممکن وجود دارد. که یکی از آنها را موفقیت و دیگری را شکست مینامند بر این تاکید شده باشد که آنها تنها برآمدهای ممکناند.
ویژگیهای امتحان برنولی
الف) هر امتحان به یکی از دو برآمد ممکن میانجامد که در اصطلاح فنی موقعیت و شکسیت نامیده میشوند.
ب) برای تمام امتحانها ، احتمال موفقیت p ، یکی است. بنابراین احتمال شکست برای هر امتحان q=1-p است که آن را با q نشان میدهید، بطوری که p+q=1
ج) امتحانها مستقل از یکدیگرند. احتمال موفقیت در یک احتمال با داشتن هر مقدار اطلاعات از برآمدهای سایر احتمالها ، تغییر نمیکند.
د) احتمالهای برنولی به صورت P(X=x) = pxq1-x تعریف می شود. دارای میانگین) p احتمال موفقیت) و واریانس pq )احتمال موفقیت در احتمال شکست( میباشد.
توزیع دو جملهای
در حالتی که n امتحان مرکدر برنولی)n عدد ثابت( انجام میشوند و احتمال موفقیت در هر امتحان p است. توزیع دو جملهای عبارت است از تعداد موفقیتهای در n امتحان.
توزیع دو جملهای را به صورت px(1-p)1-x ترکیب x شیء از n شیء (P(X=x) = b(x;n;p) برای تمایز n,…,2,1,0 تعریف میشود. اصطلاح توزیع دو جملهای از قضیه مهمی در جبر به نام قضیه بسط دو جملهای ، که مربوط است به فرمول بسط a+b)n )گرفته شده است توزیع دو جملهای دارای میانگین np تعداد موفقیتهای در n امتحان و واریانس npq )تعداد موفقیتها در n امتحان ضرب در احتمال شکستها) میباشد.
توزیع فوق هندسی
فرض کنید میخواهیم نمونه گیری را از یک جامعه N عنصری انجام دهیم که خود میتواند به دو گروه تقسیم شود، گروهی که مشخصه معینی دارند و بقیه که دارای چنین مشخصهای نیستند. این دو گروه میتوانند مثلا ، نر به ماده ، شاغل- بیکار ، سالم- معیوب و نظایر اینها باشند. با پذیرش اصطلاحات سالم و معیوب برای توصیف این دو گروه ، تعداد معیوبها در جامعه را با D نشان میدهیم، بنابراین تعداد عناصر سالم N-D خواهد بود. سپس فرض میکنیم X ، نشاندهنده تعداد معیوبها در نمونه تصادفی n عنصری باشد. توزیع فوق هندسی به صورت x=0,1,…,n و
)ترکیبn از N شی)/(ترکیب n-x از N-D شی) (ترکیب x از D شی) = P(X=x) تعریف میشود. دارای میانگین np ، که در آن P=D/N (نسبت معیوبهای جامعه) ، و واریانس (ndq(N-n)/N-1) میباشد.
توزیع هندسی یا زمان انتظار
توزیع هندسی ، توزیع گسسته دیگری است که در مبحث امتحانهای برنولی پیش میآید. وقتی تعداد امتحانها معین باشد، تعداد موفقیتها متغیری با توزیع دو جملهای (b(n,p است. اگر به جای اینکه تعداد امتحانها از قبل معین باشد، بخواهیم امتحانهای برنولی را تا به دست آوردن اولین موفقیت تکرار کنیم، تعداد موفقیتهای عدد معین 1 است ولی تعداد احتمالها متغیر تصادفی است. X عبارت است از تعداد امتحان های برنولی تا به دست آوردن اولین موفقیت. توزیع هندسی به صورت p(X=x)=q1-xp , X=0,1,…,nتعریف میشود. دارای میانگین p-1 و واریانس q/p2 میباشد.
توزیع هندسی را گاهی توزیع زمان انتظار گسسته میگویند. این امر ناشی از این واقعیت است که اگر انجام یک امتحان برنولی یک واحد زمان طول بکشد، زمان انتظار برای به دست آوردن اولین موفقیت ، دقیقا عبارت است از متغیر تصادفی x که دارای توزیع هندسی است. توزیع هندسی اغلب برای مطالعه یک مشخصه کمیاب جامعه ، نظیر وجود نوعی بیماری خونی کمیاب ، مفید است.
پیامدهای کمیاب و توزیع پواسن
توزیع پواسن برای ساختن مدل بسیاری از پدیدههای شانسی مفید است. همچنین تقریبی از احتمالهای دو جملهای را به دست میدهد. توزیع پواسن علاوه بر نقشی که به عنوان یک توزیع تقریب کننده دارد، مدل احتمال مفیدی است برای پیشامدهایی که بطور تصادفی در زمان یا مکان رخ میدهند، هنگامی که دانستهها منحصر به متوسط تعداد رخدادهای آنها در واحد زمان یک مکان باشد. برای پیشامدی که در زمان اتفاق میافتد، هر لحظه از زمان را میتوان احتمال بالقوهای دانست که در آن ، پیشامد ممکن است رخ بدهد یا رخ ندهد. در یک واحد زمان، بطور بالقوه تعداد متناهی احتمال وجود دارد، ولی معمولا پیشامدها به دفعات اندکی اتفاق میافتد.
توزیع پواسن به صورت x=0,1,…,n و !P(X=x) = e-mmx/x تعریف میشود که e عدد نمایی و برابر 71828/2 است.
توزیعهای احتمال پیوسته
توزیع نرمال یا توزیع گوس
توزیع نرمال ، که ممکن است بعضی از خوانندگان نمودار آن را به عنوان منحنی زنگدیس بشناسند، گاهی با نامهای پیر لاپلا س و کارل گاوس که در تاریخ پیدایش آن نقش چشمگیری داشتهاند، همراه است. گاوس توزیع نرمال را با روش ریاضی به عنوان توزیع احتمال خطای اندازهگیریها به دست آورد و آن را “قانون نرمال خطاها” نامید. توزیع نرمال نقشی اساسی در آمار بازی میکند، و روشهای استنباطی که از آن به دست میآیند، دارای قلمرو کاربرد وسیعی هستند و ستون فقرات روشهای جاری تجزیه و تحلیل آماری را تشکیل میدهند.
توزیع نرمال دارای چگالی e-(x-µ)2/2σ2/σ√2π میباشد. که در آن µ میانگین و σ انحراف معیار است به صورت (N(µ,σ2 ))نشان داده میشود. اگر انحراف معیار با میانگین 0 و انحراف معیار 1 باشد آن را توزیع نرمال استاندارد میگویند و به صورت (N(0,1 نشان میدهند، دارای توزیع Z = (x-µ)/σ میباشد.
قضیه حد مرکزی: برای توزیع میانگین نمونه مبتنی بر نمونهای تصادفی به حجم n ، میانگین (X) برابر µ ، واریانس (X) برای σ2/n یا (n/ واریانس جامعه) ، انحراف معیار (X) برابر σ/√n یا (n√/انحراف معیار جامعه) میباشد. طبق قضیه حد مرکزی توزیع نرمال به صورت Z = (X- µ) / σ/√n تقریبا (N(0,1 است.
Hits: 0