واریانس

دسامبر 10, 2009

در نظریه احتمالات و آمار واریانس یا پراش نوعی سنجش پراکندگی است.

مقدار واریانس با میانگین‌گیری از مربع فاصله مقدار محتمل و یا مشاهده شده با مقدار مورد انتظار محاسبه می‌شود. در مقایسه با میانگین می‌توان گفت که میانگین مکان توزیع را نشان می‌دهد، در حالی که واریانس مقیاسی است که نشان می‌دهد که داده‌ها حول میانگین چگونه پخش شده‌اند. واریانس کمتر بدین معنا است که انتظار می‌رود که اگر نمونه‌ای از توزیع مزبور انتخاب شود مقدار آن به میانگین نزدیک باشد. یکای واریانس مربع یکای کمیت اولیه می‌باشد. ریشه دوم واریانس که انحراف معیار نامیده می‌شود دارای واحدی یکسان با متغیر اولیه است.

واریانس یا وردایی عددی است که نشان می دهد چگونه یک سری داده حول مقدار میانگین پخش می شوند. برای تعریف واریانس اگر فرض کنیم که متغیر تکی X دارای توزیع p(x) است و متوسط توزیع جمعیت آن را با \mu نشان دهیم آنگاه واریانس این جمعیت بصورت زیر تعیین می گردد.

Var(X) = \sigma^{2} \equiv \left\langle (X-\mu)^{2} \right\rangle

حال اگر یک توزیع مجزا داشته باشیم که هر مجموعه داده در آن، دارای احتمال p(x) باشد، واریانس بصورت زیر محاسبه می گردد.

\sigma^{2} = \sum_{i=1}^{N}p(x_{i})(x_{i} - \mu)^{2}

اما در بیشتر موارد توزیع حاکم بر داده ها مشخص نیست در این حالت واریانس را بصورت زیر تخمین می زنیم.

S^{2}_{N}\equiv \frac{1}{N}\sum_{i=1}^{N}(x_{i}-\overline{x})^{2}

در این رابطه \overline{x} میانگین (امید ریاضی) داده‌هاست که خود از رابطهٔ زیر حساب می‌شود:

\overline{x} = \frac{1}{N}\sum_{i=1}^N x_i = \frac{x_1+x_2+\cdots+x_N}{N}

البته باید توجه داشت که تخمین فوق یک تخمین دقیق و بدون خطا برای واریانس نیست لذا برای از بین بردن این خطا در تخمین از واریانس تصحیح شده استفاده می کنیم که بصورت زیر تعریف می گردد.

S^{2}_{N-1}\equiv \frac{1}{N-1}\sum_{i=1}^{N}(x_{i}-\overline{x})^{2}

 

اگر \mu= \operatorname{E}( X )، امید ریاضی (میانگین) متغیر تصادفی X باشد، آنگاه واریانس X برابر خواهد بود با:

\operatorname{Var}(X) = \operatorname{E}[ ( X - \mu ) ^ 2 ]\,

\begin{align}\operatorname{Var}(X) 
 &= \operatorname{E}[(X - \mu)^2] \\&= \operatorname{E}[X^2 - 2\mu X + \mu^2] \\
 &= \operatorname{E}[X^2] - 2\mu\,\operatorname{E}[X] + \mu^2 \\&= \operatorname{E}[X^2] - 2\mu^2 + \mu^2 \\&= \operatorname{E}[X^2] - \mu^2 \\&= \operatorname{E}[X^2] - (\operatorname{E}[X])^2.
 \end{align}

برای به خاطر سپردن راحت‌تر این فرمول گفته‌می‌شود واریانس برابر است با «میانگین مجذور، منهای مجذور میانگین». واریانس متغیر تصادفی X را معمولاً با Var(X)‎ یا\scriptstyle\sigma_X^2 یا به صورت ساده‌تر σ2 (تلفظ می‌شود سیگما-دو) نمایش می‌دهند.

 

حالت پیوسته

\operatorname{Var}(X) =\int (x-\mu)^2 \, f(x) \, dx\,,

و

\mu = \int x \, f(x) \, dx\,,

 

خواص

\operatorname{Var}(aX+b)=\operatorname{Var}(aX)=a^2\operatorname{Var}(X).

\operatorname{Var}(X+Y)=\operatorname{Var}(X)+\operatorname{Var}(Y)+2\, \operatorname{Cov}(X,Y),

\operatorname{Var}(aX+bY)=a^2\operatorname{Var}(X)+b^2\operatorname{Var}(Y)+2ab\, \operatorname{Cov}(X,Y),

 

واژه شناسی

فرهنگستان زبان وردیدن، از ریشه باستانی ورت (ورتیدن)، را بجای واریانس برگزیده است و از این فعل مشتقات وردش(variation)، وردا(variant)، هم‌وردا(covariant)، ناوردا(invariant)، پادوردا(contravariance) را برساخته است.

 

تخمین واریانس یک تابع

\operatorname{Var}\left[f(X)\right]\approx \left(f'(\operatorname{E}\left[X\right])\right)^2\operatorname{Var}\left[X\right]

 

منبع

Hits: 0

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *