روش هاي چند متغيري پيوسته پژوهشگران علوم پایه و علوم انسانی، معمولاً مقادیر چندین متغیر را اندازه گیری می کنند. روش های آماری که برای بیان و تحلیل داده های چند متغیری ) مقادیر اندازه گیری شده هم زمان چند متغیر) به کار می روند را تحلیل چند متغیری می نامیم.

 

 

مؤلفه های اصلی

در تحلیل چند متغیره، بزرگ بودن بُعد بردار تصادفی X، اغلب در به دست آوردن روش های آماری مناسب برای نمونه تصادفی موجب مشکلاتی می گردد. حال می خواهیم با از دست دادن حداقل اطلاعات، بُعد مشاهدات را تا حد قابل ملاحظه ای تقلیل دهیم.
این تفکر از آنجا ناشی می گردد که در مراحل اولیه تحقیق، توجه به سوی متغیرهایی متمرکز است که از یک مشاهده به مشاهده دیگر بیشترین تغییرات را نشان می دهند. متغیرهایی که از یک مشاهده به مشاهده دیگر زیاد عوض نمی شوند را می توان به عنوان ثابت ها در نظرگرفت، با کنار گذاشتن متغیرهایی با واریانس پائین و توجه به متغیرهایی با واریانس بالا، می توانیم به راحتی مساله خود را در یک زیر فضایی با بُعد کمتر مورد مطالعه قرار دهیم.
روش مؤلفه های اصلی را ابتدا کارل پیرسن(1971) برای متغیرهای غیرآماری پیشنهاد کرد. در اکثر موارد یک تحلیل از مؤلفه های اصلی، ارتباط هایی که قبلاً حدس زده شده را آشکـــار می سازد. تحلیل مؤلفه های اصلی در بیان های دیگر در مباحث رگرسیون چند متغیره، آنـالیز گروه بندی و تجزیه عاملی نیز به کار گرفته می شود.
تحلیل مؤلفه های اصلی به ساختمان ماتریس کوواریانس به وسیله چند ترکیب خطی از متغیرهای اولیه، مربوط است. دو هدف عمده دراینجا پیگیری می شود.
1- فشرده کردن داده 2- تفسیر اطلاعات.
با اینکه p مولفه ی اولیه در تغییرپذیری کل سیستم لازم است، اکثر اوقات این تغییرپذیری می تواند به وسیله تعداد کمتر k از مولفه های اصلی بیان شود.
تحلیل مؤلفه های اصلی وسیله ای برای رسیدن به هدف هستند تا اینکه خودشان هدف باشند، زیرا اغلب آنها به عنوان مراحل میانی در وضعیت های بزرگتر به کار می آیند.

 

تحلیل عاملی

یک شیوه آماری که می تواند جهت تحلیل روابط متقابل میان گروه بزرگی از متغیــرها و برای توصیف این متغیرها براساس ابعاد مشترک پنهان میان عوامل به کار رود، تجزیه عاملی است.
این شیوه آماری به یافتن راهی جهت تلخیص اطلاعات موجود در تعدادی متغیرهای اصلی می پردازد و آنها را به یک سری عامل های کوچکتر با کمترین میزان ریزش اطلاعات تبدیل می کند.
تجزیه عاملی بر مبنای همبستگی در توزیع، یک بردار تصادفی X=[x1,x2,x3,…,xp]را بر حسب کمترین تعداد متغیرهای تصادفی غیرقابل مشاهده به نام عامل ها توجیه می کند. در این روش هر مؤلفه Xi مورد بررسی قرار می گیرد تا معلوم شود آیا می توان آن را بوسیله یک تابع خطی شامل مینیمم تعداد متغیرهای تصادفی غیرقابل مشاهده (که ساختار کوواریانس ظاهر می شوند) و یک متغیر دیگر ( که واریانس مؤلفه Xi را توجیه می کند) تولید کرد یا خیر؟
مراحل اجرای تحلیل عاملی عبارتند از :
1- جمع آوری داده ها و ایجاد ماتریس همبستگی
2- استخراج راه حل عاملی اولیه
3- چرخش دورانی و تفسیر
4- ساخت مقیاس ها با امتیازات عاملی برای استفاده در تحلیل های بعدی

 

طریقه طبقه بندی صفت کمی پیوسته

در این حالت به دلیل ماهیت پیوستگی داده ها مقادیر یکسان کمتر مشاهده می شوند در اینجا باید طبق قواعد مشخص داده ها را در طبقات مجزا طبقه بندی می کنیم هر طبقه دارای مرز بالا و پایین می باشد و طبقاتنباید با هم تداخل داشته باشند. ابتدا باید دامنه تغییرات را به دست آوریم دامنه تغییرات یعنی Xmax-Xmin R=
و چنان چه قید شود داده ها روند شده اند آن گاه دامنه تغییرات عبارت است از Xmax-Xmin +1 R= .
عامل بعدی تعداد طبقات است که با K نمايش ىاىه مي شوى و همواره بين 5 تا 20 ءبقه مي باشد که رابطه آن عبارت است از K=1+3.32*logn .
عامل سوم فاصله طبقاتC است که عبارت است ازمرزپایین هر طبقه- مرز بالای هر طبقه.
بین سه عامل فوق رابطه زیر برقرار است: C=R/K
دقت شود که همواره مرز پایین طبقه اول کوچکترین مشاهده می باشد و برای به دست آوردن مرز بالای طبقه اول کافی است به مرز پایین فاصله طبقات اضافه شودبدین ترتیب حدود طبقات محاسبه میشود.
داده های زیر مربوط به نمرات 40دانش آموز در یک آزمون ریاضی است جدول توزیع فراوانی را برای این داده ها به طور کامل تشکیل دهید. 7, 20, 13 , 18, 17.5, 10, 15, 8, 4, 16 ,19.5 ,13.5 ,11.5
16.5, 7.5, 3, 4, 11, 12.5, 13.5, 20, 9, 3, 8, 9, 12, 18.5
17.5, 16.5, 13.5, 12.5, 14.5, 15.5, 18.5, 19.5, 12, 4.5 , 14 ,16.5,
R=Xmax-Xmin=20-3=17 k=1+3.32*log40=6.31=6
C= R/K C=17/6=2.8=2.9

فراوانی نسبی تجمعیG

فراوانی تجمعیG

فراوانی نسبیN

تعداد فراوانی مطلقF

حدود واقعی طبقات

صفات طبقات

6/40

6

6/40

6

2.95 -5.85

3-5.8

11/40

11

5/40

5

5.85-8.75

5.9-8.7

16/40

16

5/40

5

8.75-11.65

8.8-11.6

26/40

26

10/40

10

11.65-14.55

11.7-14.5

31/40

31

5/40

5

14.55-17.45

14.6-17.4

1

40

9/40

9

17.45-20.35

17.5-20.3

1

n=40

   

گفتیم که نباید بین طبقات تداخل ایجاد گردد در ستون اول دیده می شود که داده ها تداخل دارند باید دقت شود که مثلا 5.9 درطبقه اول شمارش نمی شود منظور تا 5.9 است برای راحتی کار می توان به جای 5.9 عدد 5.8 را در نظر گرفت که در این حالت 5.8 در طبقه اول خوانده می شود.
ستون دیگری که می توان به جدول فوق اضافه کرد حدود واقعی طبقات است که زمانی مورد استفاده قرار می گیرد که می خواهیم نمودارهای آماری رسم کنیم. برای این کار چون داده ها یک رقم اعشار دارند 0.05
از مرز پایین هر طبقه کم کرده و 0.05 به مرز بالای آن اضافه می کنیم بدین ترتیب حدود واقعی طبقات محاسبه می شود.
مثال: داده های زیر مربوط به یک نمونه های 50 تایی از نوعی نخ کتان است جدول توزیع فراوانی را رسم کنید.
21.2, 27.3, 20.6, 25.4, 36.9, 28.3, 33.7, 29.5, 34.1, 24.6, 27.1, 29.4, 21.8, 27.5, 28.9, 24, 25, 21.9, 37.5, 29.6, 24.8, 32.7, 29.3, 33.5, 22.2, 28.1, 29.5, 17.3, 29.6, 22.7, 25.4 , 30.2, 29, 26.8, 31.3, 34.5, 23.9, 36.8, 28.7, 33.2, 23.6, 23, 29.2, 34.8, 37, 38.4, 26.4, 23.5, 18.6, 28.3

R=38.4-17.3=21.1 K=1+3.32*log50=6.64=7
C=21.1/7=3.01

فراوانی نسبی تجمعیG

فراوانی تجمعیG

فراوانی نسبیN

تعداد فراوانی مطلقF

صفات طبقات

2/50

2

2/50

2

17.3-20.3

9/50

9

7/50

7

20.4-23.4

19/50

19

10/50

10

23.5-26.5

36/50

36

17/50

17

26.6-29.6

39/50

39

3/50

3

29.7-32.7

45/50

45

6/50

6

32.8-35.8

1

50

5/50

n=5

35.9-39

پس از تهيه جدول توزيع فراواني مي توانيم نمودارهای آماری ار بااستفاده از آن رسم کنیم با استفاده از نمودارهای آماری می نوان اطلاعات نهفته شده در جدول فراوانی را با سهولت بیشتر به مخاطب عرضه نمود.

 

 

منابع :

1- تحلیل آماری چند متغیری کاربردی/جانسون، ویچرن؛ ترجمه : حسینعلی نیرومند. دانشگاه فردوسی
2-http://statisticslu.blogfa.com
3-http://learn-m-p-l.persianblog.i
4-http://daneshnameh.roshd.ir

Hits: 0

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *