آمار را باید علم و عمل استخراج، بسط، و توسعهٔ دانشهای تجربی انسانی با استفاده از روشهای گردآوری، تنظیم، پرورش، و تحلیل دادههای تجربی (حاصل از اندازه گیری و آزمایش) دانست. زمینههای محاسباتی و رایانهای جدیدتری همچون یادگیری ماشینی ، و کاوشهای ماشینی در دادهها، در واقع، امتداد و گسترش دانش گسترده و کهن آمار است به عهد محاسبات نو و دوران اعمال شیوههای ماشینی در همهجا.
مقدمه |
در صورتی که شاخهای علمی مد نظر نباشد، معنای آن،دادههایی بهشکل ارقام و اعداد واقعی یا تقریبی است که با استفاده از علم آمار میتوان با آنها رفتار کرد و عملیات ذکر شده در بالا را بر آنها انجام داد. بیشتر مردم با کلمة آمار به مفهومی که برای ثبت و نمایش اطلاعات عددی به کار میرود اشنا هستند . ولی این مفهوم منطبق با موضوع اصلی مورد بحث آمار نیست. آمار عمدتاً با وضعیتهابیی سر و کار دارد که در آنها وقوع یک پیشامد به طور حتمی قابل پیش بینی نیست. اسنتاجهای آماری غالباً غیر حتمی اند،زیرا مبتنی بر اطلاعات ناکاملی هستند. در طول چندین دهه آمار فقط با بیان اطلاعات و مقادیر عددی در باره اقتصاد،جمعیت شناسی و اوضاع سیاسی حاکم در یک کشور سر و کار داشت .حتی امروز بسیاری از نشریات و گزارشهای دولتی که تودهای از آمارو ارقم را در بردارند معنی اولیه کلمه آمار را در ذهن زنده میکنند .اکثر افراد معمولی هنوز این تصویر غلط را در باره آمار دارند که آن را منحصر به ستونهای عددی سرگیجه آور و گاهی یک سری شکلهای مبهوت کننده میدانند .بنابر این یادآوری این نکته ضروری است که نظریه و روشهای جدید آماری از حد ساختن جدولهای اعداد و نمودارها بسیار فراتر رفتهاند. آمار به عنوان یک موضوع علمی،امروزه شامل مفاهیم و روشهایی است که در تمام پژوهشهایی که مستلزم جمع آوری دادهها به وسیله یک فرایند آزمایش و مشاهده و انجام استنباط و نتیجه گیری به وسیله تجزیه و تحلیل این دادهها هستند اهمیت بسیار دارند.
علم آمار
علم آمار، خود مبتنی است بر نظریه آمار که شاخهای از ریاضیات کاربردی به حساب میآید. در نظریهٔ آمار، اتفاقات تصادفی و عدم قطعیت توسط نظریهٔ احتمالات مدلسازی میشوند. در این علم، مطالعه و قضاوت معقول در بارهٔ موضوعهای گوناگون، بر مبنای یک جمع انجام میشود و قضاوت در مورد یک فرد خاص، اصلاً مطرح نیست.
از جملهٔ مهمترین اهداف آمار، میتوان تولید «بهترین» اطّلاعات از دادههای موجود و سپس استخراج دانش از آن اطّلاعات را ذکر کرد. به همین سبب است که برخی از منابع، آمار را شاخهای از نظریه تصمیمها به شمار میآورند.
این علم به بخشهای آمار توصیفی و آمار استنباطی تقسیم میشود. از طرف دیگر میتوان آن را به دو بخش آمار کلاسیک و آمار بیز تقسیم بندی کرد. در آمار کلاسیک، که امروزه در دانشگاهها و دبیرستانها تدریس میگردد، ابتدا آزمایش و نتیجه را داریم و بعد بر اساس آنها فرضها را آزمون میکنیم. به عبارت دیگر ابتدا آزمایش انجام میشود و بعد فرض آزمون میگردد. در آمار بیزی ابتدا فرض در نظر گرفته میشود و دادهها با آن مطابقت داده میشوند به عبارت دیگر در آمار بیزی یک پیش توزیع داریم-توزیع پیشین- و بعد از مطالعه دادهها و برای رسیدن به آن تئزیع پیشین توزیع پسین را در نظر میگیریم.
عمل آماری
شامل برنامهریزی و جمعبندی و تفسیر مشاهدات غیر قطعی است بهشکلی که^ :
- اعداد نمایندهٔ واقعی مشاهدات بوده، غیر واقعی یا غلط نباشند.
- بهنحو مفیدی تهیه و تنظیم شوند.
- بهنحو صحیح تحلیل شوند.
- قابل نتیجهگیری صحیح باشند.
روشهای آماری
مطالعات تجربی و مشاهداتی هدف کلی برای یک پروژه تحقیقی آماری، بررسی حوادث اتفاقی بوده و به ویژه نتیجه گیری روی تأثیر تغییرات در ارزش شاخصها یا متغیرهای غیر وابسته روی یک پاسخ یا متغیر وابستهاست. دو شیوه اصلی از مطالعات آماری تصادفی وجود دارد: مطالعات تجربی و مطالعات مشاهداتی. در هر دو نوع از این مطالعات، اثر تغییرات در یک متغیر (یا متغیرهای) غیر وابسته روی رفتار متغیرهای وابسته مشاهده میشود. اختلاف بین این دو شیوه درچگونگی مطالعهای است که عملاً هدایت میشود. یک مطالعه تجربی در بردارنده روشهای اندازه گیری سیستم تحت مطالعهاست که سیستم را تغییر میدهد و سپس با استفاده از روش مشابه اندازه گیریهای اضافی انجام میدهد تا مشخص سازد که آیا تغییرات انجام شده، مقادیر شاخصها را تغییر میدهد یا خیر. در مقابل یک مطالعه نظری، مداخلات تجربی را در بر نمیگیرد. در عوض دادهها جمع آوری میشوند و روابط بین پیش بینیها و جواب بررسی میشوند.
یک نمونه از مطالعه تجربی، مطالعات Hawthorne مشهور است که تلاش کرد تا تغییرات در محیط کار را در کمپانی الکتریک غربی Howthorne بیازماید. محققان علاقه مند بودند که آیا افزایش نور میتواند کارایی را در کارگران خط تولید افزایش دهد. محققان ابتدا کارایی را در کارخانه اندازه گیری کردند و سپس میزان نور را در یک قسمت از کارخانه تغییر دادند تا مشاهده کنند که آیا تغییر در نور میتواند کارایی را تغییر دهد. به واسطه خطا در اقدامات تجربی، به ویژه فقدان یک گروه کنترل محققاتی در حالی که قادر نبودند آنچه را که طراحی کرده بودند، انجام دهند قادر شدند تا محیط را با شیوه Hawthorne آماده سازند. یک نمونه از مطالعه مشاهداتی، مطالعه ایست که رابطه بین سیگار کشیدن و سرطان ریه را بررسی میکند. این نوع از مطالعه به طور اختصاصی از شیوهای استفاده میکند تا مشاهدات مورد علاقه را جمع آوری کند و سپس تجزیه و تحلیل آماری انجام دهد. در این مورد، محققان مشاهدات افراد سیگاری و غیر سیگاری را جمع آوری میکنند و سپس به تعداد موارد سرطان ریه در هر دو گروه توجه میکنند.
احتمالات
در زبان محاوره، احتمال یکی از چندین واژهای است که برای دانسته یا پیشامدهای غیر مطمئن به کار میرود و کم و بیش با واژههایی مانند ریسک، خطرناک، نامطمئن، مشکوک و بسته به متن قابل معاوضهاست. شانس، بخت، امتیاز و شرط بندی از لغات دیگری است که نشان دهنده برداشتهای مشابهی است. همانگونه که نظریه مکانیک به تعاریف دقیق ریاضی از عبارات متداولی مثل کار و نیرو میپردازد، نظریه احتمالات نیز تلاش دارد تا مفاهیم و برداشتهای مربوط به احتمالات را کمّی سازی کند.
نرمافزارها
آمار مدرن برای انجام بعضی از محاسبات خیلی پیچیده و بزرگ به وسیله رایانهها استفاده میشود. کل شاخههای آمار با استفاده از محاسبات کامپیوتری انجامپذیر شدهاند، برای مثال شبکههای عصبی. انقلاب کامپیوتری با یک توجه نو به آمار «آزمایشی» و «شناختیک» رویکردهایی برای آینده آمار داشتهاست.
یکی از مهمترین کاربردهای آمار و احتمال با استفاده از رایانه شبیه سازی است .
شبیه سازی نسخهای از بعضی وسایل حقیقی یا موقعیتهای کاری است. شبیه سازی تلاش دارد تا بعضی جنبههای رفتاری یک سیستم فیزیکی یا انتزاعی را به وسیله رفتار سیستم دیگری نمایش دهد. شبیه سازی در بسیاری از متون شامل مدل سازی سیستمهای طبیعی و سیتمهای انسانی استفاده میشود. برای به دست آوردن بینش نسبت به کارکرد این سیستمها در تکنولوژی و مهندسی ایمنی که هدف، آزمون بعضی سناریوهای عملی در دنیای واقعی است از شبیه سازی استفاده میشود. در شبیه سازی با استفاده از یک شبیه ساز یا وسیله دیگری در یک موقعیت ساختگی میتوان آثار واقعی بعضی شرایط احتمالی را بازسازی کرد.
۱- شبیه سازی فیزیکی و متقابل (شبیه سازی فیزیکی، به شبیه سازی اطلاق میشود که در آن اشیای فیزیکی به جای شی واقعی جایگزین میشوند و این اجسام فیزیکی اغلب به این خاطر استفاده میشوند که کوچکتر و ارزان تر از شی یا سیستم حقیقی هستند. شبیه سازی متقابل (تعاملی) که شکل خاصی از شبیه سازی فیزیکی است و غالباً به انسان در شبیه سازیهای حلقهای اطلاق میشود یعنی شبیه سازیهای فیزیکی که شامل انسان میشوند مثل مدل استفاده شده در شبیه ساز پرواز.)
۲- شبیه سازی در آموزش (شبیه سازی اغلب در آموزش پرسنل شهری و نظامی استفاده میشود. معمولاً هنگامی رخ میدهد که استفاده از تجهیزات در دنیای واقعی از لحاظ هزینه کمرشکن یا بسیار خطرناک است تا بتوان به کارآموزان اجازه استفاده از آنها را داده. در چنین موقعیتهایی کارآموزان وقت خود را با آموزش دروس ارزشمند در یک محیط واقعی «ایمن» میگذرانند. غالباً این اطمینان وجود دارد تا اجازه خطا را به کارآموزان در طی آموزش داد تا ارزیابی سیستم ایمنی– بحران صورت گیرد.)
شبیه سازیهای آموزشی به طور خاص در یکی از چهار گروه زیر قرار میگیرند :
الف – شبیه سازی زنده (جایی که افراد واقعی از تجهیزات شبیه سازی شده (یا آدمک) در دنیای واقعی استفاده میکنند.)
ب – شبیه سازی مجازی (جایی که افراد واقعی از تجهیزات شبیه سازی شده در دنیای شبیه سازی شده (یا محیط واقعی) استفاده میکنند.) یا
ج – شبیه سازی ساختاری (جایی که افراد شبیه سازی شده از تجهیزات شبیه سازی شده در یک محیط شبیه سازی شده استفاده میکنند. اغلب به عنوان بازی جنگی نامیده میشود زیرا که شباهتهایی با بازیهای جنگی رومیزی دارد که در آنها بازیکنان، سربازان و تجهیزات را اطراف یک میز هدایت میکنند .)
د – شبیه سازی ایفای نقش (جایی که افراد واقعی نقش یک کار واقعی را بازی میکنند.)
۳ – شبیه سازیهای پزشکی (شبیه سازهای پزشکی به طور فزایندهای در حال توسعه و کاربرد هستند تا روشهای درمانی و تشخیص و همچنین اصول پزشکی و تصمیم گیری به پرسنل بهداشتی آموزش داده شود. طیف شبیه سازها برای آموزش روشها از پایه مثل خونگیری تا جراحی لاپاراسکوپی و مراقبت از بیمار دچار ضربه، وسیع و گستردهاست. بسیاری از شبیه سازهای پزشکی دارای یک رایانه هستند که به یک ماکت پلاستیکی با آناتومی مشابه واقعی متصل است. در بعضی از آنها، ترسیمهای کامپیوتری تمام اجزای قابل رؤیت را به دست میدهد و با دستکاری در دستگاه میتوان جنبههای شبیه سازی شده کار را تولید کرد. بعضی از این دستگاهها دارای شبیه سازهای گرافیکی رایانهای برای تصویربرداری هستند مانند پرتو ایکس یا سایر تصاویر پزشکی. بعضی از شبیه سازهای بیمار، دارای یک مانکن انسان نما هستند که به داروهای تزریق شده واکنش میدهد و میتوان آن را برای خلق صحنههای مشابه فوریتهای پزشکی خطرناک برنامه ریزی کرد. بعضی از شبیه سازهای پزشکی از طریق شبکه اینترنت قابل گسترش هستند و با استفاده از جستجوگرهای استاندارد شبکه به تغییرات جواب میدهند. در حال حاضر، شبیه سازیها به موارد غربال گری پایه محدود شدهاند به نحوی که استفاده کنندگان از طریق وسایل امتیازدهی استاندارد با شبیه سازی در ارتباط هستند.)
۴ – شبیه سازهای پرواز (یک شبیه ساز پرواز برای آموزش خلبانان روی زمین مورد استفاده قرار میگیرد. به خلبان اجازه داده میشود تا به هواپیمای شبیه سازی شده اش آسیب برساند بدون آن که خود دچار آسیب شود. شبیه سازهای پرواز اغلب برای آموزش خلبانان استفاه میشوند تا هواپیما را در موقعیتهای بسیار خطرناک مثل زمین نشستن بدون داشتن موتور یا نقص کامل الکتریکی یا هیدرولیکی هدایت کنند. پیشرفتهترین شبیه سازها دارای سیستم بصری با کیفیت بالا و سیستم حرکت هیدرولیک هستند. کار با شبیه ساز به طور معمول نسبت به هواپیمای واقعی ارزان تر است.)
۵ – شبیه سازی و بازیها(هم چنین بسیاری از بازیهای ویدئویی شبیه ساز هستند که به طور ارزان تر آماده سازی شدهاند. بعضی اوقات از اینها به عنوان بازیهای شبیه سازی (sim) نامبرده میشود. چنین بازیهایی جنبههای گوناگون واقعی را شبیه سازی میکنند از اقتصاد گرفته تا وسایل هوانوردی مثل شبیه سازهای پرواز.)
۶ – شبیه سازی مهندسی (شبیه سازی یک مشخصه مهم در سیستمهای مهندسی است. برای مثال در مهندسی برق، از خطوط تأخیری استفاده میشود تا تأخیر تشدید شده و شیفت فاز ناشی از خط انتقال واقعی را شبیه سازی کنند. مشابهاً، از بارهای ظاهری میتوان برای شبیه سازی مقاومت بدون شبیه سازی تشدید استفاده کرد و از این حالت در مواقعی استفاده میشود که تشدید ناخواسته باشد. یک شبیه ساز ممکن است تنها چند تا از کارکردهای واحد را شبیه سازی کند که در مقابل با عملی است که تقلید نامیده میشود. ۷ – اغلب شبیه سازیهای مهندسی مستلزم مدل سازی ریاضی و بررسیهای کامپیوتری هستند. به هر حال موارد زیادی وجود دارد که مدل سازی ریاضی قابل اعتماد نیست. شبیه سازی مشکلات مکانیک سیالات اغلب مستلزم شبیه سازیهای ریاضی و فیزیکی است. در این موارد، مدلهای فیزیکی نیاز به شبیه سازی دینامیک دارند.)
۸ – شبیه سازی کامپیوتری (شبیه سازی رایانه، جزو مفیدی برای بسیاری از سیستمهای طبیعی در فیزیک، شیمی و زیستشناسی و نیز برای سیستمهای انسانی در اقتصاد و علوم اجتماعی (جامعهشناسی کامپیوتری) و همچنین در مهندسی برای به دست آوردن بینش نسبت به عمل این سیستمها شدهاست. یک نمونه خوب از سودمندی استفاده از رایانهها در شبیه سازی را میتوان در حیطه شبیه سازی ترافیک شبکه جستجو کرد. در چنین شبیه سازیهایی رفتار مدل هر شبیه سازی را مطابق با مجموعه پارامترهای اولیه منظور شده برای محیط تغییر خواهد داد.شبیه سازیهای کامپیوتری] اغلب به این منظور به کار گرفته میشوند تا انسان از شبیه سازیهای حلقهای در امان باشد. به طور سنتی، مدل برداری رسمی سیستمها از طریق یک مدل ریاضی بودهاست به نحوی که تلاش در جهت یافتن راه حل تحلیلی برای مشکلات بودهاست که پیش بینی رفتار سیستم را با استفاده از یک سری پارامترها و شرایط اولیه ممکن ساختهاست. شبیه سازی کامپیوتری اغلب به عنوان یک ضمیمه یا جانشین برای سیستمهای مدل سازی است که در آنها راه حلهای تحلیلی بسته ساده ممکن نیست. انواع مختلفی از شبیه سازی کامپیوتری وجود دارد که وجه مشترک همه آنها در این است که تلاش میکند تا یک نمونه از برنامهای برای یک مدل تولید کنند که در آن امکان محاسبه کامل تمام حالات ممکن مدل مشکل یا غیر ممکن است.)
به طور رو به افزونی معمول شدهاست که نام انواع مختلفی از شبیه سازی شنیده میشود که به عنوان «محیطهای صناعی» اطلاق میشوند. این عنوان اتخاذ شدهاست تا تعریف شبیه سازی عملاً به تمام دستاوردهای حاصل از رایانه تعمیم داده شود.
۹ – شبیه سازی در علم رایانه (در برنامه نویسی کامپیوتری، یک شبیه ساز اغلب برای اجرای برنامهای مورد استفاده قرار میگیرد که انجام آن برای رایانه با مقداری دشواری همراه است. برای مثال، شبیه سازها معمولاً برای رفع عیب یک ریزبرنامه استفاده میشوند. از آن جایی که کار کامپیوتر شبیه سازی شدهاست، تمام اطلاعات در مورد کار رایانه مستقیماً در دسترس برنامه دهندهاست و سرعت و اجرای شبیه سازی را میتوان تغییر داد. همچنین شبیه سازها برای تفسیر درختهای عیب یا تست کردن طراحیهای منطقی VLSI قبل از ساخت مورد استفاده قرار میگیرند. در علم رایانه نظریه، عبارت شبیه سازی نشان دهنده یک رابطه بین سیستمهای انتقال وضعیت است که این در مطالعه مفاهیم اجرایی سودمند است.)
۱۰ – شبیه سازی در تعلیم و تربیت (شبیه سازیها در تعلیم و تربیت گاهی مثل شبیه سازیهای آموزشی هستند. آنها روی وظایف خاص متمرکز میشوند. در گذشته از ویدئو برای معلمین و دانش آموزان استفاده میشود تا مشاهده کنند، مسائل را حل کنند و نقش بازی کنند؛ هرچند، یک استفاده جدید تر از شبیه سازیها در تعلیم و تربیت شامل فیلمهای انیمیشن است (ANV .(ANVها نوعی فیلم ویدئویی کارتون مانند با داستانهای تخیلی یا واقعی هستند که برای آموزش و یادگیری کلاس استفاده میشوند.ANVها برای ارزیابی آگاهی، مهارتهای حل مسئله و نظم بچهها و معلمین قبل و حین اشتغال کارایی دارند.)
شکل دیگری از شبیه سازی در سالهای اخیر با اقبال در آموزش بازرگانی مواجه شدهاست. شبیه سازی بازرگانی که دارای یک مدل پویا است که آزمون استراتژیهای بازرگانی را در محیط فاقد خطر مهیا میسازد و محیط مساعدی برای مباحث مطالعه موارد ارائه میدهد.
واژگانی که درک مفهوم آنها در علم آمار مهم است عبارتاند از^ :
- جمعیت
- نمونه
- متغیّر
- مقیاسهای اندازهگیری:
- مقیاس اسمی
- مقیاس ترتیبی
- مقیاس فاصلهای
- مقیاس نسبتی
آمار رشته وسیعی از ریاضی است که راههای جمع آوری، خلاصه سازی و نتیجه گیری از دادهها را مطالعه میکند. این علم برای طیف وسیعی از علوم دانشگاهی از فیزیک و علوم اجتماعی گرفته تا انسانشناسی و همچنین تجارت، حکومت داری و صنعت کاربرد دارد.
هنگامی که دادهها جمع آوری شدند چه از طریق یک روش نمونه برداری خاص یا به وسیله ثبت پاسخها در قبال رفتارها در یک مجموعه آزمایشی (طرح آزمایش) یا به وسیله مشاهده مکرر یک فرایند در طی زمان (سریهای زمانی) خلاصههای گرافیکی یا عددی را میتوان با استفاده از آمار توصیفی به دست آورد.
الگوهای موجه در دادهها سازمان بندی میشوند تا نتیجه گیری در مورد جمعیتهای بزرگتر به دست آید که این کار با استفاده از آمار استنباطی صورت میگیرد و تصادفی بودن و عدم قاطعیت در مشاهدات را شناسایی میکند. این استنباطها ممکن است به شکل جوابهای بله یا خیر به سؤالات باشد (آزمون فرض)، خصوصیات عددی را برآورد کند(تخمین)، پیش گویی مشاهدات آتی باشد، توصیف ارتباطها باشد (همبستگی) و یا مدل سازی روابط باشد (رگرسیون).
شبکه توصیف شده در بالا گاهی اوقات به عنوان آمار کاربردی اطلاق میشود. در مقابل، آمار ریاضی (یا ساده تر نظریه آماری) زیر رشتهای از ریاضی کاربردی است که از نظریه احتمال و آنالیز برای به کارگیری آمار برروی یک پایه نظریه محکم استفاده میکند.
مراحل پایه برای انجام یک تجربه عبارتاند از :
برنامه ریزی تحقیق شامل تعیین منابع اطلاعاتی، انتخاب موضوع تحقیق و ملاحظات اخلاقی برای تحقیق و روش پیشنهادی. طراحی آزمون شامل تمرکز روی مدل سیستم و تقابل متغیرهای مستقل و وابسته. خلاصه سازی از نتایج مشاهدات برای جامعیت بخشیدن به آنها با حذف نتایج (آمار توصیفی). رسیدن به اجماع در مورد آنچه مشاهدات درباره دنیایی که مشاهده میکنیم به ما میگویند (استنباط آماری). ثبت و ارائه نتایج مطالعه.
سطوح اندازه گیری
چهار نوع اندازه گیری یا مقیاس اندازه گیری در آمار استفاده میشود. چــهار نوع یا سطح اندازه گیری (ترتیبی، اسمی، بازهای و نسبی) دارای درجات متفاوتی از سودمندی در بررسیهای آماری دارند. اندازه گیری نسبی در حالی که هم یک مقدار صفر و فاصله بین اندازههای متفاوت تعریف میشود بیشترین انعطاف پذیری را در بین روشهای آماری دارد که میتواند برای تحلیل دادهها استفاده شود. مقیاس تناوبی با داشتن فواصل معنی دار بین اندازهها اما بدون داشتن میزان صفر معنی دار (مثل اندازهگیری بهره هوشی یا اندازهگیری دما در مقیاس سلسیوس) در تحقیقات آماری استفاده میشود. صفت آماری – هر ویژگی مربوط به هر واحد جامعه را یک صفت آماری یا به اختصار یک صفت برای آن واحد آماری است. اگر یک واحد آماری یک انسان باشد، گروه خون، وزن، میزان سواد، میزان درآمد، درجه حرارت بدن و تعدادخانوار هر کدام یک صفت آماری برای آن واحد است.
صفتهای آماری دو دسته کلی هستند.
۱- صفت مشخصه
۲ صفت متغیر
Hits: 0