آمار و کاربرد آن در مدیریت
Download
Report
Transcript آمار و کاربرد آن در مدیریت
نام منبع درس :آمار و کاربرد آن در مدیریت ( جلد 1و ) 2
مؤلف :عادل آذر -منصور مؤمنی
تهیه کننده اسالیدها :حسن الوداری
این درس یکی از دروس اصلی رشته مدیریت بوده و
هدف آن آشناسازی دانشجویان با علم آمار و نحوه
بکارگیری آن در دانش مدیریت است
برای این درس ،کلیه فصل های هشتگانه جلد اول
و فصل 18جلد دوم کتاب به استثناء برخی
حذفیات در نظر گرفته شده است
آشنایی با مفاهیم پایه ای علم آمار و ضرورت
بکارگیری فنون و تکنیک های آن در دانش مدیریت
به منظور اداره بهتر سازمان ها
روش علمی است که برای جمع آوری ،تلخیص ،
تجزیه و تحلیل ،تفسیر و بطور کلی برای مطالعه و
بررس ی مشاهدات بکار گرفته می شود
-1برای تبدیل داده ها به اطالعات
-2برای بررس ی صحت و سقم فرضیات
-3برای تعیین اعتبار و پایایی تحقیقات
جامعه بزرگترین مجموعه از موجودات است که در
یک زمان معین ،مطلوب ما قرار می گیرند مثل
جامعه فرهنگیان ایران و . . .
تعدادی از عناصر مطلوب مورد نظر که حداقل
دارای یک صفت مشخصه باشند
صفتی است که بین همه عناصر جامعه آماری
مشترک و متمایز کننده جامعه آماری از سایر
جوامع باشد
-1محدود :یعنی جامـعه مقادیر از تعـداد محدود و
ثابتی تشکیل شده و پایان پذیر باشد
-2نا محدود :یعنی جامعه از یک ردیف بی انتهایی از
مقادیر تشکیل شده باشد
نمونه عبارتست از تعداد محدودی از آحاد جامعه
آماری که بیان کننده ویژگی های اصلی جامعه
باشد
-1پارامتر :شاخـص هایی که از طریق سرشـماری (
انـدازه گیری تمامی عناصـر جامعه آماری ) بدست
می آیند
-2آماره :شاخـص هایی که از طریق نمـونه گیری (
اندازه گیری بخش ی از جامعه ) بدست می آیند
آزمون هایی که مشروط به مفروضات آمار
کالسیک نیستند و کاربرد اصلی آنها در بررس ی
جوامع آماری غیر نرمال ،جوامع با داده های کیفی
و نمونه های کوچک آماری می باشد
-1آمار توصیفی
-2آمار استنباطی
-3آمار ناپارامتریک
یعنی محاسبه مقادیر و شاخص های جامعه آماری
با استفاده از سرشماری تمامی عناصر آن ،بعبارتی
توصیف کل جامعه از طریق محاسبه پارامترها
آماری که در آن محقق ابتدا آماره ها را محاسبه و
سپس به کمک تخمین و آزمون فرض آماری ،آنها را
به پارامترهای جامعه تعمیم می دهد
این نوع آمار در مقابل آمار پارامتریک یعنی آمارهای
توصیفی و استنباطی دارای توزیع نرمال قرار می
گیرد و برای مشاهدات فاقد توزیع آماری کاربرد
دارد
-1مشخص کردن هدف
-2جمع آوری داده ها
-3تجزیه و تحلیل داده ها
-4بیان یافته ها
-1فرضیه های تحقیق
-2متغیرهایی که برای آزمودن آنها بکار گرفته می
شوند
متغیرها ،فرضیه ها را بصورتی نشان می دهند که
محققان رفتاری و مدیریتی بتوانند آنها ( فرضیه ها
) را مشاهده و اندازه گیری نمایند
-1متغیر خصیصه
-2متغیر مستقل
-3متغیر وابسته
-4متغیر تعدیل کننده ( واسطه ای )
-5متغیر کنترل
متغیری که مقدار آن از یک فرد به فرد دیگر و یا از
یک عضو به عضو دیگر جامعه آماری ممکن است
تغییر کند .مثل اندازه سازمان
به علت احتمالی یا فرض ی متغیر وابسته ،متغیر
مستقل یا متغیر درونداد و به عبارتی محرک گفته
می شود
به متغیری که به تبع تغییر متغیر مستقل ،مقدارش
کم و زیاد می شود متغیر وابسته ،متغیر پاسخ و یا
برونداد اطالق می شود
یک متغیر ثانوی است که رابطه بین متغیر مستقل و
متغیر وابسته را تحت تأثیر قرار می دهد
به متغیرهایی که در موقع انجام پژوهش ،الزم
است تأثیر آنها خنثی شده و یا از بین برود ،
متغیرهای کنترل می گویند
موقع انجام تحقیق ،پژوهشگر سعی می کند
تأثیرات متغیر کنترل را از بین ببرد ولی تأثیرات متغیر
تعدیل کننده را مورد بررس ی قرار می دهد
) Nominal scale (
مقیاس اسمی-1
) Rank scale (
مقیاس ترتیبی-2
) Interval scale (
) Ratio scale (
مقیاس فاصله ای-3
مقیاس نسبی-4
ً
محققان از این مقیاس ،صرفا برای طبقه بندی
اشیاء ،اشخاص و یا خصوصیات استفاده می
کنند ،مثل استفاده از یک سری اعداد یا سمبول
ها برای نام گذاری سبک های رهبری
اگر بین اسامی ایجاد شده یا طبقات حاصله ناش ی
از مقیاس بندی اسمی یک نوع رابطه هم وجود
داشته باشد پژوهشگران از مقیاس ترتیبی استفاده
می نمایند
اگر در مقیاس ترتیبی ،فاصله بین اعداد یا طبقات
از یک نظم خاص ی پیروی نماید ( فواصل یکسان
باشند) محققان از مقیاس فاصله ای برای اندازه
گیری متغیرها استفاده می نمایند
مقیاس ی است که عالوه بر داشتن همه خصوصیات
مقیاس فاصله ای ،دارای نقطه صفر واقعی نیز
هست ،مثل پوند و گرم
مرات
ترتیب
نوع ب
مقیاس
اسمی
ندارد
فواصل
مبدأ صفر مبدأ صفر
قراردادی
مطلق
ندارد
ندارد
ندارد
رتبه ای
دارد
ندارد
ندارد
ندارد
فاصله ای
دارد
دارد
دارد
ندارد
نسبتی
دارد
دارد
دارد
دارد
فرضیه حدس ی است زیرکانه در مورد رابطه بین دو
یا چند متغیر که بصورت دقیق و روشن بیان شده
و پس از آزمایش ،صحت یا سقم آن مشخص می
شود
-1واضح و بدون ابهام
-2بیان در قالب جمالت خبری
-3قابل تبیین ( علت یابی )
-4توضیح دهنده رابطه مورد انتظار بین متغیرها
-5قابل آزمون بودن ( آزمون پذیری )
-1توصیفی
-6همبستگی
-2استنباطی
-7تجربی
-3تک متغیره
-8با گروه های جور شده
-4دو متغیره
-9با گروه های مستقل
-5چند متغیره
-10پارامتریک
-11ناپارامتریک
فرضیه ای است که در مورد کل جامعه آماری
تدوین شده بعبارتی ادعایی را در مورد کل جامعه
آماری بیان می نماید
به فرضیه ای اطالق می شود که در مورد یک
نمونه انتخابی از کل جامعه آماری تدوین شود و
صحت و سقم آن تحت تأثیر خطای نمونه گیری
باشد
فرضیه هایی که به ظاهر دارای دو متغیر بوده
(مستقل و وابسته) ولی فرضیه مستقل آن خودش
از چند متغیر دیگر تشکیل شده است
به فرضیه ای گفته می شود که پژوهشگر هیچ
کنترلی بر روی متغیرهای مستقل و وابسته آن ندارد
ً
،چرا که اتفاق قبال رخ داده و دیگر قابل دستکاری
نمی باشد
فرضیه ای است که محقق در آن بر روی هر دو
متغیر کنترل دارد یعنی پدیده هنوز روی نداده و
پژوهشگر می تواند متغیر مستقل را دستکاری نماید
در این نوع فرضیه سازی ،پژوهشگران یک گروه
نمونه دارند که در آن هر آزمون شونده را از لحاظ
یک متغیر واحد دو بار اندازه گیری می کنند
در این حالت ،محقق برای آزمون ،دو گروه دارد
که هر کدام از آنها را از لحاظ یک متغیر واحد
مشابه یک بار بطور جداگانه اندازه گیری می نماید
فرضیه هایی هستند که در آنها از متغیرهای نسبی یا
فاصله ای استفاده شده و توزیع جامعه (و یا
نمونه ) نرمال می باشد
فرضیه هایی هستند که متغیرهای موجود در آنها
دارای مقیاس اسمی یا رتبه ای می باشند یا این که
بر اساس شواهد موجود ،محققان نمی توانند
فرض نرمال بودن جامعه ( نمونه ) را بپذیرند
هدف این فصل آشناسازی دانشجویان با
پارامترهای مرکزی و پراکندگی در جوامع کوچک (
) N≥20می باشد
اعدادی هستند که به منظور بیان کمی توزیع
اندازه ها از آن استفاده می شود .این شاخص ها
توصیف کننده مجموعه داده ها می باشند
به هر معیار عددی که معرف مرکز مجموعه داده
ها باشد ،پارامتر مرکزی اطالق می شود یعنی همان
مقدار نماینده ای که مشاهدات در اطراف آن
توزیع شده اند
-1میـانگین ؛ شامـل میانـگین حسـابی ،میانگین
پیراسـته ،میانگین هندسـی ،میانگین هارمـونیـک
-2مد ( نما )
-3چارکها ؛ شامل چارک اول ،چارک دوم ،چارک
سوم
به نقطه تعادل یا مرکز ثقل توزیع ،در داده هایی
که بصورت منظم بر روی یک محور ردیف شده
باشند ،میانگین ( ) Meanاطالق می شود
این میانگین از تقسیم مجموع مشاهدات بر تعداد
آنها بدست می آید
n
فرمول
i
X
i 1
N
x
اگر هر یک از مشاهدات دارای تکرار باشند ،در این
صورت تعداد تکرارها بعنوان وزن مشاهدات تلقی
شده و آنها را با w iنشان می دهند
k
W X
i
w
i1
k
W
i1
i
W
i
N
i
X
i
از این میانگین زمانی استفاده می شود که در توزیع
مشاهدات ،تعداد اندکی از آنها ،با بقیه داده ها
همخوانی و تجانس نداشته باشد
-1مرتب کردن صعودی داده ها
-2حذف تمام مشاهدات کوچکتر از % LNپایین و
بزرگتر از %LNباال
-3محاسبه میانگین برای باقیمانده مشاهدات
در این میانگین بجای حذف کامل %LNها ،
مقادیر باال و پایین آن بجای مقادیر حذف شده
مورد استفاده قرار می گیرند و از تعداد داده ها
کاسته نمی شود
از این میانگین برای محاسبه اندازه های نسبی
همانند نسبت ها ،در صدها ،شاخص ها و نرخ
های رشد استفاده می شود
میانگین هندس ی یک رشته عدد همانند . . ، X ، X
X ، .برابر است با ریشه Nام حاصلضرب آن
1اعداد
N
) G ( X 1 X 2 ... X N
1
N
2
اگر داده ها در میانگین هندس ی دارای وزن باشند ،
از این نوع میانگین استفاده می شود
1
فرمول
wK ) N
K
X
w 2 ...
2
X
w1
1
X
(
G
از این نوع ،برای محاسبه میانگین مشاهداتی
استفاده می شود که از مقیاس های ترکیبی همانند
« کیلو در ساعت » یا « دور در ثانیه » برخوردار
هستند
این میانگین برای چند اندازه یا مقدار برابر است با
عکس میانگین حسابی معکوس آن اندازه ها
فرمول
N
1
i
x
N
i 1
N
1
N
x
1
...
2
x
1
1
x
H
در صورت تکرار داده ها ( وزن داشتن آنها ) از
فرمول زیر استفاده می شود :
N
k
i
w
x
i
i1
wi
k
k
w
...
x
2
2
w
x
1
w
x
1
H
به مقداری گفته می شود که در میان سایر مقادیر
توزیع ،بیشترین تکرار را داشته باشد ،مد را با
Moنشان می دهند
اگر جامعه آماری به چهار قسمت مساوی تقسیم
شود ،به هر یک از قسمت ها یک چارک گفته می
شود و آنها را با Qنشان می دهند
: Q 1مقداری که %25مشاهدات ،پایین تر از آن است
:Q 2مقداری که %50مشاهدات ،پایین تر از آن است
:Q 3مقداری که %75مشاهدات ،پایین تر از آن است
-1مرتب نمودن صعودی داده ها
-2کد گذاری کردن آنها از 1تا N
-3پیدا نمودن محل چارک مورد نظر
-4تعیین نمودن مقدار چارک مورد نظر به کمک
محل چارک
1
2
aN
4
a
CQ
چارک مورد نظر 1و2وa= 3
تعداد مشاهدات =N
شاخص هایی هستند که متوسط میزان دوری و
نزدیکی داده های توزیع را نسبت به میانگین شان
نشان می دهند
-1کمک به توصیف واقعی تر یک سری از داده ها
-2کمک به قابلیت مقایسه دو یا چند سری از داده
ها
-1دامنه تغییرات
-5انحراف معیار
-2دامنه میان چارکی
-6نیمه واریانس
-3انحراف متوسط از میانگین
-4واریانس
-7ضریب پراکندگی
ساده ترین شاخص پراکندگی است و با کم کردن
کوچکترین مشاهده از بزرگترین آنها در یک سری
توزیع بدست می آید
فرمول
Xi
MIN
Xi
MAX
R
این شاخص ،پراکندگی داده ها را در فاصله چارک
اول و چارک سوم نشان می دهد و کاری به مقادیر
کوچکتر از Qو بزرگتر Qندارد
1
3
برای محاسبه این شاخص ،کافیست که مقادیرQ
و
3
1
Q
را بدست آورده و از هم کم کنیم .
1
Q
3
Q
IQR
برای بدست آوردن این شاخص ،که به انحراف
چارکی نیز معروف است ،کافیست ،مقدار دامنه
میان چارکی را بر عدد 2تقسیم نماییم
1
Q
2
3
Q
SIQR
-1استفاده از میانه بعنوان بهترین شاخص مرکزی
-2استفاده از انحراف چارکی بعنوان بهترین شاخص
پراکندگی
این شاخـص از تقسیم مجموع قدر مطلـق انحـرافات
تک تک مشاهدات از میانگین شان بر تعداد
مشاهدات بدست
X
X
N
i
D
A
A D
محاسن :در نظر گرفتن تغییرات کل داده ها
معایب -1 :نشان ندادن تأثیر انحرافات بزرگ
-2بی بهره بودن از بعض ی از خواص مطلوب
میانگین حسابی
در این شاخص پراکندگی ،بر خالف شاخص انحراف
متوسط از میانگین بجای قدر مطلق از مجذور (توان
)2انحرافات استفاده می شود
فرمول
) ( X i x
N
2
2
X
این شاخص به منظور برطرف کردن عیوب
شاخص های قبلی است یعنی همان نشان ندادن
و افزایش دادن
توسطA
تأثیر انحراف بزرگ D
تأثیر این انحراف توسط
2
X
X
و یا
X
(
2
X
X i x )
N
2
-1اگر تمام مشاهدات با عدد ثابت b
واریانس جدید تغییر نمی کند
جمع شوند ،
-2اگر تمام مشاهدات ،به عدد ثابت bضرب
شوند ،واریانسbجدید برابر افزایش می یابد
2
2
k
) ( X i x
یعنی متوسط مجذور مقادیر نامطلوب
i 1
K
=S.V
تعداد مشاهدات جامعه =N
تعداد مقادیر نامطلوب =K
میانگین کل مشاهدات =
X
در داده های مربوط به سود و در آمد مقادیر
کوچک تر از میانگین و در داده های مربوط به زیان
و هزینه مقادیر بزرگتر از میانگین ،نامطلوب
قلمداد می شوند
ضریب پراکندگی یکی از معیارهای پراکندگی نسبی
ل
شود
می
بیان
یر
فرمو
با
که
است
ز
C V
X
X
انحراف معیار مشاهدات =
X
میانگین مشاهدات =
X
برای مقایسه دو جامعه در مواردی که :
-1مقیاس ها یکسان نیستند
-2مقیاس یکسان ولی تفاوت زیادی در بزرگی
مشاهدات وجود دارد
-3واریانسهای جوامع یکسان ولی میانگین هایشان
متفاوت است
هدف این فصل آشنایی دانشجویان با طبقه بندی
و سازماندهی مشاهدات و استفاده از نمودارهای
مختلف برای توصیف داده هاست
یعنی جدول مرتب و خالصه شده از داده ها و
مشاهدات که تکرار وقوع هر داده ها در آن
مشخص شده است
-1مرتب کردن داده ها و محاسبه دامنه تغییرات ( ) R
-2مشخص کردن تعداد طبقات ( ) K
-3محاسبه نمودن فاصله طبقات ( ) I
-4سازماندهی طبقات
-1فرمول تجربی استورجس
K 1 3 / 32 LogN
-2روش تقریبی
( Nتعداد مشاهدات می باشد )
N
K
فاصله طبقات از تقسیم مقدار ( Rدامنه تغییرات
) بر مقدار محـاسبه شـده برای تعـداد طـبقـات ( ) K
به شکل زیر بدست می آید
R
K
I
پس از مشخص شدن Kو Iسازماندهی یعنی
تعیین نوع جدول و شیوه طبقه بندی داده ها
شروع می شود که این بستگی به نوع داده های
جمع آوری شده دارد
-1طبقه بندی پیوسته :برای داده های اعشاری ،یعنی
مساوی بودن طول ،عرض و فاصله طبقات
-2طبقه بندی گسسته :برای داده های غیر اعشاری ،
یعنی برابر نبودن طول و عرض طبقات
-1تقریب 1/0
-2تقریب 5/0
-3تقریب ( 1واحد )
تقریب ،اختالف طول و عرض طبقات یا فاصله
بین حد باالی یک طبقه با حد پایین طبقه بعدی
است .
تعریف مشاهدات گسسته بصورت فاصله طبقات
بی معناست لذا برای تشکیل توزیع فراوانی آنها
کافیست یک ستون برای مشاهدات و ستون دیگری
برای فراوانی آنها تنظیم شود
چنانچه در جدول طبقه بندی داده ها بجای
نسبی ( ) استفاده
مطلق ( ) از فراوانی f
فراوانی F
شود ،به آن توزیع فراوانی نسبی گویند
i
i
i
F
N
فراوانی مطلق آن طبقه
i
f
= فراوانی
نسبی هر طبقه
تعداد کل مشاهدات (فراوانی ها)
به کمک این فراوانی می توان در صد تراکم داده ها
را در هر طبقه مشخص نمود بعبارتی از fجهت
یافتن محل تمرکز داده ها استفاده می شود
i
(حد باال +حد پایین ) طبقه مورد نظر
= متوسط یا
نماینده هر طبقه
2
اگر در جدول طبقه داده ها ،بجای فراوانی های
مطلق و نسبی از فراوانی تجمعی استفاده شود ،به
جدول بدست آمده ،توزیع فراوانی تجمعی گویند
فـراوانی تجـمعی هر طـبقه ،عـبارتست از مجموع
فراوانی های مطلق از اولین طبقه تا طبقه مورد
FCنشان می دهند
نظر که آن را با
i
i
i
F
i 1
i
Fc
این فراوانی از تقسیم فراوانی تجمعی هر طبقه بر
تعداد مشاهدات بدست می آید
یعنی
i
Fc
N
i
fc
این فراوانی بیانگر در صد داده ها و مشاهدات
واقع شده بین حد پایین اولین طبقه تا حد باالی
طبقه مورد نظر است
استفاده از نمودارها در گزارش نویس ی باعث می
شود که خوانندگان با صرف کمترین زمان و با
ساده ترین بیان ،گزارش را بفهمند و تصویری
روشن از توزیع داشته باشند
-1نمودارهای کمی :مخصوص داده هایی با مقیاس
فاصله ای و نسبی
-2نمودارهای وصفی :مخصوص داده هایی با مقیاس
اسمی و یا رتبه ای
-1بافت نگار (هیستوگرام)
-4تحلیل اکتشافی داده
ها
-2چند ضلعی (پلی گون)
4-1نمودار
شاخه و برگ
-3فراوانی تجمعی ( ُاجایو)
جعبه ای
3-1پلی گون فراوانی تجمعی
4-2نمودار
بافت نگار نموداریست در دستگاه مختصات که
محور افقی آن با حدود واقعی طبقات و محور
عمودی آن با فراوانی مطلق یا نسبی درجه بندی
می شود
پس از مدرج کردن محورها بر روی حدود واقعی
(کرانه های هر طبقه) مستطیلی عمودی رسم می
شود که مساحت آن مساوی با فراوانی نسبی آن
طبقه می باشد
نموداریست که متناظر با هر نماینده طبقه در
محور افقی و فراوانی آن در محور عمودی ،یک
نقطه در صفحه مختصات ایجاد و به هم وصل می
شوند
برای ترسیم این نمودار ،از نماینده طبقات در
محور افقی و فراوانی تجمعی در محور عمودی
استفاده می شود ،سپس نقاط ایجاد شده به
ترتیب به هم وصل می شوند
تنها فرق این نمودار با نمودار پلی گون فراوانی
تجمعی در این است که در این نمودار بجای
نماینده طبقات از حد باالی کرانه ها استفاده می
شود
-1برای محاسبه چندکها (چارکها ،دهکها ،
صدکها)
-2برای مقایسه پدیده ها (مثل میزان رشد تورم در
کشورها)
در بر گیرنده نمودار های جدیدی است که در
مراحل اولیه تحلیل داده ها مفید هستند و
اطالعات بیشتری را در مورد تک تک داده ها به
معرض نمایش می گذارند
برای تهیه این نمودار ،ارقام مشاهدات به دو بخش
شاخه و برگ تقسیم می شوند ،شاخه شامل یک
یا چند رقم اولیه و برگ شامل ارقام باقی مانده
در این نمودار بر خالف بافت نگار ،اعداد اصلی از
بین نمی روند و محاسبه چندکها هم با استفاده از
آن براحتی امکان پذیر است
این نمودار نشان دهنده چارکها و حداقل و حداکثر
مشاهدات است و برای مقایسه دو یا چند جامعه
آماری مورد استفاده قرار می گیرد
الف – پیدا کردن حداقل و حداکثر داده ها
ب – پیدا کردن چارکهای اول ،دوم و سوم
حداکثر داده ها
3
Q
Q
Q
حداقل داده ها
2
1
این دسته از نمودارها برای نمایش هندس ی داده
های کیفی بکار می روند ،در این نمودارها هر یک از
مقادیر بعنوان یک طبقه در نظر گرفته می شوند
-1نمودار ستونی
-2نمودار دایره ای
-3نمودار پاره تو
این نمودار در یک دستگاه مختصات که محور
افقی نشان دهنده کیفیت مشاهدات و محور
عمودیش نشان دهنده فراوانی مطلق یا نسبی هر
گروه است ترسیم می شود
این نمودار ابزار مناسبی برای تجسم مشاهدات
ً
بوده و معموال بر حسب در صد تهیه می شود و به
نمودار کلوچه ای نیز معروف است
-1تبدیل فراوانی مطلق به نسبی
-2پیدا کردن مساحت هر قطاع از دایره
حسب
بر
دایره
مساحت
تقسیم
3
Si
ها
-4نوشتن نوع و درصد مشاهدات بر روی دایره
برای پیدا کردن مساحت هر قطاع از دایره از
فرمول زیر استفاده می شود
i
f
36 0
یعنی فراوانی نسبی هر مشاهده
به عدد 360ضرب می شود
i
S
این نمودار دارای سه محور است :
-1محورافقی :نوع موضوعات
-2محور عمودی :فراوانی مطلق موضوعات
-3محور سوم (روبروی محور عمودی) :فراوانی
نسبی تجمعی موضوعات
یعنی این که در این نمودار پر وقوع ترین موضوعات
در سمت چپ نمودار قرار گرفته ،سپس
موضوعات با فراوانی کمتر در سمت راست آنها قرار
می گیرند
-1در تحلیل موجودیهای جنس ی انبارها
-2در بررس ی نواقص سیستم ها
-3و در بررس ی نحوه توزیع درآمد و توزیع پرسنل
مؤسسات
هدف اصلی این فصل آشنا ساختن دانشجویان با
پارامترهای مرکزی ،پراکندگی و تعیین انحراف از
قرینگی و کشیدگی در داده های طبقه بندی شده
می باشد
-1مرکز توزیع کجاست ؟
-2پراکندگی آن چقدر است ؟
-3تمایل داده به کدام سمت است ؟
-4پراکندگی توزیع در مقایسه با توزیع های مشابه
چگونه است ؟
-1میانگین ؛ که به روش های مستقیم و
غیرمستقیم قابل محاسبه است
-2مد ؛ که نشان دهنده بیشترین تکرار می باشد
-3چندکها ؛ شامل چارکها ،دهکها و صدکها
این فرمول برای داده های طبقه بندی شده به شرح ذیل
:
است
i
F X
N
i
x
فراوانی مطلق = F
i
متوسط طبقات = X
i
کل مشاهدات = N
d
F
)I
(A
N
i
عدد دلخـواه =A
کد هر طـبقه =d
i
=
فاصله طبقات I
i
x
این عدد بعنوان میانگین تقریبی از وسط ستون
نماینده طبقات انتخاب شده و موجب تسهیل
ً
عملیات ریاض ی در پیدا کردن میانگین تقریبا واقعی
می شود
i
d
d iکه کد هر طبقه است ،به شکل زیر قابل می
باشد
X
A
i
di
I
زمانی که مشاهدات حالت اعشار داشته یا این که
به گونه ای تعریف شوند که محاسبه میانگین به
روش مستقیم وقت گیر و مشکل آفرین باشد
برای روش غیر مستقیم میانگین این ستون ها ضروری هستند :
-1حدود طبقات
طبقه
-4حاصلضرب فراوانی در نماینده
-2فراوانی مطلق
-5کد طبقات
-3نماینده طبقات
-6حاصلضرب فراوانی در کد طبقه
ً
از عالمت ( تقریبا مساوی) در فرمول های
میانگین بدین جهت استفاده می شود که پارامترها
به واسطه طبقه بندی مشاهدات (استفاده از
نماینده طبقات) دقیق نمی باشند
تعریف مد بصورت بیشترین تکرار برای داده های
پیوسته و طبقه بندی شده بخوبی گویا و رسا نیست
و رسایی آن فقط در مورد طبقه مددار می باشد
Mo
L
Mo
(
d
d1
1
d
)I
2
=
دار
مد
طبقه
واقعی
پایین
حد
L Mo
فراوانی مطلق طبقه مدار منهای فراوانی طبقه ماقبل=
1
d
فراوانی مطلق طبقه مدار منهای فراوانی طبقه ما بعد=
2
d
با تقسیم دامنه تغییرات به چهار قسمت مساوی به
چارکها ،به ده قسمت مساوی به دهکها و به صد
قسمت مساوی به صدکها خواهیم رسید
-1در کنترل کیفیت آماری
-2در مدیریت
-3در اقتصاد کالن و سایر علوم مشابه
-1اضافه کردن ستون فراوانی تجمعی به جدول
-2پیدا کردن محل چارک مورد نظر با استفاده از فرمول
مربوطه
-3پیدا کردن طبقه چارک دار و استفاده از فرمول چارک
aN
4
a
a
= شماره چارک ( 2،1یا )3
= Nتعداد کل مشاهدات
CQ
aN
Q
a
LQ
4
(
a
Fc
F
i
i 1
)I
مقدار چارک = Q
a
حد پایین واقعی طبقه چارک دار = L Q
a
فراوانی تجمعی طبقه ما قبل طبقه چارک دار =
i 1
Fc
فراوانی مطلق طبقه چارک دار = F
i
) ( Da
-1اضافه کردن Fبه جدول
C
-2پیدا کردن محل دهک با استفاده از
aN
10
-3محاسبه دهک با استفاده از مراحل قبلی و
فرمول چارک
a
CD
aN
D
a
LD
4
(
a
Fc
F
i
i 1
)I
حد پایین واقعی طبقه دهک دار = L D
a
فراوانی مطلق طبقه دهک دار = F
i
فراوانی تجمعی طبقه ما قبل طبقه دهک دار =
i 1
فاصله طبقات = I
Fc
صدکها را با P aنشان می دهند و مراحل محاسبه
ً
آن تقریبا مشابه دهکها و چارکها است و مقدار
محاسبه شده نیز همانند سایر پارامترهای مربوط به
جداول تقریبی است
i 1
)I
Fc
i
aN
از
100
a
CP
F
aN
100
(
a
LP
a
P
برای پیدا کردن محل صدک
استفاده می شود
اگر در توزیع فراوانی طول و عرض طبقات مساوی
نباشد در این صورت ،باید کرانه ها را محاسبه
نموده و از حد پایین آنها استفاده نمود
-1انحراف متوسط از میانگین) A D
-2دامنه میان چارکی ) ( IQR
-3انحراف چارکی
-4واریانس
2
)
x
(
) ( SIQR
( و واریانس تصحیح
شده ) ( c
2
این فرمول در داده های طبقه بندی به شکل زیر می
باشد در این فرمول Fفراوانی طبقه iام می
باشد
Fi X i x
AD
i
N
از این پارامترهای پراکندگی زمانی استفاده می شود
که دنباله های توزیع نا معین و باز باشد ( در این
حالت محاسبه میانگین و واریانس امکان پذیر نیست
)
F ( X i x )
N
2
2
x
2
x
فرمول
روش مستقیم اول-1
i
F Xi
N
2
i
2
2
x
I
F d
N
i
2
i
2
X
فرمول
F i d i دوم
(
مستقیم
روش غیر-2
)
2
N
اگر جامعه آماری از ترکیب چند جامعه مستقل با
میانگین ها و واریانس های مشخص تشکیل شده
باشد ،می توان میانگین و واریانس جامعه کل را
بدست آورد
i
N
N
i
K
N ... N
N
...
N N
N
K
2
2
K
= Nتعداد مشاهدات هر
جامعه
= µمیانگین هر جامعه
2
1
1
1
2
N
N
i
N ( i )
N
2
2
i
i
2
i
= واریانس جامعه iام
= Nتعداد مشاهدات جامعه کل
= N iتعداد مشاهدات جامعه iام
µ
= µمیانگین جامعه iام
= میانگین جامعه کل
i
در هنگام مقایسه دو یا چند جامعه ،در صورت
مساوی بودن پارامترهای مرکزی و پراکندگی ،این
پارامترها با بهره گیری از ضریب چولگی کارساز
خواهند بود
-1متقارن ( نرمال ) :
-2چـولـه به راسـت :
-3چـولـه بـه چــپ :
مد = میانه = میانگین
مد < میانه < میانگین
مد > میانه > میانگین
-1صفر :در صورت متقارن بودن توزیع جامعه
-2مثبت :در صورت چوله به راست بودن توزیع جامعه
-3منفی :در صورت چوله به چپ بودن توزیع جامعه
اگر دم توزیع جامعه به سمت راست باشد ،
توزیع را چوله به راست و در صورت
عکـس ،آن را چوله به چپ می نامند
چوله به
چپ
چوله به
راست
ً
جامعه تقریبا نرمال
SK ، 0 / 1 -1
تفاوت0اندک با توزیع نرمال
/ 1 ، SK 0 / 5 -2
تفاوت فاحش با توزیع نرمال
SK ، 0 / 5 -3
-1ضریب چولگی گشتاوری
-2ضریب های چولگی پیرسون
-3ضریب های چولگی چندکی
3
3
x
) F ( X i x
N
r
SK
3
i
r3
x
گشتاور مرتبه سوم به مبدأ میانگین
انحراف معیار
S K
S K
2
1
(
Mo )
X
3(
x
فرمول شماره
1
Md )
X
x
فرمول شماره
2
ضریب چولگی
چارکی
1
2Q Q
Q Q
1
10
ضریب چولگی
صدکی
2
P
3
Q
Q
SK
3
2 P 50
10
P
90
P
90
P
P
SK
این پارامترها برای مقایسه توزیع جوامع مورد نظر با
توزیع جامعه نرمال به لحاظ کشیدگی ( کوتاهی و
بلندی توزیع ) مورد استفاده قرار می گیرد
-1مساوی توزیع نرمال ( ) E=0
-2بلندتر از توزیع نرمال ( ) E>0
-3کوتاه تر از توزیع نرمال ( ) E<0
توزیع کشیده تر E>0
توزیع نرمال E=0
توزیع پراکنده تر E<0
Md Mo
x
-1توزیع نرمالE 0 / 1
-2توزیع نسبت ًا بلندتر از
نرمال
0/1 E 0/5
-3توزیع کام ً
ال کشیده تر از
نرمال
E 0/5
-1ضریب کشیدگی گشتاوری ؛ با استفاده از
گشتاور مرتبه چهارم به مبدأ میانگین
-2ضریب کشیدگی چندکی ؛ با استفاده از
انحراف چارکی و صدکهای دهم و نودم
F ( X i x )
N
4
E
r
4
4
x
3
r
4
i
3 = عدد ثابت
مخصـوص توزیـع
هایی که باالجبار 0 / 263
با استـفاده از
چـندکها تـوصـیف
می شـوند
SIQR
10
P
90
P
P
E
در این فصل دانشجو با برخی از مفاهیم احتمال و
انواع احتماالت آشنا می شود
احتمال یعنی شانس وقوع یک پیشامد خاص و
احتمال وقوع یک پیشامد برابر است با نسبت
دفعاتی که پیشامد خاص ی در تکرارهای زیاد رخ می
دهد
احتمال ذهنی ،متغیر و وابسته به نظر اشخاص است احتمال عینی ،ثابت و مقدار آن از قبل مشخصاست و به عقاید اشخاص بستگی ندارد
فعالیتی که نتیجه آن از قبل مشخص نیست ولی کل
حاالت ممکن آن معلوم است ،مثل پرتاب یک سکه
ً
،که معلوم نیست دقیقا شیر خواهد آمد یا خط
مجموعه پیامدهای ممکن یک آزمایش را فضای
نمونه آن آزمایش می گویند .
فضای نمونه را با Sنشان می دهند
محدود -یعنی این که فضای نمونه تعداد کمی
عضو داشته باشد
نامحـدود -یعنی اینکه فضـای نمونه آزمایش ( تعداد
اعضاء آن ) نامتناهی است
اگر اعضای فضای نمونه آزمایش قابل شمارش
باشد ،آن را فضای نمونه گسسته ولی اگر فضای
نمونه آزمایش ی بصورت اعداد اعشاری باشند آن را
پیوسته می نامند
به هر یک از زیر مجموعه های فضای نمونه ،یک
پیشامد گفته می شود هر پیشامد را با یکی از
حروف بزرگ انگلیس ی مثل Aو Bو Cو . . .نشان
می دهند
پیامدهای مقدماتی یا پیشامدهای اولیه هم شانس
یعنی این که تمام پیشامدهای اولیه در آزمایش ی
دارای شانس وقوع برابر باشند یعنی وجود نوعی
تقارن در آزمایش
احتمال وقوع پیشامدی مثل Aبرابر می شود با
تعدادهای عضو های پیشامد Aبه تعداد عضوهای
فضای نمونه
) n( A
) n( S
P( A )
برای پیشامدی مثل A
فراوانی نسبی پیشامد AدرNتکرار = )P(A
بشرطی که Nبه سمت بی نهایت میل کند
برای هر پیشامدی مثل Aچه
0 P( A ) 1
1
هم شانس و چه غیر هم شانس
P( S ) 1
2
این قواعد عبارتند از :
-1قاعده ضرب -2جایگشت (ترتیب)
-3ترکیب
-4افرازهای (تفکیک های) مرتب
از این قواعد در وضعیت هایی استفاده می شود که
فهرست نمودن تمام حاالت ممکن آزمایش مقدور
نمی باشد ،لذا فقط به ذکر تعداد حاالت ممکن و
مختلف اکتفا می شود
اساس ی ترین اصل در شمارش « قاعده ضرب »
است و این اصل مختص آزمایش هایی است که در
ً
آنها عملیات در چند مرحله ( مثال ) Kمرحله انجام
می پذیرد
طرق ممکن انجام عمل در آزمایش ی که مرحله اول
آن به nطریق و . . .مرحله Kام آن به nطریق
انجام میگیرد ،عبارت خواهد بود از :
1
K
...
n1 n2
nK
این نمودار روش ی است منظم برای نشان کل حاالت
ممکن در آزمایشاتی که عملیات در آنها طی چندین
مرحله انجام می پذیرد ( مکمل قاعده ضرب )
یعنی تعداد طرقی که می توان rش ی را از بین nش ی
انتخاب نمود بطوریکه r nو ترتیب قرار گرفتن
اشیاء نیز مهم باشد
-1تعداد کل جایگشت های Nش ی متمایز
-2تعداد کل جایگشت های Nش ی نامتمایز
-3تعداد جایگشت های rش ی انتخابی از بین Nش ی
متمایز
-1در صورت ردیفی بودن بشکل
n!=n×(n-1)×…3×2×1
-2در صورت دایره ای بودن (n-1)!=(n-1)(n-2)×…3×2×1
!n
شروط
-1از nشی n،
1
2
n = n -2
K
n
n
…!
K
تای آنها از یک نوع
2
!
تای آنها از نوع دیگر و ...
+ n + n. . . +
2
1
!n n
1
شروط -1 :
-2
!n
متمایز
دو
هر
rوn
!) ( n r
r<n
n
r
P
-1توجه به تعداد اشیاء و حجم انتخابی از بین آنها
-2توجه به ردیفی یا دایره ای بودن اشیاء
-3توجه به متمایز یا نامتمایز بودن اشیاء
تعداد طرق انتخـاب rش ی متمـایز از بین nشـی
بشرطی که ترتیب قرار گرفتن اشیاء باعث افزایش
تعداد طرق نگردد
فرمول
!n
!) ( n r
)
n
(
r
n1
r1
ترکیب دوم
اگر ترکیب اول به شکل
بصورت
n
n2
r2
K
rK
و . . .ترکیب آخر به شکل
n
صورت :
K
تعداد کل طرق
K
باشد در آن
. .
r
.
n1 n 2
r1 r2
فرمول
ویژگی ها :
!n
=
n1 n
nK
… ! !2
nK
,
n
,
, ...
n
n
1
2
!
-1تفکیک nشی به گونه ای خاص
-2در حکم یک مجموعه بودن هر ترکیب
-3مهم نبودن ترتیب اشیاء در هر زیر مجموعه
در این نمودار به منظور نشان دادن پیشامد ها
،کل فضای نمونه در قالب مستطیلی ارائه
شده و هر پیشامدی قسمتی از این مستطیل را
به خود اختصاص می دهد
این احتمال برابر است با سطحی که پیشامد A
از ( Sفضای نمونه) اشغال کرده است
S
A
دو پیشامد را در صورتی « نا سازگار »
گویند که امکان وقوع همزمان نداشته باشند
یعنی با وقوع یکی ،دیگری امکان وقوع
نداشته باشد مثل شب و روز
نمودار نشان می دهد که پیشامدهای Aو B
هیچ وجه اشتراکی با هم ندارند
S
B
A
دو پیشامدی را گویند که وقوع یکی مانع
وقوع دیگری نیست بعبارتی این دو پیشامد
دارای حداقل یک عضو مشترک هستند
محل تالقی دو پیشامد ،نقطه مشترک آنهاست
(جائیکه دو بار هاشور خورده است)
S
B
A
اجتماع دو پیشامدی مثل Aو ، Bمجموعه
تمام عضوهایی است که در Aیا در Bیا هم
در Aو هم در Bقرار دارند
اجتماع دو پیشامد Aو Bرا با A Bنشان
می دهند .
وقوع A Bیعنی این که حد اقل
یکی از دو پیشامد مذبور رخ داده است
A B
S
A
B
اشتراک دو پیشامدی مثل Aو Bرا با ∩ A
Bنشان می دهند .وقوع A ∩ Bیعنی این که
هر دو پیشامد Aو Bرخ داده است
یعنی این که هم پیشامد Aو هم پیشامد Bرخ
داده است
S
B
A
C
متمم پیشامدی مثل Aکه با Aنشان داده می
شود مجموعه تمام عضوهایی است که در
فضای نمونه است ولی در خود پیشامد A
نیست
C
C
وقوع متمم A( A
A
) به معنی عدم وقوع
پیشامد Aمی باشد
S
C
A
A
A A
P( A
C
C
S
P( S ) 1 P( A ) P(
) 1 P( A ) , P( A ) 1 P(
A
A
C
)
C
)1
) 1 P( A B ) P( A ) P( B ) P( A B
برای دوپیشامد سازگار
) 2 P( A B ) P( A ) P( B
برای دوپیشامد ناسازگار
) P( A B
P( A / B )
) P( B
شروط -1 :وقوع Aبه Bمربوط بوده
B -2قب ً
ال رخ داده
P ( B ) 0-3
P( B / A )
P( A B )
P( A )
ً قبA -1 : شروط
ال رخ داده
P ( A ) 0-2
با استفاده از احتمـال شرطی می توان قانـون
ضرب را برای محاسبه احتمال اشتراک
پیشامدها بشرح زیر بیان نمود
) P( A B ) P( A )P( B / A
یا
) P( A B ) P( B )P( A / B
دو پیشامد را « مستقل » می گوییم ،در
صورتی که وقوع یا عدم وقوع یکی در وقوع
و یا عدم وقوع دیگری هیچ تأثیری نداشته
باشد
چون Aو Bهیچ تأثیری بر روی هم ندارند
برای محاسبه احتمال اشتراک آنها بشکل زیر
عمل می شود :
) P( A B ) P( A )P( B
شرط ناسازگار بودن دو پیشامد
A B P( A B ) 0
شرط مستقل بودن دو پیشامد
) P( A B ) P( A )P( B
پیشامدها نسبت به هم می تواند ،حالت
سازگار و مستقل ،سازگار و غیر مستقل ،
ناسازگار و غیر مستقل و . . .داشته باشند
این قضیه پژوهشگران را در تجدید نظر
احتماالت ،در صورت دسترسی به اطالعات
جدید ،کمک می کند
فرمول
) P( A )P( B / A
) P( B
P( A / B )
به احتمال وقوع پیشامدی قبل از کسب
اطالعات جدید « احتمال پیشین » و به احتمال
وقوع آن پیشامد بعد از کسب اطالعات جدید «
احتمال پسین » می گویند
هدف این فصل آشناسازی دانشجویان با
متغیرهای تصادفی گسسته ،توابع احتمال و توزیع
های مربوط به آنهاست
تابعی است که روی فضای نمونه تعریف می
شود و هر یک از مقادیر آن ،متناظر با یک
یا چند عضو از اعضای فضای نمونه است
با توجه به این که هر تابع دارای دامنه و
حوزه می باشد دامنه یک متغیر تصادفی نیز
فضای نمونه ( ) Sو حوزه اش مجموعه اعداد
حقیقی است
-1متغیر تصادفی گسسته ؛ با تعداد مقادیر
متناهی یا شمارش پذیر
-2متغـیر تصادفی پیوسـته ؛ با تعداد مقادیر
ممـکن نامتناهی و غیر قابل شمارش
متغیرهای تصادفی را با حروف بزرگ التین
مثل Zو Yو Xو هر یک از مقادیر انتخابی
آنها را با حروف کوچک zو yو xنشان می
دهند
به تابعی که بتوان با استفاده از آن احتمال هر
یک از مقادیر ممکن متغیر تصادفی را
مشخص کرد « تابع احتمال » یا « توزیع
احتمال » گویند
تابع احتمال تابعی است که دامنه آن مقادیر
ممکن متغیر تصادفی و حوزه آن احتماالت
مربوط به هر مقدار از متغیر تصادفی است
تابع توزیع ،تابعی است که به ازای جمیع
مقادیر ممکن متغیر تصادفی ، Xاحتمال وقوع
مقداری کوچکتر یا مساوی با Xرا نشان می
دهد
امید ریاضی متغیر تصادفی Xکه ) E(Xنشان
داده می شود همان میانگین موزون است که
احتماالت در آن ،نقش ضرایب ( وزن ها )
را ایفاء می کنند
امید ریاضی یک متغیر تصادفی از حاصل
جمع ضرب هر متغیر تصادفی در مقدار
احتمال خودش بدست می آید
) X f(X
E( X )
این واریانس با ) V(Xنشان داده شده و میزان
پراکندگی را حول میانگین ( امید ریاضی )
نشان می دهد
1
2
V( X )
V( X )
( X ) f ( X )
2
E( X
2
)
2
E( X )
تابع احتمال توأم عبارتست از فهرستی از
های
زوج
X , Y
f X , Y
و احتمال های متناظر با آنها ،یعنی
j
i
j
i
هر گاه پژوهشگر بخواهد رفتار متغیری مثل
Xرا در ارتباط با رفتار متغیر دیگری مثل Y
بررسی نماید ،از این تابع استفاده می کند
-1احتماالت حاشیه ای : Xبرای پیدا کردن
تابع احتمال متغیر تصادفی X
-2احتماالت حاشیه ای : Yبرای پیدا کردن
تابع احتمال متغیر تصادفی Y
معیار عددی است که نوع و شدت رابطه
خطی بین دو متغیر تصادفی را نشان می دهد
و عبارتست از امید ریاضی تغییرات دو متغیر
بر حسب میانگین شان
-1رابطه مستقیم :حرکت هم جهت متغیرها
-2رابطه معکوس :حرکت بصورت خالف
جهت هم
-3عدم وجود رابطه :عدم تأثیر متغیرها بر
هم
-1مثبت :در صورت وجود رابطه مستقیم بین
متغیرها
-2منفی :در صورت وجود رابطه معکوس
بین متغیرها
-3صفر :در صورت عدم وجود رابطه بین
1 COV ( X ,Y ) E ( X
)( Y
X
)
Y
یا
2 COV ( X ,Y ) E ( XY ) E ( X ) E ( Y )
و
E ( XY )
i
j
x y
i
f
j
X Y x در صورت گسسته بودن
i
j
yو
دو متغیر تصادفی Xو Yدر صورتی مستقل
ازای X
اند که به, Y
تمام زوج های
رابطه روبرو برقرار باشد
) f ( xi , y ) f ( xi ) f ( y
j
j
i
j
xو yمستقل
اند
اگر xو yمستقل باشند ،کواریانشان
حتم ًا صفر است ولی عکس قضیه
همیشه صادق نیست
COV ( X ,Y ) 0
ویژگی ها :
-1آزمایش فقط یک بار صورت می گیرد
-2فقط دو پیامد ممکن دارد
-3احتمال موفقیت و شکست ثابت است ( البته در
صورت تکرار آزمایش )
-4آزمایش ها مستقل از یکدیگر انجام می شوند
Pیعنی احتمال موفقیت ( احتمال وقوع پیشامدمورد نظر )
qیعنی احتمال شکست ( احتمال عدم وقوعپیشامد مورد نظر )
pو qمکمل یکدیگر هستند
نمونه گیری های بدون جایگزینی از جامعه
باعث متغیر شدن احتمال موفقیت و شکست در
آزمایش ها شده و توزیع را از حالت برنولی
خارج می کند
نمونه گیری با جایگزینی از کلیه جوامع
آماری و نمونه گیری بدون جایگزینی صرف ًا
از جوامع خیلی بزرگ ،می تواند به برنولی
بودن توزیع کمک نماید
ویژگیها:
-1تکرار آزمایش ( nبار )
-2هر آزمایشی فقط دو پیامد دارد
-3ثابت بودن pو qدر هر آزمایش
-4مستقل بودن آزمایش ها از همدیگر
P( X x )
x
n
x 0 ,1 ,2 ,..., n
x
p q
n x
تعداد آزمایش ها = n
تعداد موفقیت های مورد نظر =
x
احتمال موفقیت در هر آزمایش
=p
-1اگر p = 0/5باشد ،توزیع متقارن
-2اگر p > 0/5باشد ،توزیع چوله به چپ
-3و اگر p < 0/5باشد ،توزیع چوله به
راست است
وقتی که nنسبت ًا بزرگ است ،محاسبه احتمال
از طریق فرمول کار خسته کننده ای می شود
،لذا برای رفع این مشکل از جدول های
مخصوصی استفاده می شود
1- E(X) = np
2- V(X) = npq
nو pو qپارامترهای توزیع دو جمله ای
هستند
پیدا کردن احتمال این که ،از بین Nشی که
Kتای آنها واجد شرایط است n ،شی را
برگزینیم بطوریکه Xتای آن واجد شرایط
باشد
N k
x n x
P( X x )
,
x
0
,
1
,...,
k
N
n
k
اگر n < %5Nباشد می توان در محاسبه
میزان احتماالت توزیع فوق هندسی از توزیع
دوجمله ای کمک گرفت
توزیع فوق هندسی برای نمونه گیری های
بدون جایگذاری است ولی وقتی Nبزرگ و n
k
کوچک است pتقریب ًاp
ثابت می ماند (
N
) و حالت توزیع دو جمله ای بخود می گیرد
اگر nبه سمت بی نهایت و pبه سمت صفر
میل کند و در عین حال مقدار npثابت بماند ،
می توان بجای توزیع دو جمله ای از توزیع
پواسون استفاده نمود
P( X x )
e
x!
np بعنوان پارامتر
توزیع
وe 2 / 718
x
, x 0 ,1 ,2 ,...
از بین کلیه توزیع های رایج ،توزیع پواسون
تنها توزیعی است که میانگین و واریانس آن با
هم برابرند
E( X )
V( X )
-1بعنوان تقریب یا برآورد کننده میزان
احتمال توزیع های دو جمله ای تحت شرایط
خاص
محاسـبه احتماالت مربـوط به تعـداد
-2
مراجعات به سیستم با در واحد زمان ( ) t
x
فرمول
) e ( t
t
P( X x )
!x
x 0 ,1 ,2 ,...
میانگین مراجعات در واحد زمانی t
معین
هدف اصلی این فصل آشنا ساختن دانشجویان با
متغیرهای تصادفی پیوسته و تعدادی از توابع مهم
آنهاست
بخاطر این که میزان احتمال در توابع پیوسته
در یک نقطه معین مساوی صفر است ،لذا در
این گونه توابع ،احتمال همیشه در قالب یک
فاصله تعیین می شود
احتمال این که متغیر تصادفی پیوسته x
مقداری بین دو نقطه aو bرا بگیرد برابر
است با
f ( X ) dx
b
a
P( a X b )
) P( a X b ) P( a X b ) P( a x b ) P( a X b
پس عالمت مساوی در این توزیع ها نقشی
ایفاء نمی کند
یعنی ضرب متغیر تصادفی در تابع چگالی
خود و سپس انتگرال گیری به ازای مقادیر
متغیر
ممکن
E ( X ) X f ( X ) dx
یعنی کسر متغـیر تصادفـی از میانگین خود ،
به توان 2رساندن نتیجه و ضرب نتیجه
حاصله به تابع چگالی و انتگرال گیری
2
f ( x ) dx
X E ( X )
V( X )
در این فصل دانشجویان با مهم ترین و کاربردی
ترین نوع توزیع از زیر مجموعه توزیع های پیوسته
آشنا می شوند
متغیر تصادفی پیوسته xدر صورت داشتن
تابع چگالی زیر دارای توزیع نرمال است
(
X
)
/
2
2
1
1
e
2
2
f(X )
)X ≈ N ( µ , δ
( µمیانگین ) و ( δانحراف معیار ) دو
پارامتر توزیع نرمال بوده و با مشخص بودن
آنها ،منحنی توزیع قابل ترسیم می باشد
در یک توزیع نرمال هر قدر میانگین افزایش یابد ،باعث
می شود که منحنی آن بیشتر به سمت راست انتقال یابد )f(x
x
2
1
1
2
هر قدر انحراف معیار افزایش یابد ،منحنی توزیع
نرمال کوتاه تر (بعبارتی پهن تر) می شود
)f(x
1
S>S
2
1
2
S
x
2
=
1
S
-1سطح زیر منحنی همیشه برابر یک است
f(x) -2همیشه بزرگتر یا مساوی صفر است
-3حداکثر مقدار تابع در X = µمی باشد
-4تابع حول میانگین ،متقارن است
-5میانگین و واریانس Xبه ترتیب µو
می باشد
2
-6منحنی در محور Xها ،هیچ گاه به صفر
نمی رسد
-7میانگین ،میانه و مد با هم برابرند
-8احتمال xبا توجه به انحراف معیارهای
مختلف بشرح ذیل است :
P ( x ) 0 / 683
P ( 2 x 2 ) 0 / 954
P ( 3 x 3 ) 0 / 997
یعنی استاندارد کردن متغیر ) X ≈ N ( µ , δبا
استفاده از متغیر نرمالی که میانگین آن صفر
و واریانس اش یک است و سپس استفاده از
جدول مربوطه
با کم کردن میانگین از متغیر xو تقسیم نتیجه
آن بر انحراف معیار z ،بدست می آید
X
z
-1استفاده مستقیم :مقدار Zمشخص است و
احتمال آن را بدست می آوریم
-2استفاده معکوس :احتمال Zمشخص است
و مقدار آن را بدست می آوریم
پس از پیدا کردن Zبا توجه به میزان احتمال
اعالم شده ،مقدار Xرا با استفاده از این
رابطه پیدا می کنیم
X z
اگر nبزرگ و pدر نزدیکی های صفر یا
یک نباشد ،تقریب np
نرمال با npq
پارامترهای
تقریب خوبی برای توزیع دو جمله
و
ای است
چون توزیع دو جمله ای ،توزیعی گسسته و
توزیع نرمال ،توزیعی پیوسته است بنابراین
هنگام استفاده از تقریب نرمال باید تصحیح
پیوستگی صورت پذیرد (افزایش دامنه)
وقتی که میانگین توزیع پواسون نسبت ًا بزرگ
( ) λ≥10می شود ،می توان بجای توزیع
پواسون از فرمول توزیع نرمال استفاده کرد
میانگین ( ) µو انحراف معیار ( ) δعبارت
خواهند بود از :
,
ضمن ًا استفاده از تصحیح پیوستگی نیز الزم
است
در این فصل دانشجویان با فرآیند تصمیم ،انواع
شرایط تصمیم گیری و معیارهای مختلف اخذ
تصمیم در شرایط عدم اطمینان آشنا می شوند
-1تعریف روشن مسأله
هر ترکیب
-4تعیین بازده ناشی از
-2تعیین گزینه های ممکن
-5انتخاب یک مدل کمی
-3تعیین پیامدهای ممکن
تصمیم
-6بکارگیری مدل و اتخاذ
حاالت
طبیعت
گزینه ها
a
a
1
2
S
M
M
a
M
K
1
11
21
S
M
M
2
12
22
K1
M
K2
S
M
M
M
H
1H
2H
KH
-1تصمیم گیری تحت شرایط اطمینان کامل
-2تصمیم گیری در شرایط عدم اطمینان
-3تصمیم گیری در شرایط ریسک
در این شرایط تصمیم گیرندگان با اطمینان ،
پیامدهای هر گزینه یا تصمیمی را می دانند ،
بنابرین گزینه ای را انتخاب می کنند که منافع
آنها را حداکثر نماید
در این نوع تصمیم گیری ،تصمیم گیرنده نمی
داند کدامیک از حاالت طبیعت رخ می دهد در
ضمن نمی تواند احتمال وقوع هر یک را
مشخص کند
در این شرایط تصمیم گیرنده نمی داند کدام یک
از حاالت طبیعت واقع می شود ،ولی می تواند
احتمال وقوع هر یک را مشخص کند
افزایش دانش
اطمینان
کامل
ریسک
کاهش دانش
عدم
اطمینان
-1حداکثر حداکثر
-2حداکثر حداقل
-3احتماالت مساوی
-4واقعگرایی
-5حداقل حداکثر غبن
معیار خوش بینانه ای است و تصمیم گیرنده تصور
می کند که همه گزینه ها بیشترین بازدهی خود را
خواهند داشت ،لذا سعی می کند از بین بهترها ،
بهترین را انتخاب نماید
به معیار بد بینانه معروف است و تصمیم گیرنده ،
ابتدا بدترین ( حداقل ترین ) حالت هر گزینه را
انتخاب و سپس از بین آنها بهترین ( بازدهی حداکثر ) را
بر می گزیند
این معیار شانس حاالت مختلف طبیعت را یکسان
فرض کرده و بدین سبب بدنبال گزینه ای می گردد
که متوسط بازده آن از بقیه گزینه ها بیشتر باشد
بر اساس این معیار یک تصمیم گیرنده منطقی نه زیاد
خوش بین و نه زیاد بد بین است و سعی می کند
تعادلی بین معیارهای خوشبنیانه و بد بنیانه ایجاد
نماید
= معیار واقع گرایی گزینه i
(حداقل بازده گزینه ( + )1- α()iحداکثر بازده گزینه α )i
جدولی بنام « جدول غبن » تشکیل و حداکثر هر سطر
را مشخص می کنیم سپس حداقل آنها را تعیین و
گزینه متناظر با آن را انتخاب می نماییم
در صورتی که تصمیم گیرنده بتواند احتمال وقوع
حاالت مختلف طبیعت را برای مسأله تصمیم ،تعیین
کند ،تصمیم گیری از نوع ریسک خواهد بود
مهم ترین معیار در این شرایط « ،معیار ارزش پولی
مورد انتظار » یا همان EMVاست .ارزش پولی
مورد انتظار همان امید ریاض ی بازده است
زمانی استفاده می شود که در مسأله ای باید
تصمیمات « پیچیده » و « متوالی » اتخاذ شود و در آن
از معیار EMVو نمادهایی مثل دایره و مربع استفاده
می شود
در اغلب موارد تصمیم گیرنده ،موقع استفاده از
معیار ، EMVدرباره بازده ها و احتماالت نامطمئن
است ،لذا از تحلیل حساسیت برای تعیین دامنه
مطلوب برای بهترین گزینه استفاده می کند
EVPIبازده مورد انتظار است اگر اطالعات کامل ،
قبل از اخذ تصمیم موجود باشند
تفاوت بین ارزش مورد انتظار با اطالعات کامل و
ارزش مورد انتظار بهترین گزینه است ،بعبارتی :
= EVPI - EMVmaxارزش مورد انتظار اطالعات کامل