Transcript تابع بقا
بسم هللا الرحمن الرحیم
Your Logo
سمینار مدل های خطی
مهسا ملکیان
رویا تنهایی
زمستان 93
Your Logo
www.TahlileAmari.ir
Your Logo
مقدمه
يكي از انواع داده ها كه مورد عالقه ي شديد محققين و سرمایه گذاران است اهميت دادن به فاصله زماني
تا وقوع بعضي حوادث مانند مرگ ومير و ...مي باشد.سواالتی جذاب و بسیار حساس و پر اهمیت مانند:
(1طول عمر یک انسان سالم چقدر است؟در صورتی که دچار بیماری خاصی شود یا تحت شرایط خاصی
قرار بگیرد طول عمر او چقدر خواهد بود؟
(2عمر مفید یک محصول چقدر است؟خطر استهالک در چه زمانی از طول عمر محصول افزایش می
یابد؟در صورتی که محصول دچار تغییری مانند تغییر در فرایند تولید گردد چه تاثیری در طول عمر ان
خواهد گذاشت؟
سه نمونه از زمینه های کاری و بازار کار فردی که
فقط بتواند به سواالت اسالید قبل پاسخ دهد!!!!
بیمه های عمر و سرمایه
بیمارستان ها و مراکز درمانی جهت ارائه تاثیر بیماری های
مختلف در طول عمر و ...
در بخش صنعت (تعیین مدت زمان گارانتی محصوالت)
Your Logo
شكستتي تتد حدي تتر متتميي واتتر مت رماوتتا حتتاا ترر تتا بتتدي بترا تتر تتري ار تتد ا تتا.از جملتتر متتمايي تتر مت رماوتتا
مصاا شكسي د واقعر مميي وار بدشا:
طمل عمر ا مدشين صنع
اولين زمدن مراجعر ا ارممبيل وم بر رعمير گده
زمدن بقدی یک بیمدي پس از ييمدن ید اوجدم یک عمل جراحی
زمدن طال یک زوج پس از ازيواج و...مردل د ت از ا ن قبيل س نا.
از ان جد ت ر ا ن يوش د يي اب اا غدلبد برا مطدلعدت مرگ و مير بر دي بريه م شا بر مين جهي ودم ”رجز ر و
رحليل زمدن بقد ”بر ان وهديه شاه اسي.
با توجه به مطالب ذکر شده چه روشی
برای انجام چنین تحلیلی مناسب است؟
رگرسیون ؟
رگرسیون
رگرسیون یک تکنیک اماری است که ارتباط بین یک متغیر وابسته و یک یا چندمتغیر
مستقل را بررسی و مدل سازی می کند.برای مثال ارتباط میان وزن که پديام ری ویسي
کر لزومد رغییر ومی کنا به عنوان متغیروابسته و فشارخون به عنوان متغیر مستقل
مدلی که رگرسیون ارائه می دهد تا وقتی معتبر است که گذشت زمان تاثیری در متغیر پاسخ
ایجاد نکند برای مثال مدل وزن نوزاد
بنابرین رگرسیون روش مناسبی نیست.
Your Logo
سری های زمانی ؟
سری های
زمانی
در بحث سری های زمانی بر خالف اینکه موضوع
زمان به صورت یک پارامتر اصلی در نظر گرفته می
شود در محاسبه و تخمین طول عمر مدل مناسبی
ارائه نخواهد داد چرا که در این مدل با توجه به فرض
مانایی سری زمانی پارامتر مهمی که در طول عمر
مطرح است و آن بحث استهالک یا پیری می باشد
در نظر گرفته نمی شود
بنابرین روش سری های زمانی در مواردی مانند
پیش بینی قیمت سهام ،طال و ...کاربرد دارد.
Your Logo
روش صحیحی که جهت انجام چنین
تحلیلی مناسب است ؟؟؟
رحلیل بقد از نظر علم امار مجموعه ای از روش های مختلف اماری در تحلیل متغیر های تصادفی نامنفی
است که مقدار ان می تواند زمان شکست یک مولفه فیزیکی یا زمان مرگ یک واحد زنده باشد.
پيشينه ي تحليل بقا كارهای ي است که در گذشته در مورد جداول عمر انجام شده که در قرن 17میالدی
شخصی به نام grountاولین فهرست هفتگی مرگ ومیر را در لندن منتشر کرد.
قابلیت اطمینان یک سیستم عبارت است از احتمال کارکرد سالم و بدون عیب
برای مدت زمان مشخص طبق شرایط موجود و از پیش تعیین شده.
قابلیت اطمینان با گذشت زمان تغییر می کند.
از انجاکه تابع قابلیت اطمینان احتمال عدم از کار افتادگی را بیان می دارد به تابع
بقا معروف می باشد .زیرا در واقع تعیین کننده احتمال عمرباقیمانده دستگاه ها
است.
نرخ خطر یعنی دستگاه با گذشت زمان در معرض از کارافتادگی بیشتری قرار می
گیرد.
Your Logo
www.TahlileAmari.ir
قابلیت اطمینان یا تحلیل بقا به روش پارامتری
(روشی که به دانستن توزیع متغیر نیازمند
است و محاسبه احتماالت طوالنی!!!)
آیا در واقعیت و کاربرد روش باال قابل استفاده
است؟؟؟
با توجه به اینکه در روش باال برای به دست
آوردن توزیع ها نیاز به انجام آزمایش که ممکن
است چندین سال به طول بیانجامد دارید آیا
مدیری شما را با این شرایط استخدام خواهد
نمود؟؟؟؟
Your Logo
قابلیت اطمینان یا تحلیل بقا به روش
ناپارامتری
داده ها ی طول عمر را با تابع احتمال طول عمر
و تابع نرخ خطر خالصه نمایند و نیز برآورد
شاخص های مرکزی چون میانه و صدک ها رایج
می باشد.از آنجایی که برای استفاده از این روشها
نیازبه پیش فرض خاصی در مورد توزیع داده ها
نیست،این روش ها را روش های توزیع آزاد یا
غیر پارامتری گویند.
Your Logo
این روش در مقایسه با روش قبلی بسیار ساده
تر و قابل اجرا می باشد .همچنین با توجه به
پایگاه داده های موجود در سازمان ها (بیمارستان
،کارخانه و )...قابل انجام است .البته در این
روش ورود هر متغیر دیگری که در طول عمر اثر
خواهد گذاشت امکان پذیر نخواهد بود و فقط
بحث طول عمر مد نظر قرار می گیرد.
Your Logo
برای شروع تحلیل و جمع آوری داده ابتدا
می بایست سه مولفه:
)1مبدا زمان
) 2مقیاس و واحد اندازه گیری گذشت زمان
)3مفهوم شکست یا وقوع حادثه
به طور واضح و دقیق تعریف شود و
هیچ گونه ابهامی برای آنها وجود نداشته
باشد.
توزیع های بقا
در مطالعات بقا،توزیع های مختلفی برای زمان وقوع حادثه به کار برده می شود که
مورد توجه و عالقه ی شدید محققین می باشد از ان جمله می توان از تابع بقا،تابع
خطر،تابع توزیع تجمعی و تابع چگالی احتمال نام برد که در زیر به اختصار به انها
اشاره خواهد شد.
ردبع بقد
تابع بقا را با ) s(tنشان میدهیم و با احتمالی که یک فرد یا مؤلفه بیشتراز tواحد زمانی زنده بماند؛در
)S(t)=pr(T>t
مورد توزیعهای گسسته و پیوسته به صورت زیر تعریف میشود:
∞<0≤t
s(0)=1
s(∞)=0
واضح است که ) s(tیک تابع غیر صعودی و از چپ پیوسته است.
) s(tنرخ بقا را نیز نشان میدهد به طور مثال اگر زمانها بر حسب سال باشند ، s(t) ،نرخ بقای دو ساله را
نشان میدهد.
تابع بقا میتواند به عنوان یک منحنی هموار به صورت زیر باشد.
ولی در عمل وقتی از داده ها ی واقعی استفاده می کنیم شکل تابع بقا به صورت پله ای خواهد بود:
تابع احتمال بقا
با استفاده از نمونه ای ازافراد و از یک مجموعه زمان های بقای مشاهده شده می توان نسبتی از جامعه که
در طول یک دوره معین و تحت همان شرایط زنده می مانند براورد کرد.مثال با استفاده از اطالعات مربوط به
بیماران سرطانی می توان احتمال زنده ماندن یک بیمار جدید در طول یک فاصله زمانی را براورد نمود.
همان گونه که یک دوره ی زمانی مشخص را می توان به چند فاصله زمانی کوتاه تر تقسیم کرد،احتمال بقا و
زنده ماندن در ان دوره ی زمانی مشخص را نیز می توان بر اساس حاصل ضرب احتمال فواصل کوتاه تر
محاسبه کرد.مثال احتمال این که شخصی در مدت دو هفته زنده بماند را می توان با حاصل ضرب (احتمال
زنده ماندن در هفته اول)*(احتمال زنده ماندن در هفته دوم به شرط زنده ماندن در هفته اول)بدست اورد.
احتمال بقا را می توان با دو روش زیر محاسبه و براورد نمود.
)1روش کاپالن-مه یر(1)KM
)2روش طول عمر
1.kaplan-meier
يوش کدپالن مر یر
این روش برای نمونه های کوچک تر که زمان وقوع حوادث به دقت ثبت و اندازه گیری می شود
بسیار مفید است.در این روش،تعداد کل افراد شرکت کننده در مطالعه که تحت پیگیری و مراقبت
قرار دارند nفرد و زمان های مشاهده شده t1,t2,…,tnاست.زمان بقای بعضی از این افراد ممکن
است ثبت نشده باشد(گمشده راست)همچنین ممکن است بیش از یک مشاهده برای هر یک از زمان
های بقا وجود داشته باشد.
چون تعداد افراد شرکت کننده در این مدت niنفر بوده که تعداد diنفر انها مرده اند بنابراین
احتمال اینکه یک نفر در فاصله زمانی فوق بمیرد برابر است با:
𝐢𝐝
احتمال زنده ماندن یک نفر در فاصله زمانی فوق بربر است با 𝐧𝐢:
𝐢𝐝
می باشد که به احتمال بقا در فاصله فوق معروف است.
𝐢𝐝
)
𝐢𝐧
𝐢𝐧
(𝟏 −
𝒌
𝟏=𝒊
1-
=)S(t
روش طول عمر
وقتی که تعداد مشاهدات و بیماران مورد بررسی زیاد باشند احتمال وجود زمان های بقای یکسان قوت
می گیرد.بدین معنا که ممکن است بیش از یک حادثه در هر زمان رخ دهد.در این صورت روش KM
جداول بسیار طوالنی را موجب می شود که ارائه و تفسیر ان خیلی مطلوب نبوده و وقت گیر خواهد
شد.
بنابراین روش دیگری را به نام روش طول عمر استفاده می کنند که در ان زمان وقوع حوادث را به
صورت فواصل زمانی تقسیم بندی می کنند.این فاصله بندی به دلخواه می تواند کم و زیاد گردد و
الزامی به تساوی فاصله گروه ها نمی باشد.هر چند مساوی بودن ان ها معمول و متداول است.این
روش می تواند نمودار ها و براوردهای ی از توابع بقا و خطر را ارائه دهد.
چون احتمال مرگ در فاصله زمانی iام برابر
است
لذا احتمال بقا برابربا ) (1-qiاست و سپس تابع بقا عبارت است از :
www.TahlileAmar
i.ir
di
n̒i
= qi
میانه و صدک ها
از انجای ی که در بعضی مطالعات بقا،در اغاز کار و بالفاصله پس از شروع مراقبت و
پیگیری،وقایع(مرگ)کمتری اتفاق می افتد و تعداد این وقایع همراه با پیشرفت زمان بیشتر می
شود،لذا داده های انها ،دارای چولگی منفی است.از طرفی در برخی از مطالعات بقا وقوع حوادث در
اوایل کار زیاد بوده (مانند افزایش خطر مرگ در روزهای نخستین پس از عمل جراحی)اما با پیشرفت
زمان رو به کاهش می گذارد،لذا داده های این گونه مطالعات دارای چولگی مثبت می باشد.بنابراین به
دلیل وجود همین چولگی ها اک ثر داده های بقا دارای توزیع نرمال نبوده و محاسبه و براورد میانه و
صدک های مهم (صدک 25و صدک )75در بین شاخص های مرکزی اهمیت بسیار زیادی دارد و همواره
گرایش و تمایل به محاسبه میانه و صدک هابیشتر از محاسبه میانگین است.
مقدمه
ً
معموالدر مطالعات بقا ،حادثه مد نظر "مرگ" می باشد .در این مطالعات عده ای را برای مدتی تحت
مراقبت وپیگیری قرار می دهند تا تعدادی "مرگ"بدلیل خاصی که مد نظر وبررسی مطالعه است
مشاهده گردد .
بدیهی است که عوامل وفاک تورهای دیگری چون متغیرهای جمعیتی نظیر سن وجنس بیمار،
ً
خصوصا وضعیت قلبی ،متغیرهای محیطی وسابقه
متغیرهای روحی وروانی ،عوامل جسمانی وفیزیکی
سیگاری بودن وعادات غذای ی بر حادثه مشخص فوق تاثیر دارند .از طرف دیگر بعضی از بیماری ها
،علل مستقیم تری دارند که می توانند زمان بقا را ً
قویا تحت تاثیر خود قرار دهند.مث ًال در مطالعه
بیماران سرطانی ،سن بیمار اندازه غده ونحوه درمان و...تاثیر مستقیم بر روند وقوع مرگ دارند.
بنابراین برای ضرورت مدل سازی داده های بقا می توان دودلیل عمده زیر را بیان کرد:
)1مدل سازی ،ترکیب متغیرهای موثر بر تابع خطر را مشخص می نماید.
)2براورد تابع خطر برای هر فرد مشخصی و در هر لحظه زمانی را می توان با مدل سازی مناسب بدست اورد .
مدل اساسی که برای داده های بقا به کار برده می شود“رگرسیون کاکس“ می باشد که به مدل خطرات متناسب
نیز شناخته شده است.
رگرسیون
کاکس
مال يگرسیمن خطرات م ندسب
در سال 1972میالدی کاکس،امار شناس معروف و معاصر انگلیسی مدلی را ارائه نمود که از ان زمان
تا کنون بصورت استاندارد وگسترده ای مورد استفاده قرار می گیرد.وقتی که تحقیق بررسی اثرات چند
متغیر بر روی زمان بقا به طور همزمان مد نظر باشد مدل کاکس کاربرد فراوانی دارد.
مدل کاکس مدل خطرات متناسب نیز نام گرفته است .هرچند که این نام از ان جهت که مدل وی می
تواند برای خطرات غیر متناسب به کاربرده شود گمراه کننده وتا حدودی بی مسماست.
مدل کاکس ،یک مدل نیمه پارامتری است و به توزیع خاصی برای زمان های بقا نیاز ندارد .اما دو فرض
بسیار حساس و محکم در این مدل وجود دارد.
Your Logo
تحلیل بقا به مدل سازی و بررسی
وآزمایش زمانی که یک واقعه
نیازدارد تا به وقوع بپیوندد می
پردازد .یکی ازاین وقایع مرگ است
و در حقیقت این نامگذاری از همین
جا نشات میگیرد.
در یک مدل بقا رابطه میان بقا و
یک یا چند پیشگو را آزمایش میکند.
خوشبینانه ترین تابع بقا را میتوان مکمل تابع
توزیع دانست
S(T)= Pr (T> t)= 1 – Pr(t)
جایی که
)Pr(t) = Pr (T<= t
Your Logo
مدل کاکس
مدل کاکس یک تکنیک اماری برای پیدا
کردن ارتباط میان بقا و تعدادی از
متغیرهای توضیحی است
این مدل براوردی از اثر متغیر های
توضیحی برروی بقا به صورت همزمان
است.
Your Logo
به عالوه این مدل به ما اجازه محاسبه
تابع ریسک را می دهد.
تابع ریسک احتمالی که یک فرد در
یک فاصله زمانی کوتاه یک واقعه را
تجربه کند بیان می
کند
Your Logo
برای مدل سازی داده های بقا اصوال از تابع
ریسک یا لگاریتم ریسک استفاده می شود
توابع زیر مثال هایی از مدل های رایج ریسک
می باشند
(Gompertz dis )
Log h(t) = ν+ρt
(weibull dis )
)Log h(t) = ν+ρ log (t
Your Logo
یک مدل پارامتری برحسب تابع نمایی را می
توان به صورت زیر بیان کرد :
Log hi (t) = α + ß1xi1 + ß2xi2 +………… + ßkxik
و یا به صورت معادل
)hi (t) = exp (α + ß1xi1 + ß2xi2 +………… + ßkxik
Your Logo
Log hi (t) = α
و یا
𝛼 𝑒 = )hi (t
هنگامیکه تمام متغیر ها صفر هستند
Your Logo
در مدل کاکس
α (t) =log h0(t)
و در نتیجه تابع ریسک به صورت زیر می باشد
:
Log h (t) = α (t) + ß x + ß x +………… + ß x
i
1
i1
2
i2
k
ik
و یا
hi (t) =h (t) exp (ß x + ß x +………… + ß x )
0
1
i1
2
i2
Your Logo
k
ik
روش کاکس شبیه به رگرسیون چندگانه
است با این تفاوت که متغیر وابسته اینجا
تابع مخاطره است.
حال اگر دو مشاهده را در نظر بگیریم
ηi= ß1xi1 + ß2xi2 +………… + ßkxik
η i'= ß1xi'1 + ß2xi'2 +………… + ßkxi'k
Your Logo
مخاطره نسبی این دو مشاهده به صورت
زیراست
𝑖𝜂 𝑒
= 𝜂𝑖′
𝑒
𝑖ℎ𝑜 𝑇 𝑒 η
=
ℎ0 𝑡 𝑒 η𝑖′
)𝑡(𝑖ℎ
)𝑡( ℎ𝑖 ′
که فارغ از زمان است.مدل کاکس یک مدل مخاطره
نسبی است
Your Logo
در تفسیر مدل کاکس ضرایب
رگرسیونی را در نظر می گیریم برای
مثال یک ضریب رگرسیونی مثبت برای
یک متغیر توضیحی به معنای ریسک
باالتر است و برعکس
Your Logo
منابع
Klein, David G. Kleinbaum, Mitchel. Survival
analysis: a self-learning text (3rd ed. ed.). New
York: Springer. ISBN 978-1-4419-6645
Paul Allison. Survival Analysis Using SAS. SAS
Institute Inc., Cary, NC: 2003.
Cox Propotional-Hazards Regression for Survival
data
Your Logo
www.TahlileAmari.ir
Your Logo