تابع بقا

Download Report

Transcript تابع بقا

‫بسم هللا الرحمن الرحیم‬
‫‪Your Logo‬‬
‫سمینار مدل های خطی‬
‫‪ ‬مهسا ملکیان‬
‫‪ ‬رویا تنهایی‬
‫‪ ‬زمستان ‪93‬‬
‫‪Your Logo‬‬
‫‪www.TahlileAmari.ir‬‬
Your Logo
‫مقدمه‬
‫يكي از انواع داده ها كه مورد عالقه ي شديد محققين و سرمایه گذاران است اهميت دادن به فاصله زماني‬
‫تا وقوع بعضي حوادث مانند مرگ ومير و‪ ...‬مي باشد‪.‬سواالتی جذاب و بسیار حساس و پر اهمیت مانند‪:‬‬
‫‪ (1‬طول عمر یک انسان سالم چقدر است؟در صورتی که دچار بیماری خاصی شود یا تحت شرایط خاصی‬
‫قرار بگیرد طول عمر او چقدر خواهد بود؟‬
‫‪ (2‬عمر مفید یک محصول چقدر است؟خطر استهالک در چه زمانی از طول عمر محصول افزایش می‬
‫یابد؟در صورتی که محصول دچار تغییری مانند تغییر در فرایند تولید گردد چه تاثیری در طول عمر ان‬
‫خواهد گذاشت؟‬
‫سه نمونه از زمینه های کاری و بازار کار فردی که‬
‫فقط بتواند به سواالت اسالید قبل پاسخ دهد!!!!‬
‫‪ ‬بیمه های عمر و سرمایه‬
‫‪ ‬بیمارستان ها و مراکز درمانی جهت ارائه تاثیر بیماری های‬
‫مختلف در طول عمر و ‪...‬‬
‫‪ ‬در بخش صنعت (تعیین مدت زمان گارانتی محصوالت)‬
‫‪Your Logo‬‬
‫شكستتي تتد حدي تتر متتميي واتتر مت رماوتتا حتتاا ترر تتا بتتدي بترا تتر تتري ار تتد ا تتا‪.‬از جملتتر متتمايي تتر مت رماوتتا‬
‫مصاا شكسي د واقعر مميي وار بدشا‪:‬‬
‫‪ ‬طمل عمر ا مدشين صنع‬
‫‪ ‬اولين زمدن مراجعر ا ارممبيل وم بر رعمير گده‬
‫‪ ‬زمدن بقدی یک بیمدي پس از ييمدن ید اوجدم یک عمل جراحی‬
‫‪ ‬زمدن طال یک زوج پس از ازيواج و‪...‬مردل د ت از ا ن قبيل س نا‪.‬‬
‫از ان جد ت ر ا ن يوش د يي اب اا غدلبد برا مطدلعدت مرگ و مير بر دي بريه م شا بر مين جهي ودم ”رجز ر و‬
‫رحليل زمدن بقد ”بر ان وهديه شاه اسي‪.‬‬
‫با توجه به مطالب ذکر شده چه روشی‬
‫برای انجام چنین تحلیلی مناسب است؟‬
‫‪ ‬رگرسیون ؟‬
‫رگرسیون‬
‫رگرسیون یک تکنیک اماری است که ارتباط بین یک متغیر وابسته و یک یا چندمتغیر‬
‫مستقل را بررسی و مدل سازی می کند‪.‬برای مثال ارتباط میان وزن که پديام ری ویسي‬
‫کر لزومد رغییر ومی کنا به عنوان متغیروابسته و فشارخون به عنوان متغیر مستقل‬
‫مدلی که رگرسیون ارائه می دهد تا وقتی معتبر است که گذشت زمان تاثیری در متغیر پاسخ‬
‫ایجاد نکند برای مثال مدل وزن نوزاد‬
‫بنابرین رگرسیون روش مناسبی نیست‪.‬‬
‫‪Your Logo‬‬
‫سری های زمانی ؟‬
‫سری های‬
‫زمانی‬
‫‪ ‬در بحث سری های زمانی بر خالف اینکه موضوع‬
‫زمان به صورت یک پارامتر اصلی در نظر گرفته می‬
‫شود در محاسبه و تخمین طول عمر مدل مناسبی‬
‫ارائه نخواهد داد چرا که در این مدل با توجه به فرض‬
‫مانایی سری زمانی پارامتر مهمی که در طول عمر‬
‫مطرح است و آن بحث استهالک یا پیری می باشد‬
‫در نظر گرفته نمی شود‬
‫‪ ‬بنابرین روش سری های زمانی در مواردی مانند‬
‫پیش بینی قیمت سهام‪ ،‬طال و‪ ...‬کاربرد دارد‪.‬‬
‫‪Your Logo‬‬
‫روش صحیحی که جهت انجام چنین‬
‫تحلیلی مناسب است ؟؟؟‬
‫رحلیل بقد از نظر علم امار مجموعه ای از روش های مختلف اماری در تحلیل متغیر های تصادفی نامنفی‬
‫است که مقدار ان می تواند زمان شکست یک مولفه فیزیکی یا زمان مرگ یک واحد زنده باشد‪.‬‬
‫پيشينه ي تحليل بقا كارهای ي است که در گذشته در مورد جداول عمر انجام شده که در قرن ‪ 17‬میالدی‬
‫شخصی به نام ‪ grount‬اولین فهرست هفتگی مرگ ومیر را در لندن منتشر کرد‪.‬‬
‫‪‬قابلیت اطمینان یک سیستم عبارت است از احتمال کارکرد سالم و بدون عیب‬
‫برای مدت زمان مشخص طبق شرایط موجود و از پیش تعیین شده‪.‬‬
‫‪‬قابلیت اطمینان با گذشت زمان تغییر می کند‪.‬‬
‫‪‬از انجاکه تابع قابلیت اطمینان احتمال عدم از کار افتادگی را بیان می دارد به تابع‬
‫بقا معروف می باشد‪ .‬زیرا در واقع تعیین کننده احتمال عمرباقیمانده دستگاه ها‬
‫است‪.‬‬
‫‪‬نرخ خطر یعنی دستگاه با گذشت زمان در معرض از کارافتادگی بیشتری قرار می‬
‫گیرد‪.‬‬
‫‪Your Logo‬‬
‫‪www.TahlileAmari.ir‬‬
‫قابلیت اطمینان یا تحلیل بقا به روش پارامتری‬
‫(روشی که به دانستن توزیع متغیر نیازمند‬
‫است و محاسبه احتماالت طوالنی!!!)‬
‫‪ ‬آیا در واقعیت و کاربرد روش باال قابل استفاده‬
‫است؟؟؟‬
‫‪ ‬با توجه به اینکه در روش باال برای به دست‬
‫آوردن توزیع ها نیاز به انجام آزمایش که ممکن‬
‫است چندین سال به طول بیانجامد دارید آیا‬
‫مدیری شما را با این شرایط استخدام خواهد‬
‫نمود؟؟؟؟‬
‫‪Your Logo‬‬
‫قابلیت اطمینان یا تحلیل بقا به روش‬
‫ناپارامتری‬
‫‪ ‬داده ها ی طول عمر را با تابع احتمال طول عمر‬
‫و تابع نرخ خطر خالصه نمایند و نیز برآورد‬
‫شاخص های مرکزی چون میانه و صدک ها رایج‬
‫می باشد‪.‬از آنجایی که برای استفاده از این روشها‬
‫نیازبه پیش فرض خاصی در مورد توزیع داده ها‬
‫نیست‪،‬این روش ها را روش های توزیع آزاد یا‬
‫غیر پارامتری گویند‪.‬‬
‫‪Your Logo‬‬
‫‪ ‬این روش در مقایسه با روش قبلی بسیار ساده‬
‫تر و قابل اجرا می باشد‪ .‬همچنین با توجه به‬
‫پایگاه داده های موجود در سازمان ها (بیمارستان‬
‫‪ ،‬کارخانه و ‪ )...‬قابل انجام است‪ .‬البته در این‬
‫روش ورود هر متغیر دیگری که در طول عمر اثر‬
‫خواهد گذاشت امکان پذیر نخواهد بود و فقط‬
‫بحث طول عمر مد نظر قرار می گیرد‪.‬‬
‫‪Your Logo‬‬
‫برای شروع تحلیل و جمع آوری داده ابتدا‬
‫می بایست سه مولفه‪:‬‬
‫‪ )1‬مبدا زمان‬
‫‪ ) 2‬مقیاس و واحد اندازه گیری گذشت زمان‬
‫‪ )3‬مفهوم شکست یا وقوع حادثه‬
‫به طور واضح و دقیق تعریف شود و‬
‫هیچ گونه ابهامی برای آنها وجود نداشته‬
‫باشد‪.‬‬
‫توزیع های بقا‬
‫در مطالعات بقا‪،‬توزیع های مختلفی برای زمان وقوع حادثه به کار برده می شود که‬
‫مورد توجه و عالقه ی شدید محققین می باشد از ان جمله می توان از تابع بقا‪،‬تابع‬
‫خطر‪،‬تابع توزیع تجمعی و تابع چگالی احتمال نام برد که در زیر به اختصار به انها‬
‫اشاره خواهد شد‪.‬‬
‫ردبع بقد‬
‫تابع بقا را با )‪ s(t‬نشان میدهیم و با احتمالی که یک فرد یا مؤلفه بیشتراز ‪ t‬واحد زمانی زنده بماند؛در‬
‫)‪S(t)=pr(T>t‬‬
‫مورد توزیعهای گسسته و پیوسته به صورت زیر تعریف میشود‪:‬‬
‫∞<‪0≤t‬‬
‫‪s(0)=1‬‬
‫‪s(∞)=0‬‬
‫واضح است که )‪ s(t‬یک تابع غیر صعودی و از چپ پیوسته است‪.‬‬
‫)‪ s(t‬نرخ بقا را نیز نشان میدهد به طور مثال اگر زمانها بر حسب سال باشند‪ ، s(t) ،‬نرخ بقای دو ساله را‬
‫نشان میدهد‪.‬‬
‫تابع بقا میتواند به عنوان یک منحنی هموار به صورت زیر باشد‪.‬‬
‫ولی در عمل وقتی از داده ها ی واقعی استفاده می کنیم شکل تابع بقا به صورت پله ای خواهد بود‪:‬‬
‫تابع احتمال بقا‬
‫با استفاده از نمونه ای ازافراد و از یک مجموعه زمان های بقای مشاهده شده می توان نسبتی از جامعه که‬
‫در طول یک دوره معین و تحت همان شرایط زنده می مانند براورد کرد‪.‬مثال با استفاده از اطالعات مربوط به‬
‫بیماران سرطانی می توان احتمال زنده ماندن یک بیمار جدید در طول یک فاصله زمانی را براورد نمود‪.‬‬
‫همان گونه که یک دوره ی زمانی مشخص را می توان به چند فاصله زمانی کوتاه تر تقسیم کرد‪،‬احتمال بقا و‬
‫زنده ماندن در ان دوره ی زمانی مشخص را نیز می توان بر اساس حاصل ضرب احتمال فواصل کوتاه تر‬
‫محاسبه کرد‪.‬مثال احتمال این که شخصی در مدت دو هفته زنده بماند را می توان با حاصل ضرب (احتمال‬
‫زنده ماندن در هفته اول)*(احتمال زنده ماندن در هفته دوم به شرط زنده ماندن در هفته اول)بدست اورد‪.‬‬
‫احتمال بقا را می توان با دو روش زیر محاسبه و براورد نمود‪.‬‬
‫‪ )1‬روش کاپالن‪-‬مه یر(‪1)KM‬‬
‫‪ )2‬روش طول عمر‬
‫‪1.kaplan-meier‬‬
‫يوش کدپالن مر یر‬
‫این روش برای نمونه های کوچک تر که زمان وقوع حوادث به دقت ثبت و اندازه گیری می شود‬
‫بسیار مفید است‪.‬در این روش‪،‬تعداد کل افراد شرکت کننده در مطالعه که تحت پیگیری و مراقبت‬
‫قرار دارند ‪ n‬فرد و زمان های مشاهده شده ‪ t1,t2,…,tn‬است‪.‬زمان بقای بعضی از این افراد ممکن‬
‫است ثبت نشده باشد(گمشده راست)همچنین ممکن است بیش از یک مشاهده برای هر یک از زمان‬
‫های بقا وجود داشته باشد‪.‬‬
‫چون تعداد افراد شرکت کننده در این مدت ‪ ni‬نفر بوده که تعداد ‪ di‬نفر انها مرده اند بنابراین‬
‫احتمال اینکه یک نفر در فاصله زمانی فوق بمیرد برابر است با‪:‬‬
‫𝐢𝐝‬
‫احتمال زنده ماندن یک نفر در فاصله زمانی فوق بربر است با ‪𝐧𝐢:‬‬
‫𝐢𝐝‬
‫می باشد که به احتمال بقا در فاصله فوق معروف است‪.‬‬
‫𝐢𝐝‬
‫)‬
‫𝐢𝐧‬
‫𝐢𝐧‬
‫‪(𝟏 −‬‬
‫𝒌‬
‫𝟏=𝒊‬
‫‪1-‬‬
‫=)‪S(t‬‬
‫روش طول عمر‬
‫وقتی که تعداد مشاهدات و بیماران مورد بررسی زیاد باشند احتمال وجود زمان های بقای یکسان قوت‬
‫می گیرد‪.‬بدین معنا که ممکن است بیش از یک حادثه در هر زمان رخ دهد‪.‬در این صورت روش ‪KM‬‬
‫جداول بسیار طوالنی را موجب می شود که ارائه و تفسیر ان خیلی مطلوب نبوده و وقت گیر خواهد‬
‫شد‪.‬‬
‫بنابراین روش دیگری را به نام روش طول عمر استفاده می کنند که در ان زمان وقوع حوادث را به‬
‫صورت فواصل زمانی تقسیم بندی می کنند‪.‬این فاصله بندی به دلخواه می تواند کم و زیاد گردد و‬
‫الزامی به تساوی فاصله گروه ها نمی باشد‪.‬هر چند مساوی بودن ان ها معمول و متداول است‪.‬این‬
‫روش می تواند نمودار ها و براوردهای ی از توابع بقا و خطر را ارائه دهد‪.‬‬
‫چون احتمال مرگ در فاصله زمانی ‪i‬ام برابر‬
‫است‬
‫لذا احتمال بقا برابربا )‪ (1-qi‬است و سپس تابع بقا عبارت است از ‪:‬‬
‫‪www.TahlileAmar‬‬
‫‪i.ir‬‬
‫‪di‬‬
‫‪n̒i‬‬
‫= ‪qi‬‬
‫میانه و صدک ها‬
‫از انجای ی که در بعضی مطالعات بقا‪،‬در اغاز کار و بالفاصله پس از شروع مراقبت و‬
‫پیگیری‪،‬وقایع(مرگ)کمتری اتفاق می افتد و تعداد این وقایع همراه با پیشرفت زمان بیشتر می‬
‫شود‪،‬لذا داده های انها ‪،‬دارای چولگی منفی است‪.‬از طرفی در برخی از مطالعات بقا وقوع حوادث در‬
‫اوایل کار زیاد بوده (مانند افزایش خطر مرگ در روزهای نخستین پس از عمل جراحی)اما با پیشرفت‬
‫زمان رو به کاهش می گذارد‪،‬لذا داده های این گونه مطالعات دارای چولگی مثبت می باشد‪.‬بنابراین به‬
‫دلیل وجود همین چولگی ها اک ثر داده های بقا دارای توزیع نرمال نبوده و محاسبه و براورد میانه و‬
‫صدک های مهم (صدک ‪ 25‬و صدک ‪)75‬در بین شاخص های مرکزی اهمیت بسیار زیادی دارد و همواره‬
‫گرایش و تمایل به محاسبه میانه و صدک هابیشتر از محاسبه میانگین است‪.‬‬
‫مقدمه‬
‫ً‬
‫معموالدر مطالعات بقا ‪،‬حادثه مد نظر "مرگ" می باشد ‪.‬در این مطالعات عده ای را برای مدتی تحت‬
‫مراقبت وپیگیری قرار می دهند تا تعدادی "مرگ"بدلیل خاصی که مد نظر وبررسی مطالعه است‬
‫مشاهده گردد ‪.‬‬
‫بدیهی است که عوامل وفاک تورهای دیگری چون متغیرهای جمعیتی نظیر سن وجنس بیمار‪،‬‬
‫ً‬
‫خصوصا وضعیت قلبی ‪،‬متغیرهای محیطی وسابقه‬
‫متغیرهای روحی وروانی‪ ،‬عوامل جسمانی وفیزیکی‬
‫سیگاری بودن وعادات غذای ی بر حادثه مشخص فوق تاثیر دارند ‪.‬از طرف دیگر بعضی از بیماری ها‬
‫‪،‬علل مستقیم تری دارند که می توانند زمان بقا را ً‬
‫قویا تحت تاثیر خود قرار دهند‪.‬مث ًال در مطالعه‬
‫بیماران سرطانی‪ ،‬سن بیمار اندازه غده ونحوه درمان و‪...‬تاثیر مستقیم بر روند وقوع مرگ دارند‪.‬‬
‫بنابراین برای ضرورت مدل سازی داده های بقا می توان دودلیل عمده زیر را بیان کرد‪:‬‬
‫‪ )1‬مدل سازی ‪،‬ترکیب متغیرهای موثر بر تابع خطر را مشخص می نماید‪.‬‬
‫‪ )2‬براورد تابع خطر برای هر فرد مشخصی و در هر لحظه زمانی را می توان با مدل سازی مناسب بدست اورد ‪.‬‬
‫مدل اساسی که برای داده های بقا به کار برده می شود“رگرسیون کاکس“ می باشد که به مدل خطرات متناسب‬
‫نیز شناخته شده است‪.‬‬
‫رگرسیون‬
‫کاکس‬
‫مال يگرسیمن خطرات م ندسب‬
‫در سال ‪1972‬میالدی کاکس‪،‬امار شناس معروف و معاصر انگلیسی مدلی را ارائه نمود که از ان زمان‬
‫تا کنون بصورت استاندارد وگسترده ای مورد استفاده قرار می گیرد‪.‬وقتی که تحقیق بررسی اثرات چند‬
‫متغیر بر روی زمان بقا به طور همزمان مد نظر باشد مدل کاکس کاربرد فراوانی دارد‪.‬‬
‫مدل کاکس مدل خطرات متناسب نیز نام گرفته است ‪.‬هرچند که این نام از ان جهت که مدل وی می‬
‫تواند برای خطرات غیر متناسب به کاربرده شود گمراه کننده وتا حدودی بی مسماست‪.‬‬
‫مدل کاکس‪ ،‬یک مدل نیمه پارامتری است و به توزیع خاصی برای زمان های بقا نیاز ندارد‪ .‬اما دو فرض‬
‫بسیار حساس و محکم در این مدل وجود دارد‪.‬‬
‫‪Your Logo‬‬
‫تحلیل بقا به مدل سازی و بررسی‬
‫وآزمایش زمانی که یک واقعه‬
‫نیازدارد تا به وقوع بپیوندد می‬
‫پردازد ‪.‬یکی ازاین وقایع مرگ است‬
‫و در حقیقت این نامگذاری از همین‬
‫جا نشات میگیرد‪.‬‬
‫در یک مدل بقا رابطه میان بقا و‬
‫یک یا چند پیشگو را آزمایش میکند‪.‬‬
‫خوشبینانه ترین تابع بقا را میتوان مکمل تابع‬
‫توزیع دانست‬
‫‪S(T)= Pr (T> t)= 1 – Pr(t) ‬‬
‫جایی که‬
‫)‪Pr(t) = Pr (T<= t‬‬
‫‪Your Logo‬‬
‫مدل کاکس‬
‫مدل کاکس یک تکنیک اماری برای پیدا‬
‫کردن ارتباط میان بقا و تعدادی از‬
‫متغیرهای توضیحی است‬
‫این مدل براوردی از اثر متغیر های‬
‫توضیحی برروی بقا به صورت همزمان‬
‫است‪.‬‬
‫‪Your Logo‬‬
‫به عالوه این مدل به ما اجازه محاسبه‬
‫تابع ریسک را می دهد‪.‬‬
‫تابع ریسک احتمالی که یک فرد در‬
‫یک فاصله زمانی کوتاه یک واقعه را‬
‫تجربه کند بیان می‬
‫کند‬
‫‪Your Logo‬‬
‫برای مدل سازی داده های بقا اصوال از تابع‬
‫ریسک یا لگاریتم ریسک استفاده می شود‬
‫توابع زیر مثال هایی از مدل های رایج ریسک‬
‫می باشند‬
‫‪(Gompertz dis ) ‬‬
‫‪Log h(t) = ν+ρt‬‬
‫‪(weibull dis ) ‬‬
‫)‪Log h(t) = ν+ρ log (t‬‬
‫‪Your Logo‬‬
‫یک مدل پارامتری برحسب تابع نمایی را می‬
‫توان به صورت زیر بیان کرد ‪:‬‬
‫‪Log hi (t) = α + ß1xi1 + ß2xi2 +………… + ßkxik‬‬
‫و یا به صورت معادل‬
‫)‪hi (t) = exp (α + ß1xi1 + ß2xi2 +………… + ßkxik‬‬
‫‪Your Logo‬‬
‫‪Log hi (t) = α ‬‬
‫و یا‬
‫𝛼 𝑒 = )‪hi (t‬‬
‫هنگامیکه تمام متغیر ها صفر هستند‬
‫‪Your Logo‬‬
‫در مدل کاکس‬
α (t) =log h0(t)
‫و در نتیجه تابع ریسک به صورت زیر می باشد‬
:
Log h (t) = α (t) + ß x + ß x +………… + ß x
i
1
i1
2
i2
k
ik
‫و یا‬
hi (t) =h (t) exp (ß x + ß x +………… + ß x )
0
1
i1
2
i2
Your Logo
k
ik
‫روش کاکس شبیه به رگرسیون چندگانه‬
‫است با این تفاوت که متغیر وابسته اینجا‬
‫تابع مخاطره است‪.‬‬
‫حال اگر دو مشاهده را در نظر بگیریم‬
‫‪ηi= ß1xi1 + ß2xi2 +………… + ßkxik ‬‬
‫‪η i'= ß1xi'1 + ß2xi'2 +………… + ßkxi'k ‬‬
‫‪Your Logo‬‬
‫مخاطره نسبی این دو مشاهده به صورت‬
‫زیراست‬
‫‪‬‬
‫𝑖𝜂 𝑒‬
‫‪= 𝜂𝑖′‬‬
‫𝑒‬
‫𝑖‪ℎ𝑜 𝑇 𝑒 η‬‬
‫=‬
‫‪ℎ0 𝑡 𝑒 η𝑖′‬‬
‫)𝑡(𝑖‪ℎ‬‬
‫)𝑡( ‪ℎ𝑖 ′‬‬
‫که فارغ از زمان است‪.‬مدل کاکس یک مدل مخاطره‬
‫نسبی است‬
‫‪Your Logo‬‬
‫در تفسیر مدل کاکس ضرایب‬
‫رگرسیونی را در نظر می گیریم برای‬
‫مثال یک ضریب رگرسیونی مثبت برای‬
‫یک متغیر توضیحی به معنای ریسک‬
‫باالتر است و برعکس‬
‫‪Your Logo‬‬
‫منابع‬
 Klein, David G. Kleinbaum, Mitchel. Survival
analysis: a self-learning text (3rd ed. ed.). New
York: Springer. ISBN 978-1-4419-6645
 Paul Allison. Survival Analysis Using SAS. SAS
Institute Inc., Cary, NC: 2003.
 Cox Propotional-Hazards Regression for Survival
data
Your Logo
www.TahlileAmari.ir
Your Logo