تعریف یک مقدار برش بهینه در تجزیه و تحلیل ROC: یک روش جایگزین

آخرین مطالب

امکانات وب

تعریف یک مقدار برش بهینه در تجزیه و تحلیل ROC: یک روش جایگزین

تجزیه و تحلیل منحنی ROC اغلب برای اندازه گیری دقت تشخیصی یک نشانگر نشانگر استفاده می شود. تجزیه و تحلیل منجر به دو سود می شود: دقت تشخیصی نشانگر نشانگر و مقدار بهینه برش. روشهای زیادی در ادبیات برای به دست آوردن مقدار بهینه برش ارائه شده است. در این مطالعه ، یک رویکرد جدید ، جایگزین برای این روش ها ، ارائه شده است. رویکرد پیشنهادی براساس ارزش منطقه در زیر منحنی ROC است. این روش مقدار بهینه برش را به عنوان مقداری تعریف می کند که حساسیت و ویژگی آن نزدیکترین مقدار منطقه در زیر منحنی ROC است و مقدار مطلق تفاوت بین حساسیت و مقادیر ویژگی حداقل است. این رویکرد بسیار کاربردی است. در این مطالعه ، نتایج روش پیشنهادی با استفاده از داده های استاندارد با استفاده از داده های شبیه سازی شده با شرایط مختلف توزیع و همگن و همچنین یک داده واقعی مقایسه می شود. با توجه به نتایج شبیه سازی ، استفاده از روش پیشنهادی برای یافتن نقطه برش واقعی توصیه می شود.

1. معرفی

منحنی ROC نقشه برداری از حساسیت در مقابل است

برای کلیه مقادیر ممکن برش بین موارد و کنترل. برای اندازه گیری توانایی تشخیصی یک نشانگر نشانگر ، استفاده از اقدامات خلاصه مانند ناحیه زیر منحنی ROC (AUC) و/یا ناحیه جزئی در زیر منحنی ROC (PAUC) معمول است [1]. یک نشانگر تجاری با AUC = 1 افراد را کاملاً به عنوان بیمار یا سالم تبعیض می کند. در همین حال ، AUC = 0. 5 به این معنی است که هیچ تفاوت توزیع آشکار بین مقادیر نشانگر نشانگر دو گروه وجود ندارد [2].

تجزیه و تحلیل ROC دو نتیجه اصلی را ارائه می دهد: دقت تشخیصی آزمون و مقدار برش بهینه برای آزمون. نقاط برش مقادیر آزمایش را دوگانگی می کنند ، بنابراین این تشخیص (بیمار یا نه) را فراهم می کند. شناسایی مقدار برش نیاز به ارزیابی همزمان حساسیت و ویژگی دارد [3]. هنگامی که نقطه بیشتر افراد را به درستی طبقه بندی می کند ، یک نقطه برش بهینه گفته می شود [4 ، 5].

مقادیر AUC ، حساسیت و ویژگی برای ارزیابی یک نشانگر مفید هستند. با این حال ، آنها نقاط برش "بهینه" را مستقیماً مشخص نمی کنند. در ادبیات ، مربوط به موضوع ، رویکردهای زیادی با استفاده از حساسیت و ویژگی برای انتخاب برش وجود دارد [4-9]. یکی از روش متداول شاخص Youden (

) روش [5]. این روش برش بهینه را به عنوان نقطه حداکثر عملکرد Youden تعریف می کند که تفاوت بین سرعت مثبت واقعی و نرخ مثبت کاذب نسبت به تمام مقادیر برش ممکن است [6 ، 7]. رویکرد دیگر به عنوان نکته نزدیک به

گوشه ای در هواپیمای ROC (ER) که نقطه برش بهینه را به عنوان نقطه ای که فاصله اقلیدسی بین منحنی ROC و نقطه را به حداقل می رساند تعریف می کند [4]. رویکرد سوم مبتنی بر حداکثر مقدار قابل دستیابی آمار مجذور کای است (

) که با استفاده از تابلوی متقابل وضعیت بیماری واقعی هدایت می شود و متغیرهای جدیدی را طبقه بندی می کند که نشانگر نشانگر را با توجه به تمام مقادیر برش ممکن از دو دسته جدا می کند [8]. یک رویکرد اخیر توسط لیو [9] ارائه شده است ، که نقطه برش بهینه را به عنوان نقطه حداکثر محصول حساسیت و ویژگی (CZ) تعریف می کند. در ادبیات ، مطالعاتی وجود دارد که معیارهای بهینه حاصل از حساسیت ، ویژگی ، توافق و فاصله را مقایسه می کنند [10 ، 11]. در این مطالعات ، به طور کلی توصیه می شود که محققان باید مواردی را انتخاب کنند که از نظر بالینی بسیار مرتبط باشد.

در این مطالعه ، یک روش جدید برای شناسایی مقدار بهینه برش در تجزیه و تحلیل ROC ارائه شده است. این رویکرد مبتنی بر ناحیه زیر منحنی ROC (AUC) ، حساسیت و مقادیر ویژگی است. این مقدار برش بهینه را به عنوان نقطه ای که جمع بندی مقادیر مطلق تفاوت بین AUC و حساسیت و AUC و ویژگی را به حداقل می رساند ، تعریف می کند و به شرط آنکه تفاوت بین حساسیت و ویژگی حداقل باشد.

در بخش زیر ، ابتدا روشهای پس زمینه روشهای قبلی خلاصه می شود و سپس روش پیشنهادی معرفی می شود. در بخش 3 ، به منظور مقایسه عملکرد روشهای قبلی با روش پیشنهادی ، داده های تولید شده تحت فرض توزیع عادی و مدل های توزیع گاما برای نشانگر نشانگر استفاده می شود. سپس ، در بخش 4 ، با استفاده از داده های یک مطالعه در دنیای واقعی بیماران مبتلا به آتش قلب [12] ، نقاط برش برای فشار پالس ، سدیم پلاسما ، LVEF و ضربان قلب در پیش بینی مرگ و میر با استفاده از پیشنهادی و پیشنهادی محاسبه می شود. روشهای قبلیسرانجام ، در بخش 5 نتیجه گیری داده می شود.

2. روشهای قبلی و روش پیشنهادی

2. 1رویکرد حداقل ارزش

یک نشانگر زیستی مداوم باشد که فرض می شود پیش بینی یک رویداد باشد

برای بیمار یا برای بیمار نیست). در هر نقطه برش احتمالی

) و ویژگی () مقادیر به شرح زیر است:

نقطه برش داده ها را به دو گروه جدا می کند که A را تشکیل می دهد

جدول ، همانطور که در جدول 1 نشان داده شده است.

رویکرد حداقل ارزش توسط میلر و سیگموند [8] پیشنهاد شده و نقطه بهینه را به عنوان نقطه برش تعریف می کند

که آماری استاندارد مجذور کای را با یک درجه آزادی به حداکثر می رساند:

جایی که . همانطور که توسط Rota و Antolini [11] نشان داده شده است ، می توان آن را از نظر احتمالات طبقه بندی نیز نوشت:

2. 2فهرست شما

شاخص Youden یک اندازه گیری برای ارزیابی اثربخشی نشانگر نشانگر است. این اقدام برای اولین بار توسط یودن به ادبیات پزشکی معرفی شد [5]. تابعی از و به گونه ای است که

بیش از همه نقاط برش ؛

نقطه برش مربوط به آن را نشان می دهد. هنگامی که مقدار حداکثر باشد ، مقدار برش "بهینه" است [6 ، 7].

2. 3نزدیکترین معیارها (ER)

در این معیارها ، برش "بهینه" به عنوان نقطه ای نزدیک به نقطه ای از منحنی ROC تعریف می شود [3 ، 4].

از نظر ریاضی ، نکته

به حداقل رساندن عملکرد مقدار برش "بهینه" نامیده می شود.

2. 4روش احتمال تطابق (CZ)

روش احتمال همخوانی که توسط لیو ارائه شده است [9] نقطه برش بهینه را به عنوان نقطه حداکثر محصول حساسیت و ویژگی تعریف می کند.

این محصول بین 0 تا 1 ارزش دارد. احتمال تطابق اندازه گیری دوگانگی در برش می تواند به عنوان مساحت مستطیل مرتبط با منحنی ROC بیان شود. نقطه برش

حداکثر رساندن در واقع مساحت مستطیل را به حداکثر می رساند [9].

2. 5روش پیشنهادی: فهرست اتحادیه (IU)

پرکینز و شیسترمن [4] اظهار داشتند که نقطه برش "بهینه" باید به عنوان نقطه ای انتخاب شود که بیشتر افراد را به درستی طبقه بندی می کند و بنابراین حداقل از آنها نادرست است. از این منظر ، در این مطالعه ، شاخص روش اتحادیه ارائه شده است. این روش یک برش "بهینه" را ارائه می دهد که حداکثر حساسیت و مقادیر ویژگی را در همان زمان دارد. برای یافتن بالاترین حساسیت و مقادیر ویژگی در همان زمان ، مقدار AUC به عنوان مقدار شروع آنها گرفته می شود. به عنوان مثال ، بگذارید مقدار AUC 0. 8 باشد. مرحله بعدی این است که به دنبال یک برش از مختصات ROC باشد که حساسیت و مقادیر آن به طور همزمان بسیار نزدیک یا برابر با 0. 8 هستند. سپس این برش به عنوان نقطه برش "بهینه" تعریف می شود. معیارهای فوق با معادله زیر مطابقت دارد:

، که عملکرد و تفاوت را به حداقل می رساند ، مقدار برش "بهینه" خواهد بود.

به عبارت دیگر ، نقطه برش تعریف شده با روش IU باید دو شرط را برآورده کند: () حساسیت و ویژگی به دست آمده در این نقطه برش باید همزمان نزدیک به مقدار AUC باشد.() تفاوت بین حساسیت و ویژگی به دست آمده در این نقطه برش باید حداقل باشد. شرط دوم اجباری نیست ، اما وقتی چندین نقطه برش معادله را برآورده می کند ، یک شرط اساسی است.

به منظور نشان دادن چگونگی تعریف روش IU نقطه برش "بهینه" ، از مقادیر به دست آمده از داده های مصنوعی استفاده می شود. برخی از نقاط برش (با حساسیت و مقادیر ویژگی آنها) ارائه شده توسط داده های مصنوعی در جدول 2 آورده شده است. در این مثال ، مقدار AUC به عنوان 0. 918 محاسبه می شود. به خاطر سادگی ، به جای مقادیر ، مقادیر ویژگی در جدول آورده شده است. با استفاده از روش IU ، به راحتی می توان آن حساسیت (0. 92) و ویژگی (0. 92) مقادیر برش 1. 985 را نزدیکترین آنها به مقدار AUC دادند. از آنجا که تفاوت بین این دو مقدار حداقل است ، این برش با روش IU ، برش "بهینه" نامیده می شود.

با این حال ، لازم به ذکر است که انتخاب چنین نقطه برش مانند برش "بهینه" ممکن است گاهی اوقات شکست بخورد. به عنوان مثال ، اجازه دهید

بشرسپس ، آمار ارائه شده در (7) 0 خواهد بود و همچنین تفاوت بین و خواهد بود. بنابراین با توجه به تعریف بهینه ای که در روش IU ذکر شده است ، برش به عنوان نقطه برش "بهینه" پذیرفته می شود. با این حال ، اگر یک نکته وجود داشته باشد

برای آن و ، سپس نرخ کل طبقه بندی 0. 38 خواهد بود (که کوچکتر از نقطه ، یعنی 0. 40) است. از این رو ، بر اساس تعریف بهینه ای که توسط پرکینز و شیسترمن داده شده است ، نقطه برش یک نقطه بهینه بهتر از نقطه برش است [4].

از نظر هندسی ، ایده پشت روش IU بسیار شبیه به ایده پشت روش ER است. همانطور که در شکل 1 مشاهده می شود ، روش IU همچنین سعی می کند نزدیکترین نقطه را تا یک نقطه پیدا کند ، یعنی نکته (، AUC). در روش ER ، این نکته در نظر گرفته شده است. با این حال ، به جای استفاده از فاصله اقلیدسی مانند روش ER ، روش IU از تفاوت های مطلق بین اقدامات دقت تشخیصی و مقدار AUC استفاده می کند. به طور خاص تر ، روش IU در جستجوی نقطه ای است که نیمی از محیط مستطیل ABCD را که در شکل 1 دیده می شود به حداقل می رساند

منحنی مشخصه اپراتور گیرنده برای فشار پالس در پیش بینی مرگ قلبی عروقی [12].

3. مطالعه شبیه سازی

همانطور که توسط Rota و Antolini نشان داده شده است [11] اگرچه برخی از این روش ها از نظر ریاضی مرتبط هستند ، اما لزوماً همان برش واقعی را مشخص نمی کنند. یعنی بسته به طراحی مطالعه (متعادل یا نامتعادل) ، روش ها ممکن است نقاط مختلف برش را شناسایی کنند. با توجه به نتایج آنها ، در سناریوی همسایه متعادل ، روشها همان نکته را مشخص کردند. در سناریوهای باقیمانده (به عنوان مثال ، سناریوهای نامتوازن همسایه و متعادل/نامتعادل/نامتعادل) ، این روش ها نقاط مختلف برش را مشخص می کنند. این نتایج بر اهمیت تعریف صحیح نقطه برش واقعی در تمام سناریوهای ممکن تأکید دارد.

بگذارید فرض کنیم که یک نشانگر خاص () در جمعیت های بیمار و غیرقانونی به طور معمول توزیع می شود ،

برای افراد بیمار و

برای موضوعات غیرقانونی. تحت این فرضیات ، حساسیت و ویژگی را می توان به عنوان نوشت

جایی که عملکرد توزیع عادی استاندارد را نشان می دهد. نقطه برش بهینه در تقاطع توابع چگالی احتمال طبیعی افراد بیمار و غیرقانونی رخ می دهد (به عنوان مثال ،

) [7 ، 13]. به عنوان مثال ، اگر به عنوان گرفته شود

، نقاط برش واقعی مربوطه خواهد بود

[11 ، 13]. این مقادیر تضمین شده طیف گسترده ای از دقت طبقه بندی ، اعم از فقیر تا بالا [7 ، 11 ، 13]. شناسایی نقطه برش نظری واقعی برای روش IU تحت این سناریو در پیوست آورده شده است.

اکنون فرض کنید که گاما با پارامترهای زیر توزیع شده است:

برای افراد بیمار و برای افراد غیرقانونی. به عنوان مثال ، اگر به عنوان

، نقاط برش مربوطه برای هر روش متفاوت خواهد بود. این ، برای رویکرد ، ، برای شاخص Youden ، ، برای احتمال همخوانی ، و برای نقطه ای نزدیک به گوشه ، [11]. برای شاخص اتحادیه ، نقاط برش مربوطه با استفاده از روش تخمین تجربی در کار لیو [9] به عنوان (شکل 2) تخمین زده می شود.

توابع عینی تخمین زده شده تجربی تحت توزیع های اساسی مختلف: نور به رنگ های تیره سناریوها را با دقت طبقه بندی از فقیر تا بالا نشان می دهد. سناریوی توزیع گاما Homoscedastic با طراحی متعادل (

به منظور مقایسه عملکرد روشهای انتخاب برش با عملکرد روش پیشنهادی در این مطالعه ، یک مطالعه شبیه سازی با سناریوهای مختلف انجام می شود. این سناریوها همان مواردی است که در کار Rota و Antolini آورده شده است [11]. سناریوی اول سناریوی همجنس گرا با طراحی متعادل است که در آن همه روشها از لحاظ نظری همان نقطه برش واقعی را شناسایی می کنند. مورد دوم مورد عادی غیر متعادل است ، که در آن همه روشها به جز رویکرد همان برش را مشخص می کنند. آخرین سناریو مورد گاما است که در آن همه روش ها نقاط مختلف برش را مشخص می کنند.

در تمام سناریوها ، 1000 نمونه با اندازه نمونه 50 ، 100 و 200 برای هر گروه و با اندازه نمونه تولید شد.،و ، (تعداد افراد بیمار است و تعداد افراد غیرقانونی است).

برای هر نمونه ، نقاط برش بهینه ، ، و برای حداقل مقدار ، شاخص Youden ، احتمال همخوانی ، نقطه نزدیکترین گوشه به (0 ، 1) گوشه و شاخص اتحاد به ترتیب تخمین زده می شود. تعصب نسبی و میانگین خطای مربع (MSE) هر روش توسط محاسبه می شود

و به ترتیب(نشانگر برش واقعی است و با استفاده از روش برش تخمین زده می شود.)

به منظور برآورد انحراف استاندارد و فاصله اطمینان (CI) برای نقطه برش بهینه ، تکنیک تغییر شکل مجدد بوت استرپ اعمال می شود [14]. برای محاسبه برآورد bootstrap

، نمونه گیری تصادفی با جایگزینی برای ترسیم 200 نمونه بوت استرپ در هر یک از 1000 نمونه تولید شده استفاده می شود. علاوه بر این ، برای ساخت 95 ٪ CI برای نقطه برش بهینه ، روش صدک اصلی با گرفتن 2. 5 و 97. 5 درصد از توزیع بوت استرپ اعمال می شود.

برآوردگر بوت استرپ انحراف استاندارد (

) برای برش تخمین زده شده با در نظر گرفتن انحراف استاندارد از 200 تخمین برش محاسبه می شود. در هر یک از سناریوهای شبیه سازی ، CI ها متعاقباً با محاسبه احتمال پوشش و میانگین طول ارزیابی می شوند.

کلیه شبیه سازی ها با استفاده از برنامه R با نسخه 3. 2. 0 انجام می شود. برای تعیین تخمین برای شاخص Youden و نقطه نزدیک به گوشه ، از کتابخانه PROC استفاده می شود [15]. برای تعریف برآوردهای بقیه روشها ، یک کد R توسط نویسنده نوشته شده است و در صورت درخواست می تواند در دسترس باشد.

3. 1نتایج شبیه سازی

جدول 3 نتایج را برای طراحی متوازن تحت توزیع های هموسداستیک نرمال نشان می دهد. مقادیر سوگیری نسبی روش های پیشنهادی قبلی مشابه نتایج کار روتا و آنتولینی [11] است به جز سوگیری نسبی شاخص یودن. به ویژه برای سناریوهای دقت طبقه بندی ضعیف (یعنی و 0. 52)، شاخص یودن عملکرد بدتری در برآورد نقطه برش بهینه نسبت به نتایج آنها دارد. با این حال، این اختلاف در مقایسه MSE ها دیده نمی شود. یعنی MSEهای همه روشها مشابه کار روتا و آنتولینی است [11].

هنگام مقایسه بایاس و مقادیر MSE نسبی روش IU با روش های دیگر، به راحتی می توان دریافت که روش IU عمدتاً عملکرد مشابهی با روش نزدیکترین نقطه به گوشه دارد و عملکرد بهتری نسبت به روش های دیگر دارد. یعنی سوگیری نسبی کمتر و مقادیر MSE کمتر).

برای طراحی متوازن تحت توزیع های هموسداستیک معمولی، انحراف استاندارد بوت استرپ، احتمال پوشش، و میانگین طول 95% بوت استرپ CI برای نقطه برش در جدول 4 نشان داده شده است. همانطور که در جدول 3، نتایج ارائه شده در جدول 4 مشابه هستند. به کار روتا و آنتولینی [11]. یعنی، رویکرد حداقل مقدار نسبت به روش های دیگر بیشتر است و دقت طبقه بندی بهتر، CIهای راه اندازی باریک تر 95% را ارائه می کنند. روش IU به کمترین مقدار و باریک ترین CI در اکثر سناریوها دست می یابد. احتمالات پوشش برای همه روش ها نزدیک به سطح اسمی است.

انحراف استاندارد بوت استرپ، احتمال پوشش، و میانگین طول تخمین فاصله اطمینان 95% همه روش ها. سناریوی متعادل هموسداستیک معمولی.

تعصب نسبی و نتایج MSE برای طراحی نامتعادل تحت توزیع های همسایه عادی در جدول 5 نشان داده شده است. از آنجامقایسه ها [11]. مقادیر تعصب نسبی همه روشها شبیه به کار Rota و Antolini است [11] ، به جز رویکرد حداقل ارزش در سناریوی کمترین طبقه بندی (یعنی). برای این سناریو ، تعصب نسبی برای رویکرد حداقل ارزش از تعصب ذکر شده در کار آنها بزرگتر است. برای دقت طبقه بندی ضعیف و ضعیف (یعنی ، و 0. 52) ، MSE برای روش IU کمترین است ، و برای دقت طبقه بندی متوسط و بالا (یعنی ، و 1. 28) ، هر دو نقطه نزدیک به گوشهروش و روش IU کمترین مقادیر MSE را دریافت می کنند.

تعصب نسبی و میانگین خطای مربع (MSE) از همه روش ها. سناریوی نامتعادل هموسیستیک عادی.

برای طراحی نامتعادل تحت توزیع های همسایه عادی ، انحراف استاندارد Bootstrap ، احتمال پوشش و میانگین طول 95 ٪ Bootstrap CI برای نقطه برش در جدول 6 آورده شده است. برای این سناریو ، کمترین و میانگین طول 95 ٪مقادیر CI BOOTSTRAP با نقطه نزدیکترین روش گوشه ای به (0 ، 1) و روش IU بدست می آید. همانطور که در مقایسه با تعصب نسبی و مقادیر MSE روشها (جدول 5) ، برای دقت طبقه بندی ضعیف و ضعیف (یعنی ، و 0. 52) ، روش IU کمترین و میانگین طول را کسب می کند و برای متوسط متوسطو دقت طبقه بندی بالا (یعنی ، و 1. 28) ، هر دو نقطه نزدیک به گوشه در صفحه ROC و روش IU کمترین مقادیر را کسب می کنند. احتمال پوشش برای همه روشها نزدیک به سطح اسمی است.

انحراف استاندارد Bootstrap ، احتمال پوشش و میانگین طول تخمین فاصله اطمینان 95 ٪ از همه روش ها. سناریوی نامتعادل هموسیستیک عادی.

همانطور که در کار Rota و Antolini [11] نشان داده شده است ، با فرض توزیع گاما با یک طراحی متعادل ، نقاط برش واقعی نظری ، و همه متفاوت هستند. برای کلیه سناریوهای دقت طبقه بندی ، نقاط برش واقعی نظری برای روش IU بر اساس ایده ارائه شده در مقاله لیو [9] بدست می آید (شکل 2). مقادیر تعصب نسبی همه روشها شبیه به روشهای Rota و Antolini است [11]. MSE کمترین مقدار خود را در نقطه نزدیکترین گوشه و روش IU برای همه سناریوهای دقت طبقه بندی (جدول 7) کسب می کند.

برای این طرح (تحت توزیع گاما) ، و میانگین طول مقادیر CI 95 ٪ برای نقطه نزدیکترین روش به گوشه و روش IU پایین تر از سایر رویکردهای مورد بررسی است (جدول 8). احتمال پوشش برای همه روشها نزدیک به سطح اسمی است.

انحراف استاندارد Bootstrap ، احتمال پوشش و میانگین طول تخمین فاصله اطمینان 95 ٪ از همه روش ها. سناریوی متعادل گاما.

در تمام سناریوهای شبیه سازی ، روش IU عملکرد بهتری را در تخمین نقطه برش بهینه با توجه به روشهای دیگر نشان می دهد. انحراف استاندارد Bootstrap و میانگین طول مقادیر CI Bootstrap 95 ٪ برای روش IU نیز در بین تمام روش ها حداقل است. بنابراین ، برای همه سناریوهای شبیه سازی ، اگرچه در سناریوهای گاما ، روشها به یک نقطه برش مشترک منجر نمی شوند ، برای شناسایی نقطه برش بهینه ، روش IU جایگزین بهتری نسبت به روشهای پیشنهادی قبلی است.

3. 2اعتبارسنجی متقابل از نقطه برش بهینه

به منظور ارزیابی اهمیت برش بهینه انتخاب شده ، از فرآیند اعتبارسنجی متقابل دو برابر [16] استفاده می شود. این روش به شرح زیر است: (1) تولید داده ها با همان خواص ارائه شده در این نسخه (2) استفاده از تمام روش ها در داده ها و تخمین نقاط برش برای همه روش ها (3) تقسیم داده ها به دو زیر مجموعه مساوی ، یعنی زیر مجموعهI و Subset II (4) با استفاده از تمام روش ها در زیر مجموعه I و تخمین نقاط برش برای کلیه روش ها (5) اختصاص هر مشاهده در زیر مجموعه II به هر یک از دو گروه با استفاده از نقطه برش به دست آمده در مرحله قبل (6)با استفاده از تمام روشها در زیر مجموعه II جدید و تخمین نقاط برش برای همه روشها (7) اختصاص هر مشاهده در زیر مجموعه I به هر یک از دو گروه با استفاده از نقطه برش به دست آمده در مرحله قبل (8) با استفاده از تمام روش ها در ترکیباز میان این دو زیر مجموعه و تخمین نقاط برش برای کلیه روشها (9) که تفاوت بین نقاط برش به دست آمده در مرحله دوم و در آخرین مرحله این روش برای 4 سناریو اعمال می شود (2 سناریوی طبیعی و 2 گاما با نمونهاندازه) در نسخه خطی آورده شده است. نتایج در شکل 1 در مواد تکمیلی موجود به صورت آنلاین در https://doi.org/10. 1155/2017/3762651 نشان داده شده است. با توجه به نتایج ، برای هر روش ، تفاوت بین نقاط برش بهینه تخمین زده شده قبل و بعد از اعتبار متقابل حدود 0 است و روش IU کمترین میانگین تفاوت مطلق را در هر چهار سناریو کسب می کند.

4. کاربرد

از داده های واقعی به دست آمده از یک مطالعه در قلب و عروق به عنوان نمونه استفاده می شود. Yildiran و همکاران.[12] ارتباط بین فشار پالس و مرگ 2 ساله قلبی عروقی در کل جمعیت دلخوشی را بررسی کرد. آنها به صورت آینده نگر 225 بیمار (188 مرد ، 37 زن) با فصاحت قلب با کلاسهای عملکردی NYHA I-IV ، میانگین سنی 56. 5 را ثبت کردند [12].

آنها تاریخچه مفصلی از 225 بیمار ، از جمله خصوصیات جمعیت شناختی ، عوامل خطر قلبی عروقی (CV) و استفاده از دارو را ثبت کردند. بیماران مطابق با تاریخچه پزشکی و یافته های معاینه فیزیکی و سپس به 2 گروه طبق کلاس NYHA خود به 4 کلاس NYHA تقسیم شدند (نارسایی خفیف قلب [کلاس های I-II] و نارسایی قلبی پیشرفته [کلاس III-IV]). سطح لیپیدهای سرم ، گلوکز ، پروتئین واکنشی C با حساسیت بالا ، نیتروژن اوره خون ، کراتینین ، سدیم و پتاسیم با روشهای آزمایشگاهی روتین اندازه گیری شد. فشارهای خون مطابق با دستورالعمل های منتشر شده توسط Sphygmomanometer اندازه گیری شد. فشار پالس به عنوان تفاوت بین فشار خون سیستولیک و دیاستولیک محاسبه شد ، و بیماران بر این اساس به 4 کوارتیل (PP از 55 میلی متر جیوه) تقسیم شدند [12].

آنها از تجزیه و تحلیل ROC برای تعریف مقادیر برش برای فشار پالس ، LVEF ، مقدار سدیم پلاسما و ضربان قلب در پیش بینی مرگ CV استفاده کردند. در این تجزیه و تحلیل ، 170 بیمار که هر چهار اندازه گیری را به طور همزمان (اندازه گیری 55 بیمار از دست داده بودند) در نظر گرفتند. برای به دست آوردن مقادیر بهینه برش ، آنها از رویکرد ER استفاده کردند [12].

جدول فقط در وب ، برخی از آمار توصیفی این چهار اندازه گیری را گزارش می کند. فشار پالس ، LVEF و سطح سدیم پلاسما در بیماران مرده به طور قابل توجهی پایین تر از بیماران زنده است و ضربان قلب در بیماران مرده نسبت به بیماران زنده به طور قابل توجهی بیشتر است. با توجه به نتایج آزمایش توزیع عادی غیر پارامتری شاپیرو-ویلک ، ضربان قلب و سدیم پلاسما به طور معمول در هر دو گروه توزیع می شود ، LVEF به طور معمول در بیماران مرده توزیع می شود و به طور معمول در بیماران زنده توزیع نمی شود و فشار پالس به طور معمول توزیع نمی شوددر هر دو گروهبرای متغیرهای توزیع شده غیر طبیعی ، توزیع LVEF در بیماران زنده از سمت چپ استفاده می شود و توزیع فشار پالس در هر دو گروه از سمت راست استفاده می شود. از آنجا که تعداد بیماران در دو گروه به اندازه کافی نزدیک نیستند ، طراحی نامتعادل است و نسبت بین تعداد بیماران مشابه سناریوی 50: 100 در پروتکل شبیه سازی است.

در این مطالعه ، داده های به دست آمده از مطالعه توسط Yildiran و همکاران.[12] استفاده می شود و تمام روشهای از جمله روش IU برای این داده ها اعمال می شود. نتایج مربوطه در جدول 9 آورده شده است. قسمت فوقانی جدول 9 نقاط برش به دست آمده با استفاده از روشهای پیشنهادی قبلی را نشان می دهد. برای تعریف نقطه برش با روش IU ، برخی از نقاط برش با حساسیت و مقادیر ویژگی و مقدار AUC آنها آورده شده است. طبق این جدول ، روش IU با روش ER برای مقادیر مختلف AUC ، نقاط برش یکسانی را ارائه می دهد (شکل 3).

برآوردهای برش واقعی به دست آمده توسط تمام روشها: برخی از نقاط برش و مقادیر AUC برای فشار پالس ، LVEF ، سطح سدیم پلاسما و ضربان قلب در پیش بینی مرگ و میر.

(a) The receiver operator characteristic curve for LVEF in the prediction of cardiovascular death [12]

(الف) منحنی مشخصه اپراتور گیرنده برای LVEF در پیش بینی مرگ قلبی عروقی [12]

(b) The receiver operator characteristic curve for plasma sodium in the prediction of cardiovascular death [12]

(ب) منحنی مشخصه اپراتور گیرنده برای سدیم پلاسما در پیش بینی مرگ قلبی عروقی [12]

ج) منحنی مشخصه اپراتور گیرنده برای ضربان قلب در پیش بینی مرگ قلبی عروقی [12]

(الف) منحنی مشخصه اپراتور گیرنده برای LVEF در پیش بینی مرگ قلبی عروقی [12] (ب) منحنی مشخصه اپراتور گیرنده برای سدیم پلاسما در پیش بینی مرگ قلبی و عروقی [12] (c) عملگر گیرنده مشخصات برای ضربان قلبدر پیش بینی مرگ قلبی عروقی [12]

منحنی های مشخصه اپراتور گیرنده برای LVEF ، سدیم پلاسما و ضربان قلب در پیش بینی مرگ قلبی عروقی [12].

5. نتیجه گیری ها

تعریف نقطه برش بهینه بسیار مهم است وقتی که یک متغیر مداوم به عنوان یک نشانگر تشخیصی در نظر گرفته شود. دریافت سطح طبقه بندی بهینه بستگی به نقطه ای دارد که برای تشخیص انتخاب شده است. معیارهای بهینه می تواند با توجه به هدف از مطالعه تغییر کند. با این حال ، به عنوان یک قاعده کلی ، به حداقل رساندن نرخ کل طبقه بندی یک رویکرد خوب است. با استفاده از روش IU ، از آنجا که تفاوت بین حساسیت و مقادیر ویژگی حداقل است ، این شرایط بیشتر اوقات برآورده می شود.

با توجه به نتایج داده شده در جداول ، روش پیشنهادی IU می تواند جایگزین بهتری برای تعریف نقطه برش باشد. هنگامی که تعریف نقطه بهینه به عنوان نقطه ای بیان می شود که نرخ های نادرست طبقه بندی یا نکته ای را که مقادیر حساسیت و ویژگی را برابر می کند ، به حداقل می رساند ، روش IU در بیشتر سناریوهای مقایسه بهتر از سایر روشها است. این نتیجه گیری با توزیع نشانگر نشانگر یا همگن بودن واریانس های نشانگرهای زیستی تغییر نمی کند. تغییرات در اندازه نمونه و مقادیر AUC ممکن است تأثیر بگذارد اما تفسیر را تغییر ندهد.

روش IU به جای استفاده از فاصله اقلیدسی ، از تفاوت مطلق بین اقدامات دقت تشخیصی و مقدار AUC استفاده می کند. دلیل این ایده ارائه سادگی در تعریف نکته به عنوان بهینه است. با استفاده از روش IU ، فقط با بررسی اینکه آیا حساسیت و مقادیر ویژگی به اندازه کافی به مقدار AUC نزدیک هستند یا نه ، می توانید به راحتی نقطه برش را مشخص کنید. یعنی محاسبات پیچیده برای روش IU ضروری نیست.

هنگامی که تعصب نسبی و مقادیر MSE روش IU با روشهای قبلی مقایسه می شوند ، مشاهده می شود که روش IU بهتر از سایرین است. بنابراین می توان از این روش برای تعریف مقدار بهینه برش استفاده کرد ، به خصوص هنگامی که اندازه نمونه دو گروه برابر است و مقدار AUC زیاد است.(یعنی بالاتر از 0. 7).

یک روش معمول انتخاب یک نقطه برش است که دو گروه خطر را برای یک نشانگر تجاری به طور مداوم اندازه گیری می کند [16]. یک نقطه برش برای یک نشانگر نشانگر برای پزشکان معنی دار است که از نظر بالینی قابل تفسیر و قابل درک است. معنی بالینی برای یک نقطه برش را می توان با استفاده از دقت آن ، یعنی میزان طبقه بندی واقعی توضیح داد. در بین تمام روشها ، فقط دو مورد از آنها ، شاخص Youden و احتمال همخوانی بر اساس حداکثر رساندن این نرخ است. بنابراین ، این روش ها نقاط برش قابل تفسیر را ارائه می دهند.

نکته نزدیک به روش منحنی ROC شامل یک اصطلاح درجه دوم است و معنای بالینی این اصطلاح ناشناخته است. با وجود عدم معنای بالینی ، در ادبیات نشان داده شده است که این روش نسبت به سایر روشها در برآورد نقطه برش واقعی برتر است [11].

روش IU، مانند شاخص یودن و احتمال تطابق، سعی می کند نرخ طبقه بندی اشتباه را به حداقل برساند. از این رو، یک نقطه برش قابل تفسیر نیز ارائه می دهد. در این مطالعه نشان داده شده است که روش IU بهتر از (یا برابر) نزدیکترین نقطه به نقطه در روش منحنی ROC عمل می کند. بنابراین، استفاده از روش IU برای دریافت نقطه برش قابل تفسیرتر و بهینه سازی بهتر توصیه می شود.

روش IU نقطه برشی را فراهم می کند که حساسیت و ویژگی آن به همان اندازه بالا است. این بدان معنی است که در یک فرآیند تعیین نقطه برش، اگر حساسیت و ویژگی به طور مساوی ارزش گذاری شوند، به نظر می رسد روش IU بهترین گزینه در بین سایر روش ها باشد.

ضمیمه

شناسایی نقطه برش نظری واقعی برای روش IU در مورد توزیع همسان عادی

اجازه دهید سناریوی توزیع عادی هموسداست را در نظر بگیریم، جایی که

، 1 (با فرض و ). سپس توزیع شرطی متغیر کمی در گروه است

به طور خاص، در نقطه برش، ویژگی، و حساسیت. سپس تابع را می توان به صورت یکی از اشکال زیر نوشت (با توجه به تفاوت در مقدار مطلق): (i) (ii) (iii) (iv) یعنی

کجا و دلخواه هستند

. بنابراین این فرمول شکل کلی شاخص یودن است. بنابراین، نقطه برشی که تابع IU را بهینه می کند، می توان با گرفتن اولین مشتق از IU( ) به دست آورد.

، توابع چگالی احتمال طبیعی برای افراد بیمار و غیر بیمار کجا هستند. از آنجایی که توزیع نرمال متقارن است، برای توزیع نرمال استاندارد و در نتیجه ریشه برابر است.

تضاد علاقه

نویسنده اعلام می کند که در مورد انتشار این مقاله تضاد منافع وجود ندارد.

قدردانی ها

نویسنده از دکتر رفیک بورگوت، دکتر نازان آلپارسلان و دکتر یاسار سرتدمیر به خاطر نظرات و پیشنهادات ارزشمندشان تشکر می کند و همچنین از دکتر تانسل یلدیران برای ارائه داده ها برای نشان دادن روش تشکر می کند.

مواد تکمیلی

جدول تکمیلی 1: آمار توصیفی از مثال کاربردی یافتن نقطه برش برای فشار پالس، LVEF، سطح سدیم پلاسما و ضربان قلب در پیش بینی مرگ و میر، از یلدیران و همکاران.(2010).

شکل تکمیلی 1: تفاوت بین نقاط برش بهینه تخمین زده شده قبل و بعد از اعتبارسنجی متقاطع حدود 0 است و روش IU کوچکترین میانگین مطلق اختلاف را در هر چهار سناریو دریافت می کند.

منابع

X.-H. Zhou ، N. A. Obuchowski ، and D. K. McClish ، روش های آماری در پزشکی تشخیصی ، سری Wiley در احتمال و آمار ، Wiley-Interscience [جان ویلی و پسران] ، نیویورک ، 2002.

M. H. Zweig and G. Campbell ، "توطئه های مشخصه گیرنده (ROC): یک ابزار ارزیابی اساسی در پزشکی بالینی ،" ، شیمی بالینی ، جلد. 39 ، نه. 4 ، صص 561-577 ، 1993.

M. S. Pepe ، ارزیابی آماری تست های پزشکی برای طبقه بندی و پیش بینی ، جلد. 28 سریال علمی آماری آکسفورد ، انتشارات دانشگاه آکسفورد ، آکسفورد ، انگلیس ، 2003.

N. J. Perkins و E. F. Schisterman ، "ناسازگاری نقاط" بهینه "با استفاده از دو معیار مبتنی بر ROC" ، مجله آمریکایی اپیدمیولوژی ، جلد. 163 ، نه. 7 ، صص 670-675 ، 2006.

W. J. Youden ، "شاخص برای آزمایش های تشخیصی رتبه بندی ،" سرطان ، جلد. 3 ، نه. 1 ، صص 32-35 ، 1950.

R. Fluss ، D. Faraggi ، and B. Reiser ، "تخمین شاخص Youden و نقطه قطع آن ،" مجله بیومتریک ، جلد. 47 ، نه. 4 ، صص 458-472 ، 2005.

N. J. Perkins و E. F. Schisterman ، "شاخص Youden و نقطه برش بهینه اصلاح شده برای خطای اندازه گیری ،" مجله بیومتریک ، جلد. 47 ، نه. 4 ، صص 428-441 ، 2005.

R. Miller و D. Siegmund ، "آمار حداکثر انتخاب شده Chi" ، بیومتریک. مجله انجمن بیومتریک ، جلد. 38 ، نه. 4 ، صص 1011-1016 ، 1982.

X. لیو ، "دقت طبقه بندی و انتخاب نقطه برش" ، آمار در پزشکی ، جلد. 31 ، نه. 23 ، صص 2676 2686 ، 2012.

K. H. Zou ، C.-R. Yu ، K. Liu ، M. O. Carlsson ، and J. Cabrera ، "آستانه های بهینه با به حداکثر رساندن یا به حداقل رساندن معیارهای مختلف از طریق تجزیه و تحلیل نوع ROC ،" ، رادیولوژی آکادمیک ، جلد. 20 ، نه. 7 ، صص 807-815 ، 2013.

M. Rota و L. Antolini ، "یافتن نقطه برش بهینه برای نشانگرهای زیستی توزیع شده گاوسی و گاما ،" آمارهای محاسباتی و تجزیه و تحلیل داده ها ، جلد. 69 ، صص 1 14 ، 2014.

T. Yildiran ، M. Koc ، A. Bozkurt ، D. Y. Sahin ، I. Unal و E. Acarturk ، "فشار پالس کم به عنوان پیش بینی کننده مرگ در بیماران مبتلا به نارسایی قلبی خفیف تا پیشرفته ،" مجله موسسه قلب تگزاس ، جلد. 37 ، نه. 3 ، صص 284 290 ، 2010.

E. F. Schisterman ، N. J. Perkins ، A. Liu ، and H. Bondell ، "نقطه برش بهینه و شاخص مربوط به Youden مربوط به آن برای تبعیض افراد با استفاده از نمونه های خون مخلوط ،" اپیدمیولوژی ، جلد. 16 ، نه. 1 ، صص 73-81 ، 2005.

J. Carpenter و J. Bithell ، "فواصل اعتماد به نفس bootstrap: چه زمانی ، کدام ، چه؟یک راهنمای عملی برای آمارشناسان پزشکی ، "آمار پزشکی ، جلد. 19 ، نه. 9 ، صص 1141 1164 ، 2000.

X. Robin ، N. Turck ، A. Hainard et al. ، "PROC: یک بسته منبع باز برای R و S+ برای تجزیه و تحلیل و مقایسه منحنی های ROC ،" BMC Bioinformatics ، Vol. 12 ، ماده 77 ، 2011.

D. Farraggi و R. Simon ، "یک مطالعه شبیه سازی اعتبارسنجی متقابل برای انتخاب یک نقطه برش بهینه در تجزیه و تحلیل بقاء متغیره ،" آمار در پزشکی ، جلد. 15 ، نه. 20 ، صص 2203 2213 ، 1996.

کپی رایت

کپی رایت © 2017 Ilker Unal. این یک مقاله دسترسی آزاد است که تحت مجوز انتساب Creative Commons توزیع شده است ، که امکان استفاده ، توزیع و تولید مثل بدون محدودیت در هر رسانه را فراهم می کند ، مشروط بر اینکه کار اصلی به درستی ذکر شود.< Pan> X. Robin ، N. Turck ، A. Hainard et al. ، "PROC: یک بسته منبع باز برای R و S+ برای تجزیه و تحلیل و مقایسه منحنی های ROC" ، BMC Bioinformatics ، Vol. 12 ، ماده 77 ، 2011.

پلتفرم های تجاری...

ما را در سایت پلتفرم های تجاری دنبال می کنید

برچسب : نویسنده : کمال بهروزکیا بازدید : 53 تاريخ : جمعه 4 فروردين 1402 ساعت: 11:46

تعریف یک مقدار برش بهینه در تجزیه و تحلیل ROC: یک روش جایگزین

آخرین مطالب

امکانات وب