جرافيتي ذ.م.م

عصابات الثقة

فترات الثقة ونطاقات الثقة

الأساسيات

يُسألنا أحيانًا عن كيفية الحصول على فترات الثقة في النماذج الخطية في Grafiti . في الواقع، الأمر ليس صعبًا للغاية، وهنا سنراجع هذه التقنية. ولكن قبل أن نفعل ذلك، دعونا نراجع الأفكار الأساسية وراء فترة الثقة للنموذج الخطي.

أولاً، إذا كان لدينا انحدار خطي لـ Y على المتغير X، فإننا نقول في الواقع أنه بالنسبة لقيمة معينة لـ X، يتم إعطاء قيمة Y بواسطة Y=aX+b+e حيث e هو “مصطلح ضوضاء” “.

يُفترض عادة أن يتم توزيع مصطلح الضوضاء بشكل طبيعي بمتوسط ​​0 وتباين s^2. الحيلة في مجموعة بيانات حقيقية هي تقدير a وb ثم إجراء استنتاجات على تلك التقديرات باستخدام قيمة تقديرية لـ s^2.

ومع ذلك، في بعض الأحيان، نرغب في إيجاد فاصل ثقة لمتوسط ​​Y عند قيمة محددة لـ X. وفقًا للمعادلة أعلاه، متوسط ​​Y عند X هو aX+b.

ومع ذلك، في مجموعة البيانات الحقيقية، لا نعرف أبدًا القيم “الحقيقية” لـ a وb؛ كل ما نعرفه هو تقديراتنا. لذلك، من المناسب العثور على فترة زمنية يمكننا أن نكون واثقين فيها نسبيًا من حدوث المتوسط ​​الحقيقي لـ Y.

هناك بعض الصيغ الفوضوية للغاية لحساب هذه الفترة ولكننا لن نخوض فيها هنا. بعد كل شيء، يجب أن يجعل الكمبيوتر عملية الحساب سهلة. لذا، لنفترض أننا أخذنا مجموعة البيانات النموذجية USSTATES.SYD، مع 48 حالة صالحة للمتغيرين CARDIO وCANCER. استخدم الإحصائيات> تراجع> مربع حوار خطي لإعداد نموذج الانحدار أو إصدار الأوامر:

التراجع
استخدم الولايات المتحدة
حفظ الانحدار/النموذج
نموذج السرطان = ثابت + القلب
تقدير

سيقوم الكمبيوتر بعد ذلك بتقدير النموذج، وإيجاد القيم المقدرة لكل من الثابت ومعامل CARDIO وطباعة تحليل جدول التباين.

في هذه الحالة، سيتم أيضًا حفظ ملف، REGRESS.SYD، الذي يحتوي على بقايا النموذج، وتقديرات السرطان استنادًا إلى CARDIO للنموذج (المتغير المسمى ESTIMATE) وقيمة غامضة تسمى SEPRED. إنه SEPRED الذي سنستخدمه لحساب فترات الثقة لدينا.

يرمز SEPRED إلى “الخطأ القياسي للقيمة المتوقعة. سيحتوي الملف أيضًا على قيم البيانات الأصلية. يتم حفظها لأننا أضفنا خيار MODEL إلى أمر الحفظ.

لحساب الحدود العليا والدنيا لفاصل ثقة 95% للقيم المتوقعة للسرطان، استخدم البيانات> تحول> دع مربع الحوار أو أدخل إلى الوحدة النمطية BASIC وأصدر الأوامر:
أساسي
استخدام الانحدار
دع ن = 48
دع نفار = 2
LET العلوي = التقدير+TIF(.975,n-nvars)*sepred
LET أقل = تقدير-TIF(.975,n-nvars)*sepred
طباعة الجزء العلوي السفلي
يجري

سيتم بعد ذلك طباعة حدود الثقة العليا والدنيا للقيمة المقدرة للسرطان لكل حالة. في ما سبق، يرمز TIF إلى “التوزيع العكسي t”.

يمكن تعميم الأفكار المذكورة أعلاه بعدة طرق مختلفة. على سبيل المثال، إذا كنت ترغب في العثور على فاصل ثقة لمتوسط ​​Y للانحدار على متغيرين، فأنت تحتاج فقط إلى إضافة تلك المتغيرات إلى عبارة MODEL في REGRESS وتغيير NVARS من 2 إلى 3 في الوحدة النمطية BASIC. (ملاحظة: يمثل N-NVARS عدد الحالات الصالحة مطروحًا منه عدد المتغيرات في النموذج. قم بتعيين N وNVARS أعلاه على العدد الصحيح للحالات والمتغيرات لنموذجك.

فترات الثقة لمتوسط ​​Y عند القيم الجديدة لـ X

قد يحدث أنك ترغب في إيجاد فاصل الثقة لمتوسط ​​Y عند قيمة جديدة واحدة أو أكثر لمتغير X الخاص بك. ضع قيم X الجديدة في نهاية ملفك واجعل قيم Y المرتبطة بها صفرًا. (لا داعي للقلق بشأن قيمة Y فعليًا. قيمة Y هذه هي مجرد عنصر نائب ولن تدخل في الحسابات.)

بعد ذلك، قم بإضافة متغير جديد في ملفك يسمى WT. يجب أن تكون قيمة WT هي 1 للحالات التي لديك بيانات لكل من X وY، و0 للحالات ذات القيم الجديدة لـ X. بعد حفظ الملف، استخدم البيانات> مربع حوار التردد لتحديد WT كمتغير الترجيح، أو قم بإصدار الأمر:

التردد = الوزن

استخدام الإحصائيات> تراجع> في مربع الحوار الخطي أو ملف الأوامر، قم بتقدير نموذج الانحدار الخاص بك مرة أخرى، وتذكر حفظ النتائج في ملف بيانات باستخدام خيار MODEL. يعد الأمر FREQUENCY مفيدًا جدًا في هذا السياق؛ في حساب الانحدار، سيتم استخدام النقاط ذات الوزن 1 مرة واحدة، وسيتم استخدام النقاط ذات الوزن صفر صفر مرة.

وبالتالي، سيتم حساب الانحدار للحالات ذات القيم المعروفة Y وX. ومع ذلك، سيتم حساب قيمة ESTIMATE لجميع الحالات. باستخدام ملف النتائج المحفوظة، يمكنك استخدام الحساب أعلاه لاشتقاق فاصل الثقة للمتوسط ​​المقدر لـ Y غير معروف بقيمة معروفة لـ X للحالات الجديدة.

الدقيقة

هناك بعض التفاصيل الدقيقة المتعلقة بهذا النوع من فترة الثقة والتي يجب عليك مراعاتها. أولاً، هذا فاصل زمني لمتوسط ​​Y عند قيمة معينة لـ X، وليس فاصل ثقة أو نطاقًا لخط الانحدار. إذا قمت برسم حدود الثقة العلوية والسفلية، فسوف ترى خطين منحنيين حول خط الانحدار. بالعودة إلى المثال الأصلي باستخدام ملف USSTATES.SYD، قم بحساب قيم فاصل الثقة والمؤامرة: يبدأ ارسم السرطان*x(1) /الحجم=0 ناعم=خطي قصير YMIN=100 YMAX=300، XMIN=100 XMAX=500 XLABEL=’CARDIO’ COLOR=BLUE قطعة أرض علوية، سفلية*x(1) /SIZE=0 ناعم=خط قصير YMIN=100 YMAX=300، XMIN=100 XMAX=500 YLABEL=’ ‘ XLABEL=’ ‘ COLOR=RED, تراكب نهاية (عند حفظ نتائج النموذج المقدر، يقوم SYSTAT بإعادة تسمية المتغيرات المستقلة X(1). . . X(n)، بحيث تتم إعادة تسمية CARDIO إلى X(1) في هذا المثال.)
ومن المغري الاعتقاد بأن هذه الخطوط تشكل نطاق ثقة للخط بأكمله. هذا ليس صحيحا. المشكلة هي أن حدود الثقة العليا والدنيا يتم حسابها باستخدام نقطة واحدة في كل مرة. من أجل حساب نطاق الثقة أو الفاصل الزمني لخط كامل، نحتاج إلى أن نأخذ في الاعتبار حقيقة أنه يتم حساب معلمتين، الثابت ومعامل X، لهذا الخط. ولذلك، سيتم إعطاء نطاقات الثقة العلوية والسفلية للخط بأكمله بواسطة: أساسي دع ن = 48 دع نفار = 2 LET النطاق العلوي = التقدير+SQRT(2*FIF(.95,2,n-nvars))*sepred LET النطاق السفلي = التقدير+SQRT(2*FIF(.95,2,n-nvars))*sepred طباعة النطاق العلوي والسفلي يجري عند رسم فترات الثقة للقيم المقدرة لـ CANCER ونطاقات الثقة لخط الانحدار، سترى أن نطاق الثقة أوسع من فاصل الثقة: يبدأ ارسم السرطان*x(1) / الحجم=0 ناعم=خطي قصير YMIN=100 YMAX=300، XMIN=100 XMAX=500 XLABEL=’CARDIO’ COLOR=BLUE قطعة أرض علوية، سفلية*x(1) /SIZE=0 ناعم=خط قصير YMIN=100، YMAX=300 XMIN=100 XMAX=500 YLABEL=’ ‘, XLABEL=’ ‘ اللون=تراكب أحمر ارسم النطاق العلوي، النطاق السفلي*x(1) /SIZE=0 ناعم=خط قصير، YMIN=100 YMAX=300 XMIN=100 XMAX=500 YLABEL=’ ‘, XLABEL=’ ‘ اللون=غطاء أخضر نهاية
نظرًا لأن العلاقة بين السرطان (الوفيات لكل 100000 بسبب السرطان) وCARDIO (الوفيات لكل 100000 بسبب أمراض القلب والأوعية الدموية) هي علاقة خطية، فإن الفرق بين فترات الثقة للقيم المقدرة للسرطان ونطاقات الثقة لخط الانحدار صغير، ولكن وحتى مع وجود بيانات جيدة مثل هذه فإن الفرق واضح. ثانياً، من المغري أيضاً أن نعتقد أن 95% من كل الملاحظات لابد أن تقع ضمن نطاقات الثقة. وهذا أيضا غير صحيح. هذه هي نطاقات الثقة للمتوسط ​​فقط. إذا كنت ترغب في العثور على نطاقات الثقة للملاحظات، فيجب عليك تعديل الحساب كما ترى أدناه. أساسي دع ن = 48 دع نفار = 2 دع s_square=177.065 LET النطاق العلوي = التقدير+TIF(.975,n-nvars)*SQR(sepred^2+s_square) LET النطاق السفلي = تقدير-TIF(.975,n-nvars)*SQR(sepred^2+s_square) طباعة النطاق العلوي والسفلي يجري
حيث S_SQUARE هو متوسط ​​المربع المتبقي من الانحدار. وتسمى هذه أحيانًا فترات التنبؤ. عند إدخال قيم N وNVARS، أدخل أيضًا قيمة S_SQUARE، والتي ستجدها في جدول تحليل التباين لمخرجات الانحدار. الآن، إذا كنت ترغب في رؤية نتائج هذه العملية الحسابية، قم بإصدار تسلسل الأوامر التالي: يبدأ ارسم السرطان * x (1) / ناعم = خطي قصير YMIN = 100 YMAX = 300 XMIN = 100، XMAX=500 XLABEL=’CARDIO’ COLOR=BLUE ارسم النطاق العلوي، النطاق السفلي * x (1) / الحجم = 0 ناعم = خط قصير، YMIN=100 YMAX=300 XMIN=100 XMAX=500 YLABEL=’ ‘, XLABEL=’ ‘ اللون=تراكب أخضر نهاية سيؤدي هذا إلى رسم نطاقات الثقة أو فترات التنبؤ حول البيانات.
Shopping Cart
Scroll to Top