جرافيتي ذ.م.م
عصابات الثقة
فترات الثقة ونطاقات الثقة
الأساسيات
يُسألنا أحيانًا عن كيفية الحصول على فترات الثقة في النماذج الخطية في Grafiti . في الواقع، الأمر ليس صعبًا للغاية، وهنا سنراجع هذه التقنية. ولكن قبل أن نفعل ذلك، دعونا نراجع الأفكار الأساسية وراء فترة الثقة للنموذج الخطي.
أولاً، إذا كان لدينا انحدار خطي لـ Y على المتغير X، فإننا نقول في الواقع أنه بالنسبة لقيمة معينة لـ X، يتم إعطاء قيمة Y بواسطة Y=aX+b+e حيث e هو “مصطلح ضوضاء” “.
يُفترض عادة أن يتم توزيع مصطلح الضوضاء بشكل طبيعي بمتوسط 0 وتباين s^2. الحيلة في مجموعة بيانات حقيقية هي تقدير a وb ثم إجراء استنتاجات على تلك التقديرات باستخدام قيمة تقديرية لـ s^2.
ومع ذلك، في بعض الأحيان، نرغب في إيجاد فاصل ثقة لمتوسط Y عند قيمة محددة لـ X. وفقًا للمعادلة أعلاه، متوسط Y عند X هو aX+b.
ومع ذلك، في مجموعة البيانات الحقيقية، لا نعرف أبدًا القيم “الحقيقية” لـ a وb؛ كل ما نعرفه هو تقديراتنا. لذلك، من المناسب العثور على فترة زمنية يمكننا أن نكون واثقين فيها نسبيًا من حدوث المتوسط الحقيقي لـ Y.
هناك بعض الصيغ الفوضوية للغاية لحساب هذه الفترة ولكننا لن نخوض فيها هنا. بعد كل شيء، يجب أن يجعل الكمبيوتر عملية الحساب سهلة. لذا، لنفترض أننا أخذنا مجموعة البيانات النموذجية USSTATES.SYD، مع 48 حالة صالحة للمتغيرين CARDIO وCANCER. استخدم الإحصائيات> تراجع> مربع حوار خطي لإعداد نموذج الانحدار أو إصدار الأوامر:
التراجع
استخدم الولايات المتحدة
حفظ الانحدار/النموذج
نموذج السرطان = ثابت + القلب
تقدير
سيقوم الكمبيوتر بعد ذلك بتقدير النموذج، وإيجاد القيم المقدرة لكل من الثابت ومعامل CARDIO وطباعة تحليل جدول التباين.
في هذه الحالة، سيتم أيضًا حفظ ملف، REGRESS.SYD، الذي يحتوي على بقايا النموذج، وتقديرات السرطان استنادًا إلى CARDIO للنموذج (المتغير المسمى ESTIMATE) وقيمة غامضة تسمى SEPRED. إنه SEPRED الذي سنستخدمه لحساب فترات الثقة لدينا.
يرمز SEPRED إلى “الخطأ القياسي للقيمة المتوقعة. سيحتوي الملف أيضًا على قيم البيانات الأصلية. يتم حفظها لأننا أضفنا خيار MODEL إلى أمر الحفظ.
لحساب الحدود العليا والدنيا لفاصل ثقة 95% للقيم المتوقعة للسرطان، استخدم البيانات> تحول> دع مربع الحوار أو أدخل إلى الوحدة النمطية BASIC وأصدر الأوامر:
أساسي
استخدام الانحدار
دع ن = 48
دع نفار = 2
LET العلوي = التقدير+TIF(.975,n-nvars)*sepred
LET أقل = تقدير-TIF(.975,n-nvars)*sepred
طباعة الجزء العلوي السفلي
يجري
سيتم بعد ذلك طباعة حدود الثقة العليا والدنيا للقيمة المقدرة للسرطان لكل حالة. في ما سبق، يرمز TIF إلى “التوزيع العكسي t”.
يمكن تعميم الأفكار المذكورة أعلاه بعدة طرق مختلفة. على سبيل المثال، إذا كنت ترغب في العثور على فاصل ثقة لمتوسط Y للانحدار على متغيرين، فأنت تحتاج فقط إلى إضافة تلك المتغيرات إلى عبارة MODEL في REGRESS وتغيير NVARS من 2 إلى 3 في الوحدة النمطية BASIC. (ملاحظة: يمثل N-NVARS عدد الحالات الصالحة مطروحًا منه عدد المتغيرات في النموذج. قم بتعيين N وNVARS أعلاه على العدد الصحيح للحالات والمتغيرات لنموذجك.
فترات الثقة لمتوسط Y عند القيم الجديدة لـ X
قد يحدث أنك ترغب في إيجاد فاصل الثقة لمتوسط Y عند قيمة جديدة واحدة أو أكثر لمتغير X الخاص بك. ضع قيم X الجديدة في نهاية ملفك واجعل قيم Y المرتبطة بها صفرًا. (لا داعي للقلق بشأن قيمة Y فعليًا. قيمة Y هذه هي مجرد عنصر نائب ولن تدخل في الحسابات.)
بعد ذلك، قم بإضافة متغير جديد في ملفك يسمى WT. يجب أن تكون قيمة WT هي 1 للحالات التي لديك بيانات لكل من X وY، و0 للحالات ذات القيم الجديدة لـ X. بعد حفظ الملف، استخدم البيانات> مربع حوار التردد لتحديد WT كمتغير الترجيح، أو قم بإصدار الأمر:
التردد = الوزن
استخدام الإحصائيات> تراجع> في مربع الحوار الخطي أو ملف الأوامر، قم بتقدير نموذج الانحدار الخاص بك مرة أخرى، وتذكر حفظ النتائج في ملف بيانات باستخدام خيار MODEL. يعد الأمر FREQUENCY مفيدًا جدًا في هذا السياق؛ في حساب الانحدار، سيتم استخدام النقاط ذات الوزن 1 مرة واحدة، وسيتم استخدام النقاط ذات الوزن صفر صفر مرة.
وبالتالي، سيتم حساب الانحدار للحالات ذات القيم المعروفة Y وX. ومع ذلك، سيتم حساب قيمة ESTIMATE لجميع الحالات. باستخدام ملف النتائج المحفوظة، يمكنك استخدام الحساب أعلاه لاشتقاق فاصل الثقة للمتوسط المقدر لـ Y غير معروف بقيمة معروفة لـ X للحالات الجديدة.