Sunday 10 December 2017

أولز متبقي في فوركس ستاتا


إشعار: ستقوم مجموعة الاستشارات الإحصائية إدر بترحيل الموقع إلى نظام إدارة المحتوى في وردبريس في فبراير لتسهيل الصيانة وإنشاء محتوى جديد. ستتم إزالة بعض صفحاتنا القديمة أو وضعها في الأرشيف بحيث لا يتم الاحتفاظ بها بعد الآن. سنحاول الحفاظ على عمليات إعادة التوجيه بحيث تستمر عناوين ورل القديمة في العمل بأفضل ما في وسعنا. مرحبا بكم في معهد للبحوث الرقمية والتعليم مساعدة مجموعة ستات الاستشارية من خلال إعطاء هدية الانحدار مع ستاتا الفصل 4 - ما وراء مخطط شريان الحياة للسودان 4.1 الخطوط العريضة 4.1 أساليب الانحدار القوية 4.1.1 الانحدار مع أخطاء قياسية قوية 4.1.2 باستخدام الخيار العنقودية 4.1.3 الانحدار القوي 4.1.4 الانحدار الكمي 4.2 الانحدار الخطي المقيد 4.3 الانحدار مع البيانات الخاضعة للرقابة أو المقتطعة 4.3.1 الانحدار مع البيانات الخاضعة للرقابة 4.3.2 الانحدار مع البيانات المقتطعة 4.4 الانحدار مع القياس الخطأ 4.5 نماذج الانحدار المتعددة المعادلة 4.5.1 الانحدار غير المرتبط على ما يبدو 4.5. 2 انحدار متعدد المتغيرات 4.6 ملخص 4.7 التقييم الذاتي 4.8 لمزيد من المعلومات في هذا الفصل سوف نذهب إلى أوامر مختلفة تتجاوز عملية شريان الحياة للسودان. هذا الفصل يختلف بعض الشيء عن الآخر في أنه يغطي عددا من المفاهيم المختلفة، وبعضها قد يكون جديدا بالنسبة لك. وتتمتع هذه الامتدادات، خارج نطاق عملية شريان الحياة للسودان، بقدر كبير من الشكل والشعور في عملية شريان الحياة للسودان، ولكنها ستزودك بأدوات إضافية للعمل مع النماذج الخطية. وستشمل الموضوعات أساليب الانحدار القوية، والانحدار الخطي المقيد، والانحدار مع البيانات الخاضعة للرقابة والمتقاطعة، والانحدار مع خطأ القياس، ونماذج المعادلات المتعددة. 4-1 أساليب الانحدار القوية يبدو أن مجموعة بيانات نادرة تلبي جميع الافتراضات الكامنة وراء الانحدار المتعدد. ونحن نعلم أن عدم الوفاء بالافتراضات يمكن أن يؤدي إلى تقديرات متحيزة للمعاملات ولا سيما التقديرات المتحيزة للأخطاء المعيارية. هذا الواقع يفسر الكثير من النشاط في تطوير أساليب الانحدار قوية. والفكرة الكامنة وراء أساليب الانحدار القوية هي إجراء تعديلات في التقديرات التي تأخذ في الاعتبار بعض العيوب في البيانات نفسها. سوف ننظر إلى ثلاثة مقاربات للانحدار القوي: 1) الانحدار مع أخطاء قياسية قوية بما في ذلك الخيار العنقودية، 2) الانحدار القوي باستخدام المربعات الصغرى المعاد تكراره، و 3) الانحدار الكمي، وبشكل أكثر تحديدا، الانحدار الوسيط. قبل أن ننظر إلى هذه النهج، دعونا ننظر إلى الانحدار القياسي لعملية شريان الحياة للسودان باستخدام مؤشر الأداء الأكاديمي للمدرسة الابتدائية (elemapi2.dta). سوف ننظر إلى نموذج يتنبأ عشرات المعهد عام 2000 باستخدام متوسط ​​حجم الصف في K إلى 3 (acsk3)، متوسط ​​حجم الصف 4 إلى 6 (acs46)، ونسبة المعلمين مؤهل بالكامل (الكامل)، وحجم المدرسة (التسجيل). أولا يتيح النظر إلى الإحصاءات الوصفية لهذه المتغيرات. لاحظ القيم المفقودة ل acsk3 و acsk6. أدناه نرى الانحدار التنبؤ api00 من acsk3. acs46 كامل والتسجيل. ونحن نرى أن جميع المتغيرات كبيرة باستثناء acsk3. يمكننا استخدام أمر الاختبار لاختبار كل من متغيرات حجم الفصل، ونجد أن الاختبار العام لهذين المتغيرين هام. هنا هو مؤامرة المتبقية مقابل المجهزة لهذا الانحدار. لاحظ أن نمط المخلفات ليست بالضبط كما نأمل. انتشار البقايا هو أوسع إلى حد ما نحو منتصف يمين الرسم البياني من على اليسار، حيث تباين المخلفات هو أصغر إلى حد ما، مما يشير إلى بعض التغايرية. أدناه نعرض أفبلوتس. على الرغم من أن المؤامرات صغيرة، يمكنك ان ترى بعض النقاط التي هي موضع قلق. ليس هناك نقطة متطرفة واحدة (كما رأينا في الفصل 2) ولكن حفنة من النقاط التي التمسك بها. على سبيل المثال، في أعلى الرسم البياني الأيمن يمكنك أن ترى حفنة من النقاط التي التمسك من بقية. إذا كان هذا مجرد نقطة أو نقطتين، قد نبحث عن أخطاء أو عن القيم المتطرفة، ولكننا سوف نكون أكثر ترددا في النظر في مثل هذا العدد الكبير من النقاط مثل القيم المتطرفة. هنا هو lvr2plot لهذا الانحدار. نحن نرى 4 نقاط مرتفعة إلى حد ما في كل من نفوذهم وبقاياهم. أي من هذه النتائج هي مشاكل دراماتيكية، ولكن رفلبلوت تشير إلى أنه قد يكون هناك بعض القيم المتطرفة وبعض التغايرية غير المتجانسة المحتملة الطعوم لديها بعض الملاحظات التي تبدو لها نفوذ عالية، و lvr2plot يظهر بعض النقاط في الربع الأيمن العلوي التي يمكن أن تكون مؤثرة. وقد نرغب في استخدام شيء آخر غير انحدار عملية شريان الحياة للسودان لتقدير هذا النموذج. في الأقسام التالية سوف ننظر في بعض أساليب الانحدار قوية. 4.1.1 الانحدار مع أخطاء قياسية قوية يتضمن الأمر ستاتا ريجريس خيارا قويا لتقدير الأخطاء القياسية باستخدام مقدر ساندويتش هوبر-وايت. ويمكن أن تتعامل هذه الأخطاء المعيارية القوية مع مجموعة من المخاوف البسيطة بشأن عدم الوفاء بالافتراضات، مثل المشاكل البسيطة المتعلقة بالحياة الطبيعية، أو عدم التجانس، أو بعض الملاحظات التي تظهر مخلفات كبيرة أو نفوذ أو تأثير. وبالنسبة لهذه المشاكل البسيطة، فإن الخيار القوي يمكن أن يعالج بفعالية هذه الشواغل. وباستخدام الخيار القوي، تكون تقديرات النقاط للمعاملات هي نفسها كما هو الحال في عمليات شريان الحياة للسودان العادية، ولكن الأخطاء المعيارية تأخذ في الحسبان المسائل المتعلقة بعدم التجانس ونقص الحياة الطبيعية. هنا هو نفس الانحدار كما هو موضح أعلاه باستخدام خيار قوي. لاحظ التغييرات في الأخطاء القياسية واختبارات t (ولكن لا يوجد تغيير في المعاملات). وفي هذا المثال بالذات، فإن استخدام أخطاء معيارية قوية لم يغير أي استنتاجات من الانحدار الأصلي لعملية شريان الحياة للسودان. 4-1-2 استخدام خيار المجموعة كما يفصل في الفصل 2، يفترض انحدار عملية شريان الحياة للسودان أن البقايا مستقلة. تحتوي مجموعة بيانات elemapi2 على بيانات عن 400 مدرسة من 37 مدرسة. ومن الممكن جدا أن تكون الدرجات داخل كل منطقة تعليمية غير مستقلة، وهذا قد يؤدي إلى بقايا غير مستقلة داخل المقاطعات. وميكننا استخدام خيار العنقود لإلشارة إىل أن املالحظات متجمعة يف مناطق) استنادا إىل دنوم (وأن املالحظات قد تكون مترابطة داخل املقاطعات، ولكنها ستكون مستقلة بني املقاطعات. بالمناسبة، إذا لم نكن نعرف عدد المناطق، يمكننا أن نكتشف بسرعة عدد الأحياء هناك كما هو مبين أدناه، من خلال تبويب دنوم بهدوء ومن ثم عرض الماكرو r (r) الذي يعطي أعداد الصفوف في الجدول ، وهو عدد المناطق التعليمية في بياناتنا. الآن، يمكننا تشغيل التراجع مع خيار الكتلة. نحن لسنا بحاجة إلى تضمين الخيار القوي نظرا لأن القوة متضمنة مع المجموعة. لاحظ أن الأخطاء القياسية قد تغيرت بشكل كبير، أكثر من ذلك بكثير، من التغيير الناجم عن الخيار القوي في حد ذاته. وكما هو الحال مع الخيار القوي، فإن تقديرات المعاملات هي نفس تقديرات نظام شريان الحياة للسودان، ولكن الأخطاء المعيارية تأخذ في الاعتبار أن الملاحظات داخل المقاطعات غير مستقلة. وعلى الرغم من أن الأخطاء المعيارية أكبر في هذا التحليل، فإن المتغيرات الثلاثة التي كانت هامة في تحليل عملية شريان الحياة للسودان تعتبر هامة في هذا التحليل أيضا. وتحسب هذه األخطاء المعيارية استنادا إلى الدرجات اإلجمالية للمقاطعات ال 37، حيث ينبغي أن تكون درجات مستوى المقاطعات هذه مستقلة. إذا كان لديك عدد قليل جدا من المجموعات مقارنة بحجم العينة الكلي، فمن الممكن أن تكون الأخطاء القياسية أكبر بكثير من نتائج عملية شريان الحياة للسودان. على سبيل المثال، إذا كانت هناك 3 مقاطعات فقط، سيتم حساب الأخطاء القياسية على الدرجات الإجمالية ل 3 مقاطعات فقط. 4-1-3 الانحدار القوي يؤدي الأمر ستاتا ريج انحدارا قويا باستخدام المربعات الصغرى المعاد تكراره، أي أن يعين ريج وزنا لكل ملاحظة ذات أوزان أعلى تعطى لملاحظات أفضل تصرفا. في الواقع، الحالات المنحرفة للغاية، تلك الحالات مع الطهاة D أكبر من 1، يمكن أن يكون لها الأوزان مجموعة المفقودة بحيث لا يتم تضمينها في التحليل على الإطلاق. سوف نستخدم ريج مع خيار توليد حتى نتمكن من فحص الأوزان المستخدمة لوزن الملاحظات. ويلاحظ أنه في هذا التحليل تختلف المعاملات والأخطاء المعيارية عن الانحدار الأصلي لعملية شريان الحياة للسودان. أدناه نعرض نفس التحليل باستخدام الانحدار القوي باستخدام الأمر ريج. إذا قارنت نتائج الانحدار القوي (أعلاه مباشرة) مع نتائج عملية شريان الحياة للسودان التي سبق تقديمها، يمكنك أن ترى أن المعاملات والأخطاء القياسية متشابهة تماما، وقيمتي t و p هي أيضا متشابهة تماما. على الرغم من المشاكل البسيطة التي وجدناها في البيانات عندما أجرينا تحليل شريان الحياة للسودان، فإن تحليل الانحدار القوي أسفر عن نتائج مماثلة تماما مما يوحي بأن هذه كانت مشاكل بسيطة. ولو كانت النتائج مختلفة إلى حد كبير، كنا نرغب في مزيد من التحقيق في الأسباب التي جعلت نتائج عملية شريان الحياة للسودان ونتائج الانحدار القوي مختلفة، ومن بين النتائج اثنين من نتائج الانحدار القوي ربما يكون أكثر جديرة بالثقة. يتيح حساب وإلقاء نظرة على القيم (المجهزة) المتوقعة (ع)، بقايا (ص)، والقيم رافعة (قبعة) (ح). نلاحظ أننا بما في ذلك إذا ه (عينة) في الأوامر لأن ريج يمكن أن تولد الأوزان من المفقودين وكنت لا تريد أن يكون قد تنبأ القيم والمخلفات لتلك الملاحظات. الآن، يتيح التحقق على مختلف القيم المتوقعة والترجيح. أولا، سنقوم بالفرز بالوزن بعد ذلك سوف ننظر إلى الملاحظات ال 15 الأولى. لاحظ أن أصغر الأوزان هي بالقرب من نصف ولكن بسرعة الحصول على نطاق .7. الآن، دعونا ننظر في آخر 10 ملاحظات. وأوزان الرصدات من 391 إلى 395 كلها قريبة جدا من واحد. وتفتقر قيم الرصدات 396 إلى النهاية بسبب التنبؤات الناقصة. نلاحظ أن الملاحظات أعلاه التي لها أقل الأوزان هي أيضا تلك التي تحتوي على أكبر المخلفات (المتبقية أكثر من 200) والملاحظات أدناه مع أعلى الأوزان لها بقايا منخفضة جدا (كل أقل من 3). بعد استخدام ريج. فمن الممكن توليد القيم المتوقعة، والمخلفات والرافعة المالية (قبعة)، ولكن معظم أوامر التشخيص الانحدار غير متوفرة بعد ريج. سيكون لدينا لخلق بعض منهم لأنفسنا. هنا، بطبيعة الحال، هو الرسم البياني للمخلفات مقابل المجهزة (المتوقع) مع خط في الصفر. ويبدو أن هذه المؤامرة تشبه إلى حد كبير مؤامرة عملية شريان الحياة للسودان، إلا أنه في عملية شريان الحياة للسودان تكون جميع المشاهدات مرجحة بالتساوي، ولكن كما رأينا أعلاه فإن الملاحظات التي تحتوي على أكبر المخلفات هي أقل ترجيحا وبالتالي لها تأثير أقل على النتائج. للحصول على lvr2plot نحن ذاهبون إلى أن تذهب من خلال عدة خطوات من أجل الحصول على بقايا التربيع تطبيع وسائل كل من القيم المتبقية والرافعة (قبعة). أولا، ونحن توليد المربعات المتبقية (r2) ومن ثم تقسيمها من قبل مجموع بقايا التربيعية. ثم نقوم بحساب متوسط ​​هذه القيمة وحفظه ك ماكرو محلي يسمى آرإم (والذي سنستخدمه لإنشاء الرافعة المالية مقابل المؤامرة المتبقية). بعد ذلك نحسب متوسط ​​الرافعة المالية وحفظه ك ماكرو محلي يسمى هم. الآن، يمكننا رسم النفوذ ضد تربيع المتبقية كما هو مبين أدناه. مقارنة المؤامرة أدناه مع مؤامرة من انحدار عملية شريان الحياة للسودان، وهذه المؤامرة هو أفضل بكثير تصرف. لم تعد هناك نقاط في الربع الأيمن العلوي من الرسم البياني. يتيح إغلاق هذا التحليل عن طريق حذف متغيراتنا المؤقتة. 4-1-4 الانحدار الكمي يمكن اعتبار الانحدار الكمي، بشكل عام، والانحدار الوسيط، على وجه الخصوص، بديلا عن الانحدار. و ستاتا الأمر قريج لا الكمي الانحدار. قريج دون أي خيارات سوف تفعل فعلا انحدار الوسيط الذي سيتم تقدير المعاملات عن طريق التقليل من الانحرافات المطلقة من الوسيط. وبطبيعة الحال، كمتوسط ​​للتجهز المركزي، المتوسط ​​هو مقياس مقاوم لا يتأثر بشكل كبير من القيم المتطرفة كما هو المتوسط. ليس من الواضح أن الانحدار الوسيط هو إجراء تقدير مقاوم، في الواقع، هناك بعض الأدلة على أنه يمكن أن يتأثر بقيم الرافعة المالية العالية. هنا هو ما يبدو الانحدار الكمي مثل الأمر ستاتاس قريغ. ويختلف المعامل والخطأ المعياري ل acsk3 اختلافا كبيرا عند استخدام قريج بالمقارنة مع عملية شريان الحياة للسودان باستخدام الأمر ريجريس (المعاملات هي 1.2 مقابل 6.9 والأخطاء القياسية هي 6.4 مقابل 4.3). كما أن المعاملات والأخطاء المعيارية للمتغيرات الأخرى مختلفة أيضا، ولكنها ليست مختلفة بشكل كبير. ومع ذلك، تشير النتائج القروية، مثل نتائج عملية شريان الحياة للسودان، جميع المتغيرات باستثناء acsk3 كبيرة. الأمر كريغ لديه خيارات التشخيص أقل من ريج يفعل. حول القيم الوحيدة التي يمكن الحصول عليها هي القيم المتوقعة والمتبقي. ستاتا لديها ثلاثة أوامر إضافية يمكن أن تفعل الانحدار الكمي. ويقدر إكرغ الانحدارات المتداخلة، انحدارات الفرق في الكميات. يتم الحصول على مصفوفة التباين - التباين المقدرة للمقدرين من خلال بوتسترابينغ. وتقدر التقديرات في وقت واحد-الانحدار الكمي. وتنتج نفس المعاملات كما قريج لكل كوانتيل. سكريغ يحصل على مصفوفة التباين - التباين المشترك من المقدرين التي تشمل كتل بين كوانتيليز. وهكذا، يمكن للمرء اختبار وبناء فترات الثقة مقارنة معاملات تصف الكميات المختلفة. بسغريغ هو نفس سريغ مع كوانتيل واحد. سكريغ، وبالتالي، أسرع من بسكريغ. 4.2 الانحدار الخطي المقيد يتيح هذا القسم من خلال النظر في نموذج الانحدار باستخدام مجموعة البيانات hsb2. ملف hsb2 هو عينة من 200 حالة من الدراسة الثانوية وما بعدها (روك، هيلتون، بولاك، إكستروم أمبير غورتز، 1985). وهو يتضمن المتغيرات التالية: إد. إناثا . سباق . سيس. سكتيب. البرنامج. اقرأ . اكتب . الرياضيات. العلوم و سوست. قراءة المتغيرات. اكتب . الرياضيات. العلوم و سوست هي نتائج اختبارات موحدة على القراءة والكتابة والرياضيات والعلوم والدراسات الاجتماعية (على التوالي)، ومتغير الإناث هو ترميز 1 إذا الإناث، 0 إذا كان الذكور. دعونا نبدأ من خلال القيام انحدار عملية شريان الحياة للسودان حيث نتوقع سوست النتيجة من القراءة. اكتب . الرياضيات. العلم والإناث (الجنس) لاحظ أن معاملات القراءة والكتابة متشابهة جدا، الأمر الذي يجعل من المنطقي لأنهما مقياسان للقدرة اللغوية. كما أن معاملات الرياضيات والعلوم متشابهة (حيث أنها لا تختلف كثيرا عن 0). لنفترض أن لدينا نظرية تشير إلى أن القراءة والكتابة يجب أن يكون لها معاملات متساوية، وأن الرياضيات والعلوم يجب أن يكون لها معاملات متساوية أيضا. يمكننا اختبار المساواة في المعاملات باستخدام أمر الاختبار. يمكننا أيضا القيام بذلك مع الأمر تستبارم، وهو أمر مفيد بشكل خاص إذا كنت اختبار ما إذا كان 3 أو أكثر من معاملات متساوية. كل من هذه النتائج تشير إلى أنه لا يوجد فرق كبير في معاملات درجات القراءة والكتابة. منذ يبدو أن معاملات الرياضيات والعلوم متساوية أيضا، يتيح اختبار المساواة من تلك أيضا (باستخدام الأمر تستبارم). يتيح الآن إجراء كل من هذه الاختبارات معا، في وقت واحد اختبار أن معامل للقراءة يساوي الكتابة والرياضيات يساوي العلم. ونحن نفعل ذلك باستخدام اثنين من أوامر الاختبار، والثانية باستخدام الخيار تراكم لتجميع الاختبار الأول مع الاختبار الثاني لاختبار كل من هذه الفرضيات معا. لاحظ هذا الاختبار الثاني لديه 2 دف، لأنه هو اختبار كل من الفرضيات المدرجة، وهذا الاختبار ليست كبيرة، مما يشير إلى هذه أزواج من المعاملات لا تختلف اختلافا كبيرا عن بعضها البعض. يمكننا تقدير نماذج الانحدار حيث نقيد المعاملات لتكون متساوية مع بعضها البعض. على سبيل المثال، يتيح البدء على نطاق محدود وتقييد القراءة إلى الكتابة على قدم المساواة. أولا، سوف نقوم بتحديد القيد ومن ثم سوف نقوم بتشغيل الأمر نسريغ. لاحظ أن معاملات القراءة والكتابة متطابقة، جنبا إلى جنب مع أخطاءها القياسية، واختبار t، وما إلى ذلك لاحظ أيضا أن درجات الحرية للاختبار F هو أربعة، وليس خمسة، كما هو الحال في نموذج عملية شريان الحياة للسودان. ويرجع ذلك إلى أن معامل واحد فقط قد تم تقديره للقراءة والكتابة. ويقدر مثل متغير واحد يساوي مجموع قيمها. وبصفة عامة، ينبغي أن تزداد المشروعات الصغيرة ومتناهية الصغر الجذر في النموذج المقيد لأن التقدير الخاضع للقيود الخطية لا يحسن تناسبه بالنسبة للنموذج غير المقيد (والمعاملات التي من شأنها أن تقلل من سس هي معاملات من النموذج غير المقيد). ومع ذلك، في هذا المثال بالذات (لأن معاملات القراءة والكتابة متشابهة جدا) فإن النقص في النموذج المناسب من وجود قيود على القراءة والكتابة على قدم المساواة مع بعضها البعض يقابله التغير في درجات الحرية. بعد ذلك، سوف نحدد القيد الثاني، ووضع الرياضيات مساوية للعلم. سنقوم أيضا اختصار خيار القيود ل ج. الآن انخفض معامل قراءة الكتابة وعلوم الرياضيات ودرجات الحرية للنموذج إلى ثلاثة. ومرة أخرى، تكون المشروعات المتوسطة والصغيرة الجذر أكبر بقليل مما كانت عليه في النموذج السابق، ولكن ينبغي أن نؤكد فقط أكبر قليلا. إذا كان في الواقع معاملات السكان لقراءة الكتابة وعلوم الرياضيات. فإن هذه التقديرات مجتمعة (مقيدة) قد تكون أكثر استقرارا وتعميمها بشكل أفضل على عينات أخرى. وعلى الرغم من أن هذه التقديرات قد تؤدي إلى خطأ معياري أعلى قليلا في التنبؤ في هذه العينة، فإنها قد تتعمم بشكل أفضل على السكان الذين جاءوا منها. 4.3 الانحدار مع البيانات الخاضعة للرقابة أو المقتطعة يعد تحليل البيانات التي تحتوي على قيم خاضعة للرقابة أو يتم اقتطاعها أمرا شائعا في العديد من التخصصات البحثية. وفقا ل هوسمر و ليمشو (1999)، قيمة الرقابة هي القيمة التي غير كاملة بسبب عوامل عشوائية لكل موضوع. ومن ناحية أخرى، فإن الملاحظة المقتطعة هي عملية غير مكتملة بسبب عملية اختيار في تصميم الدراسة. سنبدأ بالبحث عن تحليل البيانات ذات القيم الخاضعة للرقابة. 4.3.1 الانحدار مع البيانات الخاضعة للرقابة في هذا المثال لدينا متغير يسمى أكاديندكس وهو مزيج مرجح من درجات الاختبار القياسية والدرجات الأكاديمية. أقصى درجة ممكنة على أكاديندكس هو 200 ولكن من الواضح أن الطلاب 16 الذين سجلوا 200 ليست متساوية تماما في قدراتهم الأكاديمية. وبعبارة أخرى، هناك تباين في القدرة الأكاديمية التي لا يتم احتسابها عندما يسجل الطلاب 200 على أكاديندكس. ويقال أن أكاديندكس المتغير يخضع للرقابة، على وجه الخصوص، فإنه يخضع للرقابة الصحيحة. دعونا ننظر إلى المثال. وسوف نبدأ بالنظر إلى وصف البيانات، وبعض الإحصاءات الوصفية، والارتباطات بين المتغيرات. الآن، يتيح تشغيل الانحدار القياسي لعملية شريان الحياة للسودان على البيانات وتوليد عشرات المتوقعة في p1. الأمر توبيت هو واحد من الأوامر التي يمكن استخدامها للانحدار مع البيانات رقابة. بناء جملة الأمر مشابه للتراجع مع إضافة الخيار أول للإشارة إلى أن قيمة الرقابة الصحيحة هي 200. سنتابع الأمر توبيت من خلال التنبؤ p2 الذي يحتوي على القيم المتوقعة من المدار. ويوضح تلخيص نتائج P1 و p2 أن القيم المتوقعة في المدار لديها انحراف معياري أكبر ونطاق أكبر من القيم. عندما ننظر إلى قائمة P1 و p2 لجميع الطلاب الذين سجلوا الحد الأقصى 200 على أكاديندكس، ونحن نرى أن في كل حالة قيمة التنبؤ المدار أكبر من القيمة المتوقعة من عملية شريان الحياة للسودان. وتمثل هذه التنبؤات تقديرا لما يمكن أن يكون التغير إذا كانت قيم أكاديندكس يمكن أن تتجاوز 200. هنا هو الرسم التخطيطي بناء على المدار: يمكنك أن تعلن كل من القيم العليا والعليا الرقابة. يتم تثبيت قيم الرقابة في أن نفس القيم الدنيا والعليا تنطبق على جميع الملاحظات. هناك أمرين آخرين في ستاتا التي تسمح لك المزيد من المرونة في القيام الانحدار مع البيانات رقابة. ويقدر نريغ نموذجا قد تختلف فيه القيم الرقابية من الملاحظة إلى الملاحظة. تقديرات إنتريغ نموذجا حيث يكون متغير الاستجابة لكل ملاحظة إما بيانات نقطة أو بيانات فاصلة أو بيانات خاضعة للرقابة اليسرى أو بيانات خاضعة للرقابة الصحيحة. 4.3.2 الانحدار مع البيانات المقتطعة تحدث البيانات المقتطعة عندما لا يتم تضمين بعض الملاحظات في التحليل بسبب قيمة المتغير. وسوف نقوم بتوضيح التحليل مع اقتطاع باستخدام مجموعة البيانات، أكاديندكس. الذي تم استخدامه في القسم السابق. إذا لم يعد أكاديندكس تحميل في الذاكرة يمكنك الحصول عليه مع الأمر استخدام التالي. دعونا نتخيل أنه من أجل الحصول على برنامج يكرم خاص، يحتاج الطلاب لتسجيل ما لا يقل عن 160 على أكاديندكس. ولذا فإننا سوف إسقاط جميع الملاحظات التي قيمة أكاديندكس هو أقل من 160. الآن، يتيح تقدير نفس النموذج الذي استخدمناه في القسم على البيانات رقابة، فقط هذه المرة سوف ندعي أن 200 ل أكاديندكس لا تخضع للرقابة. ومن الواضح أن تقديرات المعاملات مشوهة نظرا لأن 56 ملاحظة لم تعد موجودة في مجموعة البيانات. وهذا يحد من النطاق على كل من متغير الاستجابة ومتغيرات التنبؤ. على سبيل المثال، انخفض معامل الكتابة من .79 إلى .59. ما يعنيه هذا هو أنه إذا كان هدفنا هو إيجاد العلاقة بين أكاديندكس ومتغيرات التنبؤ في السكان، ثم اقتطاع أكاديندكس في عينة لدينا سوف يؤدي إلى تقديرات منحازة. وهناك نهج أفضل لتحليل هذه البيانات هو استخدام الانحدار المقتطعة. في ستاتا يمكن تحقيق ذلك باستخدام الأمر ترونكريغ حيث يتم استخدام الخيار ليرة لبنانية للإشارة إلى الحد الأدنى من عشرات أكاديندكس المستخدمة في اقتطاع. المعاملات من أمر ترونكريغ أقرب إلى نتائج عملية شريان الحياة للسودان، على سبيل المثال معامل للكتابة هو .77 وهو أقرب إلى نتائج عملية شريان الحياة للسودان .79. ومع ذلك، فإن النتائج لا تزال مختلفة إلى حد ما على المتغيرات الأخرى، على سبيل المثال معامل القراءة هو .52 في ترونكريغ بالمقارنة مع .72 في أولس الأصلي مع البيانات غير المقيدة، وأفضل من تقدير عملية شريان الحياة للسودان .47 مع البيانات المقيدة. في حين أن ترونكريغ قد يحسن التقديرات على ملف بيانات مقيد بالمقارنة مع عملية شريان الحياة للسودان، فإنه بالتأكيد ليست بديلا لتحليل ملف البيانات غير المقيد الكامل. 4.4 الانحدار مع خطأ القياس كما سوف تذكر على الأرجح، واحدة من افتراضات الانحدار هو أن يتم قياس متغيرات التنبؤ دون خطأ. والمشكلة هي أن خطأ القياس في متغيرات التنبؤ يؤدي إلى تقدير معاملات الانحدار. يأخذ الأمر ستاتاس إيفريغ خطأ القياس في الاعتبار عند تقدير معاملات النموذج. دعونا ننظر إلى الانحدار باستخدام مجموعة البيانات hsb2. قراءة المتنبأ هي نتيجة اختبار موحدة. كل اختبار لديه خطأ القياس. نحن لا نعرف الموثوقية الدقيقة للقراءة. ولكن باستخدام .9 للحصول على الموثوقية ربما لن يكون بعيدا. سنقوم الآن بتقدير نفس نموذج الانحدار مع الأمر ستاتا إيفريغ، والذي يقف على الأخطاء في المتغيرات الانحدار. لاحظ أن F - نسبة و R2 زيادة جنبا إلى جنب مع معامل الانحدار للقراءة. بالإضافة إلى ذلك، هناك زيادة في الخطأ القياسي للقراءة. الآن، دعونا نحاول نموذج مع القراءة. الرياضيات و سوك كما التنبؤات. أولا، سنقوم بتراجع قياسي لعملية شريان الحياة للسودان. الآن، يتيح محاولة لحساب خطأ القياس باستخدام الموثوقية التالية: قراءة - .9، الرياضيات - .9، سوست - .8. لاحظ أن إجمالي F و R 2 ارتفع، ولكن معامل القراءة لم يعد ذو دلالة إحصائية. 4.5 نماذج انحدار معادلة متعددة إذا كان لدى مجموعة بيانات متغيرات كافية، فقد نرغب في تقدير أكثر من نموذج انحدار واحد. على سبيل المثال، قد نرغب في التنبؤ ب Y1 من x1 وأيضا التنبؤ ب y2 من x2. على الرغم من عدم وجود متغيرات مشتركة بين هذين النموذجين ليست مستقلة عن بعضها البعض لأن البيانات تأتي من نفس المواضيع. هذا مثال على نوع واحد من انحدار المعادلة المتعددة المعروف باسم الانحدار غير المرتبط على ما يبدو. يمكننا تقدير المعاملات والحصول على أخطاء قياسية مع الأخذ بعين الاعتبار الأخطاء المترابطة في النموذجين. ومن السمات الهامة لنماذج المعادلات المتعددة أنه يمكننا اختبار التنبؤات عبر المعادلات. مثال آخر على انحدار المعادلة المتعددة هو إذا أردنا التنبؤ Y1 و y2 و y3 من x1 و x2. هذا هو نظام المعادلة الثلاثة، والمعروفة باسم الانحدار متعدد المتغيرات، مع نفس المتغيرات التنبؤ لكل نموذج. مرة أخرى، لدينا القدرة على اختبار المعاملات عبر المعادلات المختلفة. نماذج المعادلة متعددة هي امتداد قوي لدينا مجموعة أدوات تحليل البيانات. 4.5.1 الانحدار غير المرتبط على ما يبدو يتيح مواصلة استخدام ملف البيانات hsb2 لتوضيح استخدام الانحدار لا علاقة لها على ما يبدو. يمكنك تحميله في الذاكرة مرة أخرى إذا كان قد تم مسح. هذه المرة يتيح نظرة على اثنين من نماذج الانحدار. وهذا هو الحال بالنسبة للأخطاء (البقايا) من هذين النموذجين. وهذا صحيح حتى لو لم يتم العثور على الإناث التنبؤ في كلا النموذجين. وستكون الأخطاء مرتبطة ببعضها لأن جميع قيم المتغيرات تجمع على نفس مجموعة الملاحظات. هذا هو وضع مصممة خصيصا لالانحدار لا علاقة لها على ما يبدو باستخدام الأمر سوريج. هنا هو أول نموذج لدينا باستخدام عملية شريان الحياة للسودان. وهنا هو نموذجنا الثاني باستخدام عملية شريان الحياة للسودان. مع الأمر سوريج يمكننا تقدير كلا النموذجين في وقت واحد مع حساب الأخطاء المترابطة في نفس الوقت، مما يؤدي إلى تقديرات فعالة للمعاملات والأخطاء القياسية. من خلال تضمين الخيار كور مع سوريج يمكننا أيضا الحصول على تقدير للارتباط بين أخطاء النموذجين. ويلاحظ أن تقديرات المعاملات وأخطاءها القياسية تختلف عن تقديرات نموذج عملية شريان الحياة للسودان المبينة أعلاه. الجزء السفلي من الإخراج يوفر اختبار بريوسش-باغان ما إذا كانت المخلفات من المعادلتين مستقلة (في هذه الحالة، فإننا نقول لم تكن المخلفات مستقلة، p0.0407). الآن وقد قدرنا نماذجنا يتيح اختبار متغيرات التنبؤ. اختبار الإناث يجمع بين المعلومات من كلا النموذجين. اختبارات الرياضيات والقراءة هي في الواقع معادلات للاختبارات z أعلاه إلا أن يتم عرض النتائج كما تشي مربع الاختبارات. الآن، يتيح تقدير 3 نماذج حيث نستخدم نفس التنبؤات في كل نموذج كما هو مبين أدناه. إذا لم يعد لديك المتغيرات وهمية ل بروج. يمكنك إعادة إنشائها باستخدام الأمر تابولات. يتيح أول تقدير لهذه النماذج الثلاثة باستخدام 3 انحدارات لعملية شريان الحياة للسودان. وتوفر هذه الانحدارات تقديرات دقيقة للمعاملات والأخطاء المعيارية ولكن هذه النتائج تفترض أن بقايا كل تحليل مستقلة تماما عن غيرها. أيضا، إذا كنا نرغب في اختبار الإناث. سيكون علينا أن نفعل ذلك ثلاث مرات ولن تكون قادرة على الجمع بين المعلومات من جميع الاختبارات الثلاثة في اختبار شامل واحد. الآن يتيح استخدام سوريج لتقدير نفس النماذج. بما أن جميع النماذج الثلاثة لها نفس المتنبئات، يمكننا استخدام بناء الجملة كما هو موضح أدناه الذي يقول أن قراءة. والكتابة والرياضيات كل توقع من قبل الإناث. prog1 و prog3. لاحظ أن المعاملات متطابقة في نتائج عملية شريان الحياة للسودان أعلاه والنتائج سوريغ أدناه، ولكن الأخطاء القياسية مختلفة، إلا قليلا، وذلك بسبب الارتباط بين البقايا في المعادلات متعددة. بالإضافة إلى الحصول على أخطاء قياسية أكثر ملاءمة، سوريج يسمح لنا لاختبار آثار التنبؤات عبر المعادلات. يمكننا اختبار فرضية أن معامل الإناث هو 0 لجميع المتغيرات الثلاثة النتائج، كما هو مبين أدناه. يمكننا أيضا اختبار فرضية أن معامل للإناث هو 0 للقراءة فقط والرياضيات. لاحظ أن ريدفيمال يعني معامل للإناث لمتغير النتيجة قراءة. يمكننا أيضا اختبار فرضية أن معاملات prog1 و prog3 هي 0 لجميع المتغيرات الثلاثة النتائج، كما هو مبين أدناه. 4.5.2 الانحدار متعدد المتغيرات يتيح الآن استخدام الانحدار متعدد المتغيرات باستخدام الأمر مفريغ للنظر في نفس التحليل الذي رأيناه في المثال سريغ أعلاه، وتقدير النماذج الثلاثة التالية. إذا لم يكن لديك ملف البيانات hsb2 في الذاكرة، يمكنك استخدامه أدناه ثم قم بإنشاء المتغيرات وهمية ل prog1 - prog3. أدناه نستخدم مفريغ للتنبؤ القراءة. والكتابة والرياضيات من الإناث. prog1 و prog3. لاحظ أن الجزء العلوي من الإخراج يشبه الإخراج سريغ في أنه يعطي ملخصا عاما للنموذج لكل متغير النتيجة، إلا أن النتائج مختلفة إلى حد ما و سوريغ يستخدم اختبار مربع تشي للصالح العام لل نموذج، و مفريغ يستخدم اختبار F. يبدو الجزء السفلي من الإخراج مشابها للإخراج سوريج ومع ذلك، عند مقارنة الأخطاء القياسية ترى أن النتائج ليست هي نفسها. وتتطابق هذه الأخطاء المعيارية مع الأخطاء القياسية في عملية شريان الحياة للسودان، ولذلك فإن هذه النتائج أدناه لا تأخذ في الاعتبار الارتباطات بين البقايا (كما تفعل نتائج سوريغ). الآن، يتيح اختبار الإناث. لاحظ أن الإناث كانت ذات دلالة إحصائية في واحدة فقط من المعادلات الثلاثة. باستخدام الأمر اختبار بعد مفريغ يسمح لنا لاختبار الإناث عبر جميع المعادلات الثلاثة في وقت واحد. و، تخمين ما هو مهم. وهذا يتفق مع ما وجدنا باستخدام سوريغ (إلا أن سوريج فعل هذا الاختبار باستخدام اختبار مربع تشي). يمكننا أيضا اختبار prog1 و prog3. سواء بشكل منفصل أو مجتمعة. تذكر أن هذه الاختبارات متعددة المتغيرات. العديد من الباحثين على دراية بالتحليل التقليدي متعدد المتغيرات قد لا يعترفون بالاختبارات المذكورة أعلاه. أنها لا ترى ويلكس لامبدا، بيليس تتبع أو إحصاءات هوتلينغ-لاولي تتبع والإحصاءات التي هم على دراية. ومن الممكن الحصول على هذه الإحصاءات باستخدام أمر مفتيست كتبه ديفيد مور من جامعة سينسيناتي. مفتيست. والتي أوكلا تحديث للعمل مع ستاتا 6 وما فوق، ويمكن تحميلها عبر الإنترنت من هذا القبيل. الآن بعد أن قمنا بتحميله، يمكننا استخدامه مثل هذا. سوف ننتهي مع مفتيست بما في ذلك جميع المتغيرات التنبؤ. هذا اختبار شامل متعدد المتغيرات للنموذج. و سوريغ و مفريغ الأوامر على حد سواء تسمح لك لاختبار نماذج معادلة متعددة مع الأخذ بعين الاعتبار حقيقة أن المعادلات ليست مستقلة. الأمر سوريج يسمح لك للحصول على تقديرات لكل معادلة التي تتكيف مع عدم استقلالية المعادلات، ويسمح لك لتقدير المعادلات التي ليس بالضرورة أن يكون لها نفس المتنبئات. وعلى النقيض من ذلك، تقتصر القيمة الكلية على المعادلات التي لها نفس مجموعة التنبؤات، والتقديرات التي تقدمها للمعادلات الفردية هي نفس تقديرات عملية شريان الحياة للسودان. ومع ذلك، مفريغ (وخصوصا عندما يقترن مع مفتيست) يسمح لك لإجراء اختبارات متعددة المتغيرات أكثر تقليدية من التنبؤات. وقد غطى هذا الفصل مجموعة متنوعة من المواضيع التي تتعدى التراجع العادي للمربعات الصغرى، ولكن لا تزال هناك مجموعة متنوعة من المواضيع التي نود أن نكون قد غطيناها، بما في ذلك تحليل بيانات الاستقصاء والتعامل مع البيانات المفقودة وتحليل بيانات اللوحات وغير ذلك الكثير. وبالنسبة للموضوعات التي قمنا بتغطيتها، نتمنى أن نتمكن من الحصول على مزيد من التفاصيل. وكان أحد أهدافنا الرئيسية لهذا الفصل هو مساعدتك على أن تكون على بينة من بعض التقنيات المتوفرة في ستاتا لتحليل البيانات التي لا تتناسب مع افتراضات انحدار عملية شريان الحياة للسودان وبعض العلاجات الممكنة. إذا كنت عضوا في مجتمع أبحاث جامعة كاليفورنيا، ولديك المزيد من الأسئلة، فإننا ندعوك لاستخدام خدماتنا الاستشارية لمناقشة القضايا الخاصة بتحليل البيانات الخاصة بك. 4.7 التقييم الذاتي 1. استخدام ملف بيانات الجريمة الذي تم استخدامه في الفصل 2 (استخدام ats. ucla. edustatstatawebbooksregcrime) والنظر في نموذج الانحدار التنبؤ بالقتل من بتمترو. الفقر. يكثس واحد باستخدام أولس وجعل أفلوتس و lvr2plot بعد الانحدار. هل هناك أي الدول التي تبدو مقلقة كرر هذا التحليل باستخدام الانحدار مع أخطاء قياسية قوية وتظهر أفبلوتس للتحليل. كرر التحليل باستخدام الانحدار قوي وجعل lvr2plot يدويا. أيضا تشغيل النتائج باستخدام قريغ. قارن نتائج التحليلات المختلفة. ننظر إلى الأوزان من الانحدار القوي والتعليق على الأوزان. 2. Using the elemapi2 data file (use ats. ucla. edustatstatawebbooksregelemapi2 ) pretend that 550 is the lowest score that a school could achieve on api00 . i. e. create a new variable with the api00 score and recode it such that any score of 550 or below becomes 550. Use meals . ell and emer to predict api scores using 1) OLS to predict the original api score (before recoding) 2) OLS to predict the recoded score where 550 was the lowest value, and 3) using tobit to predict the recoded api score indicating the lowest value is 550. Compare the results of these analyses. 3. Using the elemapi2 data file (use ats. ucla. edustatstatawebbooksregelemapi2 ) pretend that only schools with api scores of 550 or higher were included in the sample. Use meals . ell and emer to predict api scores using 1) OLS to predict api from the full set of observations, 2) OLS to predict api using just the observations with api scores of 550 or higher, and 3) using truncreg to predict api using just the observations where api is 550 or higher. Compare the results of these analyses. 4. Using the hsb2 data file (use ats. ucla. edustatstatawebbooksreghsb2 ) predict read from science . socst . math and write . Use the testparm and test commands to test the equality of the coefficients for science . socst and math . Use cnsreg to estimate a model where these three parameters are equal. 5. Using the elemapi2 data file (use ats. ucla. edustatstatawebbooksregelemapi2 ) consider the following 2 regression equations. Estimate the coefficients for these predictors in predicting api00 and api99 taking into account the non-independence of the schools. Test the overall contribution of each of the predictors in jointly predicting api scores in these two years. Test whether the contribution of emer is the same for api00 and api99 . Click here for our answers to these self assessment questions. 4.8 For more informationResidual analysis and regression diagnostics There are many tools to closely inspect and diagnose results from regression and other estimation procedures, i. e. after you have performed a command like regress you can use, what Stata calls a command. Postestimation commands are found in two places: in the menu and . Below you will find a few examples for the most common options there are many more, including specific ones for different types of regression. For more details for the regress command check help regress postestimation. help logistic postestimation for logistic regression etc. Residuals, predicted values and other result variables The predict command lets you create a number of derived variables in a regression context, variables you can inspect and plot. Click the paperclip to see the options: menu dialog Creates py with the predicted values predict res1, residual Copies the residuals predict cd, cooksd Copies Cooks distance Heres a list of derived variables you can copy. Predicted values (OLS), predicted probabilities for logistic regression, probit.

No comments:

Post a Comment