"7.1 Logistic Regression Analysis คืออะไร
บทนำ
ในบทที่ 6 ผู้เขียนจะเน้นไปที่การวิเคราะห์ Regression ในกรณีที่ทั้งตัวแปรตาม (Response) และตัวแปรอิสระ(Independent) เป็นค่าแบบต่อเนื่อง (Continueus) เท่านั้น แต่ในโลกแห่งการวิเคราะห์ตัวเลข ยังมีกรณีที่ข้อมูลไม่ได้เป็นแบบต่อเนื่องแต่เป็นชนิดที่เรียกว่า หมวดหมู่ (Category) หรือที่เรียกอีกอย่างว่า (Qualitative data) อยู่อีกด้วย ดังนั้นรูปแบบการวิเคราะห์ Regression จึงแตกต่างกันออกไป ในทางการสถิติถือว่า Logistic Regresstion Analysis เกิดขึ้นภายหลัง แต่ก็มีความสำคัญและมีการประยุกต์ใช้ในด้านสาธารณสุขศาสตร์ สังคมศาสตร์ เป็นอย่างมาก แต่ก็สามารถประยุกต์ใช้ในวิศวกรรมศาสตร์ ได้เช่นเดียวกัน
จุดประสงค์
Logistic Regresstion Analysis ถูกนำมาใช้เพื่อทำนายว่า จะเกิดเหตุการณ์หนึ่งขึ้นหรือไม่หรือมี โอกาสเกิดขึ้นมากน้อยเพียงใด โดยมีการกำหนดค่าตัวแปรตัวหนึ่งหรือหลายตัวที่คาดว่าจะส่งผลต่อการเกิดเหตุการณ์นั้นๆ และในที่สุดก็จะทำให้เราเข้าใจสาเหตุการเกิดเหตุ การณ์นั้นๆได้ในที่สุด
การจำแนกชนิดของ Logistic Regression Analysis
การแบ่งชนิดของการวิเคราะห์ จะใช้ลักษณะหรือธรรมชาติของตัวแปรตอบสนอง (Response) เป็นตัวกำหนด ดังแผนภาพต่อไปนี้
รูปที่ 7.1.1 การจำแนกชนิด Logistic Regression Analysis
ถึงแม้ตัวแปรตอบสนองจะเป็นแบบไม่ต่อเนื่อง แต่ Logistic Regression ก็ไม่กำหนดว่าตัวแปรอิสระจะต้องเป็นแบบไม่ต่อเนื่อง สามารถเป็นได้ทั้งแบบค่าต่อเนื่องที่วัดได้โดย เครื่องมือวัดและแบบไม่ต่อเนื่อง (Category) ก็ได้
โมเดลทางคณิตศาสตร์
g(x) เราจะเรียกว่า Link function
X1 , X2 , .... Xk เราจะเรียว่า Predictors
กรณี X1,X2,....Xk เป็นค่าแบบต่อเนื่อง เราเรียกว่า Covariates และหากเป็นตัวแปรแบบไม่ต่อเนื่องเราจะเรียกว่า Risk factors
เช่นเดียวกันกับการวิเคราะห์กรณีตัวแปรตอบสนองเป็นค่าต่อเนื่องในบทที่ 6 Logistic Regression ที่มีตัวแปรอิสระหรือ Predictor (X) เพียงหนึ่งตัว ก็จะเรียกว่า Simple logistic regression เช่น Simple binary logistic regression และ Simple nominal logistic regression เป็นต้น และถ้ามีตัวแปรอิสระ (Predictor) หลายตัว ก็จะเรียกว่า Multiple logistic regression แต่ทั้งนี้ทั้งนั้น ขั้นตอนในการวิเคราะห์ของทั้งกรณีที่ตัวแปรตอบสนองเป็นค่าต่อเนื่องหรือเป็น Category ก็ยังมีขั้นตอนหลักๆในการวิเคราะห์ที่เหมือนกัน คือ
1. วิเคราะห์ผ่านทางกราฟฟิก เช่น Scatter plot หรือ Fit line plot เพื่อให้สามารถมองภาพออก
2. การวิเคราะห์ความคลาดเคลื่อนของ Model ที่ได้ ซึ่งเราจะใช้วิธี Least square method (ดูขั้นตอนการวิเคราะห์ย่อยในบทที่ 6) สำหรับกรณีที่ตัวแปรตอบสนองเป็น ค่าต่อเนื่อง และใช้วิธี Maximum likelihood estimation สำหรับกรณีที่ตัวแปรตอบสนองเป็นค่าต่อเนื่องหรือเป็น Category"
|
0 ความคิดเห็น:
แสดงความคิดเห็น