ผู้ลงคะแนนเหล่านี้บางคนสอบถามผู้มีสิทธิเลือกตั้ง เว็บสล็อตแตกง่าย ผู้ลงคะแนนที่ลงทะเบียนบางคน และผู้ใหญ่คนอื่นๆ โดยไม่คำนึงถึงสถานะการลงคะแนนของพวกเขา เกือบครึ่งหนึ่งของแบบสำรวจใช้การโทรศัพท์ อีกครึ่งหนึ่งใช้แบบสำรวจออนไลน์ และบางส่วนใช้ทั้งสองแบบผสมกัน เรื่องที่ซับซ้อนมากขึ้น ยังไม่ชัดเจนว่าการโทรผ่านโทรศัพท์มือถือหรือโทรศัพท์บ้านส่งผลต่อผลการสำรวจอย่างไร
หลงทาง
เช่นเดียวกับพวกคุณหลายๆ คน ฉันดูทีวีในตอนเย็นของวันที่ 8 พ.ย. ด้วยความไม่เชื่อที่เพิ่มขึ้น ฉันได้ติดตามการคาดการณ์ของ FiveThirtyEight อย่างใกล้ชิด ตลอดฤดูกาลเลือกตั้ง เว็บไซต์นี้ใช้แบบสำรวจความพึงพอใจของประธานาธิบดีหลายร้อยแห่งเพื่อสร้างแบบจำลองผลการเลือกตั้ง การคาดการณ์ตามการสำรวจความคิดเห็นมีประวัติที่เป็นตัวเอก: ระหว่างการเลือกตั้งประธานาธิบดีปี 2008 และ 2012 FiveThirtyEight คาดการณ์ผู้ชนะได้อย่างถูกต้องในทุกรัฐยกเว้นเพียงรัฐเดียว เช่นเดียวกับวอชิงตัน ดีซี
ในขณะที่การคาดการณ์ขั้นสุดท้ายของ FiveThirtyEight กำหนดความน่าจะเป็น 71 ถึง 72 เปอร์เซ็นต์ให้กับชัยชนะของฮิลลารี คลินตัน แต่โอกาสของเธอกลับไม่แข็งกระด้างเท่ากับโมเดลแบบสำรวจความคิดเห็นอื่นๆ โมเดลของ New York Timesทำให้ Clinton มีโอกาสชนะถึง 85 เปอร์เซ็นต์ สมาคมการเลือกตั้งพรินซ์ตันทำให้คลินตันมีโอกาสชนะมากกว่า 99 เปอร์เซ็นต์
ชัยชนะที่ “น่าประหลาดใจ” ของทรัมป์ทำให้หลายคนสงสัยว่าโพลและแบบอย่างที่ใช้แบบสำรวจนี้ผิดพลาดได้อย่างไร
อย่างไรก็ตาม ในระดับชาติ การเลือกตั้งทำให้ถูกต้อง ค่าเฉลี่ย ขั้นสุดท้ายของการสำรวจความคิดเห็นระดับชาติที่ RealClearPoliticsทำให้ฮิลลารี คลินตันนำหน้า 3.2 เปอร์เซ็นต์ทั่วประเทศ คลินตันชนะคะแนนโหวตประมาณ 2.1 เปอร์เซ็นต์ ซึ่งอยู่ในระยะที่ผิดพลาด
การเลือกตั้งประธานาธิบดีไม่ได้ตัดสินด้วยคะแนนเสียงระดับชาติ แต่ในระดับรัฐ หากการเลือกตั้งผิดพลาด มันก็อยู่ในสถานะที่สำคัญในการเลือกตั้งจำนวนหนึ่ง โมเดลตามโพลส่วนใหญ่ที่มีรายชื่ออยู่ในเว็บไซต์เดอะนิวยอร์กไทมส์ซึ่งรวมถึง FiveThirtyEight และ Princeton Election Consortium คาดการณ์ว่าคลินตันจะชนะรัฐสำคัญของฟลอริดา มิชิแกน นอร์ทแคโรไลนา เพนซิลเวเนีย และวิสคอนซิน โพลส่วนใหญ่ในรัฐเหล่านี้ทำให้คลินตันเป็นผู้นำเช่นกัน ถ้าคลินตันแพ้สองหรือสามของรัฐเหล่านี้ เธอก็ยังสามารถชนะได้
เมื่อผลออกมา พวกเราหลายคนตอบสนองด้วยความตกใจ หากเราให้ความสำคัญอย่างใกล้ชิดกับผลกระทบของระยะขอบของข้อผิดพลาด เราอาจจะไม่มี
ระยะขอบของข้อผิดพลาด
ทุกโพลล์มีระยะขอบของข้อผิดพลาด ระยะขอบของข้อผิดพลาดหมายความว่าจำนวนจริงไม่จำเป็นต้องเป็นผลลัพธ์ที่รายงาน แต่อยู่ในช่วงที่กำหนด
ผู้ลงคะแนนมีข้อผิดพลาดเนื่องจากพวกเขากำลังสำรวจกลุ่มตัวอย่างเล็ก ๆ ของประชาชนที่ลงคะแนนเสียง ในขณะที่ผู้สำรวจทำผลงานได้อย่างยอดเยี่ยมในการตรวจสอบให้แน่ใจว่ากลุ่มตัวอย่างของพวกเขาเป็นตัวแทนของประชาชนที่ลงคะแนนเสียง แต่ก็ไม่ค่อยเป็นกระจกเงาที่สมบูรณ์แบบ ดังนั้นจึงมีข้อผิดพลาดอย่างหลีกเลี่ยงไม่ได้
กล่าวอีกนัยหนึ่ง การสนับสนุนที่แท้จริงสำหรับผู้สมัครอาจอยู่ที่ใดก็ได้ภายในช่วงที่กำหนดของผลการสำรวจความคิดเห็น
ตัวอย่างเช่น สำนักงานสำรวจความคิดเห็นนโยบายสาธารณะ ของสำนักงานการเลือกตั้งของพรรคเดโมแครต สุ่มตัวอย่างผู้มีสิทธิเลือกตั้งในรัฐมิชิแกน 957 คนในช่วงสองวันในเดือนพฤศจิกายน โดยให้คลินตันเป็นผู้นำเหนือทรัมป์ 46% ถึง 41% โพลระบุว่ามีข้อผิดพลาด 3.2 เปอร์เซ็นต์
ดังนั้น แทนที่จะให้ผลรวมอย่างง่าย โพลให้ผลลัพธ์ที่เป็นไปได้มากมาย ขอบของข้อผิดพลาดบอกเป็นนัยถึงระดับการสนับสนุนของคลินตันอยู่ระหว่าง 42.8 ถึง 49.2 เปอร์เซ็นต์ นั่นคือ 46 เปอร์เซ็นต์บวกหรือลบขอบของข้อผิดพลาด ทรัมป์ก็เช่นเดียวกัน อยู่ระหว่าง 37.8 ถึง 44.2 เปอร์เซ็นต์
เป็นไปได้อย่างยิ่งที่คะแนนเสียงของผู้สมัครทั้งสองอาจซ้อนทับกันในช่วงของตน นี่คือสถานการณ์ที่ทรัมป์อยู่ข้างหน้าในมิชิแกน โพลในเดือนพฤศจิกายนส่วนใหญ่ในฟลอริดา มิชิแกน นอร์ทแคโรไลนา เพนซิลเวเนีย และวิสคอนซิน มีคลินตันอยู่ข้างหน้า แต่ในเกือบทุกกรณี ผลลัพธ์สุดท้ายอยู่ในระยะขอบของข้อผิดพลาด
เป็นเรื่องธรรมดามากที่จะเห็นพาดหัวข่าวว่าคลินตันเป็นผู้นำในการสำรวจความคิดเห็นและสรุปว่าเธอนำหน้าจริงๆ แต่การตีความผลลัพธ์ที่ถูกต้องอาจรวมถึงความเป็นไปได้ที่เธออาจจะไม่เป็น ในการที่จะเป็นผู้อ่านที่ชาญฉลาดของการสำรวจต้องรู้เกี่ยวกับข้อจำกัดโดยธรรมชาติของหน่วยเลือกตั้ง
สมมติฐานที่ซ่อนอยู่
การเลือกตั้งมีจำกัด เนื่องจากผู้สำรวจตั้งสมมติฐาน รวมถึงการตั้งสมมติฐานเกี่ยวกับผู้มีสิทธิเลือกตั้งและกลุ่มประชากรที่มีแนวโน้มว่าจะเป็น จากความจำเป็น สมมติฐานเหล่านี้ขึ้นอยู่กับรูปแบบการลงคะแนนเสียงจากการเลือกตั้งที่ผ่านมา
ผู้สำรวจความคิดเห็นจำเป็นต้องคาดการณ์เปอร์เซ็นต์การลงคะแนนขั้นสุดท้ายของแต่ละกลุ่มประชากรย่อยที่ประกอบเป็นเขตเลือกตั้งด้วยความแม่นยำอย่างมาก เนื่องจากการเลือกตั้งเกิดขึ้นก่อนการเลือกตั้ง จึงไม่ใช่เรื่องง่ายที่จะคาดเดา เช่น จำนวนชายกรรมกรผิวขาวจะลงคะแนนเสียงกี่คน ในทำนองเดียวกัน เป็นเรื่องยากมากที่จะทราบระดับของโอกาสในการเลือกตั้งประธานาธิบดีผิวดำที่ดึงดูดชาวแอฟริกัน-อเมริกันให้เข้าร่วมการเลือกตั้งในปี 2008 และ 2012 ผู้ลงคะแนนต้องตั้งสมมติฐานเกี่ยวกับสิ่งเหล่านี้ และสมมติฐานแต่ละข้อทำให้เกิดข้อผิดพลาดที่อาจเกิดขึ้น
โพลสมมติฐานต่าง ๆ เกี่ยวกับตัวอย่างของพวกเขาช่วยอธิบายผลลัพธ์ที่หลากหลายที่เราเห็นในการจัดอันดับการอนุมัติของทรัมป์
นอกจากนี้ยังอาจช่วยอธิบายได้ว่าเหตุใดในระหว่างการเลือกตั้งทรัมป์จึงทำผลงานได้ดีกว่าการเลือกตั้งในรัฐสมรภูมิ การสนับสนุนของเขาอยู่ในระดับสูงในหมู่ผู้มีสิทธิเลือกตั้งผิวขาว ซึ่งเห็นได้ชัดว่ามาที่การเลือกตั้งในจำนวนที่มากกว่าที่คาดไว้ คลินตันหวังว่าผู้มีสิทธิเลือกตั้งผิวสีจะออกมาใกล้เคียงกับที่พวกเขาทำในปี 2008 หรือ 2012 ซึ่งไม่เกิดขึ้น ระยะขอบแห่งชัยชนะของทรัมป์ในรัฐสำคัญของมิชิแกน เพนซิลเวเนีย และวิสคอนซิน อยู่ที่ประมาณ77,000 คะแนนจากผู้ลงคะแนน 15 ล้านคน
การเปลี่ยนแปลงเล็กน้อยในสมมติฐานด้านประชากรศาสตร์อาจส่งผลต่อการโหวต 77,000 เสียงและส่งผลให้มีการสำรวจความคิดเห็นที่นำทรัมป์ไปข้างหน้า
มีวิธีป้องกันข้อผิดพลาด ทีมเบสบอลอย่าง Chicago Cubs และ Boston Red Sox ผสมผสานการวิเคราะห์ที่ซับซ้อนกับ “การทดสอบสายตา” นั่นคือข้อมูลของมือเบสบอลแบบเก่าที่ต้องอาศัยการสังเกตและความรู้สึกมากกว่าตัวเลขที่บริสุทธิ์
ในทำนองเดียวกัน นักสำรวจและนักสร้างแบบจำลองสามารถลองผสมผสานในองค์ประกอบของมนุษย์ ตัวอย่างเช่น เพื่อหาข้อมูลเพิ่มเติมเกี่ยวกับลักษณะบุคลิกภาพที่อาจส่งผลต่อการคัดเลือกรายงานการเมืองของ Cook ได้ รวมการสัมภาษณ์ส่วนตัวกับผู้สมัครเข้าไว้ในการคาดการณ์การแข่งขันในสภา ผู้สำรวจความคิดเห็นอาจพยายามวัดความกระตือรือร้นของผู้สนับสนุนผู้สมัครชิงตำแหน่งประธานาธิบดีด้วยการวัดกิจกรรมทางโซเชียลมีเดียหรือป้ายสาธารณะ
อีกวิธีหนึ่งในการปรับปรุงความถูกต้องของแบบสำรวจคือการนำเสนอแบบจำลองข้อมูลประชากรหลายแบบ ตัวอย่างเช่น การสำรวจนโยบายสาธารณะอาจใช้แบบจำลองที่แตกต่างกันสามแบบสำหรับการสำรวจความคิดเห็นของรัฐมิชิแกน โดยแต่ละแบบขึ้นอยู่กับสมมติฐานด้านประชากรศาสตร์ที่แตกต่างกัน หนึ่งอาจถือว่าผลิตภัณฑ์สีดำเหมือนกับการเลือกตั้งประธานาธิบดีครั้งก่อน ประการที่สองอาจถือว่ามีผลิตภัณฑ์มากขึ้นเล็กน้อย และอันที่สามมีขนาดเล็กกว่า แม้ว่าผลลัพธ์ประเภทนี้อาจต้านทานการย่อพาดหัวข่าวได้ง่าย แต่ก็ให้ความเป็นไปได้ที่หลากหลายยิ่งขึ้นและอาจมีความประหลาดใจน้อยกว่า
โมเดลแบบสำรวจความคิดเห็นบางแบบป้องกันข้อผิดพลาดโดยพิจารณาจากปัจจัยอื่นๆ เช่น การวิเคราะห์ข้อมูลประชากร การจัดอันดับการอนุมัติหน้าที่ และตัวชี้วัดทางเศรษฐกิจ การระบุผลลัพธ์เป็นความน่าจะเป็นยังช่วยเน้นถึงความไม่แน่นอนที่เกี่ยวข้องด้วย แต่พวกเขายังคงอิงจากการสำรวจความคิดเห็น
การเปรียบเทียบที่เหมาะสมเป็นอีกวิธีหนึ่งในการป้องกันความเสี่ยง ในตอนเช้าของการเลือกตั้ง เดอะนิวยอร์กไทมส์ตั้งข้อสังเกตว่าโอกาสในการชนะของคลินตันนั้นใกล้เคียงกับที่นักเตะมืออาชีพในสนามจะทำประตูได้ 37 หลา