1 คะแนน โดย GN⁺ 2026-01-26 | 1 ความคิดเห็น | แชร์ทาง WhatsApp
  • งานวิจัยที่อ้างว่า มีความสัมพันธ์ระหว่างความยั่งยืนขององค์กรกับผลการดำเนินงานของราคาหุ้น ถูกอ้างอิงไปมากกว่า 6,000 ครั้ง แต่ภายหลังพบว่า มีข้อผิดพลาดร้ายแรงและคำอธิบายอันเป็นเท็จ
  • Andy King ผู้พยายามทำซ้ำงานวิจัยนี้ระบุว่า ทั้งผู้เขียน วงการวิชาการ วารสาร และมหาวิทยาลัย ต่างก็ เพิกเฉยต่อการขอแก้ไขข้อผิดพลาดและการตรวจสอบซ้ำของเขามาโดยตลอด
  • บทความดังกล่าวมีปัญหาหลายประการ เช่น การระบุค่านัยสำคัญทางสถิติผิด, การอธิบายระเบียบวิธีผิด, การจับคู่กลุ่มตัวอย่างที่ไม่สมจริง เป็นต้น โดยบางส่วนถูกปัดตกว่าเป็นเพียงคำพิมพ์ผิด
  • King เปิดเผยปัญหานี้ผ่าน LinkedIn และ วารสารเฉพาะทางด้านงานวิจัยทำซ้ำ (JOMSR) แต่ Harvard Business School และ London Business School สรุปว่าเป็นประเด็นเล็กน้อย
  • ผู้เขียนยังคงไม่ถอนบทความ และเนื้อหานี้ชี้ให้เห็นถึง การล่มสลายของระบบกำกับความน่าเชื่อถือทางวิทยาศาสตร์และความจำเป็นในการปฏิรูป

บทความที่มีปัญหาและความพยายามในการทำซ้ำ

  • บทความ “The Impact of Corporate Sustainability on Organizational Processes and Performance” ถูกอ้างอิงมากกว่า 6,000 ครั้ง และถูกประเมินว่าเป็นงานวิจัยทรงอิทธิพลถึงขั้นที่ ผู้บริหารในวอลล์สตรีทและอดีตรองประธานาธิบดีสหรัฐฯ ยังนำไปอ้างอิง
  • Andy King พยายามทำซ้ำผลของบทความนี้ และพบ ความไม่สอดคล้องของระเบียบวิธี, ข้อผิดพลาดทางสถิติ, การทดสอบที่ขาดหายไป, และการจัดองค์ประกอบกลุ่มตัวอย่างที่ผิดปกติ
    • เขาส่งอีเมลถึงผู้เขียนหลายครั้งแต่ ไม่ได้รับคำตอบ
    • ยังมีงานวิจัยของ Bloomfield et al.(2018) ที่ชี้ว่า การที่นักวิจัยต้นฉบับเพิกเฉยหรือล่าช้าต่อคำขอจากนักวิจัยด้านการทำซ้ำ/การจำลองผล (Replication) เป็นเรื่องที่พบได้ทั่วไป

การตอบสนองของวงการวิชาการและวารสาร

  • King ขอความช่วยเหลือจากนักวิชาการร่วมสาขา แต่ส่วนใหญ่ปฏิเสธโดยให้เหตุผลเรื่อง การหลีกเลี่ยงความขัดแย้ง หรือ ไม่มีเวลาเพียงพอ
    • นักวิชาการบางคนกล่าวว่า “การชี้ข้อผิดพลาดของบทความที่ตีพิมพ์แล้วส่งผลเสียต่ออาชีพมากกว่า”
  • เขาส่งบทวิจารณ์เชิงวิพากษ์ไปยังวารสาร Management Science แต่ถูกปฏิเสธด้วยเหตุผลว่า “น้ำเสียงไม่เหมาะสม”
    • ผู้เขียนยอมรับว่าการระบุผลลัพธ์หลักว่ามีนัยสำคัญนั้นผิดพลาด แต่ยืนยันว่าเป็นเพียง ‘คำพิมพ์ผิด’
    • คำขอแก้ไขเพิ่มเติมของ King ถูกปฏิเสธทั้งหมด

การเปิดเผยสู่สาธารณะและการตีพิมพ์งานทำซ้ำ

  • หลังจาก King เปิดเผยข้อผิดพลาดบน LinkedIn วารสารจึงค่อยออก ประกาศแก้ไข (erratum) ในภายหลัง
  • งานวิจัยทำซ้ำถูกตีพิมพ์ใน Journal of Management Scientific Reports(JOMSR) ซึ่งตอกย้ำ บทบาทของวารสารที่อุทิศให้กับงานวิจัยทำซ้ำโดยเฉพาะ
  • King ยืนยันว่า บทความต้นฉบับนั้น วิธีการที่รายงานไว้ไม่ตรงกับวิธีที่ใช้จริง และไม่สามารถทำซ้ำผลลัพธ์ได้ด้วยวิธีที่ใช้จริง

การสอบสวนจริยธรรมการวิจัยและปฏิกิริยาของมหาวิทยาลัย

  • King ยื่นเรื่องร้องเรียนการละเมิดจริยธรรมการวิจัยต่อ Harvard Business School และ London Business School
    • ผู้เขียนชี้แจงว่า “มีข้อความที่ผิดค้างอยู่เพราะความผิดพลาดในกระบวนการแก้ไขต้นฉบับ” แต่ ข้อผิดพลาดเดียวกันนี้ปรากฏซ้ำในต้นฉบับทุกฉบับ
    • Harvard ไม่เปิดเผยว่าจะมีการสอบสวนหรือไม่ ส่วน LBS ระบุว่า “ไม่ใช่การให้ข้อมูลเท็จโดยเจตนา” และ แนะนำเพียงมาตรการเชิงการศึกษา
  • King วิจารณ์ว่า “ประเด็นสำคัญไม่ใช่ว่าเข้าถึงข้อมูลได้หรือไม่ แต่คำอธิบายที่ผิดทำลายความสามารถในการตีความงานวิจัย”

ความล้มเหลวเชิงสถาบันและข้อเสนอปฏิรูป

  • บทความนี้ได้รับการแก้ไขเพียงบางส่วน และ คำอธิบายวิธีการที่ผิดยังคงไม่ได้รับการแก้ไข
  • King กล่าวว่า “ระบบกำกับวิทยาศาสตร์ที่น่าเชื่อถือไม่ทำงาน” และเสนอแนวทางดังนี้
    • หลีกเลี่ยงการอ้างอิงงานวิจัยเพียงชิ้นเดียว และตรวจสอบว่ามีการทำซ้ำแล้วหรือไม่
    • เมื่อพบข้อผิดพลาดให้แก้ไขทันที
    • เตือนเพื่อนร่วมวิชาชีพเมื่อพบพฤติกรรมที่ผิดจริยธรรม
    • สนับสนุนงานวิจัยทำซ้ำและวารสารอย่าง JOMSR
    • เสริมความเข้มแข็งของนโยบายจริยธรรมการวิจัยในสถาบัน
  • นอกจากนี้ยังเสนอให้สถาปนา ความโปร่งใส, การกำกับดูแลอย่างอิสระ, และการลงโทษแบบเป็นขั้นตอน ในระบบบริหารวิชาการ รวมถึงความจำเป็นในการนำระบบตรวจสอบภายหลังอย่าง FurtherReview มาใช้

ความเห็นของ Andrew Gelman

  • Gelman ระบุว่าการกระทำของผู้เขียนเข้าข่าย การประพฤติมิชอบทางการวิจัย แต่ก็เน้นไปที่ ปัญหาเชิงระบบ มากกว่าตัวบุคคล
  • เขาชี้ว่า “ท่าทีที่ไม่ยอมรับข้อผิดพลาดในอดีต” ทำให้วิทยาศาสตร์กลายเป็น ‘ศาสตร์ที่ตายแล้ว (dead science)’
  • เขาเตือนว่า หากชุมชนวิชาการยังไม่ส่งเสริม การแก้ไขข้อผิดพลาดและความรับผิดชอบอย่างจริงจัง ปัญหาแบบเดิมก็จะเกิดซ้ำอีก

1 ความคิดเห็น

 
GN⁺ 2026-01-26
ความคิดเห็นจาก Hacker News
  • ฉันพัฒนา ชุดเครื่องมือการทำแบบจำลองเชิงตัวแทนแบบโอเพนซอร์ส ที่ดูแลมาตั้งแต่ปี 2003
    ไม่นานมานี้มีบทความของชุดเครื่องมือใหม่ที่ทำด้วยภาษาอื่นมาเปรียบเทียบกับซอฟต์แวร์ของฉันและอ้างว่าของพวกเขาดีกว่า แต่จริง ๆ แล้วพวกเขารันเครื่องมือของฉันผิดและยัง บิดเบือน ข้อมูลด้วย
    ฉันขอให้แก้ไขแล้ว แต่เพราะหน้าตาของวารสารจึงถูกกลบเงียบไว้ และผู้เขียนก็มีแต่แก้ตัว
    ปัญหาคือเรื่องแบบนี้เกิดขึ้นบ่อยเกินไปในวงวิชาการ

    • ฉันก็เคยเจอเรื่องคล้ายกัน คู่แข่งตีความซอฟต์แวร์ของฉันผิดแล้วตีพิมพ์บทความ โดยสรุปผลจาก ข้อมูลที่ผิดพลาด
      หลังจากเจอเรื่องนั้น ความเชื่อมั่นของฉันต่อบทความวิชาการก็ลดลงมาก
    • สมัยก่อนฉันมีซอฟต์แวร์สำหรับงานวิชาการที่ตัวเองสร้างไว้ แล้วได้เป็นผู้รีวิวบทความที่ทีมวิจัยอื่นใช้โปรแกรมของฉันเป็นตัวเปรียบเทียบ
      วิธีวิทยาการทดสอบ ของพวกเขา ผิดตั้งแต่รากฐาน และพวกเขาก็ฝึกกับเกณฑ์ที่ตั้งขึ้นเองในปัญหาที่ไม่มี “คำตอบจริง” แล้วอ้างว่าผลของตัวเองดีที่สุด
      ฉันแนะนำว่าไม่ควรรับตีพิมพ์ และวารสารก็เห็นด้วย แต่ไม่กี่เดือนต่อมากลับเห็นบทความนั้น ถูกตีพิมพ์ในวารสารอื่นโดยไม่แก้ไขอะไรเลย จนรู้สึกสิ้นหวังกับวงการวิชาการ
    • ถ้าคุณคือ Sean Luke ที่ฉันรู้จักจริง ตอนเป็นนักศึกษาปริญญาตรีที่มหาวิทยาลัยแมริแลนด์ การสอนของคุณมีอิทธิพลอย่างมากต่อวิธีคิดด้านวิทยาการคอมพิวเตอร์ของฉัน ขอบคุณมาก
    • ครั้งหนึ่งเพื่อนร่วมงานขอให้ฉันช่วยตรวจโค้ดของบทความ พอดูแล้วพบว่าเขา คำนวณความซับซ้อนผิด จนได้ข้อสรุปที่ผิดทั้งหมด
      สุดท้ายฉันเลยได้ข้อสรุปว่า “อย่าให้คนจิตวิทยาเขียนโค้ด” อย่างน้อยก็ควรให้คนที่จบ CS มาช่วยตรวจสอบ
    • ตอนเรียนบัณฑิตศึกษา ฉันแจ้งวารสารว่าศาสตราจารย์ที่ปรึกษาของฉันบิดเบือนข้อมูล แต่ ไม่ได้รับคำตอบใด ๆ เลย
      ทีมกฎหมายของมหาวิทยาลัยก็เหมือนกัน และหลังจากนั้นความเชื่อมั่นของฉันต่อวงการวิชาการก็แทบหมดไป นี่แหละเหตุผลของ วิกฤตการทำซ้ำผลการวิจัย
  • ทุกวันนี้ จำนวนการอ้างอิง ไม่ได้มีความหมายเหมือนเมื่อก่อนแล้ว
    บทความที่มีปัญหายังคงถูกคัดลอกการอ้างอิงต่อ ๆ กันไป
    เลยกำลังคิดทำบริการที่เอา เครือข่ายความน่าเชื่อถือ มาซ้อนบนกราฟการอ้างอิง
    บทความที่อ้างงานผิด ๆ แบบไม่วิจารณ์ก็จะถูกติดป้ายว่า “อาจปนเปื้อน” และผู้เขียนหรือสถาบันที่มีงานแบบนี้เยอะก็จะถูกแท็กด้วย

    • ตอน GPT-3 ออกมาใหม่ ๆ ฉันก็เคยลองสำรวจไอเดียแบบนี้
      แต่พออ่านบทความจริง ๆ แล้วพบว่า บทความมั่วมีเยอะเกินไป
      สมมติฐานที่ว่างานแย่เป็นข้อยกเว้นนั้นผิดตั้งแต่ต้น สุดท้ายมันเหมือน “งมเพชรในโคลน”
      เพราะงั้นถ้าสาขาไหนมีของปลอม 90% ก็ เมินทั้งสาขาไปเลยยังดีกว่า
    • ไอเดียน่าสนใจ แต่ การแยกการอ้างอิงเชิงวิจารณ์ออกจากการอ้างอิงธรรมดา ไม่ยากเหรอ?
      แค่สรุปงานที่เกี่ยวข้องก็ดูเหมือนจะโดนลงโทษได้
    • ฉันเห็นคนที่ สร้างอาชีพจากงานวิจัยปลอม ในงานประชุมวิชาการ เลยเชื่อผู้เชี่ยวชาญน้อยลง
      แต่ถึงจะสร้างระบบความเชื่อถือขึ้นมา สุดท้ายก็คงถูก เล่นเป็นเกม อยู่ดี เลยค่อนข้างสงสัย
    • ในประเทศเราก็มีทั้ง citation ring และการปั่นจำนวนผู้เขียนระบาดหนักเหมือนกัน
  • ทุกสาขามีบทความห่วย ๆ อยู่แล้ว แต่พอไปดู บทความของคณะบริหารธุรกิจ จริง ๆ แล้วจะช่วยเรียกความมั่นใจในตัวเองกลับมาได้
    คนที่ทำวิจัยดีจริงในสาขานั้นแทบเป็น ข้อยกเว้นระดับกาลิเลโอ

    • ฉันเองก็เรียนควบวิศวกรรม เศรษฐศาสตร์ และบริหารธุรกิจ และรู้สึกว่าบริหารธุรกิจมันเหมือน อ่านหนังสือพิมพ์
      น่าสนใจอยู่หรอก แต่ขาดความลึก เหมือน สารคดีประวัติศาสตร์ ที่ผิวเผิน
    • ท้ายที่สุดแล้วคณะบริหารธุรกิจก็คือที่ที่ศึกษาวิธี ทำกำไรด้วยต้นทุนต่ำ ดังนั้นสิ่งนั้นเองก็คือผลลัพธ์ของมัน
  • ฉันเห็นด้วยเต็มที่กับคำพูดที่ว่า “อย่าอ้างงานวิจัยชิ้นเดียวเป็นหลักฐานชี้ขาด”
    ตัวอย่างเช่น “Harvard Goal Study” อันโด่งดังนั้นไม่มีอยู่จริง
    ใน FAQ ของห้องสมุดฮาร์วาร์ดก็ ระบุชัดว่าไม่มีงานวิจัยดังกล่าว

    • Jick Study” ก็เป็นกรณีคล้ายกัน ลองดู บทความในวิกิพีเดีย ได้
    • งานวิจัยชิ้นเดียวควรถูกมองข้าม ถ้ามีผลจริง นักวิจัยคนอื่นก็จะ ทำซ้ำบางส่วน แล้วต่อยอดการศึกษา
      ในทางกลับกัน ถ้าแทบไม่มีการอ้างอิงต่อเลย นั่นคือ สัญญาณว่าควรหนีให้ไกล
  • ปัญหาที่รากจริง ๆ คือวัฒนธรรม “publish or perish”
    การได้ตำแหน่งอาจารย์และทุนวิจัยผูกอยู่กับจำนวนการอ้างอิง จึงเกิด การอ้างอิงกันเองและการผลิตบทความจำนวนมาก เป็นเรื่องปกติ

    • ปัญหาคือการประเมินจากการอ้างอิงอย่างเดียว
      เราต้องการระบบประเมินหลายขั้นที่รวมถึงการเปิดเผยข้อมูลและ การตรวจสอบการทำซ้ำผล
    • ท้ายที่สุดมันก็คือโครงสร้างการแข่งขันเรื่อง เกรด สมัยเรียน ที่ต่อยอดมาเป็น “การแข่งขันเรื่องบทความ” ในโลกผู้ใหญ่
    • นี่คือตัวอย่างคลาสสิกของ กฎของ Goodhart
  • โลกนี้มี บทความวิทยาศาสตร์ห่วย ๆ มากเกินไป
    งานเขียนที่ฉันชอบคือ “Why Most Published Research Findings Are False” ของ John P. A. Ioannidis

    • เป็นบทความที่ยอดเยี่ยม แต่คนในวงการเทคบางส่วนกลับใช้มันเป็นข้ออ้างเพื่อ หลบหนีความจริง แบบว่า “ความจริงของฉันก็คือความจริง”
    • Ioannidis ยิ่งใหญ่ในงานวิจัยเรื่อง วิกฤตการทำซ้ำผลการวิจัย แต่คำพูดของเขาเกี่ยวกับ COVID-19 น่าผิดหวังเพราะมีท่าที เอนไปทางทฤษฎีสมคบคิด
  • แก่นของปัญหาคือ นัยสำคัญทางสถิติและโครงสร้างของวารสารวิชาการ
    งานที่ “ไม่มีผลอย่างมีนัยสำคัญ” จะไม่ถูกตีพิมพ์ จึงเหลือแต่ ผลลัพธ์ที่มีอคติ ตามธรรมชาติ
    การลงทะเบียนล่วงหน้าและ การเปิดเผยข้อมูลที่ทำซ้ำได้ เป็นเรื่องสำคัญ แต่เพราะการแข่งขันเพื่อเลื่อนตำแหน่งและผลประโยชน์ทางการค้าจึงไม่ค่อยทำกัน

    • มี การ์ตูน xkcd ที่เกี่ยวข้องอยู่ https://xkcd.com/882/
  • ฉันเห็นด้วยได้ยากกับคำกล่าวที่ว่า “คนเมาแล้วขับไม่ใช่คนเลว”
    ถ้าปกป้องพฤติกรรมที่คุกคามชีวิตคนอื่น ความหมายของคำว่า “เลว” ก็จะหายไป
    เวลาเหล่านักวิจัยทำพฤติกรรมไร้จริยธรรมแล้วบอกว่า “เป็นเพราะการฝึกมาแบบนั้น” มันฟังดูเหมือน การปัดความรับผิดชอบ

    • การตัดสินว่าคน ๆ หนึ่งเป็น “คนเลว” เป็น การคิดแบบแบ่งขาวดำ
      ถ้าระบบทำให้พฤติกรรมแย่เกิดขึ้นได้ง่าย ต้นเหตุก็คือ ปัญหาเชิงโครงสร้าง
      คำว่า “ถูกฝึกมา” ไม่ได้แปลว่า “ถูกสอนมา” แต่หมายถึง ถูกสภาพแวดล้อมหล่อหลอม
    • แทนที่จะพูดว่า “พฤติกรรมเลว” การใช้คำว่า “พฤติกรรมโง่เขลา” หรือ “พฤติกรรมไร้ความรับผิดชอบ” น่าจะแม่นยำกว่า
      คำว่า ‘bad’ มีนัยทางศีลธรรมค่อนข้างอ่อน
    • ในยุคที่ทุกคนทำแบบนั้น คนจำนวนมากก็เชื่อว่าตัวเองต่างออกไปท่ามกลาง ความเข้าใจผิดทางวัฒนธรรม
      สุดท้ายมันก็เป็นผลของ Dunning-Kruger effect ที่ทำให้มั่นใจในตัวเองเกินไป
      ถ้าการตกอยู่ในภาพลวงตาแบบนี้เป็นเรื่องของมนุษย์ เราก็คงเรียกมนุษย์ว่าเลวโดยตัวตนไม่ได้
  • คำพูดที่ว่า “นักวิจัยด้านการทำซ้ำผลควรระวังตัว” ขัดกับแก่นแท้ของวิทยาศาสตร์
    ผลลัพธ์ที่ทำซ้ำไม่ได้ย่อมไร้ความหมาย และงานวิจัยเชิงทำซ้ำควรถูกส่งเสริมเสียด้วยซ้ำ

  • จำนวนการอ้างอิงของบทความในวารสารหนึ่งแสดงไม่เท่ากันในแต่ละเว็บไซต์
    SSRN แสดง 109 ครั้ง, ResearchGate 3936 ครั้ง, และ Google Scholar แสดง 6269 ครั้ง
    เกณฑ์การนับการอ้างอิงต่างกันไปหมดจนยากจะเชื่อถือ
    อีกทั้งยังมีข้อเสนอว่า “ควรเปิดเผยความคิดเห็น การแก้ไข และคำขอถอนบทความของทุกงาน” แต่
    ถ้าทำแบบนั้นก็คงมี คอมเมนต์ประหลาดเต็มไปหมดแม้แต่ในบทความของไอน์สไตน์

    • ในความเป็นจริง ถ้านับตาม Google Scholar ก็คือถูกอ้างอิง 6269 ครั้งจริง
    • แต่พอดูแพลตฟอร์มที่อนุญาตคอมเมนต์นิรนามอย่าง PubPeer แล้ว
      ปัญหาการ นำไปใช้ในทางที่ผิด กลับไม่ได้ใหญ่เท่าที่คิด