บทความปลอมใน Google Scholar ที่สร้างด้วย GPT: ลักษณะสำคัญ การแพร่กระจาย และนัยต่อการป้องกันการบิดเบือนหลักฐาน
(misinforeview.hks.harvard.edu)- พบงานวิจัยน่าสงสัยจำนวนมากใน Google Scholar ที่ดูเหมือนถูกสร้างขึ้นด้วยโมเดล GPT ซึ่งใช้งานกันอย่างแพร่หลายได้อย่างง่ายดาย
- งานวิจัยเหล่านี้ส่วนใหญ่ถูกสร้างด้วยแอปพลิเคชัน AI ทั่วไปที่ใช้กันอย่างกว้างขวาง โดยเฉพาะ ChatGPT และเลียนแบบงานเขียนเชิงวิทยาศาสตร์
- Google Scholar แสดงงานวิจัยน่าสงสัยเหล่านี้เคียงข้างงานวิจัยที่มีชื่อเสียงและผ่านการควบคุมคุณภาพ
- จากการวิเคราะห์ตัวอย่างบทความวิทยาศาสตร์น่าสงสัยที่สร้างด้วย GPT ซึ่งพบบน Google Scholar พบว่าหลายบทความครอบคลุมสาขาการประยุกต์ใช้ที่เปราะบางต่อข้อมูลบิดเบือนดิจิทัล เช่น สิ่งแวดล้อม สุขภาพ และคอมพิวติ้ง
- ความเป็นไปได้ของการบิดเบือนหลักฐานโดยเจตนาในประเด็นที่มีความขัดแย้งทางการเมืองสูง กำลังกลายเป็นปัญหาที่น่ากังวลมากขึ้นเรื่อย ๆ
ข้อค้นพบ
ข้อค้นพบ 1: งานวิจัยน่าสงสัยที่สร้างด้วย GPT จำนวน 139 ชิ้น ถูกแสดงเป็นงานวิจัยปกติในผลการค้นหาของ Google Scholar โดยมีวารสารที่ไม่ถูกจัดทำดัชนีจำนวนมาก
- งานวิจัยน่าสงสัยส่วนใหญ่เป็นวารสารที่ไม่ถูกจัดทำดัชนีหรือ working paper แต่บางส่วนก็พบในวารสาร สิ่งพิมพ์ การประชุม และคลังข้อมูลที่มีชื่อเสียงด้วย
- พบงานวิจัยรวม 139 ชิ้นที่สงสัยว่าใช้ ChatGPT หรือแอปพลิเคชัน LLM ที่คล้ายกันในลักษณะหลอกลวง
- ในจำนวนนี้ 19 ชิ้นอยู่ในวารสารที่ถูกจัดทำดัชนี 89 ชิ้นอยู่ในวารสารที่ไม่ถูกจัดทำดัชนี 19 ชิ้นเป็นวิทยานิพนธ์นักศึกษาในฐานข้อมูลมหาวิทยาลัย และ 12 ชิ้นเป็น working paper (ส่วนใหญ่อยู่ในฐานข้อมูล preprint)
- งานวิจัยด้านสิ่งแวดล้อมและสุขภาพคิดเป็นประมาณ 34% ของตัวอย่าง และในกลุ่มนี้ 66% ตีพิมพ์ในวารสารที่ไม่ถูกจัดทำดัชนี
ข้อค้นพบ 2: งานวิจัยน่าสงสัยที่สร้างด้วย GPT ถูกเผยแพร่ออนไลน์และกระจายไปทั่วโครงสร้างพื้นฐานการสื่อสารทางวิชาการ โดยมักมีหลายสำเนา และสาขาประยุกต์ใช้ที่มีนัยเชิงปฏิบัติครองสัดส่วนหลัก
- บทความเกี่ยวกับประเด็นสิ่งแวดล้อม 27 ชิ้น ถูกพบบน 56 URL จาก 26 โดเมนที่ไม่ซ้ำกัน
- บทความเกี่ยวกับประเด็นสุขภาพ 20 ชิ้น ถูกพบบน 46 URL จาก 20 โดเมนที่ไม่ซ้ำกัน
- งานวิจัยที่ระบุได้ส่วนใหญ่มีอยู่หลายสำเนา และได้แพร่กระจายไปยังคลังเก็บข้อมูล รีโพซิทอรี และโซเชียลมีเดียหลายแห่งแล้ว
- การลบสิ่งเหล่านี้ออกจากบันทึกทางวิชาการน่าจะเป็นเรื่องยากหรือแทบเป็นไปไม่ได้
ข้อค้นพบ 3: Google Scholar นำเสนอผลลัพธ์จากฐานข้อมูลการอ้างอิงที่มีการควบคุมคุณภาพและที่ไม่มีการควบคุมคุณภาพผ่านอินเทอร์เฟซเดียวกัน ทำให้เข้าถึงงานวิจัยน่าสงสัยที่สร้างด้วย GPT ได้โดยไม่มีข้อจำกัด
- สถานะที่เป็นศูนย์กลางของ Google Scholar ในโครงสร้างพื้นฐานการสื่อสารทางวิชาการแบบเปิด พร้อมกับการขาดมาตรฐาน ความโปร่งใส และความรับผิดชอบในเกณฑ์การคัดรวม อาจส่งผลกระทบร้ายแรงต่อความเชื่อมั่นของสาธารณชนต่อวิทยาศาสตร์
- สิ่งนี้จะเพิ่มโอกาสที่ Google Scholar จะถูกใช้ในทางที่ผิดเพื่อ evidence hacking และส่งผลต่อความพยายามในการถอนหรือ删除บทความปลอมจากแหล่งต้นทาง
- ไม่ว่าจะแก้ปัญหาด้วยวิธีใด ก็จำเป็นต้องคำนึงถึงโครงสร้างพื้นฐานการสื่อสารทางวิชาการทั้งหมด รวมถึงปฏิสัมพันธ์ระหว่างผู้มีส่วนเกี่ยวข้อง ผลประโยชน์ และแรงจูงใจที่แตกต่างกัน
ความเห็นของ GN⁺
ปัญหานี้น่ากังวลด้วยเหตุผลดังต่อไปนี้:
-
บทความที่สร้างด้วย GPT อาจถาโถมเข้าสู่ระบบการสื่อสารทางวิชาการและคุกคามความสมบูรณ์ของบันทึกทางวิทยาศาสตร์ ซึ่งจะยิ่งซ้ำเติมปัญหา paper mill ที่มีอยู่เดิม
-
เนื้อหาที่สร้างด้วย AI ซึ่งดูน่าเชื่อถือในเชิงวิทยาศาสตร์ อาจแท้จริงแล้วถูกสร้างขึ้นอย่างหลอกลวง สิ่งนี้อาจบั่นทอนความเชื่อมั่นของสาธารณชนต่อองค์ความรู้ทางวิทยาศาสตร์ และก่อให้เกิดความเสี่ยงทางสังคมอย่างร้ายแรง
-
เกณฑ์การคัดรวมของ Google Scholar ขาดความโปร่งใสและความรับผิดชอบ ซึ่งเชื่อมโยงกับปัญหาการแสดงผลการค้นหาโดยไม่แยกความแตกต่างระหว่างฐานข้อมูลการอ้างอิงที่เป็นไปตามมาตรฐานกับฐานข้อมูลที่ไม่เป็นไปตามมาตรฐาน
-
เนื่องจากบทความปลอมแพร่กระจายไปยังหลายแพลตฟอร์ม แม้ถอนต้นฉบับออกแล้วก็ยังยากที่จะติดตามและลบออก ซึ่งอาจส่งผลกระทบเชิงลบต่อสาขาวิจัยนั้น ๆ ไปอีกนาน
-
พบงานวิจัยที่สร้างด้วย GPT จำนวนมากในหัวข้ออ่อนไหวและสำคัญทางสังคม เช่น สุขภาพและสิ่งแวดล้อม ซึ่งอาจก่อให้เกิดความสับสนอย่างรุนแรงต่อการกำหนดนโยบาย และมีช่องให้ถูกนำไปใช้ประโยชน์ทางการเมืองได้
เพื่อรับมือกับปัญหานี้ จำเป็นต้องพิจารณาแนวทางเชิงเทคนิค การศึกษา และเชิงสถาบันไปพร้อมกัน ตัวอย่างเช่น
- จัดให้มีตัวเลือกกรองในเสิร์ชเอนจินวิชาการ เช่น การกรองตามการผ่าน peer review หรือไม่
- บูรณาการเครื่องมือประเมินเข้ากับอินเทอร์เฟซและ crawler ของเสิร์ชเอนจินวิชาการ
- สร้างเสิร์ชเอนจินวิชาการแบบใช้ฟรีที่ดำเนินการเพื่อประโยชน์สาธารณะ ไม่ใช่เหตุผลเชิงพาณิชย์
- โครงการริเริ่มด้านการศึกษาสำหรับผู้กำหนดนโยบาย ผู้สื่อสารวิทยาศาสตร์ นักข่าว และกลุ่มอื่น ๆ
ในระดับรากฐาน ควรเข้าหาปัญหานี้ในบริบทที่กว้างกว่า เช่น ปัญหาในระบบการตีพิมพ์ทางวิชาการ วัฒนธรรม "publish or perish" การผูกขาดของ Google และความขัดแย้งทางอุดมการณ์เรื่องการควบคุมข้อมูล แนวทางแก้เชิงเทคนิคเพียงอย่างเดียวไม่เพียงพอ
2 ความคิดเห็น
alphaXiv - เปิดให้ถกเถียงสาธารณะเกี่ยวกับบทความบน arXiv
พอแพลตฟอร์มนี้กับบทความนี้มาอยู่ด้วยกัน ก็ให้ความรู้สึกเหมือนมีอะไรเชื่อมโยงกันอยู่
ความเห็นจาก Hacker News
ที่งาน APS March Meeting บรรณาธิการวารสารวิทยาศาสตร์กังวลเกี่ยวกับรีวิวที่สร้างโดย LLM มากกว่าบทความวิชาการที่สร้างโดย LLM
สคริปต์ Python ของผู้เขียนอาจมีบั๊ก
bibในการตอบกลับจาก API คอลัมน์ของ data frame อาจไม่สอดคล้องกันGPT อาจทำให้การปลอมแปลงบทความวิทยาศาสตร์ทำได้ง่ายขึ้น แต่มนุษย์ก็ทำเรื่องนี้ได้ดีอยู่แล้วโดยไม่ต้องมี AI
อยากให้วิธีการเก็บข้อมูลในงานวิจัยเกี่ยวกับ LLM มีความประณีตมากกว่านี้
ผู้เชี่ยวชาญในสาขาที่เกี่ยวข้องสามารถแยกแยะผลลัพธ์ปลอมได้ง่าย
ในการถกเถียงก่อนหน้านี้ บทความที่ถูกสงสัยว่าใช้ GPT แท้จริงแล้วถูกเขียนขึ้นก่อนยุค OpenAI
ChatGPT ไม่ได้เข้าใจความจริง
ชื่นชมที่ภาพประกอบของบทความนี้ไม่ได้สร้างด้วย AI
บทความที่สร้างด้วย GPT อาจถูกเขียนขึ้นโดยผู้ที่ไม่ได้ใช้ภาษาอังกฤษเป็นภาษาแม่เพื่อปรับปรุงภาษาอังกฤษของตน
ดูเหมือนว่าเรากำลังก้าวเข้าสู่ยุคมืด