GPT-5: ล่าช้า เกินความคาดหวัง และไม่เป็นไปตามหวัง — และยังมีปัญหาที่ร้ายแรงกว่านั้น

(garymarcus.substack.com)

6 คะแนน โดย GN⁺ 2025-08-11 | 5 ความคิดเห็น | แชร์ทาง WhatsApp

แม้จะมี GPT-5 ถูกคาดหวังสูง แต่หลังการเปิดตัวจริงแล้ว ความผิดหวังของชุมชน เพิ่มขึ้นอย่างมาก
GPT-5 ไม่มีความแตกต่างเชิงปฏิบัติที่ชัดเจนจากโมเดลเดิม และในบาง benchmark ยังพบ การลดลงของประสิทธิภาพ
งานวิจัยล่าสุดยังยืนยันว่า LLM ยังเผชิญ ข้อจำกัดในการทั่วไป (generalization) และ ปัญหา distribution shift อย่างรุนแรง
การสูญเสีย ความเป็นผู้นำทางเทคโนโลยี ของ OpenAI การออกรกของบุคลากรสำคัญ และการไล่ตามจากคู่แข่ง ทำให้การรักษามูลค่าบริษัทดูไม่ชัดเจน
ความเชื่อมั่นต่อการอ้างว่าบรรลุ AGI ตกต่ำลง และในวงการโดยรวมเกิดการรับรู้มากขึ้นถึงข้อจำกัดของแนวทาง “การขยายขนาดล้วนๆ”

การเปิดตัว GPT-5 และกระแสความคาดหวัง

สุดท้ายแล้ว การเปิดตัว GPT-5 ซึ่ง OpenAI ริเริ่มประกาศมานานก็เกิดขึ้นในที่สุด
ซีอีโอ Sam Altman ใช้การพูดที่เต็มไปด้วยความมั่นใจและภาพลักษณ์การตลาดอย่างแข็งขันก่อนและหลังการเปิดตัว
อย่างไรก็ตามหลังการเปิดตัว GPT-5 ยกเว้น influencer บางรายแล้ว ความผิดหวัง ครองใจในชุมชนส่วนใหญ่
ผู้ใช้จำนวนมาก ผิดหวังมาก กับโมเดลใหม่ และเกิดปรากฏการณ์ที่มีการรณรงค์ขอให้อาศัยเวอร์ชันเก่ากลับมา
แตกต่างจากการตลาดและคำกล่าวของ Altman รีวิวหลังใช้งานจริงกลับชี้ไปทาง การประเมินเชิงลบชัดเจน

ปฏิกิริยาของชุมชนและสื่อ

ในชุมชนต่างๆ เช่น OpenAI Reddit, Hacker News เป็นต้น ผู้ใช้ยกประเด็นปัญหาของ GPT-5 อย่างเข้มข้น เช่น ข้อผิดพลาด, hallucination (การสมมติข้อมูล)
ใน benchmark ประสิทธิภาพสำคัญบางตัว GPT-5 ยังอ่อนกว่าคู่แข่งอย่าง Grok 4
ฟีเจอร์ใหม่อย่างการ routing อัตโนมัติก็เปิดเผย ความสับสนและความไม่สมบูรณ์ อย่างชัดเจน
ในสถานการณ์ที่ความคาดหวังของชุมชนพุ่งสูงขึ้น GPT-5 กลับสร้างความผิดหวังอย่างมาก
ในการสำรวจ Polymarket วันเปิดตัว ความเชื่อมั่นต่อ ความเป็นผู้นำด้าน AI ของ OpenAI ลดลงจาก 75% เป็น 14% ภายในเวลา 1 ชั่วโมง

ข้อจำกัดเชิงโครงสร้าง: ปัญหาหมากรุก การเข้าใจภาพ และการอนุมาน

ปัญหา ข้อผิดพลาดในการอนุมานพื้นฐานและการไม่ปฏิบัติตามกฎหมากรุก ที่ผู้เขียนและผู้เชี่ยวชาญหลายคนชี้ชัด ยังคงยังคงอยู่
ในด้านการสร้างภาพและงานอื่นๆ ขีดจำกัดที่เห็นชัดคือความสัมพันธ์ ระหว่างส่วน-รวม และความสอดคล้องทางภาพ
GPT-5 ยังทำผิดพลาดในระดับปัญหาที่คาดว่าแม้แต่ผู้เชี่ยวชาญด้านวิศวกรรมเครื่องกลและคนทั่วไปก็ไม่ควรทำผิดได้
ในงานพื้นฐานอย่างการสรุปและการอ่านจับใจความก็มีรายงานข้อผิดพลาดจำนวนมาก
GPT-5 แม้จะเป็นโมเดลที่มีการพัฒนาค่อยเป็นค่อยไปที่ดี แต่เมื่อเทียบกับปีที่แล้วก็แทบไม่เห็นการเปลี่ยนแปลงที่เด่นชัด

สถานการณ์และแนวโน้มปัจจุบันของ OpenAI

GPT-5 ยังคงเป็นระดับการปรับปรุงแบบค่อยเป็นค่อยไปเมื่อเทียบกับรุ่นก่อน และข้อด้อยที่รุนแรงถูกซ้ำรอยอยู่
ความเชื่อมั่นใน ความเป็นผู้นำทางเทคโนโลยี ของ OpenAI กำลังลดลงทั้งในตลาดและอุตสาหกรรม
บุคลากรหลักจำนวนมากออกจากองค์กรไปก่อตั้งคู่แข่งหรือย้ายไปที่อื่น และมีการไล่ตามโดยเร็วจาก Anthropic, Google, Elon Musk
ความกดดันด้านการลดราคา ปัญหาความเป็นไปได้ทางรายได้ และความเสื่อมโทรมของความสัมพันธ์กับ Microsoft ทำให้ความเสี่ยงเชิงโครงสร้างรุนแรงขึ้น
การตั้งคำถามต่อความเป็นไปได้ของ AGI ที่อิง LLM และความเชื่อมั่นต่อ CEO Sam Altman ยังถดถอยลงต่อเนื่อง

ข้อจำกัดพื้นฐานของ LLM: generalization และ distribution shift

งานวิจัยล่าสุดจาก Arizona State University พบว่าการอนุมานแบบ Chain of Thought ก็ล้มเหลวเมื่อออกนอก distribution ที่ใช้ฝึกแล้ว
โครงสร้างที่เปราะบางต่อ distribution shift ซึ่งถูกชี้โดย Apple และผู้เล่นอื่นๆ มาก่อน ถูกพบเหมือนกันในโมเดลล่าสุด
สิ่งนี้ชี้ให้เห็นว่ามันคือสาเหตุรากฐานที่ LLM ต้องเผชิญข้อจำกัดเชิงคุณภาพซ้ำๆ และไม่อาจแก้ได้ด้วยการเพิ่มพารามิเตอร์จำนวนมหาศาล
กลยุทธ์การขยายขนาดที่ใช้จ่ายถึงระดับพันล้านดอลลาร์ยังพิสูจน์ได้ว่าแก้ปัญหาพื้นฐานไม่สำเร็จ
ความตระหนักว่าจำเป็นต้องหา แนวทางใหม่ กำลังขยายตัว

ขอบเขตของ AI โดยรวมและข้อจำกัดของ ‘การขยายขนาด’

การตลาดที่เกินจริงเกี่ยวกับ AGI การขับขี่อัตโนมัติ และ timeline ที่ฟุ้งเฟ้อแพร่หลาย
benchmark ที่บิดเบือนผลลัพธ์ การประเมินแบบ black-box และความขาดความโปร่งใสยังคงรุนแรง
หลายคนเริ่มตระหนักว่า คำว่า AGI ถูกใช้เป็นเครื่องมือล่อใจนักลงทุนและสาธารณะ
คาดหวังเชิงบวกต่อ AI และการปลุกกระแสแบบเกินจริงเพิ่มขึ้นไปพร้อมกัน
ความเป็นจริงคือแนวทาง การขยายขนาดล้วนๆ ได้ชนกำแพงตันแล้ว

ทางเลือกและข้อสรุป

แม้ GPT-5 อาจถูกลง แต่ข้อจำกัดเชิงคุณภาพด้านหมากรุก การอนุมาน ภาพ และคณิตศาสตร์ยังคงอยู่
โมเดลคู่แข่งเช่น Grok, Claude, Gemini ก็ยังคงทำผิดปัญหาเดียวกันแบบซ้ำๆ
distribution shift ยังคงเป็นปัญหาที่แก้ไม่ได้จนถึงตอนนี้
เริ่มมีการยืนยันว่าต้องการแนวทางใหม่ เช่น neurosymbolic AI และวิธีที่อิง world model
ยืนยันอีกครั้งว่าการขยายขนาดล้วนๆ ไม่พอ ต้องอาศัย นวัตกรรมอัลกอริทึมแบบผสมผสาน เพื่อให้ AGI เกิดขึ้นจริง

ประเด็นต่อเนื่องและ PS

ข้อค้นพบเกี่ยวกับข้อจำกัดของ LLM ในสัปดาห์นี้ยังชี้ว่ายังมีประเด็นทางวิทยาศาสตร์ร้ายแรงอีกประการที่อาจถูกเปิดเผย
ได้รับการแจ้งไว้ว่าจะมีการแชร์เนื้อหาแยกต่างหากในโพสต์ถัดไป

สรุป

ก่อนและหลังการเปิดตัว GPT-5 ได้มีการพูดคุยอย่างกว้างขวางเกี่ยวกับความคาดหวังและปฏิกิริยาของอุตสาหกรรมและชุมชน ขีดจำกัดเชิงโครงสร้างของ LLM อนาคตของ OpenAI และความเป็นจริงของกรอบ AGI
โดยรวมเนื้อหานี้ให้สัญญาณสำคัญต่อผู้ปฏิบัติงานสตาร์ทอัปและ IT เกี่ยวกับข้อจำกัดที่จับต้องได้ของ LLM และ GPT-5, การลงทุน/ความคาดหวัง/ความผิดหวังของ AI, ประเด็นนวัตกรรม, และแนวโน้มการวิจัย

5 ความคิดเห็น

gnsdl116 2025-08-12

มันดูเป็นความมองโลกในแง่ร้ายมากเกินไป เข้าใจประเด็นที่กังวลได้ แต่การพัฒนาเทคโนโลยีก็ไม่จำเป็นต้องเพิ่มขึ้นอย่างต่อเนื่องเสมอไป

mammal 2025-08-11

เพราะผู้เขียนโพสต์คือ Gary Marcus ที่ขึ้นชื่อว่ามักพูดแต่เรื่องไร้สาระอยู่เสมอ...

dongho42 2025-08-11

ถ้าทำแบบ Google ที่เงียบๆ แค่ทำ show&prove เงียบๆ ก็น่าจะไม่เลวร้ายขนาดนี้นะ ช่วงนี้มีคนเถียงกันไปหมดว่าเขาน่ากลัวเกินไป ว่ามันเหมือน ‘ดาวแห่งความตาย’ ว่าดูเหมือนทำระเบิดนิวเคลียร์ไปแล้ว นึกว่าเป็นผลจากการเอาเรื่องพวกนี้ไปยกย่องฮไพป์จนเกินไปจนได้เอง