- แม้จะมี GPT-5 ถูกคาดหวังสูง แต่หลังการเปิดตัวจริงแล้ว ความผิดหวังของชุมชน เพิ่มขึ้นอย่างมาก
- GPT-5 ไม่มีความแตกต่างเชิงปฏิบัติที่ชัดเจนจากโมเดลเดิม และในบาง benchmark ยังพบ การลดลงของประสิทธิภาพ
- งานวิจัยล่าสุดยังยืนยันว่า LLM ยังเผชิญ ข้อจำกัดในการทั่วไป (generalization) และ ปัญหา distribution shift อย่างรุนแรง
- การสูญเสีย ความเป็นผู้นำทางเทคโนโลยี ของ OpenAI การออกรกของบุคลากรสำคัญ และการไล่ตามจากคู่แข่ง ทำให้การรักษามูลค่าบริษัทดูไม่ชัดเจน
- ความเชื่อมั่นต่อการอ้างว่าบรรลุ AGI ตกต่ำลง และในวงการโดยรวมเกิดการรับรู้มากขึ้นถึงข้อจำกัดของแนวทาง “การขยายขนาดล้วนๆ”
การเปิดตัว GPT-5 และกระแสความคาดหวัง
- สุดท้ายแล้ว การเปิดตัว GPT-5 ซึ่ง OpenAI ริเริ่มประกาศมานานก็เกิดขึ้นในที่สุด
- ซีอีโอ Sam Altman ใช้การพูดที่เต็มไปด้วยความมั่นใจและภาพลักษณ์การตลาดอย่างแข็งขันก่อนและหลังการเปิดตัว
- อย่างไรก็ตามหลังการเปิดตัว GPT-5 ยกเว้น influencer บางรายแล้ว ความผิดหวัง ครองใจในชุมชนส่วนใหญ่
- ผู้ใช้จำนวนมาก ผิดหวังมาก กับโมเดลใหม่ และเกิดปรากฏการณ์ที่มีการรณรงค์ขอให้อาศัยเวอร์ชันเก่ากลับมา
- แตกต่างจากการตลาดและคำกล่าวของ Altman รีวิวหลังใช้งานจริงกลับชี้ไปทาง การประเมินเชิงลบชัดเจน
ปฏิกิริยาของชุมชนและสื่อ
- ในชุมชนต่างๆ เช่น OpenAI Reddit, Hacker News เป็นต้น ผู้ใช้ยกประเด็นปัญหาของ GPT-5 อย่างเข้มข้น เช่น ข้อผิดพลาด, hallucination (การสมมติข้อมูล)
- ใน benchmark ประสิทธิภาพสำคัญบางตัว GPT-5 ยังอ่อนกว่าคู่แข่งอย่าง Grok 4
- ฟีเจอร์ใหม่อย่างการ routing อัตโนมัติก็เปิดเผย ความสับสนและความไม่สมบูรณ์ อย่างชัดเจน
- ในสถานการณ์ที่ความคาดหวังของชุมชนพุ่งสูงขึ้น GPT-5 กลับสร้างความผิดหวังอย่างมาก
- ในการสำรวจ Polymarket วันเปิดตัว ความเชื่อมั่นต่อ ความเป็นผู้นำด้าน AI ของ OpenAI ลดลงจาก 75% เป็น 14% ภายในเวลา 1 ชั่วโมง
ข้อจำกัดเชิงโครงสร้าง: ปัญหาหมากรุก การเข้าใจภาพ และการอนุมาน
- ปัญหา ข้อผิดพลาดในการอนุมานพื้นฐานและการไม่ปฏิบัติตามกฎหมากรุก ที่ผู้เขียนและผู้เชี่ยวชาญหลายคนชี้ชัด ยังคงยังคงอยู่
- ในด้านการสร้างภาพและงานอื่นๆ ขีดจำกัดที่เห็นชัดคือความสัมพันธ์ ระหว่างส่วน-รวม และความสอดคล้องทางภาพ
- GPT-5 ยังทำผิดพลาดในระดับปัญหาที่คาดว่าแม้แต่ผู้เชี่ยวชาญด้านวิศวกรรมเครื่องกลและคนทั่วไปก็ไม่ควรทำผิดได้
- ในงานพื้นฐานอย่างการสรุปและการอ่านจับใจความก็มีรายงานข้อผิดพลาดจำนวนมาก
- GPT-5 แม้จะเป็นโมเดลที่มีการพัฒนาค่อยเป็นค่อยไปที่ดี แต่เมื่อเทียบกับปีที่แล้วก็แทบไม่เห็นการเปลี่ยนแปลงที่เด่นชัด
สถานการณ์และแนวโน้มปัจจุบันของ OpenAI
- GPT-5 ยังคงเป็นระดับการปรับปรุงแบบค่อยเป็นค่อยไปเมื่อเทียบกับรุ่นก่อน และข้อด้อยที่รุนแรงถูกซ้ำรอยอยู่
- ความเชื่อมั่นใน ความเป็นผู้นำทางเทคโนโลยี ของ OpenAI กำลังลดลงทั้งในตลาดและอุตสาหกรรม
- บุคลากรหลักจำนวนมากออกจากองค์กรไปก่อตั้งคู่แข่งหรือย้ายไปที่อื่น และมีการไล่ตามโดยเร็วจาก Anthropic, Google, Elon Musk
- ความกดดันด้านการลดราคา ปัญหาความเป็นไปได้ทางรายได้ และความเสื่อมโทรมของความสัมพันธ์กับ Microsoft ทำให้ความเสี่ยงเชิงโครงสร้างรุนแรงขึ้น
- การตั้งคำถามต่อความเป็นไปได้ของ AGI ที่อิง LLM และความเชื่อมั่นต่อ CEO Sam Altman ยังถดถอยลงต่อเนื่อง
ข้อจำกัดพื้นฐานของ LLM: generalization และ distribution shift
- งานวิจัยล่าสุดจาก Arizona State University พบว่าการอนุมานแบบ Chain of Thought ก็ล้มเหลวเมื่อออกนอก distribution ที่ใช้ฝึกแล้ว
- โครงสร้างที่เปราะบางต่อ distribution shift ซึ่งถูกชี้โดย Apple และผู้เล่นอื่นๆ มาก่อน ถูกพบเหมือนกันในโมเดลล่าสุด
- สิ่งนี้ชี้ให้เห็นว่ามันคือสาเหตุรากฐานที่ LLM ต้องเผชิญข้อจำกัดเชิงคุณภาพซ้ำๆ และไม่อาจแก้ได้ด้วยการเพิ่มพารามิเตอร์จำนวนมหาศาล
- กลยุทธ์การขยายขนาดที่ใช้จ่ายถึงระดับพันล้านดอลลาร์ยังพิสูจน์ได้ว่าแก้ปัญหาพื้นฐานไม่สำเร็จ
- ความตระหนักว่าจำเป็นต้องหา แนวทางใหม่ กำลังขยายตัว
ขอบเขตของ AI โดยรวมและข้อจำกัดของ ‘การขยายขนาด’
- การตลาดที่เกินจริงเกี่ยวกับ AGI การขับขี่อัตโนมัติ และ timeline ที่ฟุ้งเฟ้อแพร่หลาย
- benchmark ที่บิดเบือนผลลัพธ์ การประเมินแบบ black-box และความขาดความโปร่งใสยังคงรุนแรง
- หลายคนเริ่มตระหนักว่า คำว่า AGI ถูกใช้เป็นเครื่องมือล่อใจนักลงทุนและสาธารณะ
- คาดหวังเชิงบวกต่อ AI และการปลุกกระแสแบบเกินจริงเพิ่มขึ้นไปพร้อมกัน
- ความเป็นจริงคือแนวทาง การขยายขนาดล้วนๆ ได้ชนกำแพงตันแล้ว
ทางเลือกและข้อสรุป
- แม้ GPT-5 อาจถูกลง แต่ข้อจำกัดเชิงคุณภาพด้านหมากรุก การอนุมาน ภาพ และคณิตศาสตร์ยังคงอยู่
- โมเดลคู่แข่งเช่น Grok, Claude, Gemini ก็ยังคงทำผิดปัญหาเดียวกันแบบซ้ำๆ
- distribution shift ยังคงเป็นปัญหาที่แก้ไม่ได้จนถึงตอนนี้
- เริ่มมีการยืนยันว่าต้องการแนวทางใหม่ เช่น neurosymbolic AI และวิธีที่อิง world model
- ยืนยันอีกครั้งว่าการขยายขนาดล้วนๆ ไม่พอ ต้องอาศัย นวัตกรรมอัลกอริทึมแบบผสมผสาน เพื่อให้ AGI เกิดขึ้นจริง
ประเด็นต่อเนื่องและ PS
- ข้อค้นพบเกี่ยวกับข้อจำกัดของ LLM ในสัปดาห์นี้ยังชี้ว่ายังมีประเด็นทางวิทยาศาสตร์ร้ายแรงอีกประการที่อาจถูกเปิดเผย
- ได้รับการแจ้งไว้ว่าจะมีการแชร์เนื้อหาแยกต่างหากในโพสต์ถัดไป
สรุป
- ก่อนและหลังการเปิดตัว GPT-5 ได้มีการพูดคุยอย่างกว้างขวางเกี่ยวกับความคาดหวังและปฏิกิริยาของอุตสาหกรรมและชุมชน ขีดจำกัดเชิงโครงสร้างของ LLM อนาคตของ OpenAI และความเป็นจริงของกรอบ AGI
- โดยรวมเนื้อหานี้ให้สัญญาณสำคัญต่อผู้ปฏิบัติงานสตาร์ทอัปและ IT เกี่ยวกับข้อจำกัดที่จับต้องได้ของ LLM และ GPT-5, การลงทุน/ความคาดหวัง/ความผิดหวังของ AI, ประเด็นนวัตกรรม, และแนวโน้มการวิจัย
ยังไม่มีความคิดเห็น