อดีตผู้อำนวยการ AI ของ OpenAI และ Tesla, Andrej Karpathy แสดงการวิเคราะห์แบบสมจริงเกี่ยวกับอนาคตของ AI Agent และไทม์ไลน์ของ AGI ในพอดแคสต์ล่าสุดของ Dwarkesh Patel ขณะที่วงการกำลังพูดถึง “ปีแห่ง AI Agent” เขาอธิบายอย่างตรงไปตรงมาว่าเหตุใดจึงควรเป็น “สิบปีของ AI Agent” และปัญหาพื้นฐานที่แท้จริงของการเรียนรู้แบบเสริมกำลัง (reinforcement learning) ในปัจจุบันคืออะไร

หัวใจสำคัญ:

  • “การดูดการกำกับเสมือนดูดผ่านหลอด” – จุดอ่อนร้ายแรงของ RL: วิธีการประเมินกระบวนการทั้งหมดด้วยสัญญาณตอบหนึ่งเดียวเพียงครั้งเดียวแม้จะลองซ้ำเป็นร้อยครั้ง เป็นวิธีที่โดยพื้นฐานแล้วไม่มีประสิทธิภาพและมีสัญญาณรบกวนสูงมาก
  • ความสามารถจริงของ AI ในการเขียนโค้ด: สิ่งที่โปรเจกต์ nanochat แสดงให้เห็น – ในการสร้างโคลน ChatGPT ขนาด 8,000 บรรทัด AI Agent แสดงจุดอ่อนอย่างรุนแรงในการเขียนโค้ดแบบสร้างสรรค์ และสิ่งที่ดีที่สุดที่ทำได้คือการทำงานในระดับการเติมโค้ดอัตโนมัติ
  • วิกฤตความเสื่อมของโมเดล: กับดักของข้อมูลสังเคราะห์ที่ซ่อนอยู่ – ตัวอย่างทุกอย่างที่ LLM สร้างขึ้นมีการกระจายที่ “เงียบ ๆ เสื่อมสภาพ” และนี่คือเหตุผลที่เมื่อขอให้ ChatGPT เล่าเรื่องตลก มักได้แค่ประมาณ 3 แบบซ้ำๆ

ยังไม่มีความคิดเห็น

ยังไม่มีความคิดเห็น