1 คะแนน โดย GN⁺ 2024-06-16 | 1 ความคิดเห็น | แชร์ทาง WhatsApp

ข้อจำกัดของ Leela Chess Zero

  • Leela Chess Zero กลายเป็นแชมป์โลกหลังจากฝึกฝนผ่านการเล่นกับตัวเองหลายพันล้านครั้ง
  • แต่กลับพ่ายแพ้ต่อ Stockfish อย่างหมดรูป
  • แม้จะฝึกเครือข่ายที่ใหญ่ขึ้น ก็ยังไม่สามารถเอาชนะ Stockfish ได้
  • Stockfish ใช้โมเดลที่เล็กกว่า Leela มาก แต่ชนะได้ด้วยความสามารถในการค้นหาที่ดีกว่า

ข้อคิดเพิ่มเติมเกี่ยวกับชัยชนะของ Stockfish

  • Leela เสียตำแหน่งแชมป์โลกไปเพราะค้นหาได้ไม่ดีพอ
  • การเพิ่มความสามารถด้านการค้นหาให้ LLM กำลังใกล้เข้ามา แต่ยังไม่ได้รับความสนใจ
  • Foundation model อย่าง GPT-4 ไม่มีความสามารถในการค้นหา
  • แม้จะมีสมมติฐานที่ครอบงำอยู่ว่าต้องใช้โมเดลที่ใหญ่กว่าเพื่อให้ค้นหาได้ แต่ก็มีตัวอย่างโต้แย้งอยู่
  • งานวิจัยของ DeepMind ระบุว่าพฤติกรรมการค้นหาเกิดขึ้นเองตามธรรมชาติในอัลกอริทึมหมากรุก
  • ในเมื่อมีอัลกอริทึมการค้นหาที่มีประสิทธิภาพอยู่แล้ว ก็ไม่จำเป็นต้องรอให้พฤติกรรมการค้นหาที่ไม่มีประสิทธิภาพเกิดขึ้นโดยบังเอิญในโมเดลขนาดใหญ่
  • โมเดลในปัจจุบันมีขนาดใหญ่พอที่จะทำให้การค้นหาเป็นไปได้แล้ว และอาจใหญ่เกินความจำเป็นด้วยซ้ำ

การค้นหาช่วยให้สามารถจัดสรรทรัพยากรคอมพิวต์ให้กับโดเมนเป้าหมายได้

  • สมมติว่าบริษัทยาต้องการใช้ AI เพื่อวิจัยยาตัวใหม่
  • ในโลกที่ AI สามารถค้นหาได้ จะมีสองทางเลือก
    1. รอจนถึงปี 2030 เพื่อให้ OpenAI ออกโมเดลที่ใหญ่ขึ้น 4 ลำดับขั้น
    2. ใช้ทรัพยากรคอมพิวต์สำหรับการอนุมานมากขึ้น 4 ลำดับขั้นได้ตั้งแต่วันนี้
  • บริษัทยาน่าจะเลือกทางที่สอง
  • ด้วยการค้นหา จึงสามารถใช้งานความสามารถระดับ ASI ของปี 2030 ได้ตั้งแต่ตอนนี้

ฉากทัศน์การพัฒนา AI แบบอิงการค้นหา

  • มีการค้นพบว่าการค้นหาทำงานได้บนโมเดลที่มีอยู่แล้ว
  • รัฐบาลหรือสถาบันวิจัยขนาดใหญ่ตระหนักว่าสามารถนำการค้นหาไปใช้กับการวิจัย AI หรือการรวบรวมข้อมูลจากต่างประเทศได้ทันที
  • เนื่องจากทรัพยากรคอมพิวต์สำหรับการอนุมานมีจำกัด จึงถูกจำกัดการใช้งานไว้กับงานด้านความมั่นคงหรือการวิจัย AI ของรัฐบาลและสถาบันใหญ่
  • การพัฒนา AI ที่ขับเคลื่อนด้วยการค้นหานำไปสู่การค้นพบอัลกอริทึมการค้นหาที่มีประสิทธิภาพมากขึ้นและสถาปัตยกรรมโมเดลแบบใหม่
  • การค้นหาไม่ต้องการข้อมูลฝึกเพิ่มขึ้น จึงช่วยแก้ปัญหาเรื่อง 'กำแพงข้อมูล'
  • การระเบิดของสติปัญญาจะเริ่มขึ้นในปีหน้า ไม่ใช่ปี 2030

ความเป็นไปได้ในการประยุกต์ใช้การค้นหากับการวิจัย AI โดยตัว AI เอง

  • หาก AI พัฒนาไปไกลพอที่จะวิจัยตัวเองได้ ก็มีแนวโน้มจะเกิดพลวัตของการพัฒนาแบบก้าวกระโดด
  • เช่นเดียวกับที่บริษัทยาไม่จำเป็นต้องรอ GPT-8 เพื่อวิจัยยาใหม่ ห้องแล็บ AI ก็จะสามารถวิจัย AI ได้โดยไม่ต้องรอโมเดลที่ใหญ่กว่า
  • การแทนที่นักวิจัย AI ที่เป็นมนุษย์อาจยังต้องมีการปลดข้อจำกัดเพิ่มเติม
  • แต่คาดว่าแม้เป็นเพียงแชตบอตธรรมดาที่มีสติปัญญาระดับ GPT-8 ก็เพียงพอที่จะเร่งความก้าวหน้าของ AI ได้แล้ว

1 ความคิดเห็น

 
GN⁺ 2024-06-16
ความคิดเห็นจาก Hacker News

สรุปความคิดเห็นจาก Hacker News

  • ประสิทธิภาพของการค้นหาขึ้นอยู่ใกล้ชิดกับคุณภาพของ value function: ปัจจุบัน value function มีความเฉพาะทางสูงกับบางโดเมน และยังมีหลักฐานไม่มากพอว่าจะสร้าง value function ที่ทำให้ทั่วไปข้ามไปยังโดเมนใหม่ได้
  • งานวิจัยของ Yann LeCun: Yann LeCun กำลังศึกษาบทบาทของการค้นหาเพื่อสร้าง AGI และพยายามสร้าง world model ที่แข็งแกร่งผ่าน JEPA
  • ข้อจำกัดของ language model: ยังมีคำถามว่า LLM ในปัจจุบันสามารถจำลอง world model ที่มีความสมบูรณ์เพียงพอได้หรือไม่ และเหตุผลที่วิดีโอสำคัญคือมนุษย์สามารถดึง world model ที่เป็นประโยชน์ออกมาจากลำดับของภาพได้
  • ความคลุมเครือของบทความ: โพสต์เริ่มต้นด้วยสมมติฐานที่น่าสนใจ แต่ไม่ได้ให้นิยามการค้นหาในบริบทของ LLM และไม่ได้อธิบายคำกล่าวที่ว่า "Pfizer สามารถใช้ความสามารถของ GPT-8 ได้ในวันนี้"
  • การค้นหาใน chess engine: การค้นหาของ chess engine เป็นไปได้เพราะมีฟังก์ชันเชิงวัตถุวิสัยรองรับ แต่ก็ยังน่าสงสัยว่า LLM มีเมตริกแบบนั้นหรือไม่
  • ความจำเป็นของการค้นหา: การค้นหาแทบจะแน่นอนว่าจำเป็น และสิ่งสำคัญคือการหาวิธีให้คลัสเตอร์ต้นทุนต่ำเอาชนะคลัสเตอร์ต้นทุนสูงได้
  • ความแตกต่างระหว่างหมากรุกกับเกมอื่น: หมากรุกมีปัจจัยในการตัดกิ่งน้อย จึงใช้แนวทางแบบกว้างได้ แต่สถานการณ์ในโลกจริงมีปัจจัยในการตัดกิ่งมากกว่ามาก
  • การทำให้การค้นหาทั่วไปขึ้น: การค้นหาคือการทำให้ "generate and test" และ rejection sampling เป็นกรณีทั่วไป โดยความเร็วขึ้นอยู่กับการสร้างผู้สมัครและเวลาในการทดสอบ
  • ปัญหาของเว็บไซต์: มีเว็บไซต์บางแห่งที่รบกวนความสามารถพื้นฐานของเบราว์เซอร์ ทำให้ใช้งานได้ไม่สะดวก
  • game tree ของ Leela Chess Zero: Leela สร้างแบบจำลองเกมหมากรุกเป็น game tree และใช้อัลกอริทึมการค้นหา
  • ความเป็นไปได้ในการค้นหาของ LLM: ยังไม่ชัดเจนว่า LLM มี possible space ที่สามารถค้นหาได้แบบใด
  • ข้อจำกัดของ LLM: เนื่องจาก LLM ไม่สามารถทำหรือประเมินชีสเค้กได้ จึงควรลดความคาดหวังต่อ AGI ลง
  • ปัญหาเชิงทฤษฎีสารสนเทศ: การฝึก LLM ต้องใช้ข้อมูลมากเกินไป ซึ่งสะท้อนถึงปัญหาการทำให้ทั่วไปและการขาด world modeling ภายในที่เพียงพอ