1 คะแนน โดย GN⁺ 2025-04-30 | 1 ความคิดเห็น | แชร์ทาง WhatsApp
  • CoRT เป็นอัลกอริทึมที่ทำให้โมเดล AI ตรวจทานคำตอบของตัวเองซ้ำ ๆ และสร้างทางเลือกขึ้นมาเพื่อคัดเลือกคำตอบที่ดีที่สุด
  • เมื่อนำไปใช้กับโมเดล Mistral 3.1 24B ประสิทธิภาพดีขึ้นอย่างมาก โดยเฉพาะในงานเขียนโปรแกรม
  • AI จะสร้างคำตอบเริ่มต้นก่อน แล้วประเมินทางเลือกผ่าน 'รอบความคิด' หลายครั้งเพื่อเลือกคำตอบสุดท้าย
  • กระบวนการนี้ประกอบด้วย การประเมินตนเอง, การสร้างทางเลือกแบบแข่งขัน, การปรับปรุงแบบวนซ้ำ, ความลึกของการคิดแบบไดนามิก
  • CoRT เผยแพร่ภายใต้สัญญาอนุญาต MIT และยินดีรับการมีส่วนร่วมเพื่อการปรับปรุง

CoRT (Chain of Recursive Thoughts) 🧠🔄

สรุป

  • แนะนำ CoRT ซึ่งเป็นอัลกอริทึมที่ทำให้ AI ถกเถียงกับตัวเองเพื่อค้นหาคำตอบที่ดีกว่า
  • โมเดล AI จะตรวจทานคำตอบซ้ำ ๆ และสร้างทางเลือกขึ้นมาเพื่อคัดเลือกคำตอบที่ดีที่สุด
  • เมื่อนำไปใช้กับโมเดล Mistral 3.1 24B ประสิทธิภาพดีขึ้นอย่างมาก โดยเฉพาะในงานเขียนโปรแกรม

วิธีการทำงานของ CoRT

  • AI สร้างคำตอบเริ่มต้น
  • AI ตัดสินใจจำนวน 'รอบความคิด' ที่จำเป็น
  • ในแต่ละรอบ:
    • สร้างคำตอบทางเลือก 3 แบบ
    • ประเมินคำตอบทั้งหมด
    • เลือกคำตอบที่ดีที่สุด
  • คำตอบสุดท้ายจะเป็นผู้รอดชีวิตจาก AI battle royale นี้

ส่วนผสมลับ

  • การประเมินตนเอง
  • การสร้างทางเลือกแบบแข่งขัน
  • การปรับปรุงแบบวนซ้ำ
  • ความลึกของการคิดแบบไดนามิก

การมีส่วนร่วม

  • หากพบวิธีปรับปรุง ยินดีรับ PR

สัญญาอนุญาต

  • ใช้งานได้อย่างอิสระภายใต้สัญญาอนุญาต MIT

1 ความคิดเห็น

 
GN⁺ 2025-04-30
ความคิดเห็นจาก Hacker News
  • ให้โมเดลแชต AI ตอบคำถามเกี่ยวกับปัญหาหนึ่ง แล้วให้เขียนรายงานอธิบายว่าทำไมคำตอบนั้นจึงถูกต้อง

    • จากนั้นให้โมเดล AI ตัวที่สองประเมินรายงานนี้ และเขียนรายงานที่ชี้ข้อมูลที่โมเดลต้นฉบับไม่ได้ให้ไว้หรือความไม่สอดคล้องกันทางตรรกะ
    • ทำกระบวนการนี้ซ้ำไปเรื่อย ๆ จนกว่าโมเดล AI ตัวที่สองจะพอใจกับคำอธิบายของโมเดลตัวแรก หรือจนกว่าโมเดลตัวแรกจะปรับตามที่ร้องขอครบทั้งหมด
    • วิธีนี้ค่อนข้างซับซ้อน แต่เมื่อได้ลองแล้วก็ได้ผลลัพธ์ที่ดีพอสมควร
  • อยากลองทำการถกเถียงแบบ "วุฒิสภา" ในโหมดที่เปิดทำงานตลอดและในสเกลที่ใหญ่ขึ้น

    • แทนที่จะให้ตอบเป็นรายปัญหา ก็ให้รายการงานแล้วปล่อยให้วุฒิสภาจัดการแก้ไข
    • คิดว่าน่าจะได้ผลลัพธ์ที่น่าประทับใจจากมุมมองที่หลากหลายและการวิเคราะห์เชิงวิพากษ์
    • ต้องใช้โทเคนจำนวนมาก แต่ต้นทุนต่อโทเคนกำลังลดลงเรื่อย ๆ จึงมีความเป็นไปได้
    • อาจตั้งเซิร์ฟเวอร์ IRC สำหรับ AI โดยเฉพาะ เพื่อสร้างพื้นที่ถกเถียงร่วมกันที่ใคร ๆ ก็เชื่อมต่อโมเดลของตัวเองเข้ามาได้
  • มีกลยุทธ์ง่าย ๆ โดยตอนจบข้อความจะขอว่า "ช่วยคิดหนึ่งรอบด้วยแท็กความคิด วิจารณ์ตัวเองหนึ่งรอบด้วยแท็กวิจารณ์ แล้วคิดอีกหนึ่งรอบด้วยแท็กความคิดก่อนตอบ"

    • ใช้งานได้ดี
    • การขอให้หาปัญหาใหญ่ที่สุด 5 ข้อของข้อเสนอหนึ่ง ๆ ก็ได้ผลเช่นกัน
  • ไม่เหมือนกับที่คาดจากชื่อเรื่อง

    • ตั้งบทบาทเป็นผู้ช่วย ผู้ตรวจสอบไขว้ และผู้ตัดสิน แล้วให้ถามตอบตามบทบาทนั้น
    • ขอให้ ChatGPT "อธิบายหาก XYZ เป็นความจริง" และ "อธิบายหาก XYZ ไม่เป็นความจริง" เพื่อหาว่าฝั่งไหนน่าเชื่อถือกว่ากัน
  • กำลังออกแบบกราฟเอดิเตอร์สไตล์บลูพรินต์ของ Unreal Engine โดยเริ่มจากอินพุตของผู้ใช้แล้วให้หลายเอเจนต์ทำงานต่อ

    • รู้สึกว่า Mistral small 3.1 และ gemma 3 เป็นเหมือนโมเดลกึ่งมีความสามารถชุดแรกที่รันบนเครื่องตัวเองได้
    • ถ้าลองให้รัน Python ในลูปและสั่งให้สำรวจโลก มันก็จะเริ่มดาวน์โหลดและอ่านข่าวต่าง ๆ
  • สงสัยว่าทีมเอเจนต์ AI จะบริหารทีมสครัมและมีการประชุมสแตนด์อัปทุก ๆ สองสามชั่วโมงหรือไม่

    • สงสัยว่าจะจำลองระบบราชการภาครัฐด้วยวิธีที่เอเจนต์ถกเถียงหัวข้อต่าง ๆ กันทั้งวันเพื่อหาความเห็นที่ดีที่สุดหรือไม่
  • วิธีหนึ่งในการทำให้โมเดล ML สร้างไอเดียใหม่คือ ให้เข้าหาแบบเฉียง ๆ กับไอเดียที่เคยลองแล้วทิ้งไป โดยยังคงข้อจำกัดด้านความสอดคล้องบางอย่างไว้

  • ถ้าไม่เร่งเปลี่ยน GPU ทั้งหมดไปใช้พลังงานสีเขียว โลกคงร้อนขึ้นระหว่างที่ AI กำลังถกเถียงกันเพื่อหาวิธีแก้ที่เหมาะสมที่สุดด้วยตัวเอง

  • มีตัวอย่างที่ใช้ CoRT และตัวอย่างที่ไม่ใช้ ซึ่งตัวอย่างที่ไม่ใช้นั้นดีกว่ามาก

    • เป็นการเลือกตัวอย่างที่แปลกดี
  • วิธีการนี้ชวนให้นึกถึงครีเอเตอร์บน YouTube

    • เขียนสคริปต์เกมให้เหมือนสนามแข่งเพื่อไปให้ถึงจุดหมาย แล้วทำซ้ำจนกว่าจะเจอวิธีแก้ที่เร็วที่สุด
    • สิ่งนี้เรียกว่าแมชชีนเลิร์นนิงหรือรีอินฟอร์ซเมนต์เลิร์นนิง
    • ความเข้าใจแบบผิวเผินเกี่ยวกับ AI โดยรวมก็คล้าย ๆ กัน