- CoRT เป็นอัลกอริทึมที่ทำให้โมเดล AI ตรวจทานคำตอบของตัวเองซ้ำ ๆ และสร้างทางเลือกขึ้นมาเพื่อคัดเลือกคำตอบที่ดีที่สุด
- เมื่อนำไปใช้กับโมเดล Mistral 3.1 24B ประสิทธิภาพดีขึ้นอย่างมาก โดยเฉพาะในงานเขียนโปรแกรม
- AI จะสร้างคำตอบเริ่มต้นก่อน แล้วประเมินทางเลือกผ่าน 'รอบความคิด' หลายครั้งเพื่อเลือกคำตอบสุดท้าย
- กระบวนการนี้ประกอบด้วย การประเมินตนเอง, การสร้างทางเลือกแบบแข่งขัน, การปรับปรุงแบบวนซ้ำ, ความลึกของการคิดแบบไดนามิก
- CoRT เผยแพร่ภายใต้สัญญาอนุญาต MIT และยินดีรับการมีส่วนร่วมเพื่อการปรับปรุง
CoRT (Chain of Recursive Thoughts) 🧠🔄
สรุป
- แนะนำ CoRT ซึ่งเป็นอัลกอริทึมที่ทำให้ AI ถกเถียงกับตัวเองเพื่อค้นหาคำตอบที่ดีกว่า
- โมเดล AI จะตรวจทานคำตอบซ้ำ ๆ และสร้างทางเลือกขึ้นมาเพื่อคัดเลือกคำตอบที่ดีที่สุด
- เมื่อนำไปใช้กับโมเดล Mistral 3.1 24B ประสิทธิภาพดีขึ้นอย่างมาก โดยเฉพาะในงานเขียนโปรแกรม
วิธีการทำงานของ CoRT
- AI สร้างคำตอบเริ่มต้น
- AI ตัดสินใจจำนวน 'รอบความคิด' ที่จำเป็น
- ในแต่ละรอบ:
- สร้างคำตอบทางเลือก 3 แบบ
- ประเมินคำตอบทั้งหมด
- เลือกคำตอบที่ดีที่สุด
- คำตอบสุดท้ายจะเป็นผู้รอดชีวิตจาก AI battle royale นี้
ส่วนผสมลับ
- การประเมินตนเอง
- การสร้างทางเลือกแบบแข่งขัน
- การปรับปรุงแบบวนซ้ำ
- ความลึกของการคิดแบบไดนามิก
การมีส่วนร่วม
- หากพบวิธีปรับปรุง ยินดีรับ PR
สัญญาอนุญาต
- ใช้งานได้อย่างอิสระภายใต้สัญญาอนุญาต MIT
1 ความคิดเห็น
ความคิดเห็นจาก Hacker News
ให้โมเดลแชต AI ตอบคำถามเกี่ยวกับปัญหาหนึ่ง แล้วให้เขียนรายงานอธิบายว่าทำไมคำตอบนั้นจึงถูกต้อง
อยากลองทำการถกเถียงแบบ "วุฒิสภา" ในโหมดที่เปิดทำงานตลอดและในสเกลที่ใหญ่ขึ้น
มีกลยุทธ์ง่าย ๆ โดยตอนจบข้อความจะขอว่า "ช่วยคิดหนึ่งรอบด้วยแท็กความคิด วิจารณ์ตัวเองหนึ่งรอบด้วยแท็กวิจารณ์ แล้วคิดอีกหนึ่งรอบด้วยแท็กความคิดก่อนตอบ"
ไม่เหมือนกับที่คาดจากชื่อเรื่อง
กำลังออกแบบกราฟเอดิเตอร์สไตล์บลูพรินต์ของ Unreal Engine โดยเริ่มจากอินพุตของผู้ใช้แล้วให้หลายเอเจนต์ทำงานต่อ
สงสัยว่าทีมเอเจนต์ AI จะบริหารทีมสครัมและมีการประชุมสแตนด์อัปทุก ๆ สองสามชั่วโมงหรือไม่
วิธีหนึ่งในการทำให้โมเดล ML สร้างไอเดียใหม่คือ ให้เข้าหาแบบเฉียง ๆ กับไอเดียที่เคยลองแล้วทิ้งไป โดยยังคงข้อจำกัดด้านความสอดคล้องบางอย่างไว้
ถ้าไม่เร่งเปลี่ยน GPU ทั้งหมดไปใช้พลังงานสีเขียว โลกคงร้อนขึ้นระหว่างที่ AI กำลังถกเถียงกันเพื่อหาวิธีแก้ที่เหมาะสมที่สุดด้วยตัวเอง
มีตัวอย่างที่ใช้ CoRT และตัวอย่างที่ไม่ใช้ ซึ่งตัวอย่างที่ไม่ใช้นั้นดีกว่ามาก
วิธีการนี้ชวนให้นึกถึงครีเอเตอร์บน YouTube