16 คะแนน โดย taekim34 2026-05-12 | 13 ความคิดเห็น | แชร์ทาง WhatsApp

LoPE คือเทคนิคที่แทรก Lorem ipsum dolor sit amet ... ไว้หน้าพรอมป์ต์ระหว่างการฝึกด้วย RL เพื่อแก้ปัญหา "zero-advantage" ที่เมื่อทุกตัวอย่างล้มเหลวในโจทย์ยาก สัญญาณการเรียนรู้จะกลายเป็น 0

ผลลัพธ์สำคัญ:

  • บน Qwen3-4B คะแนนเฉลี่ยของเบนช์มาร์กคณิตศาสตร์เพิ่มขึ้น +4.62 คะแนน
  • บน AMC 2023 ประสิทธิภาพเชิงสัมพัทธ์ดีขึ้น 22%
  • เป็นวิธีเดียวที่ทะลุผ่านโจทย์ยาก 50 ข้อซึ่งวิธีเดิมทั้งหมดทำไม่สำเร็จ

ประเด็นน่าอ่าน

เหตุผลที่ "ข้อความไร้ความหมายที่ดูเหมือนภาษา" ซึ่งอิงจากภาษาละตินจึงได้ผล และกลไกที่ไปรบกวนเส้นทางการให้เหตุผลตั้งต้นของโมเดลเพื่อเพิ่มความหลากหลายในการสำรวจนั้นน่าสนใจ

13 ความคิดเห็น

 
gooksangom6394 2026-05-12

“นกฮูกหมายเลข 158 ทำได้ไหม?”
“… ครูฝึกครับ มันเกินไปสำหรับผม…”
“Lorem Ipsum! ทำได้ไหม?”
“อ๊าก!!! ทำได้ครับ!”

 
sonic0987 2026-05-12

อั๊ก 555555555555555

 
epics 2026-05-12

55555

 
taekim34 2026-05-12

🤣🤣🤣🤣 ขำลั่นเลยครับ

 
mammal 2026-05-12

น่าสนใจดีนะ เหมือนเป็นการเพิ่มประโยคที่โมเดลสามารถมองข้ามได้เข้าไป ใช้เหมือน seed เพื่อขยายพื้นที่การสำรวจตอนทำการสุ่มตัวอย่าง

 
taekim34 2026-05-12

ใช่เลยครับ/ค่ะ ทั้งการนำเสนอมุมมองใหม่ที่คาดไม่ถึง และยังช่วยปรับปรุงประสิทธิภาพจริงได้ด้วย ก็น่าสนุกและน่าสนใจมากครับ/ค่ะ

 
ide127 23 일 전

บางทีนี่อาจตีความได้ว่าปัจจุบันโมเดลต่าง ๆ กำลังเกิดการเรียนรู้แบบ overfitting อยู่ และดังนั้นก็อาจยังมีช่องให้ลดขนาดความจุของโมเดลลงได้มากกว่านี้ครับ

 
happing94 2026-05-12

ที่แท้ความรู้สึกที่ว่าเวลาเขียนพรอมป์แล้วพิมพ์ผิดแบบมั่ว ๆ ประสิทธิภาพจะดีขึ้น ก็ไม่ใช่แค่ความรู้สึกสินะ

 
taekim34 2026-05-13

5555 ทุกคนทำไมถึงตลกกันขนาดนี้ครับ

 
aliveornot 2026-05-12

หลักการฟังดูสมเหตุสมผล แต่น่าทึ่งดีนะครับ ทำไมประสิทธิภาพถึงไม่ลดลงแต่กลับเพิ่มขึ้นล่ะ?

 
taekim34 2026-05-12

ผมคิดว่ามันอาจจะคล้ายกับเวลาเป็นคนแล้วต้องแก้ปัญหาที่ยาก พอได้ 'ปลุกความคิด' ให้ตื่นขึ้นมาก่อน แล้วกลับมาคิดใหม่ตั้งแต่ต้นอีกครั้ง บางทีก็ทำให้แก้ปัญหาได้ แบบนั้นหรือเปล่านะ? นี่เป็นความเห็นส่วนตัวของผมเองครับ 555

 
somang04 2026-05-12

สงสัยว่าถ้าเอาอันนั้นไปประยุกต์ใช้ จะให้ผลลัพธ์ที่มีนัยสำคัญกับการเรียนรู้ทั่วไปด้วยไหมครับ?? ตื่นเต้นจัง..

 
taekim34 2026-05-12

ผมก็อยากลองทำดูสักครั้งเหมือนกันครับ ^^
ก่อนหน้านี้ก็เคยมีผลวิจัยออกมาด้วยว่า ถ้าใส่พรอมป์ต์เดียวกันซ้ำ 2 ครั้งเข้าไป (แม้จะไม่มีความหมายอะไร) ผลลัพธ์จะออกมาดีกว่าเดิม เหมือนเป็นการบ่นย้ำอีกรอบอะไรทำนองนั้น.. อย่างที่ผมเคยไปคอมเมนต์ไว้ในโพสต์ของคุณ aliverornot นะครับ ผมว่ามันเหมือนทำหน้าที่ช่วยกระตุ้นความคิด คล้ายกับเวลาที่นักคณิตศาสตร์เจอโจทย์ยาก ๆ แล้ววางปากกาลงสักพักออกไปเดินเล่นนั่นแหละครับ.. ฮ่าๆ