แนะนำ
สวัสดีครับ
ครั้งนี้ผมได้สร้างเวิร์กโฟลว์สำหรับแปลซีรีส์เอกสารทางการ และเปิดเผยผลการแปลของ Mysql และ Spring boot ในรูปแบบที่สามารถค้นหาได้
ปกติผมมักจะไล่อ่านเอกสารทางการคร่าว ๆ ก่อนและหลังการสัมภาษณ์ จึงหวังว่าน่าจะเป็นประโยชน์กับคนที่อยากนำไปใช้ในลักษณะใกล้เคียงกันด้วย
ผมรวบรวมพรอมป์ต์ที่ใช้จริง ลิงก์บริการ และบทความในบล็อกของ Openai ที่อ้างอิงตอนใช้งาน 5.1 ครั้งนี้ไว้ในชุดลิงก์ด้านล่าง
หลัง GPT-5.1: ความรู้สึกต่อประสิทธิภาพการให้เหตุผลของ LLM
ขอบันทึกความแตกต่างด้านประสิทธิภาพที่สัมผัสได้ ระหว่างช่วงที่พยายามทำระบบแปลอัตโนมัติมาตั้งแต่ยุค GPT-3.5
เมื่ออิงตาม GPT-3.5 แม้แต่กับข้อความที่ค่อนข้างสั้นราว 5,000~10,000 ตัวอักษร ก็มักมีหลายกรณีที่งานเล็ก ๆ อย่างการปรับรูปแบบ Markdown ยังทำออกมาได้ไม่ดีนัก
ในทางกลับกัน GPT-5.1 สามารถทำงานต่อไปนี้ได้ค่อนข้างเสถียร
- ดึงข้อมูล TOC มากกว่า 1,000 รายการ (6 คอลัมน์) จาก HTML ที่ยาวเกิน 100,000 ตัวอักษร โดยยังคงลำดับไว้ได้อย่างเสถียร
- แม้จะปล่อยให้ LLM ตัดสินใจเองว่าควรคงคำไหนไว้เป็นภาษาอังกฤษ และควรแปลคำไหน เอกสารที่ได้ก็ยังอ่านลื่นไหลดี (เช่น ในเอกสาร Spring คง bean ไว้เป็นอังกฤษ แต่แปลง factory เป็นคำแปลภาษาเกาหลี)
ระหว่างทำงาน หากมีส่วนที่พังหรือต้องเสริม ก็รับมือด้วยการเพิ่มกฎใน system prompt และถึงแม้ system prompt จะยาวขึ้น คุณภาพของผลลัพธ์ก็ไม่ได้แกว่งมากนัก ซึ่งเป็นจุดที่ยากจะคาดหวังได้จากโมเดลในอดีต
รวมลิงก์
ด้านล่างนี้คือแหล่งอ้างอิงที่เกี่ยวข้องกับงานครั้งนี้ซึ่งผมรวบรวมไว้
ผมคิดว่าน่าจะมีคุณค่าในฐานะข้อมูลอ้างอิงที่แสดงให้เห็นว่า แม้จะเป็นคำขอพรอมป์ต์ที่หนักระดับนี้ ก็ยังสามารถให้ผลลัพธ์ในระดับพร้อมใช้งานบริการจริงได้ในปัจจุบัน จึงนำมาแชร์ไว้
(ไม่ได้คิดว่าตัวพรอมป์ต์เขียนได้ดีอะไรนะครับ 555 ทิปเรื่องพรอมป์ต์แบบนี้มีอยู่เยอะในบล็อกของ anthropic และ openai เลยแนบตัวอย่างที่เป็นตัวแทนมาหนึ่งอัน)
2 ความคิดเห็น
ดูเหมือนว่าจำนวนเอกสารในผลการค้นหาจะเป็น 0 อยู่เสมอ
อ๊ะ! ขอบคุณสำหรับการแจ้งครับ
ตอนนี้ของผมแสดงผลได้ปกติดีอยู่ครับ ถึงอย่างนั้นเผื่อไว้ ผมได้ตรวจเช็กการ deploy อีกรอบแล้ว
แต่เพื่อให้พอตรวจสอบได้ รบกวนช่วยบอกหน่อยได้ไหมครับว่าคุณใช้คำค้นหาอะไร
ตอนนี้ยังไม่มีพจนานุกรมคำพ้องความหมายระหว่างภาษาเกาหลี <-> อังกฤษ ดังนั้นอาจเป็นไปได้ว่ามันไม่แสดงผลเพราะจับคู่กันตรง ๆ ไม่ได้จริง ๆ ครับ