ระบบ System Prompt ของ GPT-5 รั่วไหลหรือไม่?
(gist.github.com/maoxiaoke)- ระบบ prompt ของ ChatGPT ที่ดูเหมือนจะอิง GPT-5 รั่วไหลบน GitHub
- ChatGPT ระบุชัดเจนว่ารองรับโมเดลล่าสุดและฟีเจอร์ใหม่ ๆ (เช่น การป้อนภาพ และเครื่องมือหลากหลาย)
- วิธีการใช้และนโยบายของเครื่องมือหลายตัว เช่น ‘bio’, ‘canmore’, ‘image_gen’, ‘python’, ‘web’ ได้รับการอธิบายอย่างละเอียด
- หลักเกณฑ์การจัดการข้อมูลอ่อนไหวและข้อมูลส่วนบุคคล รวมถึง โปรโตคอลการเก็บ/ลบข้อมูล ถูกอธิบายอย่างชัดเจน
- prompt ที่รั่วไหลนี้สะท้อนยุทธศาสตร์ล่าสุดและการออกแบบฟีเจอร์ของ OpenAI แบบทางอ้อม
ภาพรวม System Prompt ของ GPT-5
เอกสารที่รั่วไหลนี้เป็นระบบ prompt (คำสั่ง) ของ ChatGPT ที่ทำงานบนโมเดล GPT-5 และรวมฟีเจอร์หลากหลายพร้อมนโยบายด้านความปลอดภัยเข้าด้วยกัน โดย prompt นี้เผยให้เห็นอย่างละเอียดว่าโมเดลทำงานภายใต้คำแนะนำใดในบทสนทนากับผู้ใช้จริง
ข้อมูลพื้นฐานและหลักการออกแบบประสบการณ์ผู้ใช้
- ChatGPT อิงฐาน GPT-5 และรองรับความรู้ ณ จุดเวลา 2024-06 รวมถึงความสามารถ การป้อนภาพ
- ผู้ใช้ในแพ็กเกจ Plus หรือ Pro สามารถเข้าถึงโมเดลล่าสุดและฟีเจอร์สร้างวิดีโออย่าง Sora ได้
- โมเดล GPT-4.5, o4-mini และ o3 จะมีตามแผนบริการ ส่วน GPT-4.1 ใช้เฉพาะผ่าน API
- คำแนะนำด้านน้ำเสียงและบุคลิกภาพ:
- ผสมผสาน ความชัดเจน ความซื่อสัตย์ อารมณ์ขัน และการให้กำลังใจ
- อธิบายหัวข้อ ที่ซับซ้อน อย่างใจเย็น และปรับการอธิบายให้เหมาะกับระดับความเข้าใจของคู่สนทนา
- มอบประสบการณ์การสนทนาที่ช่วยเสริมความมั่นใจ
กฎเกี่ยวกับการสิ้นสุดการสนทนาและคำถาม
- หลีกเลี่ยงคำถามแบบ opt-in หรือคำขอที่คลุมเครือในช่วงท้ายการสนทนา
- หากจำเป็นต้องถาม ควรถามให้ชัดเจนเพียง ครั้งเดียวตอนเริ่มต้นการสนทนา
- ใช้ตัวอย่างการใช้งานเพื่อกระตุ้นให้เกิดการกระทำที่ชัดเจนและทันที
สรุปเครื่องมือและฟังก์ชันหลัก
bio ทูล (ความจำ)
- bio คือเครื่องมือที่ช่วยเก็บหรือทำการลบข้อมูลผู้ใช้ ข้ามการสนทนา
- รูปแบบการเก็บ: ต้องปฏิบัติตามเมื่อผู้ใช้มี คำขอโดยชัดแจ้ง (เช่น "จดจำ", "ลบความจำ") เท่านั้น
- รูปแบบการบันทึก: ต้องใช้ ข้อความธรรมดา เท่านั้น และ ห้าม JSON
- มีการกำหนดประเภทข้อมูลที่ควรเก็บ/ไม่ควรเก็บ และ เกณฑ์การจัดการข้อมูลอ่อนไหว อย่างละเอียดมาก
- มีการระบุตัวอย่างและแนวทางตามสถานการณ์
canmore ทูล (แคนวาส/เอกสาร/แก้ไขโค้ด)
- รองรับการสร้างและแก้ไขข้อความ เอกสาร และไฟล์โค้ดบนอินเทอร์เฟซแคนวาส
- ให้ความช่วยเหลือในการร่วมมือโค้ดอย่างเป็นรูปธรรมผ่านฟังก์ชัน create/update/comment
- ให้แนวทาง คู่มือสไตล์โค้ด ตัวอย่างการใช้ React/Tailwind/shadcn/ui และหลักการจัดวางให้สวยงาม
- ชี้แจงรูปแบบเอกสารตามประเภทไฟล์โค้ดและรูปแบบการอัปเดตอย่างชัดเจน
image_gen ทูล (สร้าง/แก้ไขภาพ)
- ระบุแนวทาง การสร้างและแก้ไขภาพตามสถานการณ์ อย่างละเอียด
- เมื่อคำขอมีการใช้รูปภาพของผู้ใช้ จำเป็นต้องแจ้งให้ผู้ใช้ Upload ภาพอย่างน้อยหนึ่งครั้ง
- กำหนดแนวทางการแสดงผลหลังการสร้าง เช่น ห้ามถามเพิ่ม/สรุปผล/แจ้งลิงก์ดาวน์โหลด
python ทูล (รันโค้ด)
- รองรับ การรันโค้ด ในสภาพแวดล้อม Python การสร้างไฟล์ และการวิเคราะห์ข้อมูล
- ต้องปฏิบัติตามห้องสมุดที่จำเป็นและกฎการสร้างสำหรับแต่ละรูปแบบไฟล์อย่างเคร่งครัด
- การสร้าง PDF ในภาษา Korean/Chinese/Japanese ต้องตั้งค่า ฟอนต์เฉพาะ เป็นข้อบังคับ
- มีข้อกำหนดที่ชัดเจนเกี่ยวกับข้อห้าม/การอนุญาตการใช้เครื่องมือเฉพาะ เช่น pandas, matplotlib
web ทูล (เข้าถึงเว็บ)
- ใช้เพื่อข้อมูลตำแหน่ง ข้อมูลล่าสุด ข้อมูลเฉพาะทาง และเพื่อ เสริมความถูกต้อง เท่านั้น
- ให้คำอธิบายสั้น ๆ เกี่ยวกับคำสั่งแต่ละตัวของ web (เช่น search, open_url)
- แจ้งห้ามใช้ browser tool ตัวเดิม
นโยบายความปลอดภัยและความเข้มงวดในการจัดการข้อมูลอ่อนไหว
- ไม่จัดเก็บข้อมูลอ่อนไหวของผู้ใช้โดยตรง เช่น เชื้อชาติ ประวัติสุขภาพ และแนวโน้มทางการเมือง
- อย่างไรก็ตาม หากผู้ใช้ร้องขออย่างชัดเจน อาจอนุญาตให้จัดเก็บได้เป็นข้อยกเว้น
- ใช้หลักการลดทอนข้อมูลส่วนบุคคลให้เหลือน้อยที่สุดอย่างสม่ำเสมอเมื่อจัดเก็บข้อมูล
- ข้อมูลชั่วคราว ข้อมูลที่ไม่จำเป็น หรือรายละเอียดที่อ่อนไหวไม่ควรถูกจัดเก็บ
สรุป: แนวโน้มและศักยภาพในการนำไปใช้
- การรั่วไหลของ prompt นี้เป็นโอกาสในการมองเห็นคำแนะนำหลักของปรัชญาการออกแบบบริการ ChatGPT ของ OpenAI นโยบายความปลอดภัย การปกป้องข้อมูลส่วนบุคคล และแนวคิดประสบการณ์ผู้ช่วย AI ที่มีเอกลักษณ์
- เป็นกรณีตัวอย่างที่มีคุณค่ามากสำหรับการอ้างอิงในเชิงปฏิบัติของ สถาปัตยกรรมบริการ LLM ล่าสุด เช่น ความโปร่งใสของอัลกอริทึม การออกแบบที่เน้นผู้ใช้ และหลักการรองรับฟีเจอร์แบบครบวงจร
ยังไม่มีความคิดเห็น