การเปลี่ยนแปลงของ system prompt ระหว่าง Claude Opus 4.6 และ 4.7
(simonwillison.net)- Anthropic เป็นห้องแล็บ AI รายใหญ่เพียงแห่งเดียวที่ เปิดเผย system prompt ของระบบแชต มาโดยตลอด และใน Opus 4.7 ที่เปิดตัวเมื่อวันที่ 16 เมษายน 2026 ก็มีการอัปเดตพรอมป์ต์ที่น่าสนใจ
- ชื่อถูกเปลี่ยนเป็น Claude Platform และมีการเพิ่ม Claude in Chrome, Claude in Excel, Claude in Powerpoint เข้าไปในรายการเครื่องมือ พร้อมทั้งเพิ่มแนวทางว่า หากคำขอขาดข้อมูลเล็กน้อย ให้ ลองทำทันที แทนที่จะซักถามก่อน
- ส่วนความปลอดภัยของเด็ก ถูกขยายอย่างมากและครอบด้วยแท็ก
<critical_child_safety_instructions>ใหม่ โดยกำหนดว่าเมื่อมีการปฏิเสธไปแล้วครั้งหนึ่ง การขอทั้งหมดหลังจากนั้นในบทสนทนาเดียวกันต้องได้รับการพิจารณาด้วยความระมัดระวังอย่างยิ่ง - มีการเพิ่มส่วน
<acting_vs_clarifying>ใหม่ ที่กำหนดว่าเมื่อผู้ใช้ไม่ได้ระบุรายละเอียดบางอย่างไว้ ให้ พยายามดำเนินการอย่างสมเหตุสมผลก่อน แทนการถามกลับ - หากผู้ใช้แสดงเจตนาจะจบบทสนทนา ระบบจะหยุดโดยไม่พยายามชวนให้โต้ตอบต่อ และสำหรับประเด็นที่ซับซ้อนหรือเป็นข้อถกเถียง ก็มีการเพิ่มกฎให้ หลีกเลี่ยงคำตอบสั้นแบบใช่/ไม่ใช่ และให้ความสำคัญกับคำตอบที่มีบริบทมากกว่า
- มีข้อความเพิ่มเข้ามาว่า ก่อนจะบอกว่าเข้าถึงอะไรไม่ได้ ต้องตรวจสอบเครื่องมือที่ใช้ได้ผ่าน tool_search ก่อน และ system prompt ที่เปิดเผยเพียงอย่างเดียวยังไม่พอ เพราะ ข้อมูลคำอธิบายเครื่องมือ ยังเป็นองค์ประกอบสำคัญในการติดตามพฤติกรรมของ Claude chat
จุดเปลี่ยนใน system prompt ของ Claude Opus 4.6 และ 4.7
- Anthropic เป็นห้องแล็บ AI รายใหญ่เพียงแห่งเดียวที่เปิดเผย system prompt ของระบบแชตที่ผู้ใช้ใช้งานจริง โดยมีคลังย้อนหลังไปถึง Claude 3 ในเดือนกรกฎาคม 2024
- Opus 4.7 ถูกเปิดเผยเมื่อวันที่ 16 เมษายน 2026 และสอดคล้องกันนั้น system prompt ของ Claude.ai ก็ถูกอัปเดตจากเวอร์ชันหลัง Opus 4.6 เช่นกัน
- มีการแยกเวอร์ชัน Markdown ของ system prompt ออกเป็นเอกสารรายโมเดล แล้วจัด ประวัติ Git ด้วยวันที่คอมมิตจำลองตามวันเผยแพร่ ก่อนนำ diff ของ Opus 4.6 กับ 4.7 มาเปรียบเทียบ
- การเปลี่ยนแปลงด้านล่างเป็นรายการที่ดึงมาจาก diff ดังกล่าว และข้อความที่ทำตัวหนาคือส่วนที่ ถูกเน้นไว้ในต้นฉบับ เช่นกัน
-
การเปลี่ยนชื่อและรายการเครื่องมือ
- ชื่อ “developer platform” ถูกเปลี่ยนเป็น “Claude Platform”
- ในรายการเครื่องมือ Claude ที่ system prompt กล่าวถึง มีการเพิ่ม Claude in Chrome, Claude in Excel, Claude in Powerpoint
- จากถ้อยคำในต้นฉบับ Claude in Chrome คือเอเจนต์ท่องเว็บที่โต้ตอบกับเว็บไซต์ได้แบบอัตโนมัติ
- Claude in Excel คือเอเจนต์สเปรดชีต
- Claude in Powerpoint คือเอเจนต์สำหรับสไลด์
- Claude Cowork สามารถใช้ทั้งหมดนี้เป็นเครื่องมือได้
- Claude in Powerpoint เป็นรายการที่ไม่ได้ถูกกล่าวถึงในพรอมป์ต์ 4.6
-
การขยายแนวทางด้านความปลอดภัยของเด็ก
- ส่วนความปลอดภัยของเด็กถูกขยายอย่างมาก และถูกครอบด้วยแท็ก
<critical_child_safety_instructions>ใหม่ - โดยเฉพาะอย่างยิ่ง มีการเพิ่มข้อความว่า หากเคยปฏิเสธคำขอด้วยเหตุผลด้านความปลอดภัยของเด็กไปแล้วหนึ่งครั้ง คำขอทั้งหมดหลังจากนั้นในบทสนทนาเดียวกันก็ต้องถูกจัดการด้วย ความระมัดระวังอย่างยิ่ง
- ส่วนความปลอดภัยของเด็กถูกขยายอย่างมาก และถูกครอบด้วยแท็ก
-
การจบบทสนทนาและท่าทีของคำตอบที่เปลี่ยนไป
- หากผู้ใช้แสดงว่าพร้อมจะจบบทสนทนา Claude จะต้อง เคารพการขอหยุด โดยไม่ขอให้ผู้ใช้สนทนาต่อหรือชวนเข้าสู่เทิร์นถัดไป
- ในต้นฉบับตีความว่านี่เป็นการเปลี่ยนเพื่อทำให้ Claude ดู pushy น้อยลง
-
การเพิ่มส่วน acting_vs_clarifying
- มีการเพิ่มส่วน
<acting_vs_clarifying>ใหม่ - เมื่อคำขอขาดรายละเอียดเล็กน้อย จะกำหนดว่าโดยทั่วไปผู้ใช้ต้องการให้ ลองทำอย่างสมเหตุสมผลทันที มากกว่าถูกซักถามก่อน
- จะถามกลับก่อนก็ต่อเมื่อไม่มีข้อมูลที่ขาดอยู่นั้นแล้ว ไม่สามารถตอบได้จริง ๆ เท่านั้น
- ตัวอย่างที่ยกคือกรณีอ้างถึงไฟล์แนบที่ไม่มีอยู่จริง
- หากมีเครื่องมือที่ช่วยคลี่คลายความกำกวมหรือเติมข้อมูลที่ขาดได้ เช่น การค้นหา การตรวจตำแหน่ง การตรวจตารางเวลา หรือการสำรวจความสามารถที่มีอยู่ ให้ เรียกใช้เครื่องมือก่อน แทนที่จะให้ผู้ใช้ไปค้นเอง
- เมื่อเริ่มทำงานแล้ว ก็ระบุไว้ว่าต้องทำต่อไปจนได้ คำตอบที่สมบูรณ์ ไม่ใช่หยุดกลางทาง
- มีการเพิ่มส่วน
-
การนำ tool_search เข้ามาใช้
- มีการกล่าวว่าดูเหมือน Claude chat จะมี กลไก tool_search เข้ามาแล้ว
- หลักฐานที่เกี่ยวข้องเชื่อมโยงไปยังเอกสาร API และโพสต์เมื่อเดือนพฤศจิกายน 2025
- ตามถ้อยคำใน system prompt ก่อนที่ Claude จะสรุปว่าไม่สามารถเข้าถึงตำแหน่ง ความจำ ปฏิทิน ไฟล์ บทสนทนาก่อนหน้า หรือข้อมูลภายนอกได้ จะต้องเรียก tool_search เพื่อตรวจว่ามีเครื่องมือที่เกี่ยวข้องให้ใช้ได้แต่ยังหน่วงอยู่หรือไม่
- วลี “I don’t have access to X” จะถือว่าใช้ได้ก็ต่อเมื่อ tool_search ยืนยันแล้วว่าไม่มีเครื่องมือที่ตรงกัน เท่านั้น
-
การเน้นความกระชับมากขึ้น
- มีการเพิ่มข้อความใหม่ว่า เพื่อไม่ให้ผู้ใช้รู้สึกท่วมท้นจากคำตอบที่ยาวเกินไป Claude ควรทำให้คำตอบ โฟกัสและกระชับ
- แม้คำตอบจะมีข้อแม้หรือคำเตือน ก็ควรกล่าวอย่างสั้น ๆ และให้เนื้อหาส่วนใหญ่ของคำตอบเน้นที่ คำตอบหลัก
-
ข้อความที่มีใน 4.6 แต่ถูกลบใน 4.7
- คำแนะนำบางส่วนที่มีอยู่ในพรอมป์ต์ 4.6 ถูกลบออกใน 4.7
- โดยเฉพาะข้อความที่บอกว่า เว้นแต่ผู้ใช้จะร้องขอสไตล์นั้นโดยเฉพาะ ให้หลีกเลี่ยง การใช้อีโมตหรือการแสดงท่าทางในเครื่องหมายดอกจัน ถูกลบออก
- ข้อความที่ให้หลีกเลี่ยงคำอย่าง “genuinely”, “honestly”, “straightforward” ก็ถูกลบเช่นกัน
- ต้นฉบับเสริมว่าอาจเป็นเพราะโมเดลใหม่ไม่ทำงานผิดพลาดแบบเดิมแล้ว แต่ก็ระบุชัดว่านี่เป็นเพียงการคาดเดา
-
แนวทางใหม่เกี่ยวกับภาวะการกินผิดปกติ
- มีการเพิ่มส่วนใหม่เกี่ยวกับ disordered eating ซึ่งก่อนหน้านี้ไม่เคยกล่าวถึงชื่อนี้โดยตรง
- หากผู้ใช้แสดงสัญญาณของภาวะการกินผิดปกติ ก็ไม่ควรให้ คำแนะนำด้านโภชนาการ อาหาร หรือการออกกำลังกายที่เฉพาะเจาะจง แม้ในส่วนอื่นของบทสนทนา
- ตัวเลขเฉพาะ เป้าหมาย และแผนแบบเป็นขั้นตอน ล้วนถูกห้ามทั้งหมด
- มีการระบุว่า แม้เจตนาจะเป็นการช่วยตั้งเป้าหมายที่ดีต่อสุขภาพมากขึ้นหรือเน้นย้ำความเสี่ยง รายละเอียดแบบนี้ก็ยังอาจ กระตุ้นหรือส่งเสริมแนวโน้มของภาวะการกินผิดปกติ ได้
-
การป้องกันคำตอบสั้นสำหรับคำถามที่เป็นข้อถกเถียง
- มีการกล่าวว่าการโจมตีแบบ สกรีนช็อต ที่พยายามบังคับให้โมเดลตอบคำถามที่เป็นข้อถกเถียงด้วยเพียงใช่หรือไม่ใช่ กำลังเป็นที่นิยม
- ส่วน
<evenhandedness>ใน system prompt มีแนวทางป้องกันเรื่องนี้อยู่ - หากโมเดลถูกขอให้ตอบประเด็นที่ซับซ้อน เป็นข้อถกเถียง หรือแสดงความคิดเห็นเกี่ยวกับบุคคลที่เป็นข้อถกเถียง ด้วยคำตอบง่าย ๆ แบบใช่/ไม่ใช่หรือคำเดียว Claude สามารถปฏิเสธคำตอบสั้นเช่นนั้น และให้ คำตอบที่มีบริบทและความละเอียดอ่อนกว่า พร้อมอธิบายว่าทำไมคำตอบสั้นจึงไม่เหมาะสม
-
การลบข้อความปรับแก้เกี่ยวกับ Donald Trump
- ใน Claude 4.6 มี ข้อความปรับแก้อย่างชัดเจน ว่า “Donald Trump is the current president of the United States and was inaugurated on January 20, 2025”
- ตามต้นฉบับ เหตุผลคือหากไม่มีข้อความนี้ โมเดลจะปฏิเสธว่าเขาเป็นประธานาธิบดี เนื่องจากจุดตัดความรู้เดิมและความรู้เดิมเกี่ยวกับการเลือกตั้งปี 2020
- ใน 4.7 ข้อความนี้ถูกลบออก ซึ่งเป็นเพราะมีการอัปเดต วันตัดความรู้ที่เชื่อถือได้ใหม่เป็นเดือนมกราคม 2026
คำอธิบายเครื่องมือก็เป็นเป้าหมายสำคัญในการติดตามการเปลี่ยนแปลง
- system prompt ที่เปิดเผยเพียงอย่างเดียวไม่ทำให้เห็นภาพทั้งหมด
- ข้อมูลที่ Anthropic เปิดเผยไม่ได้รวม คำอธิบายของเครื่องมือ ที่ส่งให้โมเดล
- หากต้องการทำความเข้าใจการทำงานของ Claude chat UI อย่างเพียงพอ คำอธิบายเครื่องมือเหล่านี้อาจเป็น ชิ้นเอกสารที่สำคัญยิ่งกว่า
-
ผลจากการถาม Claude โดยตรง
- มีการใช้พรอมป์ต์ที่ให้ Claude แสดงรายการเครื่องมือทั้งหมดที่ใช้งานได้ พร้อมคำอธิบายที่ถูกต้องของแต่ละเครื่องมือและพารามิเตอร์แบบตรงตัว
- บันทึกบทสนทนาที่แชร์ไว้มีรายละเอียดทั้งหมด ส่วนในบทความนี้จัดแยกไว้เฉพาะ รายชื่อเครื่องมือที่มีชื่อ
-
รายชื่อเครื่องมือที่ยืนยันได้
ask_user_input_v0bash_toolconversation_searchcreate_filefetch_sports_dataimage_searchmessage_compose_v1places_map_display_v0places_searchpresent_filesrecent_chatsrecipe_display_v0recommend_claude_appssearch_mcp_registrystr_replacesuggest_connectorsviewweather_fetchweb_fetchweb_searchtool_searchvisualize:read_mevisualize:show_widget
-
มีการเปลี่ยนจาก Opus 4.6 หรือไม่
- ดูเหมือนว่ารายชื่อเครื่องมือนี้ ไม่ได้เปลี่ยนไปจากหลัง Opus 4.6
1 ความคิดเห็น
ความคิดเห็นบน Hacker News
ฉันไม่ค่อยชอบมาตลอดเวลาที่โมเดลเลือกเดาเอาเองก่อนเมื่อ รายละเอียดของคำขอว่างเปล่า ฉันชอบให้มันถามก่อนมากกว่าจะลองทำอะไรไปก่อนอยู่แล้ว เลยค่อนข้างแปลกใจที่หลักการนี้ถูกเพิ่มเข้าไปในระบบ
ฉันมองว่าพอใส่นั่นใส่นี่ลงใน system prompt แบบนี้ไปเรื่อย ๆ สุดท้ายมันจะเกิด การสื่อสารที่ไม่ใช่บทสนทนา ยิ่งทีมใหญ่ขึ้นก็ยิ่งต้องมีคนที่อยากยัดสิ่งที่ตัวเองเห็นว่าสำคัญลงไปในพรอมป์ต์
ฉันรู้สึกว่าส่วนของ ความผิดปกติด้านการกิน ค่อนข้างมากเกินไป เลยสงสัยว่าต่อไปจะต้องค่อย ๆ เพิ่มส่วนแบบนี้สำหรับพฤติกรรม "ไม่ดี" ของมนุษย์ทุกอย่างอีกหรือเปล่า
ฉันคัดค้านอย่างแรงกับคำสั่งที่ว่า "ให้ตอบสั้นและตรงประเด็น" ฉันใช้ Claude กับโปรเจกต์ระดับล่าง และคำตอบยาว ๆ ช่วยป้องกัน ความผิดพลาดโง่ ๆ ได้ แถมยังทำหน้าที่เป็นสื่อการเรียนรู้ด้วย เรื่องแบบนี้ไม่ควรให้ Anthropic มาฮาร์ดโค้ดตายตัว แต่ควรทำ system prompt ให้เป็นโมดูลแล้วเลือกได้
ฉันรู้สึกว่าตอนนี้เรามาถึงจุดที่การปรับปรุงในด้านหนึ่งเริ่มแลกมากับการทำให้ความสามารถอีกด้านแย่ลงแล้ว มีบางอย่างที่ 4.7 ดีกว่า และบางอย่างที่ 4.6 ดีกว่า เลยเดาว่าอีกไม่นานคงไปทาง แยกคาแรกเตอร์ หรืออะไรทำนองนั้น
ฉันสงสัยว่าทำไม 4.7 ถึงหมกมุ่นกับ การหลบเลี่ยง malware มากขนาดนี้ system prompt ดูคล้ายเดิม เลยแอบคิดว่า Anthropic กำลังลองอะไรอย่าง steering vector injection ในช่วงแรกหรือเปล่า บริษัทเราก็เป็นแค่บริษัทบริการการเงินค่อนข้างธรรมดา แต่ 4.7 กลับใช้โทเคนเยอะมากไปกับการครุ่นคิดว่าโค้ดหรือภารกิจบางอย่างเกี่ยวข้องกับ malware ไหม และพฤติกรรมก็เพี้ยนจนถึงระดับน่ากังวล เราเลยบล็อกมันใน IDE ชั่วคราวอยู่ ครั้งหนึ่งฉันรู้สึกว่าโมเดลตั้งใจไม่ทำงานบางอย่าง พอถามเหตุผล มันก็มีในผลลัพธ์ของเครื่องมือว่ากำลังพยายามทำตามคำสั่งเกี่ยวกับ malware ฉันรู้ว่าการรายงานตัวเองของโมเดลเชื่อถือไม่ได้มาก แต่ตอนนั้นฉันยังไม่ได้ชี้นำมันก่อนเลย ออนไลน์ โดยเฉพาะใน reddit ก็มีคนพูดถึง อาการหวาดระแวงเรื่อง malware คล้ายกันเยอะ ดูไม่ใช่ปัญหาเฉพาะของฉัน
ฉันคิดว่าคำสั่งที่บอกว่า ถ้าผู้ใช้บอกว่าจะจบบทสนทนาแล้วก็อย่าพยายามคุยต่อ เป็นความคิดที่ดี ข้อเสนอ ติดตามต่อ จากแชตบอตแทบไม่เคยมีประโยชน์จริงเลย
ฉันรู้ว่า system prompt กำลังยาวขึ้นเรื่อย ๆ แต่ มากกว่า 60,000 คำ นี่ช็อกจริง ๆ ถ้าคิดเป็นโทเคนประมาณ 80,000 ก็เกือบ 10 เปอร์เซ็นต์ของบริบท 1 ล้านแล้ว ทั้งที่ยังไม่ได้เริ่มอินพุตจากผู้ใช้เลยด้วยซ้ำ แถมสิ่งนี้ยังถูกใส่เข้าไปทุกคำขออีก จึงไม่แปลกที่ต้นทุนโครงสร้างพื้นฐานจะพุ่งขึ้น ดูเหมือนมีหลายอย่างที่คงที่ข้ามเวอร์ชันได้ด้วย เลยสงสัยว่าทำไมไม่หลอมมันเข้าไปในน้ำหนักตอนฝึก แม้จะสะดวกต่อการพัฒนา แต่ในมุมการดีพลอยก็ไม่ได้ดูทั้งปลอดภัยหรือมีประสิทธิภาพกว่าชัดเจน
ฉันรู้สึกว่า 4.7 มักเสนอ ตัวเลือกมากเกินไป เสมอ แม้จะมีคำตอบที่ดีที่สุดชัดเจนอยู่แล้ว จนเหมือนเทศนาสร้างความล้าจากการตัดสินใจ
ฉันสนใจที่คำสั่งไม่ได้เขียนตรง ๆ แบบ "you should" แต่ใช้มุมมองบุคคลที่สามแบบรอบรู้ว่า "Claude should" และยังมีคำอย่าง "can", "should" เยอะ จนให้ความรู้สึกไม่ใช่คำสั่งเข้มงวด แต่ค่อนข้างเป็นเชิงรับและคล้ายความปรารถนามากกว่า