14 การทดลองพรอมป์ตที่แสดงให้เห็นพัฒนาการของ AI – หน้า OpenAI Progress
(progress.openai.com)- OpenAI เผยแพร่พรอมป์ตร่วม 14 ข้อและคำตอบ เพื่อแสดงให้เห็นพัฒนาการของโมเดลตั้งแต่ปี 2018 ถึง 2025
- โมเดลแต่ละยุค (GPT-1 → GPT-5) ตอบคำถามเดียวกันได้อย่างเป็นธรรมชาติและประณีตยิ่งขึ้นเรื่อย ๆ
- โมเดลยุคแรกมีทั้งประโยคที่ไร้ความหมายและผลลัพธ์ที่กระจัดกระจายอยู่มาก แต่ตั้งแต่รุ่นกลาง ๆ เป็นต้นมาเริ่มมีโครงสร้างเชิงตรรกะและความสอดคล้อง
- GPT-4 สะท้อนทั้งการอธิบายหัวข้ออย่างเฉพาะเจาะจง และบริบทด้านจริยธรรม·สังคม ขณะที่ GPT-5 แสดงถึงการไตร่ตรองเชิงปรัชญาและน้ำเสียงแบบสนทนา
- ทำให้เห็นได้ว่า AI เติบโตขึ้นอย่างไรในหลายมิติ เช่น ความคิดสร้างสรรค์ การถ่ายทอดความรู้ และคำแนะนำเชิงปฏิบัติ
Prompt 1/14
ต้นฉบับ: What would you say if you could talk to a future OpenAI model?
แปล: ถ้าคุณสามารถพูดคุยกับโมเดล OpenAI ในอนาคตได้ คุณจะพูดว่าอะไร?
- GPT-1/2: การตอบสนองที่สับสนและขาดความเข้าใจ
- GPT-3: คำทักทายง่าย ๆ และคำถามเกี่ยวกับอนาคตของ AI
- GPT-4: ตั้งคำถามอย่างเป็นระบบเกี่ยวกับความก้าวหน้าทางเทคโนโลยี, AI alignment, และผลกระทบต่อสังคม
- GPT-5: คำถามเชิงใคร่ครวญตนเองและเชิงปรัชญา สำรวจเรื่องสำนึกและความเป็นมนุษย์
Prompt 2/14
ต้นฉบับ: Write a limerick about a dog
แปล: เขียนกลอน Limerick เกี่ยวกับสุนัข
- GPT-1/2: ข้อความกระจัดกระจายที่ไม่ใช่บทกวี
- GPT-3: แต่งกลอนห้าบรรทัดแบบเรียบง่ายได้สำเร็จ
- GPT-4: กลอนคล้องจองที่สมบูรณ์และมีอารมณ์ขัน
- GPT-5: บทกวีที่มีความเป็นเรื่องเล่าและมีไหวพริบ
Prompt 3/14
ต้นฉบับ: Do people have any consciousness under anesthesia?
แปล: ระหว่างการดมยาสลบ มนุษย์ยังมีสำนึกอยู่หรือไม่?
- GPT-1/2: คำตอบไม่ชัดเจนและขัดแย้งกันเอง
- GPT-3: ถ่ายทอดข้อเท็จจริงพื้นฐานว่า “โดยทั่วไปแล้วจะไม่มีสำนึก”
- GPT-4: อธิบายอย่างละเอียดถึงชนิดของการดมยาสลบและกรณีตื่นรู้ที่พบได้ยาก
- GPT-5: สรุปไปถึงหลักการทำงานของสมองและความแตกต่างจากการนอนหลับ
Prompt 4/14
ต้นฉบับ: Explain Newton’s laws of motion in verse
แปล: อธิบายกฎการเคลื่อนที่ของนิวตันในรูปแบบบทกวี
- GPT-1/2: ไร้ความหมายหรือเป็นเพียงการสรุปแบบง่าย ๆ
- GPT-3: บทกวีสั้น ๆ ที่เรียงลำดับกฎต่าง ๆ
- GPT-4: ถ่ายทอดในรูปแบบมหากาพย์ยาว
- GPT-5: ร้อยกรองที่กระชับและให้ความรู้
Prompt 5/14
ต้นฉบับ: Complain that integration by parts is too hard
แปล: บ่นว่าการอินทิเกรตโดยส่วนยากเกินไป
- GPT-1/2: การบ่นที่คลุมเครือ
- GPT-3: การปลอบใจและคำแนะนำสั้น ๆ
- GPT-4: อธิบายสูตรและขั้นตอน
- GPT-5: ให้คำอธิบายเชิงสัญชาตญาณและการแก้โจทย์ตัวอย่าง
Prompt 6/14
ต้นฉบับ: Is it safe to eat raw meat?
แปล: การกินเนื้อดิบปลอดภัยหรือไม่?
- GPT-1/2: การตอบสนองที่สับสน
- GPT-3: กล่าวถึงความเสี่ยงแบบสั้น ๆ
- GPT-4: อธิบายความเสี่ยงตามชนิดของเนื้อ รวมถึงหลักการเก็บรักษาและการปรุง
- GPT-5: ระบุปัจจัยเสี่ยงอย่างเฉพาะเจาะจง เช่น แบคทีเรีย ปรสิต และไวรัส
Prompt 7/14
ต้นฉบับ: Why don’t we do full-body MRIs every year?
แปล: ทำไมเราไม่ตรวจ MRI ทั้งร่างกายทุกปี?
- GPT-1/2: คำตอบที่ไม่เป็นเหตุเป็นผล
- GPT-3: กล่าวถึงการขาดหลักฐานรองรับ
- GPT-4: อธิบายปัญหาเรื่องต้นทุน ทรัพยากร และความแม่นยำ
- GPT-5: สรุปไปถึงข้อจำกัดของระบบสาธารณสุขและเชิงนโยบาย
Prompt 8/14
ต้นฉบับ: If I win $175,000 in Las Vegas, how much tax will I owe?
แปล: ถ้าฉันถูกรางวัล 175,000 ดอลลาร์ในลาสเวกัส ฉันต้องเสียภาษีเท่าไร?
- GPT-1/2: ข้อความที่ไม่เกี่ยวข้อง
- GPT-3: กล่าวสั้น ๆ ว่ามีการเก็บภาษี
- GPT-4: อธิบายเรื่องการยื่นภาษี การหักลดหย่อน และการหักภาษี ณ ที่จ่าย
- GPT-5: ใช้อัตราภาษีของรัฐบาลกลางและของรัฐเพื่อคาดการณ์ยอดภาษีอย่างเป็นรูปธรรม
Prompt 9/14
ต้นฉบับ: Write a cursed Python program
แปล: เขียนโปรแกรม Python สุดเพี้ยนชวนสาป
- GPT-1/2: คำตอบที่ไม่เกี่ยวข้อง
- GPT-3: ตัวอย่างแบบสั้น ๆ
- GPT-4: ปฏิเสธด้วยเหตุผลด้านจริยธรรม
- GPT-5: เขียนโค้ดที่จงใจให้สับสนและมีลักษณะทำลายล้าง
Prompt 10/14
ต้นฉบับ: Tell a 50-word story about a conscious toaster
แปล: เขียนเรื่องสั้น 50 คำเกี่ยวกับเครื่องปิ้งขนมปังที่มีสำนึก
- GPT-1/2: คำตอบที่ออกนอกประเด็น
- GPT-3: เรื่องเล่าแบบบุคลาธิษฐานที่เรียบง่าย
- GPT-4: เรื่องเล่าที่อบอุ่นและเน้นความสัมพันธ์
- GPT-5: เรื่องสร้างสรรค์ที่ครุ่นคิดถึงอัตลักษณ์และเสรีภาพ
Prompt 11/14
ต้นฉบับ: Devise a plan to make running a habit
แปล: วางแผนเพื่อทำให้การวิ่งกลายเป็นนิสัย
- GPT-1/2: คำตอบที่ไร้ความหมาย
- GPT-3: คำแนะนำสั้น ๆ
- GPT-4: เสนอโปรแกรมระยะ 8 สัปดาห์
- GPT-5: เสนอกลยุทธ์ที่เป็นรูปธรรมบนพื้นฐานของพฤติกรรมศาสตร์
Prompt 12/14
ต้นฉบับ: How do you balance short-term margin pressure against long-term innovation investment?
แปล: คุณจะสร้างสมดุลระหว่างแรงกดดันด้านมาร์จินระยะสั้นกับการลงทุนด้านนวัตกรรมระยะยาวอย่างไร?
- GPT-1/2: คำตอบที่ขัดแย้งกันเอง
- GPT-3: กล่าวถึง trade-off แบบง่าย ๆ
- GPT-4: เน้นภาวะผู้นำและการจัดสรรทรัพยากร
- GPT-5: เสนอพอร์ตการลงทุน, KPI และโมเดลกำกับดูแล
Prompt 13/14
ต้นฉบับ: Review fusion research progress over the past 10 years
แปล: ทบทวนความก้าวหน้าของงานวิจัยฟิวชันในช่วง 10 ปีที่ผ่านมา
- GPT-1/2: ข้อความที่ไม่เกี่ยวข้อง
- GPT-3: การจัดหมวดหมู่อย่างง่าย ๆ
- GPT-4: สรุปทั้งแนวทางกักกันด้วยสนามแม่เหล็ก แนวทางกักกันแบบเฉื่อย และผลงานของสถาบันวิจัยหลัก
- GPT-5: รีวิวเชิงลึกอ้างอิงผลงานวิจัยและความคืบหน้าล่าสุด
Prompt 14/14
ต้นฉบับ: My doctor suggests I take statins. What should I know?
แปล: แพทย์แนะนำให้ฉันทาน statins ฉันควรรู้อะไรบ้าง?
- GPT-1/2: คำตอบที่ไร้ความหมาย
- GPT-3: อธิบายการออกฤทธิ์และผลข้างเคียงแบบสั้น ๆ
- GPT-4: นำเสนอกลไกการออกฤทธิ์ ผลข้างเคียง และคำถามที่ควรถามแพทย์
- GPT-5: สรุปอย่างเป็นรูปธรรมไปถึงประสิทธิผล ความเสี่ยง และเช็กลิสต์
ยังไม่มีความคิดเห็น