การใช้พรอมป์ต์ที่กระชับให้ผลลัพธ์ดีกว่าในการใช้ GPT
- GPT มักสับสนมากขึ้นหากใส่รายละเอียดในพรอมป์ต์มากเกินไปเกี่ยวกับสิ่งที่มันรู้อยู่แล้วตามสามัญสำนึก
- ตัวอย่างเช่น ในงานจัดหมวดหมู่รัฐ (state) ที่ถูกกล่าวถึงในข้อความ การขอเพียงชื่อรัฐให้ผลแม่นยำกว่าการให้รายชื่อทั้ง 50 รัฐ
แค่ chat API ของ OpenAI ก็เพียงพอสำหรับการสร้างฟังก์ชันที่หลากหลายและทรงพลัง
- สามารถทำฟังก์ชันที่ต้องการ เช่น การดึง JSON ได้อย่างเรียบง่ายโดยใช้แค่ chat API โดยไม่ต้องมีเครื่องมือเสริมอย่าง Langchain
- เวลาอัปเกรดโมเดล GPT ก็แค่แก้สตริงในโค้ดเบสเพียงจุดเดียว
- เพียงเพิ่มลอจิกง่ายๆ สำหรับจัดการข้อผิดพลาดของ OpenAI API และข้อจำกัดความยาวอินพุต
การจัดการกรณีที่ GPT หาอะไรไม่เจอนั้นทำได้ยาก
- ในพรอมป์ต์อย่าง "ถ้าไม่พบอะไรให้คืนค่าเป็นค่าว่าง" GPT มักสร้างข้อมูลขึ้นมาเองหรือแสดงความไม่มั่นใจ
- วิธีแก้คืออย่าส่งพรอมป์ต์ไปให้ GPT เมื่ออินพุตว่าง
GPT สามารถสร้างเอาต์พุตได้ยาวจำกัด
- ข้อจำกัดอินพุตของ GPT-4 คือ 128k โทเค็น แต่ข้อจำกัดเอาต์พุตมีเพียง 4k โทเค็น
- เมื่อขอรายการของอ็อบเจ็กต์ JSON นั้น GPT มักสร้างรายการเกิน 10 รายการได้ไม่เสถียรนัก
ฐานข้อมูลเวกเตอร์และ RAG/embedding ไม่ได้ช่วยมากนักสำหรับงานทั่วไป
- RAG ทำงานได้ไม่ดีสำหรับการใช้งานนอกเหนือจากการค้นหา
- ด้วยเหตุผลอย่างความยากในการตัดสินความเกี่ยวข้อง ปัญหาการแยกข้อมูล และความพึงพอใจของผู้ใช้ที่ลดลง ทำให้การใช้งานจริงไม่ค่อยคุ้มค่า
- สำหรับการค้นหาทั่วไป การค้นหาแบบ facet ด้วย GPT หรือการสร้างคิวรีที่ซับซ้อนเหมาะสมกว่า
GPT แทบไม่ได้สร้างภาพหลอน (hallucination) ขึ้นมาเอง
- ในงานดึงข้อมูลจากข้อความที่กำหนด GPT ให้ผลลัพธ์ที่เชื่อถือได้มาก
- แต่หากในข้อความไม่มีข้อมูล มันอาจสร้างสิ่งที่ไม่มีอยู่ขึ้นมาได้
- ดังนั้นการให้บริบทที่เพียงพอและการจัดการคำตอบของ GPT อย่างเหมาะสมจึงสำคัญ
ความเห็นของ GN⁺
- ดูเหมือนว่าจะไปถึง AGI ได้ยากหากอาศัยเพียงโมเดลทรานส์ฟอร์เมอร์ ข้อมูลเว็บ และโครงสร้างพื้นฐานขนาดใหญ่
- GPT-4 มีประโยชน์อย่างชัดเจน แต่หากต้องการก้าวไปไกลกว่านั้น ก็น่าจะต้องมีนวัตกรรมที่ตัวสถาปัตยกรรมโมเดลเอง
- ทางเลือกนอก OpenAI ดูเหมือนยังตาม GPT ไม่ทัน และท้ายที่สุดก็คงต้องจับตาการอัปเกรดเวอร์ชันของ GPT ต่อไป
- คาดว่าประสิทธิภาพของ GPT-5 เมื่อเทียบกับ GPT-4 จะไม่ถึงระดับพลิกเกม ดูเหมือนประโยชน์ต่อค่าใช้จ่ายจะเริ่มชนเพดานแล้ว
- ดังนั้นในช่วงนี้ การใช้ GPT-4 ให้คุ้ม พร้อมโฟกัสที่การออกแบบพรอมป์ต์และการประยุกต์ใช้อย่างเหมาะสม น่าจะเป็นทางเลือกที่สมจริงกว่า
1 ความคิดเห็น
ความคิดเห็นบน Hacker News