Representation Engineering: Mistral-7B, Acid Trip
-
เวกเตอร์ควบคุมคืออะไร?
- เวกเตอร์ควบคุมคือเวกเตอร์ (รายการเวกเตอร์ในแต่ละเลเยอร์) ที่นำไปใช้กับการกระตุ้นของโมเดลในช่วงการอนุมาน เพื่อให้สามารถควบคุมพฤติกรรมของโมเดลได้โดยไม่ต้องใช้พรอมต์เพิ่มเติม
- โดยใช้พรอมต์และโมเดลชุดเดียวกัน การใส่หรือไม่ใส่เวกเตอร์ควบคุม และขนาดของเวกเตอร์จะสร้างผลลัพธ์ที่ต่างกัน
-
การสร้างเวกเตอร์ควบคุมไม่ยาก
- ใช้ PCA สร้างชุดข้อมูลคู่พรอมต์ที่มีความตรงข้ามกันแล้วรันโมเดลเพื่อเก็บสถานะแฝงในแต่ละเลเยอร์ จากนั้นใช้ single-component PCA เพื่อให้ได้เวกเตอร์ควบคุมในแต่ละเลเยอร์
- กระบวนการนี้ใช้โค้ดเพียงไม่กี่บรรทัดและใช้เวลาเพียงประมาณ 1 นาที
-
สิ่งที่ทำได้ด้วยเวกเตอร์ควบคุม
- ด้วยเวกเตอร์ควบคุม คุณสามารถทำให้โมเดล AI อยู่ในโหมด "acid trip" หรือควบคุมให้มีอารมณ์เช่น "ขี้เกียจ" "ขยัน" "สร้างสรรค์" ได้
- เวกเตอร์ควบคุมแต่ละตัวสามารถฝึกฝนให้พร้อมใช้ได้ภายในไม่กี่นาที และคุณสามารถลองเองได้ในสมุดทดลองบน GitHub
-
เปรียบเทียบเวกเตอร์ควบคุมกับ Prompt Engineering
- เวกเตอร์ควบคุมและ Prompt Engineering เป็นแนวทางที่แตกต่างกัน แต่มีบางส่วนที่ซ้อนทับกัน
- เวกเตอร์ควบคุมสามารถสร้างผลลัพธ์ที่สามารถจำลองได้ด้วย Prompt Engineering ได้ แต่การปรับความแรงทำได้ง่ายกว่า
ความเห็นของ GN⁺
- ความสำคัญของเวกเตอร์ควบคุม: เวกเตอร์ควบคุมเป็นเครื่องมือที่ทรงพลังสำหรับการปรับพฤติกรรมของโมเดล AI อย่างละเอียด ช่วยเปิดมุมมองใหม่ที่เกินขีดจำกัดของ Prompt Engineering
- ประสิทธิภาพและการเข้าถึง: ด้วยเวกเตอร์ควบคุม ผู้ใช้สามารถปรับพฤติกรรมโมเดลได้อย่างง่ายดาย โดยไม่ต้องออกแบบพรอมต์ที่ซับซ้อนมาก ซึ่งอาจช่วยยกระดับการใช้งาน AI ได้อย่างมาก
- การใช้งานเชิงสร้างสรรค์: การทดลองสร้างสถานะ “acid trip” ให้กับ AI ด้วยเวกเตอร์ควบคุมเป็นตัวอย่างที่แสดงให้เห็นแนวทางเชิงทดลองที่เพิ่มมิติใหม่ให้กับงานวิจัย AI
1 ความคิดเห็น
ความคิดเห็นบน Hacker News