- แชร์ผลการนำ Priority PayGo ของ Vertex AI ไปใช้กับ AI แชตบอตที่เปิดให้บริการจริง และวิเคราะห์ข้อมูลสะสมราว 27,000 รายการตลอดประมาณ 2 สัปดาห์ แยกตามช่วงเวลา
- เวลาในการตอบสนองตามค่ามัธยฐาน (Median) ของ ON_DEMAND(Standard) และ ON_DEMAND_PRIORITY ส่วนใหญ่อยู่ภายใน 100~300ms จึงแทบไม่มีความต่างด้านประสิทธิภาพ
- ช่วงเวลาที่ Priority เร็วกว่าอย่างมีนัยสำคัญมีเพียงราว 16 นาฬิกา (-338ms) เท่านั้น ส่วนอีก 23 ชั่วโมงที่เหลือใกล้เคียงกัน หรือ Standard เร็วกว่าเสียอีก
- สัดส่วนคำขอที่ใช้เวลานานเกิน 10 วินาทีอยู่ที่ Standard 3.4% และ Priority 5.9% ทำให้ Priority กลับมีความไม่เสถียรมากกว่าประมาณ 1.7 เท่า
- โดยเฉพาะช่วงกลางคืน (22~23 นาฬิกา) อัตราที่ Priority ใช้เวลาเกิน 10 วินาทีสูงเกิน 12% และสูงกว่า Standard มากกว่า 3 เท่า
- เมื่อพิจารณาว่าราคาต่อโทเคนสูงกว่า 1.8 เท่า จึงประเมินได้ว่า ณ ตอนนี้ Priority PayGo ยังไม่มีข้อได้เปรียบด้านความคุ้มค่าต่อประสิทธิภาพ
- เนื่องจากเป็นผลลัพธ์ในสภาพแวดล้อม gemini-3-flash-preview (โมเดลพรีวิว) + asia-northeast3 (รีเจียนโซล) จึงอาจเปลี่ยนแปลงได้หลังเปิดตัว GA
ยังไม่มีความคิดเห็น