- กระบวนการออก Google Gemini 3 Pro API คีย์ ซับซ้อนเกินไป ทำให้เป็นโครงสร้างที่นักพัฒนารายบุคคลเข้าถึงได้ยาก
- ชื่อ Gemini ถูก ใช้ซ้ำกับหลายสายผลิตภัณฑ์ จนยากจะจำแนกให้ชัดเจนว่าบริการไหนมีความสามารถอะไร
- การสร้าง API คีย์ใน Google AI Studio ทำได้ง่าย แต่ ขั้นตอนตั้งค่าการชำระเงินจะพาไปที่ Google Cloud Console ซึ่งต้องผ่านการยืนยันตัวตนที่ซับซ้อนและการส่งเอกสาร
- แม้จะยืนยันบัญชีชำระเงินแล้ว ก็ยังเกิด ข้อผิดพลาด 403 Forbidden ซ้ำ ๆ ทำให้ต้องใช้เวลาหลายชั่วโมงกว่าจะใช้งานได้จริง
- ประสบการณ์ทั้งหมดสะท้อนให้เห็นถึง กระบวนการที่ไม่มีประสิทธิภาพและเอื้อต่อองค์กรขนาดใหญ่ ซึ่งตัดกันกับแนวทางที่กระชับของ OpenAI และ Anthropic
ความสับสนของสายผลิตภัณฑ์ Gemini
- ชื่อ “Gemini” ถูกใช้กับผลิตภัณฑ์หลากหลายประเภท เช่น แชตบอต, แอปมือถือ, ผู้ช่วยเสียง, ความสามารถ AI ใน Workspace, เครื่องมือ CLI, ส่วนขยาย IDE, โมเดล LLM เป็นต้น
- ตัวอย่าง: แชตบอตบน gemini.google.com, แอป Android/iPhone, Gemini CLI, Gemini Code Assist, Vertex AI Platform เป็นต้น
- เมื่อใช้ชื่อเดียวกันครอบคลุมหลายบริการ จึงเกิดสถานการณ์ที่ ค้นหาเส้นทางเข้าถึง API สำหรับนักพัฒนาได้ยาก
- ส่วน Anthropic และ OpenAI ให้เส้นทางเข้าถึงเพียงสองแบบคือ เว็บบริการสำหรับผู้ใช้ทั่วไปและคอนโซลสำหรับนักพัฒนา ทำให้โครงสร้างเรียบง่ายกว่ามาก
กระบวนการสร้าง API คีย์
- ใน Google AI Studio การ สร้าง API คีย์ทำได้ง่าย และสามารถออกคีย์ใหม่ได้ภายในไม่กี่วินาที
- คีย์ที่ออกแล้วถูกตรวจพบโดย Gemini CLI ได้ตามปกติ แต่ยังต้องมี การตั้งค่าชำระเงินสำหรับเครดิต API แบบเสียเงิน
- เมื่อคลิกลิงก์ “Set up billing” จะถูกพาไปยัง Google Cloud Console และจากนั้นขั้นตอนที่ซับซ้อนก็เริ่มขึ้น
ความซับซ้อนของการตั้งค่าบัญชีชำระเงิน
- ไม่สามารถชำระเงินแบบง่าย ๆ ได้ แต่ต้องผ่านขั้นตอน สร้าง Billing Account → เชื่อมต่อโปรเจกต์ → เพิ่มวิธีชำระเงิน → ยืนยันวิธีชำระเงิน
- หลังผ่าน การยืนยัน OTP สองขั้นตอน ของบัตรเครดิตในอินเดียแล้ว ยังถูกขอให้ส่ง บัตรประจำตัวที่ออกโดยหน่วยงานรัฐและรูปบัตรเครดิต เพิ่มเติม
- ต้องใช้โปรแกรมแก้ไขภาพปิดบังหมายเลขบัตรด้วยตนเอง และการอัปโหลด รองรับเฉพาะไฟล์ PNG
- เกิดข้อผิดพลาดระหว่างอัปโหลดซ้ำ ๆ และได้รับ อีเมลแจ้งว่าอาจใช้เวลาหลายวันกว่าการตรวจสอบจะเสร็จสิ้น
ข้อผิดพลาด 403 และการกู้คืนบัญชี
- แม้การตรวจสอบจะเสร็จแล้ว แต่ตอนเรียกใช้ Gemini CLI และ API ก็ยังคงเกิด ข้อผิดพลาด 403 Forbidden อย่างต่อเนื่อง
- ลองทดสอบด้วยโค้ดตัวอย่าง JavaScript จากเอกสารของ Google แล้วก็ยังเกิดข้อผิดพลาดแบบเดียวกัน
- แม้แต่ใน AI Studio Playground ก็แสดงข้อความ “Failed to generate content”
- หลังจากนั้นจึงมีอีเมลจาก Google ว่า “Your account is in good standing” และจึงเริ่มทำงานได้ตามปกติ
- จากนั้นทั้ง Playground, API และ CLI ก็เปลี่ยนเป็นสถานะที่สามารถใช้ Gemini 3 Pro ได้ทั้งหมด
การประเมินต่อขั้นตอนนี้
- กระบวนการทั้งหมดเป็น ประสบการณ์ที่ไม่มีประสิทธิภาพซึ่งกินเวลามากกว่า 3 ชั่วโมง และซับซ้อนเกินความจำเป็นสำหรับนักพัฒนารายบุคคล
- ระบบของ Google ถูกออกแบบโดย เน้นการปฏิบัติตามข้อกำหนดสำหรับองค์กรขนาดใหญ่ จึงบั่นทอนประสิทธิภาพการทำงานของผู้ใช้รายบุคคล
- ในทางกลับกัน OpenAI และ Anthropic มี ขั้นตอนการชำระเงินและการเข้าถึง API ที่เรียบง่าย และเป็นมิตรกับนักพัฒนามากกว่า
- แม้มีแผนจะลองใช้ Gemini 3 Pro เป็นเวลา 1 เดือนเพื่อประเมินประสิทธิภาพ แต่ก็ถูกมองว่าเป็น แพลตฟอร์มที่ขาดความใส่ใจผู้ใช้เป็นศูนย์กลาง
1 ความคิดเห็น
ความคิดเห็นจาก Hacker News
บน Microsoft Azure ผมเจอประสบการณ์ที่ เลวร้ายยิ่งกว่า อีก
ระหว่างทางมีทีมขายบุคคลที่สามที่อ้างตัวว่าเป็น ‘Microsoft support ที่ได้รับการรับรองอย่างเป็นทางการ’ เข้ามาติดต่อ แล้วสุดท้ายก็พบว่าจริง ๆ แล้วพยายามขาย แพ็กเกจคิดค่าบริการราคาแพงเกินจริง
ผมทำเกมกับลูกและลองฟีเจอร์ แปลงข้อความเป็นเสียง (TTS)
ทดสอบโมเดล Google Gemini บนเบราว์เซอร์แล้วใช้งานได้ดี แต่พอจะรวมเข้ากับ API กลับเจอการลองผิดลองถูกหลายรอบ
Gemini API มีโอกาสล้มเหลวแบบสุ่มประมาณ 1% จึงจำเป็นต้องมี ตรรกะการลองใหม่
และความเร็วตอบกลับของ API ก็แกว่งมาก ตั้งแต่ 30 วินาทีไปจนถึง 4 นาทีตามสภาพภายในของ Google
ในยุคแรกของ Google AdWords แค่มีบัตรเครดิตก็ลงโฆษณาได้ทันที
การเข้าถึงได้ทันที แบบนี้ทำให้เกิดความเชื่อมั่น และทำให้ผู้ใช้ทั่วไปรู้สึกว่าถูกปฏิบัติเท่าเทียมกับบริษัทใหญ่
แต่หลังจากเข้าซื้อ DoubleClick ในปี 2008 ผมคิดว่าทิศทางของ Google เปลี่ยนจากผู้ใช้ไปเป็น องค์กรธุรกิจเป็นศูนย์กลาง
ผมแค่อยากจ่ายเงินแล้วเริ่มใช้ได้เลย โดยไม่ต้องคุยกับใครหรือรออะไร
แต่ทีมขายอยากคงโครงสร้างแบบนี้ไว้เพราะต้องการโอกาสในการแบ่งระดับราคาและการโน้มน้าวลูกค้า
สมัครง่ายก็จริง แต่พอตั้งค่าโฆษณาแรกเสร็จก็บัญชีถูกระงับทันที และอุทธรณ์ก็ไม่ช่วย
เป็นระดับที่ต้องจ้างผู้เชี่ยวชาญถึงจะใช้งานได้อย่างถูกต้อง
ผมสงสัยมาตลอดว่า Cloud Console UI ของ AWS หรือ GCP ผ่านออกมาในสภาพแบบนี้ได้อย่างไร
ไม่เข้าใจเลยว่าจะปล่อยผลิตภัณฑ์แบบนี้ออกมาแล้วก็ยังพอใจหรือได้เลื่อนตำแหน่งกันได้
ดูเพิ่มเติมได้ที่ Conway’s Law wiki และวิดีโอของ Molly Rocket “The Only Unbreakable Rule”
ค้นหา
gemini API keyก็เจอ เอกสารทางการ ทันทีมีลิงก์อยู่ตั้งแต่ส่วนแรกของเอกสาร และดูสะอาดเรียบง่าย ไม่ใช่งานออกแบบเชิงการตลาด ซึ่งผมว่าดี
ปัญหาน่าจะอยู่ที่เรื่องการชำระเงิน
เมื่อก่อนการตั้งค่า service account ซับซ้อน และเอกสารก็เน้นการยืนยันตัวตนผ่าน CLI
ช่วงหลังมี Express Mode ที่ใช้ API Key ได้แล้ว แต่ก็เข้าใจได้ว่าทำไมคนถึงไม่พอใจ
ในอดีตความต่างด้านฟีเจอร์ระหว่าง Vertex กับ AI Studio ก็ห่างกันมาก
ดูการถกเถียงที่เกี่ยวข้อง: Google AI Studio forum
ผมใช้ AI Studio ด้วยบัญชี Workspace ส่วนตัว อยู่มาวันหนึ่ง Gemini CLI ก็เริ่มปฏิเสธ API key ของผม
ไม่มีทั้งเหตุผลและคำอธิบาย ทั้งที่ก็จ่ายเงินอยู่แต่กลับถูกบล็อกการเข้าถึง
ผมพยายามสลับไปใช้บัญชีบริษัท แต่เอกสารก็คล้ายกันไปหมดจนสมัครบริการผิด
สุดท้ายต้องไปถาม Gemini Pro ซึ่งมันบอกขั้นตอนมา 27 ขั้นตอน ถ้าติดแค่ข้อเดียวก็ต้องเริ่มใหม่ทั้งหมด
Azure ก็คล้ายกันหรือแย่กว่าอีก จนตอนนี้ยังเข้า GPT-5 ไม่ได้ด้วยซ้ำ
พอกดลิงก์ “Set up billing” ก็ถูกพาจาก Google AI Studio ไปยัง Cloud Console
ตอนนั้น ความสิ้นหวัง ถาโถมเข้ามาทันที ทุกครั้งที่เข้า AWS หรือ GCP console ผมต้องเสียเวลาไปกับเอกสารเก่าและแดชบอร์ดซับซ้อน
ผมก็เลิกใช้ Gemini ด้วยเหตุผลเดียวกัน
ผมไม่มีเวลาพอจะเอาไปเสียกับ ขั้นตอนอันซับซ้อน ของ Google
ผมเห็น “nano banana pro” แล้วพยายามจะขอ API key แต่ยอมแพ้ใน 5 นาที
นึกว่ามีแค่ผมคนเดียว ที่ไหนได้แม้แต่คนเก่ง ๆ ก็ยังติดกันหมด
ตู้สั่งอาหารของ McDonald’s ยังออกแบบให้แม้อ่านหนังสือไม่ออกก็สั่งแฮมเบอร์เกอร์ได้ แล้วทำไม Google ถึงทำ UX พื้นฐานแบบนี้ไม่ได้ก็น่าสงสัย
เหมือน ด่านปราสาทใน Mario ที่ต้องเดินตามลำดับเป๊ะ ๆ ถึงจะออกมาได้
ถ้าเป็น IBM ก็พอเข้าใจได้ แต่ดูเหมือน Google จะลงมาถึงจุดนั้นแล้ว
ถ้าทีม Gemini API มาเห็น ผมอยากขอคำอธิบายที่ โปร่งใสมากกว่านี้ เกี่ยวกับข้อผิดพลาด
'The specified schema produces a constraint that has too many states for serving'ที่เกิดเวลาใช้ Structured Outputsน่าจะเป็นปัญหาที่ constraint grammar หรือ token mask โตเกินไป
OpenAI มี เอกสารที่ชัดเจนและข้อจำกัดที่ยืดหยุ่น
ส่วน issue ที่เกี่ยวข้องก็ถูกปิดใน GitHub แบบไม่มีเหตุผล
ถึงอย่างนั้น ความเร็ว ของโมเดล Gemini ก็น่าประทับใจ และคุณภาพของ API ก็ดีขึ้นมากเมื่อเทียบกับปีก่อน
ก่อนหน้านี้ผมเคยโพสต์บ่นบน HN แล้ว Logan ก็มาขอฟีดแบ็กด้วยตัวเอง
เขายังเคลื่อนไหวอย่างมากบน บัญชี X และบอกล่วงหน้าว่าเดือนหน้า AI Studio จะมีการปรับปรุง UX/UI
แม้อยู่ในองค์กรขนาดใหญ่ แต่ก็ดูให้ความสำคัญกับตัวผลิตภัณฑ์ จึงทำให้ มีความคาดหวังอยู่มาก
ทิศทางของทีมยังไม่ชัด และรู้สึกว่า PM ของ Google ไม่มี ความเข้าใจหน้างาน เท่าแต่ก่อนแล้ว
เหมือนจะรอจนกว่ามันจะกลายเป็นเรื่องสำคัญเชิงกลยุทธ์
ผมไม่เข้าใจเลยว่าทำไม “การทำให้ขั้นตอนจ่ายเงินง่ายขึ้น” ถึงไม่ถือว่าสำคัญเชิงกลยุทธ์