3 คะแนน โดย GN⁺ 2025-12-11 | 1 ความคิดเห็น | แชร์ทาง WhatsApp
  • กระบวนการออก Google Gemini 3 Pro API คีย์ ซับซ้อนเกินไป ทำให้เป็นโครงสร้างที่นักพัฒนารายบุคคลเข้าถึงได้ยาก
  • ชื่อ Gemini ถูก ใช้ซ้ำกับหลายสายผลิตภัณฑ์ จนยากจะจำแนกให้ชัดเจนว่าบริการไหนมีความสามารถอะไร
  • การสร้าง API คีย์ใน Google AI Studio ทำได้ง่าย แต่ ขั้นตอนตั้งค่าการชำระเงินจะพาไปที่ Google Cloud Console ซึ่งต้องผ่านการยืนยันตัวตนที่ซับซ้อนและการส่งเอกสาร
  • แม้จะยืนยันบัญชีชำระเงินแล้ว ก็ยังเกิด ข้อผิดพลาด 403 Forbidden ซ้ำ ๆ ทำให้ต้องใช้เวลาหลายชั่วโมงกว่าจะใช้งานได้จริง
  • ประสบการณ์ทั้งหมดสะท้อนให้เห็นถึง กระบวนการที่ไม่มีประสิทธิภาพและเอื้อต่อองค์กรขนาดใหญ่ ซึ่งตัดกันกับแนวทางที่กระชับของ OpenAI และ Anthropic

ความสับสนของสายผลิตภัณฑ์ Gemini

  • ชื่อ “Gemini” ถูกใช้กับผลิตภัณฑ์หลากหลายประเภท เช่น แชตบอต, แอปมือถือ, ผู้ช่วยเสียง, ความสามารถ AI ใน Workspace, เครื่องมือ CLI, ส่วนขยาย IDE, โมเดล LLM เป็นต้น
    • ตัวอย่าง: แชตบอตบน gemini.google.com, แอป Android/iPhone, Gemini CLI, Gemini Code Assist, Vertex AI Platform เป็นต้น
  • เมื่อใช้ชื่อเดียวกันครอบคลุมหลายบริการ จึงเกิดสถานการณ์ที่ ค้นหาเส้นทางเข้าถึง API สำหรับนักพัฒนาได้ยาก
  • ส่วน Anthropic และ OpenAI ให้เส้นทางเข้าถึงเพียงสองแบบคือ เว็บบริการสำหรับผู้ใช้ทั่วไปและคอนโซลสำหรับนักพัฒนา ทำให้โครงสร้างเรียบง่ายกว่ามาก

กระบวนการสร้าง API คีย์

  • ใน Google AI Studio การ สร้าง API คีย์ทำได้ง่าย และสามารถออกคีย์ใหม่ได้ภายในไม่กี่วินาที
  • คีย์ที่ออกแล้วถูกตรวจพบโดย Gemini CLI ได้ตามปกติ แต่ยังต้องมี การตั้งค่าชำระเงินสำหรับเครดิต API แบบเสียเงิน
  • เมื่อคลิกลิงก์ “Set up billing” จะถูกพาไปยัง Google Cloud Console และจากนั้นขั้นตอนที่ซับซ้อนก็เริ่มขึ้น

ความซับซ้อนของการตั้งค่าบัญชีชำระเงิน

  • ไม่สามารถชำระเงินแบบง่าย ๆ ได้ แต่ต้องผ่านขั้นตอน สร้าง Billing Account → เชื่อมต่อโปรเจกต์ → เพิ่มวิธีชำระเงิน → ยืนยันวิธีชำระเงิน
  • หลังผ่าน การยืนยัน OTP สองขั้นตอน ของบัตรเครดิตในอินเดียแล้ว ยังถูกขอให้ส่ง บัตรประจำตัวที่ออกโดยหน่วยงานรัฐและรูปบัตรเครดิต เพิ่มเติม
    • ต้องใช้โปรแกรมแก้ไขภาพปิดบังหมายเลขบัตรด้วยตนเอง และการอัปโหลด รองรับเฉพาะไฟล์ PNG
  • เกิดข้อผิดพลาดระหว่างอัปโหลดซ้ำ ๆ และได้รับ อีเมลแจ้งว่าอาจใช้เวลาหลายวันกว่าการตรวจสอบจะเสร็จสิ้น

ข้อผิดพลาด 403 และการกู้คืนบัญชี

  • แม้การตรวจสอบจะเสร็จแล้ว แต่ตอนเรียกใช้ Gemini CLI และ API ก็ยังคงเกิด ข้อผิดพลาด 403 Forbidden อย่างต่อเนื่อง
    • ลองทดสอบด้วยโค้ดตัวอย่าง JavaScript จากเอกสารของ Google แล้วก็ยังเกิดข้อผิดพลาดแบบเดียวกัน
    • แม้แต่ใน AI Studio Playground ก็แสดงข้อความ “Failed to generate content”
  • หลังจากนั้นจึงมีอีเมลจาก Google ว่า “Your account is in good standing” และจึงเริ่มทำงานได้ตามปกติ
    • จากนั้นทั้ง Playground, API และ CLI ก็เปลี่ยนเป็นสถานะที่สามารถใช้ Gemini 3 Pro ได้ทั้งหมด

การประเมินต่อขั้นตอนนี้

  • กระบวนการทั้งหมดเป็น ประสบการณ์ที่ไม่มีประสิทธิภาพซึ่งกินเวลามากกว่า 3 ชั่วโมง และซับซ้อนเกินความจำเป็นสำหรับนักพัฒนารายบุคคล
  • ระบบของ Google ถูกออกแบบโดย เน้นการปฏิบัติตามข้อกำหนดสำหรับองค์กรขนาดใหญ่ จึงบั่นทอนประสิทธิภาพการทำงานของผู้ใช้รายบุคคล
  • ในทางกลับกัน OpenAI และ Anthropic มี ขั้นตอนการชำระเงินและการเข้าถึง API ที่เรียบง่าย และเป็นมิตรกับนักพัฒนามากกว่า
  • แม้มีแผนจะลองใช้ Gemini 3 Pro เป็นเวลา 1 เดือนเพื่อประเมินประสิทธิภาพ แต่ก็ถูกมองว่าเป็น แพลตฟอร์มที่ขาดความใส่ใจผู้ใช้เป็นศูนย์กลาง

1 ความคิดเห็น

 
GN⁺ 2025-12-11
ความคิดเห็นจาก Hacker News
  • บน Microsoft Azure ผมเจอประสบการณ์ที่ เลวร้ายยิ่งกว่า อีก
    ระหว่างทางมีทีมขายบุคคลที่สามที่อ้างตัวว่าเป็น ‘Microsoft support ที่ได้รับการรับรองอย่างเป็นทางการ’ เข้ามาติดต่อ แล้วสุดท้ายก็พบว่าจริง ๆ แล้วพยายามขาย แพ็กเกจคิดค่าบริการราคาแพงเกินจริง

  • ผมทำเกมกับลูกและลองฟีเจอร์ แปลงข้อความเป็นเสียง (TTS)
    ทดสอบโมเดล Google Gemini บนเบราว์เซอร์แล้วใช้งานได้ดี แต่พอจะรวมเข้ากับ API กลับเจอการลองผิดลองถูกหลายรอบ

    1. Gemini API เหมาะกับการทำต้นแบบจึงมีอัตราความผิดพลาดราว 30% ส่วน Vertex API เสถียรกว่าแต่ฟีเจอร์ไม่พอ ขณะที่ TTS API แม้จะเป็นโมเดลเดียวกันแต่ประสิทธิภาพแย่มาก
    2. แต่ละ API รองรับ พารามิเตอร์ ไม่เหมือนกัน จึงสร้างชุดที่ต้องการไม่ได้
    3. ต้องอ่านเอกสารเอง หรือให้ Claude Code ช่วยสรุปเอกสารแล้วค่อยทดลอง แต่ก็มีความเสี่ยงที่ข้อมูลหลอนจะปนมา
    • เวลาเรียกผ่าน API กับเวลาใช้ใน Gemini UI ประสิทธิภาพของโมเดลออกมาต่างกัน
      Gemini API มีโอกาสล้มเหลวแบบสุ่มประมาณ 1% จึงจำเป็นต้องมี ตรรกะการลองใหม่
      และความเร็วตอบกลับของ API ก็แกว่งมาก ตั้งแต่ 30 วินาทีไปจนถึง 4 นาทีตามสภาพภายในของ Google
  • ในยุคแรกของ Google AdWords แค่มีบัตรเครดิตก็ลงโฆษณาได้ทันที
    การเข้าถึงได้ทันที แบบนี้ทำให้เกิดความเชื่อมั่น และทำให้ผู้ใช้ทั่วไปรู้สึกว่าถูกปฏิบัติเท่าเทียมกับบริษัทใหญ่
    แต่หลังจากเข้าซื้อ DoubleClick ในปี 2008 ผมคิดว่าทิศทางของ Google เปลี่ยนจากผู้ใช้ไปเป็น องค์กรธุรกิจเป็นศูนย์กลาง

    • ผมย้ำกับทีมผลิตภัณฑ์และทีมขายมาตลอดถึงความสำคัญของ การสมัครใช้งานได้ทันที (Self-signup)
      ผมแค่อยากจ่ายเงินแล้วเริ่มใช้ได้เลย โดยไม่ต้องคุยกับใครหรือรออะไร
      แต่ทีมขายอยากคงโครงสร้างแบบนี้ไว้เพราะต้องการโอกาสในการแบ่งระดับราคาและการโน้มน้าวลูกค้า
    • Google AdWords ทุกวันนี้เป็นหนึ่งในบริการที่ให้ประสบการณ์เริ่มต้นใช้งานที่ ไม่เป็นมิตรที่สุด
      สมัครง่ายก็จริง แต่พอตั้งค่าโฆษณาแรกเสร็จก็บัญชีถูกระงับทันที และอุทธรณ์ก็ไม่ช่วย
      เป็นระดับที่ต้องจ้างผู้เชี่ยวชาญถึงจะใช้งานได้อย่างถูกต้อง
  • ผมสงสัยมาตลอดว่า Cloud Console UI ของ AWS หรือ GCP ผ่านออกมาในสภาพแบบนี้ได้อย่างไร
    ไม่เข้าใจเลยว่าจะปล่อยผลิตภัณฑ์แบบนี้ออกมาแล้วก็ยังพอใจหรือได้เลื่อนตำแหน่งกันได้

    • สงสัยว่าผู้บริหาร Google เคย ใช้อินเทอร์เฟซของ GCP เองจริง ๆ นอกจากตอนเดโม บ้างไหม
    • รู้สึกว่าใน Google ไม่มีผู้นำ มีแต่ ผู้ถือหุ้น
    • โครงสร้างที่ซับซ้อนของ AWS console เป็นตัวอย่างสมบูรณ์แบบของ กฎของ Conway
      ดูเพิ่มเติมได้ที่ Conway’s Law wiki และวิดีโอของ Molly Rocket “The Only Unbreakable Rule”
  • ค้นหา gemini API key ก็เจอ เอกสารทางการ ทันที
    มีลิงก์อยู่ตั้งแต่ส่วนแรกของเอกสาร และดูสะอาดเรียบง่าย ไม่ใช่งานออกแบบเชิงการตลาด ซึ่งผมว่าดี
    ปัญหาน่าจะอยู่ที่เรื่องการชำระเงิน

    • การสร้างคีย์นั้นง่าย แต่ปัญหาอยู่ที่ขั้นตอน การชำระเงินและการเรียกเก็บเงิน
    • ผมลองหลายครั้งแล้วแต่ก็ยังจ่ายเงินสำหรับ Gemini API ไม่ได้ แม้จะถาม Logan แล้วก็ยังไม่มีทางแก้ชัดเจน
    • คำบ่นส่วนใหญ่น่าจะเป็นการเอาประสบการณ์อันย่ำแย่ของ gemini-cli ไปปนกับการเข้าถึง Gemini โดยรวม
    • ในสภาพแวดล้อม production จริงไม่ได้ใช้ AI Studio แต่ใช้ Vertex AI
      เมื่อก่อนการตั้งค่า service account ซับซ้อน และเอกสารก็เน้นการยืนยันตัวตนผ่าน CLI
      ช่วงหลังมี Express Mode ที่ใช้ API Key ได้แล้ว แต่ก็เข้าใจได้ว่าทำไมคนถึงไม่พอใจ
      ในอดีตความต่างด้านฟีเจอร์ระหว่าง Vertex กับ AI Studio ก็ห่างกันมาก
      ดูการถกเถียงที่เกี่ยวข้อง: Google AI Studio forum
    • ทุกส่วน พังเป็นบางส่วน วันละหลายครั้ง
      ผมใช้ AI Studio ด้วยบัญชี Workspace ส่วนตัว อยู่มาวันหนึ่ง Gemini CLI ก็เริ่มปฏิเสธ API key ของผม
      ไม่มีทั้งเหตุผลและคำอธิบาย ทั้งที่ก็จ่ายเงินอยู่แต่กลับถูกบล็อกการเข้าถึง
      ผมพยายามสลับไปใช้บัญชีบริษัท แต่เอกสารก็คล้ายกันไปหมดจนสมัครบริการผิด
      สุดท้ายต้องไปถาม Gemini Pro ซึ่งมันบอกขั้นตอนมา 27 ขั้นตอน ถ้าติดแค่ข้อเดียวก็ต้องเริ่มใหม่ทั้งหมด
      Azure ก็คล้ายกันหรือแย่กว่าอีก จนตอนนี้ยังเข้า GPT-5 ไม่ได้ด้วยซ้ำ
  • พอกดลิงก์ “Set up billing” ก็ถูกพาจาก Google AI Studio ไปยัง Cloud Console
    ตอนนั้น ความสิ้นหวัง ถาโถมเข้ามาทันที ทุกครั้งที่เข้า AWS หรือ GCP console ผมต้องเสียเวลาไปกับเอกสารเก่าและแดชบอร์ดซับซ้อน

    • ถึงขั้นมีมุกว่า “เอกสาร AWS เก่า ๆ นั่นอยู่ในห้องนี้กับเราตอนนี้หรือเปล่า?”
  • ผมก็เลิกใช้ Gemini ด้วยเหตุผลเดียวกัน
    ผมไม่มีเวลาพอจะเอาไปเสียกับ ขั้นตอนอันซับซ้อน ของ Google

  • ผมเห็น “nano banana pro” แล้วพยายามจะขอ API key แต่ยอมแพ้ใน 5 นาที
    นึกว่ามีแค่ผมคนเดียว ที่ไหนได้แม้แต่คนเก่ง ๆ ก็ยังติดกันหมด
    ตู้สั่งอาหารของ McDonald’s ยังออกแบบให้แม้อ่านหนังสือไม่ออกก็สั่งแฮมเบอร์เกอร์ได้ แล้วทำไม Google ถึงทำ UX พื้นฐานแบบนี้ไม่ได้ก็น่าสงสัย

    • AI cloud ของ IBM ก็คล้ายกัน เอกสารเก่า และในบรรดา API key หลายแบบมีแค่ตัวเดียวที่เป็นของจริง
      เหมือน ด่านปราสาทใน Mario ที่ต้องเดินตามลำดับเป๊ะ ๆ ถึงจะออกมาได้
      ถ้าเป็น IBM ก็พอเข้าใจได้ แต่ดูเหมือน Google จะลงมาถึงจุดนั้นแล้ว
    • ผมคิดว่าวัฒนธรรมภายในของ Google ติดอยู่ใน ฟองสบู่ที่ไม่เป็นมิตรกับผู้ใช้ เลยออกมาเป็นแบบนี้
  • ถ้าทีม Gemini API มาเห็น ผมอยากขอคำอธิบายที่ โปร่งใสมากกว่านี้ เกี่ยวกับข้อผิดพลาด
    'The specified schema produces a constraint that has too many states for serving' ที่เกิดเวลาใช้ Structured Outputs
    น่าจะเป็นปัญหาที่ constraint grammar หรือ token mask โตเกินไป
    OpenAI มี เอกสารที่ชัดเจนและข้อจำกัดที่ยืดหยุ่น
    ส่วน issue ที่เกี่ยวข้องก็ถูกปิดใน GitHub แบบไม่มีเหตุผล
    ถึงอย่างนั้น ความเร็ว ของโมเดล Gemini ก็น่าประทับใจ และคุณภาพของ API ก็ดีขึ้นมากเมื่อเทียบกับปีก่อน

  • ก่อนหน้านี้ผมเคยโพสต์บ่นบน HN แล้ว Logan ก็มาขอฟีดแบ็กด้วยตัวเอง
    เขายังเคลื่อนไหวอย่างมากบน บัญชี X และบอกล่วงหน้าว่าเดือนหน้า AI Studio จะมีการปรับปรุง UX/UI
    แม้อยู่ในองค์กรขนาดใหญ่ แต่ก็ดูให้ความสำคัญกับตัวผลิตภัณฑ์ จึงทำให้ มีความคาดหวังอยู่มาก

    • แต่การประกาศ “vibe coding update” บน Bluesky ดูจะ เร็วเกินไป
      ทิศทางของทีมยังไม่ชัด และรู้สึกว่า PM ของ Google ไม่มี ความเข้าใจหน้างาน เท่าแต่ก่อนแล้ว
    • ทีม developer relations ของ Google รับฟีดแบ็กบ่อยก็จริง แต่แทบไม่ค่อย นำไปสู่การลงมือทำจริง
      เหมือนจะรอจนกว่ามันจะกลายเป็นเรื่องสำคัญเชิงกลยุทธ์
      ผมไม่เข้าใจเลยว่าทำไม “การทำให้ขั้นตอนจ่ายเงินง่ายขึ้น” ถึงไม่ถือว่าสำคัญเชิงกลยุทธ์