Google AI Studio - ลองใช้ Starter Apps

(stdy.blog)

13 คะแนน โดย spilist2 2025-04-18 | ยังไม่มีความคิดเห็น | แชร์ทาง WhatsApp

(บทความต้นฉบับมี system prompt, code snippet และ gif รวมอยู่ด้วย)

เมื่อ Google AI Studio อัปเดต ก็ได้เพิ่มพื้นที่สำหรับลองเล่นมินิแอปหลากหลายแบบ (Starter Apps) ที่ใช้ Gemini
สามารถรันเดโมมากกว่า 10 แบบพร้อมแก้โค้ดไปด้วยได้ และเพราะใช้ Gemini API Key ที่ฝังมาให้ในตัวจึงใช้ฟรี
- แต่ถ้าใช้เยอะเกินไปจะเจอ 400 error น่าจะมีอะไรทำนอง daily call limit อยู่
- ถ้าใช้บัญชีอื่นก็รันได้

ลองเดาดู: ทำไม Google ถึงเปิดเดโมเหล่านี้?

ช่วงหลังมานี้ Gemini ได้รับความสนใจจากความสามารถแบบ multimodal ที่ไปไกลกว่าข้อความ ทั้งเข้าใจและสร้างภาพหรือวิดีโอได้ รวมถึงความสามารถด้านการเขียนโค้ดที่ยอดเยี่ยม
แต่ที่ผ่านมาส่วนใหญ่ยังถูกใช้อยู่แค่ใน LLM chatbot และยังไม่ค่อยมีคนทั่วไปนำไปใช้ในระดับ API มากนัก
Google อาจกำลังหวังให้ความสามารถเหล่านี้ถูกใช้งานผ่าน API มากขึ้นและสร้างรายได้ จึงนำเดโมเหล่านี้ออกมาให้ดูหรือไม่?
- เพราะทุกเดโมเป็นเหมือนโชว์เคสที่แสดงให้เห็นว่าความสามารถของ Gemini สามารถนำไปประกอบเป็นเว็บแอปในระดับโค้ด และเชื่อมกับ Google API อื่น ๆ ได้อย่างไร

วิเคราะห์ prompt และโค้ดของเดโม

ลองดูตัวที่ซับซ้อน 2 ตัว

Video Toys: ทำความเข้าใจวิดีโอและอธิบาย + ตัวอย่าง vibe coding

เป็นเดโมที่ใช้ Gemini 2.5 วิเคราะห์วิดีโอ YouTube แล้วทำ vibe coding สร้างแอปสื่อการเรียนรู้แบบ interactive อย่างง่ายให้
- ให้โมเดลวิเคราะห์วิดีโอในบทบาท “นักการศึกษาที่เชี่ยวชาญในการสร้างประสบการณ์การเรียนรู้ผ่าน interactive web app และเป็น product designer” จากนั้นทำสเปกของเว็บแอปนั้นและลงมือสร้างมัน
วิดีโอตัวอย่างมีการวิเคราะห์เนื้อหาไว้แล้ว จึงสามารถลองรันแอปสื่อการเรียนรู้ได้ทันที
ต่างจากเดโมอื่นที่มีไฟล์ไม่กี่ไฟล์ ตัวนี้สร้างด้วย React
ผู้ใช้สามารถแก้ไขได้ทั้งหมดทั้งสเปกสำหรับ vibe coding ที่ Gemini สร้างให้ และโค้ดที่ถูกสร้างขึ้น
แนะนำสำหรับคนที่อยากสร้างบริการจากวิดีโอ หรือบริการที่สร้างโค้ด

Maps Planner: ตัวอย่าง multimodal + function calling + structured output + Maps API

เป็นเดโมที่เมื่อป้อนชื่อสถานที่แล้วจะอธิบายเกี่ยวกับสถานที่นั้น และถ้าเปิด Day Planner Mode ก็จะวางแผนท่องเที่ยวหนึ่งวันให้ พร้อมประเมินเวลาเดินทาง
รองรับทั้ง General Explorer Mode และ Day Planner Mode ด้วย system prompt เดียว 2 โหมด
- น่าสนใจตรงที่มีการปรับ system prompt อย่างละเอียดตามโหมดที่ผู้ใช้เลือก
มีการกำหนดฟังก์ชันเพื่อรับส่งข้อมูลแผนที่อย่างแม่นยำ และวาดเส้นระหว่างสองตำแหน่งได้อย่างถูกต้อง จากนั้นให้ Gemini เป็นผู้เรียกใช้
- สิ่งที่อยากทำให้ได้ผ่าน MCP ก็น่าจะเป็นความขยายต่อได้แบบนี้
นอกจาก prompt จะดีแล้ว ยังแสดงวิธีจัดการ Maps API และข้อมูลตำแหน่งได้ดีด้วย แนะนำสำหรับคนที่อยากสร้างบริการเกี่ยวกับแผนที่

ลองทำเอง

สามารถคัดลอกเดโมแอปมา custom ได้ และยังมี template สำหรับคนที่อยากเริ่มทำตั้งแต่ต้นอีกหลายแบบ
ลองคัดลอกเดโมสร้างภาพชื่อ Explain Things with Lots of Tiny Cats มาทำเป็นของตัวเอง
- เป็นเดโมที่เมื่อขอให้ช่วยอธิบายแนวคิดอะไรสักอย่าง จะสร้างเป็นเหมือนเว็บตูนโดยใช้ metaphor ของแมวหลายตัว
- ที่น่าสนใจคือ prompt ที่ทำให้โมเดลสร้างภาพต่อเนื่อง (No commentary, just begin your explanation. Keep going until you're done.) และโค้ดที่ค่อย ๆ แสดงภาพที่สร้างขึ้นทีละภาพแบบ stream
เปลี่ยนเป็นเวอร์ชันภาษาเกาหลี + ฮิปโป แล้วทำเป็น ฮิปโปรู้ทุกเรื่อง
- ดึงฟอนต์ภาษาเกาหลีที่เหมาะสมจาก Google Fonts มาใช้ แล้วปรับ HTML code กับ prompt เล็กน้อย
มีฟังก์ชันแชร์แอปของตัวเอง แต่ดูเหมือนจะทำงานได้ไม่ค่อยดี
- เพราะไฟล์ที่เกี่ยวข้องทั้งหมดถูกเก็บไว้ใน Google Drive จึงแค่เข้าไปแชร์ไฟล์ใน Google Drive ตรง ๆ เหมือนการแชร์ไฟล์ทั่วไปก็ได้

Gemini Cookbook

ถ้า Starter Apps เป็นตัวอย่างเว็บแอปสนุก ๆ ที่นี่ก็มีตัวอย่าง Python หลากหลายแบบ
- มีตัวอย่าง Gemini 2.5 Flash ที่เพิ่งเปิดเผยเมื่อไม่กี่ชั่วโมงก่อนด้วย
เหมาะสำหรับคนที่กำลังจะสร้างบริการ generative AI เอาไว้อ้างอิง

Google AI Studio - ลองใช้ Starter Apps

ลองเดาดู: ทำไม Google ถึงเปิดเดโมเหล่านี้?

วิเคราะห์ prompt และโค้ดของเดโม

Video Toys: ทำความเข้าใจวิดีโอและอธิบาย + ตัวอย่าง vibe coding

Maps Planner: ตัวอย่าง multimodal + function calling + structured output + Maps API

ลองทำเอง

Gemini Cookbook

บทความที่เกี่ยวข้อง

ยังไม่มีความคิดเห็น