ทุกอย่างที่ประกาศใน Google I/O 2026
(io.google)- แกนหลักคือ Gemini 3.5 Flash, Gemini Omni Flash, Antigravity 2.0, Google AI Studio, Gemma 4, Android 17, Chrome/Web, Firebase, Google Play, และ ทักษะของนักพัฒนาในยุค AI
- Google ไม่ได้เน้นแค่การเปิดตัวโมเดลเท่านั้น แต่ยังชู เวิร์กโฟลว์การพัฒนาที่เอเจนต์เข้าถึงผลิตภัณฑ์จริง เบราว์เซอร์ คลาวด์ แอปมือถือ ข้อมูล เอกสาร และสภาพแวดล้อมการทดสอบได้จริง ขึ้นมาเป็นศูนย์กลาง
- เครื่องมือพัฒนาก้าวเลยระดับการเขียนโค้ดแทนไปสู่ การวางแผน การลงมือทำ การตรวจสอบ การดีบัก การดีพลอย การประเมินผล และการประสานงานเอเจนต์หลายตัว
- ทั้ง Android, Flutter, Chrome, Firebase และ Google Play ต่างขยายไปในแนวทาง ผสาน Gemini และเครื่องมือเอเจนต์เข้าไปในเวิร์กโฟลว์การพัฒนาเดิม
- มากกว่าการเขียนโค้ด ปัจจัยคอขวดที่ใหญ่กว่ากลายเป็น ต้นทุนการตรวจสอบ การให้บริบท สิทธิ์เข้าถึงเครื่องมือ การสังเกตการณ์รันไทม์ โครงสร้างพื้นฐานการทดสอบ รวมถึงการจัดทำเอกสารและการออกแบบระบบขององค์กร
เซสชัน 1 - Google keynote
- ทุกเดือนมีผู้คน มากกว่า 8.5 ล้านคน สร้างแอปและประสบการณ์ด้วยโมเดลของ Google
- Model API ของ Google ประมวลผลได้ราว 1.9 หมื่นล้านโทเค็น ต่อนาที
- การใช้งาน AI Search:
- AI Overviews มีผู้ใช้ มากกว่า 2.5 พันล้านคนต่อเดือน
- AI Mode มีผู้ใช้ มากกว่า 1 พันล้านคนต่อเดือน
- ผู้ใช้ที่ใช้งานต่อเดือนของ Gemini app เพิ่มจาก 400 ล้านคน ใน I/O ปีที่แล้ว เป็น มากกว่า 900 ล้านคน
- มีการสร้างภาพด้วยโมเดล Nano Banana ไปแล้ว มากกว่า 5 หมื่นล้านภาพ
- Gemini 3.5 Flash ใช้งานได้ทั้งในผลิตภัณฑ์และ API โดยมีจุดเด่นหลักคือความเร็วในการทำงานและความคุ้มค่าด้านต้นทุน
- Gemini Omni Flash เป็นโมเดลตัวแรกในตระกูล Omni โดยมุ่งขยายการรองรับอินพุตและเอาต์พุตแบบมัลติโหมดให้กว้างขึ้น
- Antigravity 2.0 เป็นแอปเดสก์ท็อปแบบสแตนด์อโลนที่ใช้งานได้ทั่วโลก โดยรวมการสนทนากับเอเจนต์ โปรเจกต์ และการจัดการงานไว้ในหน้าจอเดียว
- เดโมขนาดใหญ่ของ Antigravity:
- ใช้ เอเจนต์ย่อย 93 ตัว, การเรียกโมเดลมากกว่า 15,000 ครั้ง, และ 2.6 พันล้านโทเค็น เพื่อสร้างแกนหลักของระบบปฏิบัติการที่ทำงานได้จากโปรเจกต์ว่างเปล่า
- รันได้ด้วย เครดิต API ไม่ถึง 1,000 ดอลลาร์ โดยอาศัยประสิทธิภาพและความคุ้มค่าของ Gemini 3.5 Flash
เซสชัน 2 - Developer keynote
- Google นำเสนอแนวทางที่รวม โมเดล เครื่องมือเอเจนต์ แพลตฟอร์มผู้ใช้ และโครงสร้างพื้นฐาน เข้าด้วยกันสำหรับนักพัฒนา
- Managed agents จะเข้ามาอยู่ใน Gemini API และสามารถใช้ agent harness แบบเดียวกับ Antigravity ได้ในรูปแบบ API
- Google Antigravity 2.0 เป็นแอปเดสก์ท็อปที่ยึดเอเจนต์เป็นศูนย์กลาง โดยมีโครงสร้างที่ให้งานพัฒนาถูกแบ่งไปจัดการโดยเอเจนต์หลายตัว
- สามารถปรับแต่งและดีพลอยเวิร์กโฟลว์เอเจนต์ได้โดยตรงด้วย Antigravity SDK
- ใน Google AI Studio ผู้ใช้ใหม่สามารถดีพลอยขึ้น Cloud Run ได้ทันทีโดยไม่ต้องใช้บัตรเครดิต
- การเชื่อมต่อกับ Google Workspace ทำให้ AI Studio ใช้ข้อมูลจาก Workspace ได้ภายในเวิร์กโฟลว์การสร้างแอป
- ตอนนี้สามารถสร้าง แอป Android จากไอเดียได้โดยตรงใน Google AI Studio
- Gemma 4:
- ให้บริการภายใต้ไลเซนส์ Apache 2
- ทำยอด 100 ล้านดาวน์โหลด ได้ในเดือนแรก
- ยอดดาวน์โหลดรวมของ Gemma เพิ่มเป็น มากกว่า 500 ล้านครั้ง
- Chrome DevTools for Agents ใช้งานได้กับ Antigravity และเอเจนต์เขียนโค้ด มากกว่า 20 ตัว
- มีการ fine-tune Gemma 4 ด้วย LoRA เพื่อสร้างคำตอบคำสั่ง bash ที่ใช้ได้ทันทีใน CI pipeline และนำไปดีพลอยบนโน้ตบุ๊กภายในเครื่อง
เซสชัน 3 - Agent-first workflows from prompt to production
- หลังจากดีพลอยแอปที่สร้างใน AI Studio ด้วย Cloud Run และ Firebase แล้ว ยังเชื่อมต่อไปถึงการดีบักและการวิเคราะห์ในขั้นตอนปฏิบัติการผ่านเวิร์กโฟลว์เอเจนต์ได้
- เอเจนต์เข้าถึงเครื่องมือและข้อมูลของ Google Cloud ได้ผ่าน managed MCP server มากกว่า 50 ตัว
- Developer Knowledge MCP นำข้อมูลล่าสุดจากเอกสารของ Google เข้าไปในเครื่องมือเอเจนต์ เพื่อลดปัญหาเอกสารล้าสมัย
- สแนปช็อตเอกสารล่าสุดจะถูกส่งเข้าเครื่องมือเอเจนต์ประมาณทุก 8-12 ชั่วโมง
- ใช้ Data Agent Kit และ BigQuery MCP เพื่อวิเคราะห์ Firestore, BigQuery และข้อมูลล็อก รวมถึงสร้างแดชบอร์ด
- Antigravity สามารถตรวจสอบข้อผิดพลาดของแอป ค้นหาไฟล์ที่เกี่ยวข้อง แก้ไข และต่อเนื่องไปถึงการคอมมิตบน GitHub ได้
- remediation agent และ CI agent ที่ดีพลอยบน Cloud Run เชื่อมต่อกับ Eventarc, Pub/Sub และ Gemini เพื่อตรวจสอบและแก้ไขข้อผิดพลาด
- เอเจนต์หลายตัวส่งต่องานถึงกันในรูปแบบ A2A(agent-to-agent)
- การพัฒนาเอเจนต์ไม่ได้จบแค่การสร้างต้นแบบ แต่ขยายไปถึง การดีพลอย การมอนิเตอร์ การวิเคราะห์ข้อมูล และการกู้คืนอัตโนมัติ
เซสชัน 4 - What’s new in Android
- Android 17 เพิ่มข้อจำกัดด้านหน่วยความจำและเครื่องมือที่เกี่ยวข้อง เพื่อไม่ให้การใช้หน่วยความจำมากเกินไปของแอปทำลายประสบการณ์ผู้ใช้
- Android 17 กำหนดเงื่อนไขอย่าง excessive memory, cold start และ excessive CPU ให้เป็นเป้าหมายสำหรับการวิเคราะห์อัตโนมัติ
- แอปที่กำหนดเป้าหมายเป็น Android 17 จำเป็นต้องมีสิทธิ์ ACCESS_LOCAL_NETWORK หากต้องการค้นหาและเชื่อมต่ออุปกรณ์ในเครือข่ายภายใน
- Google เดินหน้าตอกย้ำทิศทางการสร้าง Android UI ด้วย Jetpack Compose
- Compose 1.10 และ Compose 1.11 มีทั้งการปรับปรุงด้านประสิทธิภาพ, hybrid UI และ API ใหม่
- การเชื่อมต่อ AppFunctions กับ Gemini ยังอยู่ในขั้นพรีวิวแบบปิด และทำให้แอปสามารถเป็นเป้าหมายการ orchestration ของ Gemini ได้
- สามารถทดสอบฟีเจอร์ใหม่บางส่วนได้ผ่าน Developer Preview ของ ML Kit Prompt API
- Android 17 มาพร้อม Eclipsa Video, การปรับปรุงคุณภาพเสียง HE-AAC และการปรับปรุงด้านกล้องและสื่อบนพื้นฐานของ CameraX และ Media3
- แอปจอใหญ่กำลังขยับไปสู่แนวทางที่ยึดข้อจำกัดแบบมือถือเดิมน้อยลง โดยใช้ Navigation 3 และไลบรารี Compose Adaptive
- Compose 1.6 สำหรับ Wear OS รองรับ Navigation 3 และ mode manager ที่ช่วยจัดการคอนเทนต์ในสถานะประหยัดพลังงาน
เซสชัน 5 - What’s new in Chrome
- Chrome มุ่งเน้นให้เว็บไซต์ทำงานได้ดีสำหรับผู้ใช้ที่ใช้งาน เอเจนต์และเครื่องมือแบบเอเจนต์
- แทนที่จะพึ่งพาเฉพาะความรู้พื้นฐานของโมเดล Chrome ต้องการเชื่อม Baseline และความสามารถเว็บล่าสุดเข้ากับเครื่องมือพัฒนา
- ตั้งแต่ปีที่แล้วมี 55 ฟีเจอร์ ที่เข้าสู่สถานะ Baseline Widely Available
- ณ เวลาที่ประกาศ มี 52 ฟีเจอร์ อยู่ในสถานะ Baseline Newly Available
- เนื่องจาก Chrome อัปเดตทุก 4 สัปดาห์ หากเอเจนต์เขียนโค้ดไม่รู้จักฟีเจอร์เว็บล่าสุด ก็มีแนวโน้มจะสร้าง implementation แบบล้าสมัยได้ง่าย
- Prompt API ของ Chrome จะพร้อมใช้งานใน Chrome 148
- Navigation API, View Transitions, HTML-in-Canvas และ declarative partial updates ถูกนำเข้ามาอยู่ในเวิร์กโฟลว์การพัฒนา
- นักพัฒนา Chrome extension จะสามารถตรวจสอบและดีบักการติดตั้ง, service worker, side panel และ popup ได้แบบอัตโนมัติ
- Chrome กำลังขยายไปสู่แนวทางที่ให้เอเจนต์เข้าถึง skill ระดับสูง เช่น web performance, identity, security และคู่มือกรณีใช้งานทั่วไป มากกว่า 100 แบบ
- หากต้องการลดการทำซ้ำของแพตเทิร์นความเข้ากันได้แบบเก่า จำเป็นต้องป้อนข้อมูลฟีเจอร์เว็บล่าสุดและข้อมูลการรองรับของเบราว์เซอร์ให้เอเจนต์
เซสชัน 6 - มีอะไรใหม่ใน Google AI
- ตระกูลโมเดล Gemini เป็นตระกูลโมเดลแบบมัลติโหมดที่รองรับอินพุตข้อความ รูปภาพ เสียง วิดีโอ และโค้ด รวมถึงเอาต์พุตได้หลายรูปแบบ
- บทบาทของ Gemini 3.5 Pro และ Flash:
- Gemini 3.5 Pro เน้นการแก้ปัญหาที่ซับซ้อน
- Gemini 3.5 Flash รับบทด้านความสมดุลของประสิทธิภาพ ความเร็ว และต้นทุน
- ฟีเจอร์ Build ของ AI Studio ใช้ 3.5 Flash เป็นโมเดลเริ่มต้น
- สามารถทดลองใช้ Nano Banana 2 ได้โดยตรงใน AI Studio
- Gemini Omni Flash เป็นโมเดลที่สามารถสร้างเอาต์พุตซึ่งรวมถึงวิดีโอจากอินพุตได้
- Gemini Live และ Live API รองรับการโต้ตอบด้วยเสียง
- Interactions API เป็นฟีเจอร์สำหรับโต้ตอบกับเอเจนต์ภายใน AI Studio
- การเข้าถึง Gemma 4:
- สามารถทดลองได้ใน AI Studio playground
- ใช้งานการเรียกผ่าน Gemini API ได้ฟรีบางส่วน
- มี หน้าต่างบริบท 256,000 โทเค็น และสามารถหาได้บน Hugging Face
- ยังมีการเปิดตัว Gemini Robotics 1.6, Genie 3, Antigravity 2.0 รวมถึงกลยุทธ์ลดต้นทุนด้วยการผสมโมเดลแบบเปิดและโมเดลแบบปิดลิขสิทธิ์เข้าด้วยกัน
เซสชัน 7 - สร้างประสบการณ์ AI ยุคถัดไปด้วย Google AI Studio และ Google Antigravity
- Google AI Studio ขยายจากการเป็นเพียง model playground ไปสู่พื้นที่สำหรับเปลี่ยนไอเดียให้เป็นแอปและนำไป deploy
- โมเดล เอเจนต์ การสร้างแอป การเชื่อมต่อกับ Workspace และการ deploy ไปยัง Cloud Run ถูกรวมอยู่ในเวิร์กโฟลว์เดียว
- ส่วนแอปของ AI Studio จะเปิดให้ใช้งานเร็ว ๆ นี้ และจะรองรับการสร้างและ deploy แอปได้โดยตรงมากขึ้น
- มีการเพิ่มฟีเจอร์ส่งออกโค้ดที่สร้างใน AI Studio ไปยัง Antigravity ได้ในครั้งเดียว
- Antigravity 2.0 ไม่ได้มีหน้าที่แค่เขียนโค้ด แต่ยังทำหน้าที่เป็น mission control สำหรับประสานงานหลายงานผ่านเอเจนต์
- Antigravity 2.0 วาง task list, implementation plan และการตรวจสอบไฟล์ที่เปลี่ยนแปลงเป็นแกนหลักของเวิร์กโฟลว์
- สามารถจัดการ code review และการตรวจสอบการเปลี่ยนแปลงได้โดยตรงภายใน Antigravity 2.0
- เป็นโครงสร้างที่มอบงานหนักให้เอเจนต์ เช่น การทดสอบบนเบราว์เซอร์ การวางแผน การเขียนฟีเจอร์หลายไฟล์ และการตรวจสอบแบบ end-to-end
- สามารถสร้างแอปธุรกิจใหม่ได้ภายในประมาณ 20 นาที ด้วย Google AI Studio และต่อยอดเพิ่มเติมด้วย Antigravity
- Google AI Studio คือจุดเริ่มต้นแบบรวดเร็วของ “prompt to app” ส่วน Antigravity คือเครื่องมือที่ช่วยยกระดับแอปไปสู่งานพัฒนาจริง
เซสชัน 8 - ปลดล็อกความสามารถเว็บสมัยใหม่ในเวิร์กโฟลว์ AI coding ของคุณ
- หาก coding agent ไม่รู้จักความสามารถเว็บสมัยใหม่ ก็มีแนวโน้มที่จะสร้างโค้ดตามมาตรฐานความเข้ากันได้ของเบราว์เซอร์แบบเก่า
- Chrome เปิดตัว 50 ฟีเจอร์ใหม่ ในช่วง 1 ปีที่ผ่านมา แต่เพราะ knowledge cutoff ของโมเดล ทำให้หลายฟีเจอร์ยังไม่ไปถึงตัวโมเดล
- ในตัวอย่าง Interest Invokers API พบปัญหาที่เอเจนต์ใช้ชื่อแอตทริบิวต์เก่าอย่าง
interesttarget - Modern Web Guidance คือแพ็กเกจความรู้ที่ช่วยให้เอเจนต์ค้นหาฟีเจอร์เว็บสมัยใหม่และแนวทางการใช้งานที่แนะนำ
- เอเจนต์จะทำการค้นหาเชิงความหมายภายในแพ็กเกจในเครื่องก่อนตอบ
- ขนาดและโครงสร้างของไกด์:
- ปัจจุบันมีไกด์มากกว่า 100 รายการ
- เป็นโครงสร้างที่ไม่ได้เปิดเผย skill ของแต่ละฟีเจอร์เป็นเครื่องมือระดับบนทั้งหมด แต่จะค้นหาและนำมาใช้เมื่อจำเป็น
- ไกด์ให้ทั้งแนวทางการใช้งานสมัยใหม่ที่เหมาะสมที่สุด และคำแนะนำ fallback ไปพร้อมกัน
- หากไม่มีข้อกำหนดเรื่องการรองรับเบราว์เซอร์ เอเจนต์จะถือว่า Baseline Widely Available เป็นสมมติฐานเริ่มต้น
- หากระบุเงื่อนไขอย่าง “รองรับเฉพาะ Chrome 144 ขึ้นไป” ใน
AGENTS.mdเอเจนต์จะหลีกเลี่ยง fallback ที่ไม่จำเป็นได้ - ทีม Chrome รันการประเมินทุกวันกับโมเดลอย่าง Gemini 3.1, Claude Opus 4.7 และ GPT 5.5
เซสชัน 9 - มีอะไรใหม่ใน Firebase
- Firebase กำลังขยับไปสู่การเป็น agent-native platform ที่ทั้งมนุษย์และเอเจนต์สามารถใช้สร้างและขยายแอปได้
- Firebase Data Connect พัฒนาไปเป็น Firebase SQL Connect ที่รองรับการพัฒนาแอปบนพื้นฐาน SQL
- custom resolver ของ Firebase SQL Connect สามารถเชื่อมต่อบริการ Google Cloud อย่าง Cloud Functions และ BigQuery ได้
- Firestore รองรับ geo search, native full text search และ semantic match
- Firebase AI Logic รองรับโมเดลรุ่นล่าสุด และสามารถสร้างความสามารถ AI ที่รับรู้ตำแหน่งได้ด้วย Maps grounding
- ความสามารถควบคุมการสร้างภาพของ Nano Banana ก็ใช้งานได้ใน Firebase AI Logic
- Firebase AI Logic รองรับการอนุมานแบบ local และ hybrid บน iOS, Chrome และ Android และจะ fallback ไปใช้ cloud-hosted model เมื่อไม่มีโมเดลในเครื่อง
- Dart support for Cloud Functions in Firebase เปิดให้ใช้งานใน experimental preview
- AI Studio เชื่อมต่อกับ Google Workspace ทำให้แอปสามารถใช้ข้อมูลจาก Sheets, Docs, Gmail และ Calendar ได้
- Firebase agent skills ใช้ได้บน Android, iOS, web และ Flutter และยังขยายการรองรับ Crashlytics ด้วย
เซสชัน 10 - มีอะไรใหม่ใน Google Play
- Play Billing รองรับ วิธีชำระเงินท้องถิ่นมากกว่า 300 แบบ ใน มากกว่า 65 ตลาด
- Google Play มีผู้ใช้ที่พร้อมซื้อกว่า 890 ล้านคน
- มีการขยายตัวเลือกที่ให้ใช้งานทั้ง Google Play Billing และการชำระเงินทางเลือกควบคู่กันได้ พร้อมทั้งมีการประกาศค่าธรรมเนียมบริการที่ต่ำลง
- การค้นพบแอปขยายไปยัง Gemini app, Android และเว็บ ทำให้ผู้ใช้ค้นหาแอปและเกมได้ภายใน Gemini
- Gemini แนะนำแอปโดยอาศัยความสามารถจริงของแอปและข้อมูล store listing แทนการแสดงรายการลิงก์แบบคงที่
- ในบางหัวข้อ ผู้ใช้ Gemini และ Play สามารถสำรวจคอนเทนต์ภาพยนตร์และทีวีได้มากกว่า 450,000 รายการ
- ใน Play Console หากอัปโหลดไฟล์แบบมีโครงสร้าง เช่น Eclipsa Video หรือ Google Sheets, Gemini จะช่วยกรอก listing ล่วงหน้า
- Gemini เตรียมช่วยงานใน Play Console เช่น bulk price changes, import skills และ metadata configuration
- ด้วย in-app subscription management API ผู้ใช้สามารถเปลี่ยนแพ็กเกจสมาชิกได้ง่ายภายในแอป
- ปีที่แล้ว Google Play Billing ป้องกันความพยายามฉ้อโกงได้ 3.4 พันล้านดอลลาร์ และ abusive refunds ได้ 130 ล้านดอลลาร์
เซสชัน 11 - นิยามยุคของ agentic AI
- Gemini, Search, แอป Gemini และ Google DeepMind ต่างขับเคลื่อน AI แบบ agentic ไปในทิศทางเดียวกัน
- Gemini 3.5 Flash สามารถใช้งานได้ภายใน Search ด้วย
- Search ต้องหาสมดุลระหว่างคำตอบที่รวดเร็วกับ agentic task ที่ยาวกว่า
- Gemini Spark ทำหน้าที่เป็น always-on agent ที่คอยจัดการงานที่ผู้ใช้ฝากไว้เบื้องหลัง
- โมเดลต้องทำงานได้ครอบคลุมทั้งผลิตภัณฑ์ของ Google และ ecosystem ภายนอก ไม่ใช่แค่ตอบแชตอย่างเดียวอีกต่อไป
- เครื่องมือภายในที่แปลจาก Python ไปเป็น Go:
- งานแปลโปรแกรมเดิมที่มีชุดทดสอบอยู่แล้วไปเป็นภาษาอื่น เป็นปัญหาที่ชัดเจนกว่าสำหรับโมเดล
- เครื่องมือภายในบางตัวเร็วขึ้น 10-20 เท่า ภายในชั่วข้ามคืน
- โครงสร้างพื้นฐานซอฟต์แวร์ภายในของ Google ก็อาจปรับเปลี่ยนได้เร็วขึ้นเพื่อให้เข้ากับโลกแบบ agentic ใหม่นี้
- ฮาร์ดแวร์ ขนาดโมเดล การนำไปใช้ในผลิตภัณฑ์ และ feedback loop ต้องทำงานสอดประสานกัน เพื่อให้ Gemini เข้าไปอยู่ในผลิตภัณฑ์ทั้งหมดของ Google ได้
- จุดโฟกัสของคำถามกำลังย้ายจาก “โมเดลทำอะไรได้บ้าง” ไปเป็น “จะวางโมเดลลงในผลิตภัณฑ์และเวิร์กโฟลว์อย่างไร”
เซสชัน 12 - What’s new in Android development tools
- เครื่องมือพัฒนา Android ถูกออกแบบโดยคำนึงไม่ใช่แค่นักพัฒนาที่เป็นมนุษย์ แต่รวมถึง AI agent ที่จะถูกนำไปใช้งานใน codebase ด้วย
- Android Studio Otter รองรับบัญชี Gemini Enterprise และ Google One
- Android Studio สามารถนำโมเดลแบบโลคัลและโมเดลระยะไกลมาใช้ได้
- Android Bench ทำหน้าที่เป็นเกณฑ์สำหรับตัดสินว่าจะใช้โมเดลใดกับงานพัฒนา Android
- สามารถขอให้แปลง UI ได้โดยตรงจาก Compose Preview เพื่อให้เอเจนต์ทำงานด้วยบริบทที่ดีขึ้น
- สามารถใช้ agent-based new project wizard เพื่อสร้างแอป Android แบบ adaptive ได้ด้วย prompt เพียงอย่างเดียว
- Android Studio มี skill ราว 10 รายการ ที่ช่วยงานอย่างการรวม adaptive API และการแปลงจาก XML ไปเป็น Compose
- Android CLI ใหม่รองรับเวิร์กโฟลว์ LLM และในการสร้างโปรเจกต์ใหม่ใช้โทเค็นน้อยกว่าเครื่องมือ Gradle LLM อื่น ๆ มากกว่า 70%
- สามารถรวม Antigravity CLI, Android CLI และ Android skill เข้าด้วยกัน เพื่อเริ่มพัฒนาแอป Android ใน Antigravity ได้เช่นกัน
- ใน Android Studio Quail และอุปกรณ์ Android 17 การเชื่อมต่ออุปกรณ์จะยังคงอยู่แม้เปลี่ยนเครือข่ายหรือรีสตาร์ตโน้ตบุ๊ก
เซสชัน 13 - What’s new in Flutter
- เปิดตัว Flutter 3.44 พร้อมกับ Dart 3.12
- ปีนี้มี contributor มากกว่า 1,700 คน เข้าร่วมในโปรเจกต์ Flutter
- มีนักพัฒนามากกว่า 1.5 ล้านคน สร้างงานด้วย Flutter ในแต่ละเดือน
- ใน Flutter 3.44 สามารถทดลอง rendering mode ใหม่ได้บนอุปกรณ์ Android ที่รองรับ Vulkan และใช้ Android API 34 ขึ้นไป
- Flutter ถูกนำไปใช้ในระบบ infotainment ของ Toyota 2026 RAV4
- Cloud Functions for Firebase ที่ใช้ Dart มีกรณีที่ลด cold start ได้ต่ำถึง 10ms ด้วย AOT compilation
- Firebase AI Logic เพิ่ม server prompt template เข้ามา ทำให้ไม่จำเป็นต้องใส่ prompt ไว้ตรง ๆ ภายในแอป
- Firebase Agent Skills for Flutter มอบแนวทางให้เอเจนต์สำหรับการสร้างแอป Flutter และ Firebase แบบ full-stack
- รองรับ LiteRT-LM ในแพ็กเกจ
flutter_gemmaเร็ว ๆ นี้ - บน Flutter desktop นั้น Canonical เข้าร่วมเป็นทั้ง lead maintainer และ strategic steward
เซสชัน 14 - What’s new in the Gemma open model family
- Gemma 4 ขึ้นเป็นโมเดลสาธารณะที่ทรงพลังที่สุดในตระกูล Gemma
- มีให้เลือกหลายขนาดตั้งแต่ 2B ถึง 31B ใช้งานได้ทั้งบนมือถือ โน้ตบุ๊ก และคลาวด์
- Gemma เริ่มต้นในปี 2024 ด้วยตระกูลโมเดลตั้งแต่ 1B ถึง 27B
- Gemma 4 เป็นโมเดลแบบ open weight และเข้ากันได้กับ ecosystem โอเพนซอร์ส
- ด้วย MTP และ speculative decoding ทำให้เพิ่ม decode speed ได้สูงสุด 3 เท่า
- มี day-zero implementation ของ Gemma 4 พร้อมสำหรับ ecosystem ของ Android
- ผ่าน Android API สามารถรันโมเดล Gemma ขนาดเล็กบนโทรศัพท์ได้โดยตรง หรือใช้โมเดล Gemma แบบโลคัลเพื่อเขียนแอป Android ในสภาพแวดล้อมที่เข้าถึง Gemini API ได้ยาก
- ใช้ ADK(agent development kit) บน Cloud Run ร่วมกับ Gemma 31B เพื่อสร้างเอเจนต์ที่เข้าใจฐานข้อมูลและค้นหาคำตอบได้
- Gemma 4 สามารถรันในเบราว์เซอร์หรือสภาพแวดล้อมโลคัลผ่านอินเทอร์เฟซที่เข้ากันได้กับ OpenAI ของ Transformers.js, Ollama และ LM Studio
- คลาวด์สำหรับองค์กร เครื่องภายใน เบราว์เซอร์ และมือถือ ล้วนกลายเป็นสภาพแวดล้อมสำหรับรัน Gemma ได้
เซสชัน 15 - What’s new in Web UI
- การอัปเดต Web UI ปี 2026 ครอบคลุมฟีเจอร์หลักพร้อมสถานะ Baseline
- ทุกฟีเจอร์มีป้ายความเข้ากันได้ เช่น Baseline Widely Available, Newly Available และ Limited Available
- ด้วย contrast-color API ทำให้เลือกสีที่มีคอนทราสต์เหมาะสมใน CSS ได้ง่ายขึ้น
- ฟีเจอร์
meta name="text-scale"ใน Chrome 146 รองรับการตั้งค่าขนาดตัวอักษรของระบบ - ผู้ใช้ทั้ง Android และ iOS มากกว่า 30% เปลี่ยนขนาดตัวอักษรเริ่มต้น
- ตั้งแต่ Chrome 134 เป็นต้นมา dialog element รองรับความสามารถอย่าง declarative light dismiss ของ popover
- สามารถทดลอง two-phase View Transitions ได้ใน Chrome Canary
- scroll-driven animations เข้ามาใน Chrome ตั้งแต่ปี 2023 และ Interop 2026 ช่วยเพิ่มความสามารถในการทำงานร่วมกัน
- HTML-in-Canvas API ทำให้สามารถใส่เนื้อหา DOM จริงลงไปใน Canvas ได้
- ใน Chrome 149 มีการเพิ่มรูปแบบการใช้งานใหม่ของ gap decorations และ shape outside
เซสชัน 16 - Adaptive development for the expanding Android ecosystem
- Android ไม่ได้เป็นระบบนิเวศสำหรับมือถือเท่านั้นอีกต่อไป และอุปกรณ์หน้าจอใหญ่ที่เปิดใช้งานอยู่ มากกว่า 580 ล้านเครื่อง ได้รับผลจากการลงทุนใน adaptive app
- ผู้ใช้ foldable ถูกจัดว่าเป็นกลุ่มผู้ใช้มูลค่าสูงกว่าใน adaptive app
- ใน Android 17 มีแนวโน้มจะยกเลิกการ opt-out ของ orientation และ resizability สำหรับแอปที่กำหนด target SDK 37
- Desktop emulator ใน Android Studio Quail Canary รองรับการทดสอบแอป Android ในรูปแบบเดสก์ท็อป
- Continue On API ของ Android 17 ช่วยให้ผู้ใช้ทำสิ่งที่ค้างไว้บนอุปกรณ์หนึ่งต่อบนอุปกรณ์ที่สองได้
- Google กำลังเร่งแนวทางการสร้างแอป Android แบบ Compose-first
- Compose 1.11 ปรับปรุงการรองรับ trackpad ให้ดีขึ้นในระดับ mouse และ pointer และเพิ่ม API สำหรับการทดสอบ non-touch input
- ใน Compose มีการเพิ่ม experimental API สำหรับ state-based styling
- Connected Displays เปิดให้ใช้งานทั่วไปผ่าน Android Feature Drop
- Compose, Navigation 3 และไลบรารี Compose Adaptive รองรับหลายหน้าจอ เช่น foldable, desktop, car, TV และ XR
เซสชัน 17 - Building the quantum-AI future with Hartmut Neven and James Manyika
- ประเด็นหลักคือแนวโน้มที่ quantum computing และ AI เร่งความก้าวหน้าซึ่งกันและกัน
- Hartmut Neven เริ่มทีม Quantum AI ของ Google ในปี 2012
- superposition และ qubit เป็นรากฐานของ quantum computing
- จำนวน bit string ที่เป็นไปได้บนชิป 105 qubit คือ 2 ยกกำลัง 105
- ขณะนี้ชุมชนได้ระบุอัลกอริทึมและปัญหาที่ quantum computer สามารถแก้ได้อย่างมีประโยชน์แล้ว มากกว่า 70 รายการ
- ในอนาคตจำนวนดังกล่าวอาจเพิ่มขึ้นมากกว่า 10 เท่า
- quantum error correction เป็นเทคโนโลยีหลักที่จำเป็นต่อการรักษาสถานะ superposition
- Google ประสบความสำเร็จในการลดข้อผิดพลาดของเครื่องจริงด้วย quantum error correction ในปี 2022
- Quantum Echoes เชื่อมโยงกับแนวทางการเรียนรู้จากข้อมูลที่ได้จาก NMR หรือ MRI
- Google เสนอว่าควรเร่งการเปลี่ยนผ่านสู่ post-quantum cryptography ให้แข็งแกร่งขึ้นภายในปี 2029
เซสชัน 18 - Scale AI with Google’s TPU software stack
- กล่าวถึงซอฟต์แวร์สแต็กโอเพนซอร์สสำหรับ การฝึก, การปรับจูนละเอียด, และการอนุมาน โมเดลบน TPU
- เวิร์กโฟลว์การพัฒนาโมเดลแบ่งเป็น pre-training, post-training และ serving/inference
- สามารถลองทำ post-training และ inference ได้ด้วย TPU ฟรีบน Kaggle และ Colab
- เดโม vLLM on TPU รันโมเดล Gemma 4 31B บน TPU และสรุปข้อมูลโภชนาการจากภาพอาหาร
- Gemma 4 เป็นโมเดลมัลติโหมดที่เหมาะกับงานรับภาพ ทำความเข้าใจเนื้อหา และสรุปผล
- การใส่ MTP เข้าไปใน TPU inference ของ vLLM ทำให้ได้ความเร็วเพิ่มขึ้นประมาณ 3 เท่า ในหลายงาน
- Tunix เป็นเฟรมเวิร์กน้ำหนักเบาสำหรับ post-training
- แทนที่จะใช้โมเดลขนาดใหญ่ มีการ fine-tune โมเดล 4B ให้ทำงานเดียวกันได้ และรันบนชิป Trillium เพียงตัวเดียว
- MaxText, Tunix, vLLM, JAX, PyTorch และ TPU ถูกจัดวางเป็นเครื่องมือตามแต่ละช่วงของวงจรชีวิตโมเดล
เซสชัน 19 - Supercharge your AI coding workflow with Chrome DevTools for agents
- Chrome DevTools for agents เป็นเครื่องมือที่ทำให้ coding agent สังเกตรันไทม์ของเบราว์เซอร์ได้โดยตรงผ่าน DevTools
- เช่นเดียวกับที่นักพัฒนามนุษย์ใช้ DevTools เพื่อเรียนรู้และดีบัก coding agent ก็ควรมี feedback loop แบบปิดเดียวกัน
- เอเจนต์สามารถเปิดอินสแตนซ์ Chrome จริง ท่องหน้าเว็บ กรอกฟอร์ม และเก็บ console log กับ network request ได้
- การเข้าถึง source map ช่วยให้ย้ายจากปัญหารันไทม์ไปยังไฟล์ซอร์สที่เกี่ยวข้องได้
- เครื่องมือนี้ให้มาในรูปแบบ NPM package พร้อมทั้ง MCP server และ CLI
- มี skill ให้ 6 รายการ:
- troubleshooting, Chrome DevTools และ Chrome DevTools CLI skill ช่วยเรื่องการใช้งานทั่วไปและแนวคิด
- accessibility debugging, memory leak debugging และ optimized LCP skill ใส่ความรู้เฉพาะทางให้กับเอเจนต์
- พื้นฐานการทำงานสร้างบน Puppeteer และเอเจนต์จะใช้ตัวห่อของเครื่องมือแทนการใช้ Puppeteer โดยตรง
- โดยค่าเริ่มต้นจะใช้โปรไฟล์เบราว์เซอร์แบบไม่ระบุตัวตนแยกต่างหาก และไม่เข้าถึง Chrome password manager
- CyberAgent ใช้ DevTools for agents ตรวจสอบ 236 Storybook story ของ 32 คอมโพเนนต์ ได้ภายใน 1 ชั่วโมง
เซสชัน 20 - A new era of discovery: AI and the frontiers of science with Demis Hassabis
- Demis Hassabis ตั้งเป้าหมายดั้งเดิมของ DeepMind ไว้ว่า “solve intelligence”
- ประเด็นหลักคือแนวโน้มที่ AI กำลังเปลี่ยนการค้นพบทางวิทยาศาสตร์ ผลิตภัณฑ์ และเครื่องมือวิจัย
- AlphaFold ถูกยกขึ้นมาอีกครั้งในฐานะกรณีตัวอย่างของการแก้ โจทย์ยาก 50 ปี เรื่องโครงสร้างโปรตีน
- Gemini for Science เชื่อมโยงกับทิศทางของโมเดลเพื่อวิทยาศาสตร์ที่ประกาศในคีย์โน้ต
- Demis Hassabis อธิบายปัจจุบันว่าเป็นช่วงที่ยืนอยู่บน “foothills of the singularity” และมองว่าช่วงเวลาที่ intelligence ถูกแก้ได้น่าจะอยู่ราว บวกลบ 1 ปีจากปี 2030
- โมเดลตระกูล Genie ถูกใช้ให้ Waymo ทดสอบสถานการณ์แบบ 1 in a billion ที่แทบไม่เกิดขึ้นจริงบนโลกจริง
- ความคืบหน้าในการค้นพบยาของ Isomorphic Labs ถูกใช้เป็นตัวอย่างว่า AI เร่งวิทยาศาสตร์ได้อย่างไร
- แอป Gemini มีผู้ใช้ต่อเดือน 900 ล้านคน และ AI Mode in Search ก็กลายเป็นพื้นผิวผลิตภัณฑ์สำคัญเช่นกัน
- AI ไม่ได้ถูกใช้แค่เป็นฟีเจอร์ของผลิตภัณฑ์ แต่ยังเป็นเครื่องมือแก้ปัญหาด้านวิทยาศาสตร์และการวิจัยด้วย
เซสชัน 21 - A fireside chat on the evolution of the developer craft
- ในยุค AI งานของนักพัฒนากำลังย้ายจากการเขียนโค้ดไปสู่ การออกแบบระบบ, การทำเอกสาร, และการ orchestration
- แม้จะมีเครื่องมือและโมเดลใหม่ออกมาต่อเนื่อง แต่ไม่จำเป็นต้องตามทุกเทรนด์ทันที และควรเลือกเครื่องมือที่จะเรียนรู้อย่างตั้งใจ
- การนำเอเจนต์เข้าทีมคล้ายกับการรับวิศวกรจูเนียร์หลายคนเข้ามา จึงทำให้เอกสารภายในและบันทึกการตัดสินใจด้านการออกแบบยิ่งสำคัญขึ้น
- การสร้าง agentic workflow ที่ดีต้องกำหนดความรับผิดชอบของเอเจนต์แต่ละตัว วิธีสนทนาระหว่างหลายเอเจนต์ และตำแหน่งที่มนุษย์จะกำกับดูแล
- UX ของเครื่องมือเขียนโค้ดหลายตัวกำลังคล้ายกันมากขึ้น ทำให้รูปแบบที่เรียนรู้จากเครื่องมือหนึ่งย้ายไปใช้อีกเครื่องมือได้
- เมื่อต้องทำงานกับเอเจนต์ ต้องยอมปล่อยการควบคุมเส้นทางบางส่วน และหันไปจัดสมดุลผลลัพธ์กับเจตนาการออกแบบ
- technical debt, cognitive debt และ intent debt อาจดีขึ้นเร็วขึ้นหรือแย่ลงเร็วขึ้นด้วย AI
- การรัน 20 เอเจนต์ พร้อมกันอาจเกินขีดความสามารถด้านการรับรู้ของมนุษย์ จึงต้องบริหารอย่างตั้งใจ
- นิสัยการเขียน prompt ที่ดีจะเปลี่ยนจากการพิมพ์คำค้นแบบเป็นชิ้น ๆ ไปเป็นการระบุเป้าหมายและบริบทให้ครบถ้วน
- สิ่งที่สำคัญกว่าคำถามว่า “เขียนโค้ดทุกบรรทัดเองหรือไม่” คือ “มีบริบทและระบบตรวจสอบที่ทำให้เอเจนต์ทำงานได้หรือไม่”
เซสชัน 22 - Build core skills to thrive as an AI-era developer
- แม้ในยุค AI ความสามารถพื้นฐานด้านวิศวกรรมซอฟต์แวร์ก็ยิ่งสำคัญมากขึ้น
- AI อาจเป็น force multiplier ได้ แต่การประเมิน ผสานรวม และบำรุงรักษาผลลัพธ์ยังต้องอาศัยความเชี่ยวชาญเชิงลึก
- ยิ่งเอเจนต์ทำงานได้อย่างอิสระมากขึ้น ก็ยิ่งต้องมีการ shift-left ที่ทำให้ intent ชัดเจนตั้งแต่เนิ่นๆ
- System Design ขยายความหมายให้ครอบคลุมถึงสภาพแวดล้อม ผู้คน เอเจนต์ เครื่องมือ และวัฒนธรรม
- ทีมไม่ควรใช้เอเจนต์แบบ out-of-box เท่านั้น แต่ต้องสร้างและดูแล agent role, profile, recipe, rule, skill ด้วยตนเอง
- Specs, agent rules และ skills จะกลายเป็น source of truth ที่ส่งต่อ what และ why ของระบบให้เอเจนต์
- การสร้าง realistic eval ต้องอาศัยทั้งความสามารถด้าน AI วิศวกรรมซอฟต์แวร์ ผู้ใช้ และธุรกิจร่วมกัน
- ต้องสร้าง feedback loop ที่วิเคราะห์ agent trace เพื่อปรับปรุงการใช้งานเครื่องมือ agent skill และการออกแบบระบบ
- วิศวกรที่เป็นมนุษย์จะเปลี่ยนบทบาทจาก conductor ของเอเจนต์รายตัว ไปเป็น orchestrator ของทีมเอเจนต์อะซิงโครนัสหลายตัว
- หากต้องการมองระบบจากมุมของผู้ไม่หวังดี ก็สามารถกำหนด red team agent ไว้อย่างชัดเจนได้
เซสชัน 23 - Software engineering at the tipping point
- เมื่อ AI ทำให้การเขียนโค้ดเร็วขึ้น ระบบนิเวศการพัฒนาทั้งหมดก็จะเผชิญแรงกดดันในระดับ software ecology
- Google มีโครงสร้างที่โค้ดทั้งหมดรวมถึง Android และ Chrome อยู่ใน monorepo ที่ใช้ร่วมกัน และคอมมิตเข้า trunk
- Google ใช้เครื่องมือภายในมานานแล้วที่ทำให้นักพัฒนาคนหนึ่งสามารถแก้ไขโค้ดได้เป็นหลักล้านบรรทัด
- มีความเป็นไปได้สูงว่าระบบนิเวศการพัฒนาในปัจจุบันจะรองรับ ความเร็วเพิ่มขึ้น 10 เท่า ไม่ไหว
- หากเอเจนต์ทำให้เกิดการคอมไพล์ การทดสอบ การคอมมิต และการใช้โทเค็นมากขึ้น ต้นทุนโครงสร้างพื้นฐานและคอขวดก็จะยิ่งเพิ่มขึ้น
- เอเจนต์อาจสร้างโค้ดที่เขียนได้ง่าย แต่ไม่จำเป็นต้องเป็นโค้ดที่มนุษย์ดูแลรักษาได้ง่าย
- จำเป็นต้องมี agentic skill ด้าน component reuse และ component isolation ที่บังคับให้เกิดการนำกลับมาใช้ซ้ำและการแยกส่วน
- API และการเข้าถึงข้อมูลต้องป้องกันให้แข็งแกร่งราวกับว่าเปิดเผยต่อเอเจนต์โดยพฤตินัย
- ประโยค “agents will find things you probably didn't want them to” สะท้อนความเสี่ยงของการออกแบบสิทธิ์การเข้าถึง
- ในระบบนิเวศการพัฒนาปี 2030 วิธีการในปัจจุบันอาจดูล้าสมัยเหมือนยุค CD-ROM ในปี 2001
เซสชัน 24 - Vibe once, run anywhere with Google Antigravity and Flutter
- เมื่อใช้ Antigravity ร่วมกับ Flutter ก็สามารถขยายไอเดียที่สร้างครั้งเดียวไปยังหลายแพลตฟอร์มได้
- ตั้งแต่ช่วงเปิดตัว Gemini 3 ความสามารถของโมเดลก็เพิ่มขึ้นอย่างมาก และ Antigravity รองรับความสามารถนั้นมาตั้งแต่ต้น
- Antigravity ให้ความสำคัญกับ feedback loop ที่เชื่อมการวางแผน การดำเนินการ และการตรวจสอบเข้าด้วยกันอย่างแน่นหนา
- Antigravity สร้าง task list และ implementation plan ระหว่างดำเนินการจะบันทึก screenshot และ video และเมื่อเสร็จแล้วจะเขียนรายงานที่อธิบายทั้งสิ่งที่ทำและเหตุผล
- ในขั้นตอนการตรวจสอบ จะมีการรันแอป ถ่าย screenshot คลิกปุ่มใน Chrome และรันทดสอบต่อเนื่องกัน
- ใน Flutter ความเป็น strongly typed ของ Dart และ analysis server จะส่งสัญญาณข้อผิดพลาดเชิงวัตถุ เช่น function signature และรูปแบบคลาส ให้กับ LLM
- Flutter คือ cross-platform UI toolkit ที่มอบพิกเซลและฟังก์ชันเดียวกันบนหลายหน้าจอ
- stateful hot reload ของ Flutter มอบประสบการณ์พัฒนาที่รีบิลด์แอประหว่างรันได้ในเวลา น้อยกว่า 1 วินาที
- ยิ่งเอเจนต์สร้างโค้ดมากขึ้น มนุษย์ก็ยิ่งต้องกำหนดเป้าหมายการออกแบบและทิศทางของผลิตภัณฑ์ รวมถึงตรวจทานผลลัพธ์จากเอเจนต์
- Antigravity มอบลูปการทำงานของเอเจนต์ ส่วน Flutter มอบผลลัพธ์ที่สม่ำเสมอบนหลายแพลตฟอร์ม จึงเกิดเวิร์กโฟลว์ “vibe once, run anywhere”
1 ความคิดเห็น
Flash แพงเกินไป ตอนนี้ฉันจะไปอยู่กับการโฮสต์ gemma บน OpenRouter ตลอดกาล