2 คะแนน โดย xguru 1 시간 전 | 1 ความคิดเห็น | แชร์ทาง WhatsApp
  • แกนหลักคือ Gemini 3.5 Flash, Gemini Omni Flash, Antigravity 2.0, Google AI Studio, Gemma 4, Android 17, Chrome/Web, Firebase, Google Play, และ ทักษะของนักพัฒนาในยุค AI
  • Google ไม่ได้เน้นแค่การเปิดตัวโมเดลเท่านั้น แต่ยังชู เวิร์กโฟลว์การพัฒนาที่เอเจนต์เข้าถึงผลิตภัณฑ์จริง เบราว์เซอร์ คลาวด์ แอปมือถือ ข้อมูล เอกสาร และสภาพแวดล้อมการทดสอบได้จริง ขึ้นมาเป็นศูนย์กลาง
  • เครื่องมือพัฒนาก้าวเลยระดับการเขียนโค้ดแทนไปสู่ การวางแผน การลงมือทำ การตรวจสอบ การดีบัก การดีพลอย การประเมินผล และการประสานงานเอเจนต์หลายตัว
  • ทั้ง Android, Flutter, Chrome, Firebase และ Google Play ต่างขยายไปในแนวทาง ผสาน Gemini และเครื่องมือเอเจนต์เข้าไปในเวิร์กโฟลว์การพัฒนาเดิม
  • มากกว่าการเขียนโค้ด ปัจจัยคอขวดที่ใหญ่กว่ากลายเป็น ต้นทุนการตรวจสอบ การให้บริบท สิทธิ์เข้าถึงเครื่องมือ การสังเกตการณ์รันไทม์ โครงสร้างพื้นฐานการทดสอบ รวมถึงการจัดทำเอกสารและการออกแบบระบบขององค์กร

เซสชัน 1 - Google keynote

  • ทุกเดือนมีผู้คน มากกว่า 8.5 ล้านคน สร้างแอปและประสบการณ์ด้วยโมเดลของ Google
  • Model API ของ Google ประมวลผลได้ราว 1.9 หมื่นล้านโทเค็น ต่อนาที
  • การใช้งาน AI Search:
    • AI Overviews มีผู้ใช้ มากกว่า 2.5 พันล้านคนต่อเดือน
    • AI Mode มีผู้ใช้ มากกว่า 1 พันล้านคนต่อเดือน
  • ผู้ใช้ที่ใช้งานต่อเดือนของ Gemini app เพิ่มจาก 400 ล้านคน ใน I/O ปีที่แล้ว เป็น มากกว่า 900 ล้านคน
  • มีการสร้างภาพด้วยโมเดล Nano Banana ไปแล้ว มากกว่า 5 หมื่นล้านภาพ
  • Gemini 3.5 Flash ใช้งานได้ทั้งในผลิตภัณฑ์และ API โดยมีจุดเด่นหลักคือความเร็วในการทำงานและความคุ้มค่าด้านต้นทุน
  • Gemini Omni Flash เป็นโมเดลตัวแรกในตระกูล Omni โดยมุ่งขยายการรองรับอินพุตและเอาต์พุตแบบมัลติโหมดให้กว้างขึ้น
  • Antigravity 2.0 เป็นแอปเดสก์ท็อปแบบสแตนด์อโลนที่ใช้งานได้ทั่วโลก โดยรวมการสนทนากับเอเจนต์ โปรเจกต์ และการจัดการงานไว้ในหน้าจอเดียว
  • เดโมขนาดใหญ่ของ Antigravity:
    • ใช้ เอเจนต์ย่อย 93 ตัว, การเรียกโมเดลมากกว่า 15,000 ครั้ง, และ 2.6 พันล้านโทเค็น เพื่อสร้างแกนหลักของระบบปฏิบัติการที่ทำงานได้จากโปรเจกต์ว่างเปล่า
    • รันได้ด้วย เครดิต API ไม่ถึง 1,000 ดอลลาร์ โดยอาศัยประสิทธิภาพและความคุ้มค่าของ Gemini 3.5 Flash

เซสชัน 2 - Developer keynote

  • Google นำเสนอแนวทางที่รวม โมเดล เครื่องมือเอเจนต์ แพลตฟอร์มผู้ใช้ และโครงสร้างพื้นฐาน เข้าด้วยกันสำหรับนักพัฒนา
  • Managed agents จะเข้ามาอยู่ใน Gemini API และสามารถใช้ agent harness แบบเดียวกับ Antigravity ได้ในรูปแบบ API
  • Google Antigravity 2.0 เป็นแอปเดสก์ท็อปที่ยึดเอเจนต์เป็นศูนย์กลาง โดยมีโครงสร้างที่ให้งานพัฒนาถูกแบ่งไปจัดการโดยเอเจนต์หลายตัว
  • สามารถปรับแต่งและดีพลอยเวิร์กโฟลว์เอเจนต์ได้โดยตรงด้วย Antigravity SDK
  • ใน Google AI Studio ผู้ใช้ใหม่สามารถดีพลอยขึ้น Cloud Run ได้ทันทีโดยไม่ต้องใช้บัตรเครดิต
  • การเชื่อมต่อกับ Google Workspace ทำให้ AI Studio ใช้ข้อมูลจาก Workspace ได้ภายในเวิร์กโฟลว์การสร้างแอป
  • ตอนนี้สามารถสร้าง แอป Android จากไอเดียได้โดยตรงใน Google AI Studio
  • Gemma 4:
    • ให้บริการภายใต้ไลเซนส์ Apache 2
    • ทำยอด 100 ล้านดาวน์โหลด ได้ในเดือนแรก
    • ยอดดาวน์โหลดรวมของ Gemma เพิ่มเป็น มากกว่า 500 ล้านครั้ง
  • Chrome DevTools for Agents ใช้งานได้กับ Antigravity และเอเจนต์เขียนโค้ด มากกว่า 20 ตัว
  • มีการ fine-tune Gemma 4 ด้วย LoRA เพื่อสร้างคำตอบคำสั่ง bash ที่ใช้ได้ทันทีใน CI pipeline และนำไปดีพลอยบนโน้ตบุ๊กภายในเครื่อง

เซสชัน 3 - Agent-first workflows from prompt to production

  • หลังจากดีพลอยแอปที่สร้างใน AI Studio ด้วย Cloud Run และ Firebase แล้ว ยังเชื่อมต่อไปถึงการดีบักและการวิเคราะห์ในขั้นตอนปฏิบัติการผ่านเวิร์กโฟลว์เอเจนต์ได้
  • เอเจนต์เข้าถึงเครื่องมือและข้อมูลของ Google Cloud ได้ผ่าน managed MCP server มากกว่า 50 ตัว
  • Developer Knowledge MCP นำข้อมูลล่าสุดจากเอกสารของ Google เข้าไปในเครื่องมือเอเจนต์ เพื่อลดปัญหาเอกสารล้าสมัย
  • สแนปช็อตเอกสารล่าสุดจะถูกส่งเข้าเครื่องมือเอเจนต์ประมาณทุก 8-12 ชั่วโมง
  • ใช้ Data Agent Kit และ BigQuery MCP เพื่อวิเคราะห์ Firestore, BigQuery และข้อมูลล็อก รวมถึงสร้างแดชบอร์ด
  • Antigravity สามารถตรวจสอบข้อผิดพลาดของแอป ค้นหาไฟล์ที่เกี่ยวข้อง แก้ไข และต่อเนื่องไปถึงการคอมมิตบน GitHub ได้
  • remediation agent และ CI agent ที่ดีพลอยบน Cloud Run เชื่อมต่อกับ Eventarc, Pub/Sub และ Gemini เพื่อตรวจสอบและแก้ไขข้อผิดพลาด
  • เอเจนต์หลายตัวส่งต่องานถึงกันในรูปแบบ A2A(agent-to-agent)
  • การพัฒนาเอเจนต์ไม่ได้จบแค่การสร้างต้นแบบ แต่ขยายไปถึง การดีพลอย การมอนิเตอร์ การวิเคราะห์ข้อมูล และการกู้คืนอัตโนมัติ

เซสชัน 4 - What’s new in Android

  • Android 17 เพิ่มข้อจำกัดด้านหน่วยความจำและเครื่องมือที่เกี่ยวข้อง เพื่อไม่ให้การใช้หน่วยความจำมากเกินไปของแอปทำลายประสบการณ์ผู้ใช้
  • Android 17 กำหนดเงื่อนไขอย่าง excessive memory, cold start และ excessive CPU ให้เป็นเป้าหมายสำหรับการวิเคราะห์อัตโนมัติ
  • แอปที่กำหนดเป้าหมายเป็น Android 17 จำเป็นต้องมีสิทธิ์ ACCESS_LOCAL_NETWORK หากต้องการค้นหาและเชื่อมต่ออุปกรณ์ในเครือข่ายภายใน
  • Google เดินหน้าตอกย้ำทิศทางการสร้าง Android UI ด้วย Jetpack Compose
  • Compose 1.10 และ Compose 1.11 มีทั้งการปรับปรุงด้านประสิทธิภาพ, hybrid UI และ API ใหม่
  • การเชื่อมต่อ AppFunctions กับ Gemini ยังอยู่ในขั้นพรีวิวแบบปิด และทำให้แอปสามารถเป็นเป้าหมายการ orchestration ของ Gemini ได้
  • สามารถทดสอบฟีเจอร์ใหม่บางส่วนได้ผ่าน Developer Preview ของ ML Kit Prompt API
  • Android 17 มาพร้อม Eclipsa Video, การปรับปรุงคุณภาพเสียง HE-AAC และการปรับปรุงด้านกล้องและสื่อบนพื้นฐานของ CameraX และ Media3
  • แอปจอใหญ่กำลังขยับไปสู่แนวทางที่ยึดข้อจำกัดแบบมือถือเดิมน้อยลง โดยใช้ Navigation 3 และไลบรารี Compose Adaptive
  • Compose 1.6 สำหรับ Wear OS รองรับ Navigation 3 และ mode manager ที่ช่วยจัดการคอนเทนต์ในสถานะประหยัดพลังงาน

เซสชัน 5 - What’s new in Chrome

  • Chrome มุ่งเน้นให้เว็บไซต์ทำงานได้ดีสำหรับผู้ใช้ที่ใช้งาน เอเจนต์และเครื่องมือแบบเอเจนต์
  • แทนที่จะพึ่งพาเฉพาะความรู้พื้นฐานของโมเดล Chrome ต้องการเชื่อม Baseline และความสามารถเว็บล่าสุดเข้ากับเครื่องมือพัฒนา
  • ตั้งแต่ปีที่แล้วมี 55 ฟีเจอร์ ที่เข้าสู่สถานะ Baseline Widely Available
  • ณ เวลาที่ประกาศ มี 52 ฟีเจอร์ อยู่ในสถานะ Baseline Newly Available
  • เนื่องจาก Chrome อัปเดตทุก 4 สัปดาห์ หากเอเจนต์เขียนโค้ดไม่รู้จักฟีเจอร์เว็บล่าสุด ก็มีแนวโน้มจะสร้าง implementation แบบล้าสมัยได้ง่าย
  • Prompt API ของ Chrome จะพร้อมใช้งานใน Chrome 148
  • Navigation API, View Transitions, HTML-in-Canvas และ declarative partial updates ถูกนำเข้ามาอยู่ในเวิร์กโฟลว์การพัฒนา
  • นักพัฒนา Chrome extension จะสามารถตรวจสอบและดีบักการติดตั้ง, service worker, side panel และ popup ได้แบบอัตโนมัติ
  • Chrome กำลังขยายไปสู่แนวทางที่ให้เอเจนต์เข้าถึง skill ระดับสูง เช่น web performance, identity, security และคู่มือกรณีใช้งานทั่วไป มากกว่า 100 แบบ
  • หากต้องการลดการทำซ้ำของแพตเทิร์นความเข้ากันได้แบบเก่า จำเป็นต้องป้อนข้อมูลฟีเจอร์เว็บล่าสุดและข้อมูลการรองรับของเบราว์เซอร์ให้เอเจนต์

เซสชัน 6 - มีอะไรใหม่ใน Google AI

  • ตระกูลโมเดล Gemini เป็นตระกูลโมเดลแบบมัลติโหมดที่รองรับอินพุตข้อความ รูปภาพ เสียง วิดีโอ และโค้ด รวมถึงเอาต์พุตได้หลายรูปแบบ
  • บทบาทของ Gemini 3.5 Pro และ Flash:
    • Gemini 3.5 Pro เน้นการแก้ปัญหาที่ซับซ้อน
    • Gemini 3.5 Flash รับบทด้านความสมดุลของประสิทธิภาพ ความเร็ว และต้นทุน
  • ฟีเจอร์ Build ของ AI Studio ใช้ 3.5 Flash เป็นโมเดลเริ่มต้น
  • สามารถทดลองใช้ Nano Banana 2 ได้โดยตรงใน AI Studio
  • Gemini Omni Flash เป็นโมเดลที่สามารถสร้างเอาต์พุตซึ่งรวมถึงวิดีโอจากอินพุตได้
  • Gemini Live และ Live API รองรับการโต้ตอบด้วยเสียง
  • Interactions API เป็นฟีเจอร์สำหรับโต้ตอบกับเอเจนต์ภายใน AI Studio
  • การเข้าถึง Gemma 4:
    • สามารถทดลองได้ใน AI Studio playground
    • ใช้งานการเรียกผ่าน Gemini API ได้ฟรีบางส่วน
    • มี หน้าต่างบริบท 256,000 โทเค็น และสามารถหาได้บน Hugging Face
  • ยังมีการเปิดตัว Gemini Robotics 1.6, Genie 3, Antigravity 2.0 รวมถึงกลยุทธ์ลดต้นทุนด้วยการผสมโมเดลแบบเปิดและโมเดลแบบปิดลิขสิทธิ์เข้าด้วยกัน

เซสชัน 7 - สร้างประสบการณ์ AI ยุคถัดไปด้วย Google AI Studio และ Google Antigravity

  • Google AI Studio ขยายจากการเป็นเพียง model playground ไปสู่พื้นที่สำหรับเปลี่ยนไอเดียให้เป็นแอปและนำไป deploy
  • โมเดล เอเจนต์ การสร้างแอป การเชื่อมต่อกับ Workspace และการ deploy ไปยัง Cloud Run ถูกรวมอยู่ในเวิร์กโฟลว์เดียว
  • ส่วนแอปของ AI Studio จะเปิดให้ใช้งานเร็ว ๆ นี้ และจะรองรับการสร้างและ deploy แอปได้โดยตรงมากขึ้น
  • มีการเพิ่มฟีเจอร์ส่งออกโค้ดที่สร้างใน AI Studio ไปยัง Antigravity ได้ในครั้งเดียว
  • Antigravity 2.0 ไม่ได้มีหน้าที่แค่เขียนโค้ด แต่ยังทำหน้าที่เป็น mission control สำหรับประสานงานหลายงานผ่านเอเจนต์
  • Antigravity 2.0 วาง task list, implementation plan และการตรวจสอบไฟล์ที่เปลี่ยนแปลงเป็นแกนหลักของเวิร์กโฟลว์
  • สามารถจัดการ code review และการตรวจสอบการเปลี่ยนแปลงได้โดยตรงภายใน Antigravity 2.0
  • เป็นโครงสร้างที่มอบงานหนักให้เอเจนต์ เช่น การทดสอบบนเบราว์เซอร์ การวางแผน การเขียนฟีเจอร์หลายไฟล์ และการตรวจสอบแบบ end-to-end
  • สามารถสร้างแอปธุรกิจใหม่ได้ภายในประมาณ 20 นาที ด้วย Google AI Studio และต่อยอดเพิ่มเติมด้วย Antigravity
  • Google AI Studio คือจุดเริ่มต้นแบบรวดเร็วของ “prompt to app” ส่วน Antigravity คือเครื่องมือที่ช่วยยกระดับแอปไปสู่งานพัฒนาจริง

เซสชัน 8 - ปลดล็อกความสามารถเว็บสมัยใหม่ในเวิร์กโฟลว์ AI coding ของคุณ

  • หาก coding agent ไม่รู้จักความสามารถเว็บสมัยใหม่ ก็มีแนวโน้มที่จะสร้างโค้ดตามมาตรฐานความเข้ากันได้ของเบราว์เซอร์แบบเก่า
  • Chrome เปิดตัว 50 ฟีเจอร์ใหม่ ในช่วง 1 ปีที่ผ่านมา แต่เพราะ knowledge cutoff ของโมเดล ทำให้หลายฟีเจอร์ยังไม่ไปถึงตัวโมเดล
  • ในตัวอย่าง Interest Invokers API พบปัญหาที่เอเจนต์ใช้ชื่อแอตทริบิวต์เก่าอย่าง interesttarget
  • Modern Web Guidance คือแพ็กเกจความรู้ที่ช่วยให้เอเจนต์ค้นหาฟีเจอร์เว็บสมัยใหม่และแนวทางการใช้งานที่แนะนำ
  • เอเจนต์จะทำการค้นหาเชิงความหมายภายในแพ็กเกจในเครื่องก่อนตอบ
  • ขนาดและโครงสร้างของไกด์:
    • ปัจจุบันมีไกด์มากกว่า 100 รายการ
    • เป็นโครงสร้างที่ไม่ได้เปิดเผย skill ของแต่ละฟีเจอร์เป็นเครื่องมือระดับบนทั้งหมด แต่จะค้นหาและนำมาใช้เมื่อจำเป็น
  • ไกด์ให้ทั้งแนวทางการใช้งานสมัยใหม่ที่เหมาะสมที่สุด และคำแนะนำ fallback ไปพร้อมกัน
  • หากไม่มีข้อกำหนดเรื่องการรองรับเบราว์เซอร์ เอเจนต์จะถือว่า Baseline Widely Available เป็นสมมติฐานเริ่มต้น
  • หากระบุเงื่อนไขอย่าง “รองรับเฉพาะ Chrome 144 ขึ้นไป” ใน AGENTS.md เอเจนต์จะหลีกเลี่ยง fallback ที่ไม่จำเป็นได้
  • ทีม Chrome รันการประเมินทุกวันกับโมเดลอย่าง Gemini 3.1, Claude Opus 4.7 และ GPT 5.5

เซสชัน 9 - มีอะไรใหม่ใน Firebase

  • Firebase กำลังขยับไปสู่การเป็น agent-native platform ที่ทั้งมนุษย์และเอเจนต์สามารถใช้สร้างและขยายแอปได้
  • Firebase Data Connect พัฒนาไปเป็น Firebase SQL Connect ที่รองรับการพัฒนาแอปบนพื้นฐาน SQL
  • custom resolver ของ Firebase SQL Connect สามารถเชื่อมต่อบริการ Google Cloud อย่าง Cloud Functions และ BigQuery ได้
  • Firestore รองรับ geo search, native full text search และ semantic match
  • Firebase AI Logic รองรับโมเดลรุ่นล่าสุด และสามารถสร้างความสามารถ AI ที่รับรู้ตำแหน่งได้ด้วย Maps grounding
  • ความสามารถควบคุมการสร้างภาพของ Nano Banana ก็ใช้งานได้ใน Firebase AI Logic
  • Firebase AI Logic รองรับการอนุมานแบบ local และ hybrid บน iOS, Chrome และ Android และจะ fallback ไปใช้ cloud-hosted model เมื่อไม่มีโมเดลในเครื่อง
  • Dart support for Cloud Functions in Firebase เปิดให้ใช้งานใน experimental preview
  • AI Studio เชื่อมต่อกับ Google Workspace ทำให้แอปสามารถใช้ข้อมูลจาก Sheets, Docs, Gmail และ Calendar ได้
  • Firebase agent skills ใช้ได้บน Android, iOS, web และ Flutter และยังขยายการรองรับ Crashlytics ด้วย

เซสชัน 10 - มีอะไรใหม่ใน Google Play

  • Play Billing รองรับ วิธีชำระเงินท้องถิ่นมากกว่า 300 แบบ ใน มากกว่า 65 ตลาด
  • Google Play มีผู้ใช้ที่พร้อมซื้อกว่า 890 ล้านคน
  • มีการขยายตัวเลือกที่ให้ใช้งานทั้ง Google Play Billing และการชำระเงินทางเลือกควบคู่กันได้ พร้อมทั้งมีการประกาศค่าธรรมเนียมบริการที่ต่ำลง
  • การค้นพบแอปขยายไปยัง Gemini app, Android และเว็บ ทำให้ผู้ใช้ค้นหาแอปและเกมได้ภายใน Gemini
  • Gemini แนะนำแอปโดยอาศัยความสามารถจริงของแอปและข้อมูล store listing แทนการแสดงรายการลิงก์แบบคงที่
  • ในบางหัวข้อ ผู้ใช้ Gemini และ Play สามารถสำรวจคอนเทนต์ภาพยนตร์และทีวีได้มากกว่า 450,000 รายการ
  • ใน Play Console หากอัปโหลดไฟล์แบบมีโครงสร้าง เช่น Eclipsa Video หรือ Google Sheets, Gemini จะช่วยกรอก listing ล่วงหน้า
  • Gemini เตรียมช่วยงานใน Play Console เช่น bulk price changes, import skills และ metadata configuration
  • ด้วย in-app subscription management API ผู้ใช้สามารถเปลี่ยนแพ็กเกจสมาชิกได้ง่ายภายในแอป
  • ปีที่แล้ว Google Play Billing ป้องกันความพยายามฉ้อโกงได้ 3.4 พันล้านดอลลาร์ และ abusive refunds ได้ 130 ล้านดอลลาร์

เซสชัน 11 - นิยามยุคของ agentic AI

  • Gemini, Search, แอป Gemini และ Google DeepMind ต่างขับเคลื่อน AI แบบ agentic ไปในทิศทางเดียวกัน
  • Gemini 3.5 Flash สามารถใช้งานได้ภายใน Search ด้วย
  • Search ต้องหาสมดุลระหว่างคำตอบที่รวดเร็วกับ agentic task ที่ยาวกว่า
  • Gemini Spark ทำหน้าที่เป็น always-on agent ที่คอยจัดการงานที่ผู้ใช้ฝากไว้เบื้องหลัง
  • โมเดลต้องทำงานได้ครอบคลุมทั้งผลิตภัณฑ์ของ Google และ ecosystem ภายนอก ไม่ใช่แค่ตอบแชตอย่างเดียวอีกต่อไป
  • เครื่องมือภายในที่แปลจาก Python ไปเป็น Go:
    • งานแปลโปรแกรมเดิมที่มีชุดทดสอบอยู่แล้วไปเป็นภาษาอื่น เป็นปัญหาที่ชัดเจนกว่าสำหรับโมเดล
    • เครื่องมือภายในบางตัวเร็วขึ้น 10-20 เท่า ภายในชั่วข้ามคืน
  • โครงสร้างพื้นฐานซอฟต์แวร์ภายในของ Google ก็อาจปรับเปลี่ยนได้เร็วขึ้นเพื่อให้เข้ากับโลกแบบ agentic ใหม่นี้
  • ฮาร์ดแวร์ ขนาดโมเดล การนำไปใช้ในผลิตภัณฑ์ และ feedback loop ต้องทำงานสอดประสานกัน เพื่อให้ Gemini เข้าไปอยู่ในผลิตภัณฑ์ทั้งหมดของ Google ได้
  • จุดโฟกัสของคำถามกำลังย้ายจาก “โมเดลทำอะไรได้บ้าง” ไปเป็น “จะวางโมเดลลงในผลิตภัณฑ์และเวิร์กโฟลว์อย่างไร”

เซสชัน 12 - What’s new in Android development tools

  • เครื่องมือพัฒนา Android ถูกออกแบบโดยคำนึงไม่ใช่แค่นักพัฒนาที่เป็นมนุษย์ แต่รวมถึง AI agent ที่จะถูกนำไปใช้งานใน codebase ด้วย
  • Android Studio Otter รองรับบัญชี Gemini Enterprise และ Google One
  • Android Studio สามารถนำโมเดลแบบโลคัลและโมเดลระยะไกลมาใช้ได้
  • Android Bench ทำหน้าที่เป็นเกณฑ์สำหรับตัดสินว่าจะใช้โมเดลใดกับงานพัฒนา Android
  • สามารถขอให้แปลง UI ได้โดยตรงจาก Compose Preview เพื่อให้เอเจนต์ทำงานด้วยบริบทที่ดีขึ้น
  • สามารถใช้ agent-based new project wizard เพื่อสร้างแอป Android แบบ adaptive ได้ด้วย prompt เพียงอย่างเดียว
  • Android Studio มี skill ราว 10 รายการ ที่ช่วยงานอย่างการรวม adaptive API และการแปลงจาก XML ไปเป็น Compose
  • Android CLI ใหม่รองรับเวิร์กโฟลว์ LLM และในการสร้างโปรเจกต์ใหม่ใช้โทเค็นน้อยกว่าเครื่องมือ Gradle LLM อื่น ๆ มากกว่า 70%
  • สามารถรวม Antigravity CLI, Android CLI และ Android skill เข้าด้วยกัน เพื่อเริ่มพัฒนาแอป Android ใน Antigravity ได้เช่นกัน
  • ใน Android Studio Quail และอุปกรณ์ Android 17 การเชื่อมต่ออุปกรณ์จะยังคงอยู่แม้เปลี่ยนเครือข่ายหรือรีสตาร์ตโน้ตบุ๊ก

เซสชัน 13 - What’s new in Flutter

  • เปิดตัว Flutter 3.44 พร้อมกับ Dart 3.12
  • ปีนี้มี contributor มากกว่า 1,700 คน เข้าร่วมในโปรเจกต์ Flutter
  • มีนักพัฒนามากกว่า 1.5 ล้านคน สร้างงานด้วย Flutter ในแต่ละเดือน
  • ใน Flutter 3.44 สามารถทดลอง rendering mode ใหม่ได้บนอุปกรณ์ Android ที่รองรับ Vulkan และใช้ Android API 34 ขึ้นไป
  • Flutter ถูกนำไปใช้ในระบบ infotainment ของ Toyota 2026 RAV4
  • Cloud Functions for Firebase ที่ใช้ Dart มีกรณีที่ลด cold start ได้ต่ำถึง 10ms ด้วย AOT compilation
  • Firebase AI Logic เพิ่ม server prompt template เข้ามา ทำให้ไม่จำเป็นต้องใส่ prompt ไว้ตรง ๆ ภายในแอป
  • Firebase Agent Skills for Flutter มอบแนวทางให้เอเจนต์สำหรับการสร้างแอป Flutter และ Firebase แบบ full-stack
  • รองรับ LiteRT-LM ในแพ็กเกจ flutter_gemma เร็ว ๆ นี้
  • บน Flutter desktop นั้น Canonical เข้าร่วมเป็นทั้ง lead maintainer และ strategic steward

เซสชัน 14 - What’s new in the Gemma open model family

  • Gemma 4 ขึ้นเป็นโมเดลสาธารณะที่ทรงพลังที่สุดในตระกูล Gemma
  • มีให้เลือกหลายขนาดตั้งแต่ 2B ถึง 31B ใช้งานได้ทั้งบนมือถือ โน้ตบุ๊ก และคลาวด์
  • Gemma เริ่มต้นในปี 2024 ด้วยตระกูลโมเดลตั้งแต่ 1B ถึง 27B
  • Gemma 4 เป็นโมเดลแบบ open weight และเข้ากันได้กับ ecosystem โอเพนซอร์ส
  • ด้วย MTP และ speculative decoding ทำให้เพิ่ม decode speed ได้สูงสุด 3 เท่า
  • มี day-zero implementation ของ Gemma 4 พร้อมสำหรับ ecosystem ของ Android
  • ผ่าน Android API สามารถรันโมเดล Gemma ขนาดเล็กบนโทรศัพท์ได้โดยตรง หรือใช้โมเดล Gemma แบบโลคัลเพื่อเขียนแอป Android ในสภาพแวดล้อมที่เข้าถึง Gemini API ได้ยาก
  • ใช้ ADK(agent development kit) บน Cloud Run ร่วมกับ Gemma 31B เพื่อสร้างเอเจนต์ที่เข้าใจฐานข้อมูลและค้นหาคำตอบได้
  • Gemma 4 สามารถรันในเบราว์เซอร์หรือสภาพแวดล้อมโลคัลผ่านอินเทอร์เฟซที่เข้ากันได้กับ OpenAI ของ Transformers.js, Ollama และ LM Studio
  • คลาวด์สำหรับองค์กร เครื่องภายใน เบราว์เซอร์ และมือถือ ล้วนกลายเป็นสภาพแวดล้อมสำหรับรัน Gemma ได้

เซสชัน 15 - What’s new in Web UI

  • การอัปเดต Web UI ปี 2026 ครอบคลุมฟีเจอร์หลักพร้อมสถานะ Baseline
  • ทุกฟีเจอร์มีป้ายความเข้ากันได้ เช่น Baseline Widely Available, Newly Available และ Limited Available
  • ด้วย contrast-color API ทำให้เลือกสีที่มีคอนทราสต์เหมาะสมใน CSS ได้ง่ายขึ้น
  • ฟีเจอร์ meta name="text-scale" ใน Chrome 146 รองรับการตั้งค่าขนาดตัวอักษรของระบบ
  • ผู้ใช้ทั้ง Android และ iOS มากกว่า 30% เปลี่ยนขนาดตัวอักษรเริ่มต้น
  • ตั้งแต่ Chrome 134 เป็นต้นมา dialog element รองรับความสามารถอย่าง declarative light dismiss ของ popover
  • สามารถทดลอง two-phase View Transitions ได้ใน Chrome Canary
  • scroll-driven animations เข้ามาใน Chrome ตั้งแต่ปี 2023 และ Interop 2026 ช่วยเพิ่มความสามารถในการทำงานร่วมกัน
  • HTML-in-Canvas API ทำให้สามารถใส่เนื้อหา DOM จริงลงไปใน Canvas ได้
  • ใน Chrome 149 มีการเพิ่มรูปแบบการใช้งานใหม่ของ gap decorations และ shape outside

เซสชัน 16 - Adaptive development for the expanding Android ecosystem

  • Android ไม่ได้เป็นระบบนิเวศสำหรับมือถือเท่านั้นอีกต่อไป และอุปกรณ์หน้าจอใหญ่ที่เปิดใช้งานอยู่ มากกว่า 580 ล้านเครื่อง ได้รับผลจากการลงทุนใน adaptive app
  • ผู้ใช้ foldable ถูกจัดว่าเป็นกลุ่มผู้ใช้มูลค่าสูงกว่าใน adaptive app
  • ใน Android 17 มีแนวโน้มจะยกเลิกการ opt-out ของ orientation และ resizability สำหรับแอปที่กำหนด target SDK 37
  • Desktop emulator ใน Android Studio Quail Canary รองรับการทดสอบแอป Android ในรูปแบบเดสก์ท็อป
  • Continue On API ของ Android 17 ช่วยให้ผู้ใช้ทำสิ่งที่ค้างไว้บนอุปกรณ์หนึ่งต่อบนอุปกรณ์ที่สองได้
  • Google กำลังเร่งแนวทางการสร้างแอป Android แบบ Compose-first
  • Compose 1.11 ปรับปรุงการรองรับ trackpad ให้ดีขึ้นในระดับ mouse และ pointer และเพิ่ม API สำหรับการทดสอบ non-touch input
  • ใน Compose มีการเพิ่ม experimental API สำหรับ state-based styling
  • Connected Displays เปิดให้ใช้งานทั่วไปผ่าน Android Feature Drop
  • Compose, Navigation 3 และไลบรารี Compose Adaptive รองรับหลายหน้าจอ เช่น foldable, desktop, car, TV และ XR

เซสชัน 17 - Building the quantum-AI future with Hartmut Neven and James Manyika

  • ประเด็นหลักคือแนวโน้มที่ quantum computing และ AI เร่งความก้าวหน้าซึ่งกันและกัน
  • Hartmut Neven เริ่มทีม Quantum AI ของ Google ในปี 2012
  • superposition และ qubit เป็นรากฐานของ quantum computing
  • จำนวน bit string ที่เป็นไปได้บนชิป 105 qubit คือ 2 ยกกำลัง 105
  • ขณะนี้ชุมชนได้ระบุอัลกอริทึมและปัญหาที่ quantum computer สามารถแก้ได้อย่างมีประโยชน์แล้ว มากกว่า 70 รายการ
  • ในอนาคตจำนวนดังกล่าวอาจเพิ่มขึ้นมากกว่า 10 เท่า
  • quantum error correction เป็นเทคโนโลยีหลักที่จำเป็นต่อการรักษาสถานะ superposition
  • Google ประสบความสำเร็จในการลดข้อผิดพลาดของเครื่องจริงด้วย quantum error correction ในปี 2022
  • Quantum Echoes เชื่อมโยงกับแนวทางการเรียนรู้จากข้อมูลที่ได้จาก NMR หรือ MRI
  • Google เสนอว่าควรเร่งการเปลี่ยนผ่านสู่ post-quantum cryptography ให้แข็งแกร่งขึ้นภายในปี 2029

เซสชัน 18 - Scale AI with Google’s TPU software stack

  • กล่าวถึงซอฟต์แวร์สแต็กโอเพนซอร์สสำหรับ การฝึก, การปรับจูนละเอียด, และการอนุมาน โมเดลบน TPU
  • เวิร์กโฟลว์การพัฒนาโมเดลแบ่งเป็น pre-training, post-training และ serving/inference
  • สามารถลองทำ post-training และ inference ได้ด้วย TPU ฟรีบน Kaggle และ Colab
  • เดโม vLLM on TPU รันโมเดล Gemma 4 31B บน TPU และสรุปข้อมูลโภชนาการจากภาพอาหาร
  • Gemma 4 เป็นโมเดลมัลติโหมดที่เหมาะกับงานรับภาพ ทำความเข้าใจเนื้อหา และสรุปผล
  • การใส่ MTP เข้าไปใน TPU inference ของ vLLM ทำให้ได้ความเร็วเพิ่มขึ้นประมาณ 3 เท่า ในหลายงาน
  • Tunix เป็นเฟรมเวิร์กน้ำหนักเบาสำหรับ post-training
  • แทนที่จะใช้โมเดลขนาดใหญ่ มีการ fine-tune โมเดล 4B ให้ทำงานเดียวกันได้ และรันบนชิป Trillium เพียงตัวเดียว
  • MaxText, Tunix, vLLM, JAX, PyTorch และ TPU ถูกจัดวางเป็นเครื่องมือตามแต่ละช่วงของวงจรชีวิตโมเดล

เซสชัน 19 - Supercharge your AI coding workflow with Chrome DevTools for agents

  • Chrome DevTools for agents เป็นเครื่องมือที่ทำให้ coding agent สังเกตรันไทม์ของเบราว์เซอร์ได้โดยตรงผ่าน DevTools
  • เช่นเดียวกับที่นักพัฒนามนุษย์ใช้ DevTools เพื่อเรียนรู้และดีบัก coding agent ก็ควรมี feedback loop แบบปิดเดียวกัน
  • เอเจนต์สามารถเปิดอินสแตนซ์ Chrome จริง ท่องหน้าเว็บ กรอกฟอร์ม และเก็บ console log กับ network request ได้
  • การเข้าถึง source map ช่วยให้ย้ายจากปัญหารันไทม์ไปยังไฟล์ซอร์สที่เกี่ยวข้องได้
  • เครื่องมือนี้ให้มาในรูปแบบ NPM package พร้อมทั้ง MCP server และ CLI
  • มี skill ให้ 6 รายการ:
    • troubleshooting, Chrome DevTools และ Chrome DevTools CLI skill ช่วยเรื่องการใช้งานทั่วไปและแนวคิด
    • accessibility debugging, memory leak debugging และ optimized LCP skill ใส่ความรู้เฉพาะทางให้กับเอเจนต์
  • พื้นฐานการทำงานสร้างบน Puppeteer และเอเจนต์จะใช้ตัวห่อของเครื่องมือแทนการใช้ Puppeteer โดยตรง
  • โดยค่าเริ่มต้นจะใช้โปรไฟล์เบราว์เซอร์แบบไม่ระบุตัวตนแยกต่างหาก และไม่เข้าถึง Chrome password manager
  • CyberAgent ใช้ DevTools for agents ตรวจสอบ 236 Storybook story ของ 32 คอมโพเนนต์ ได้ภายใน 1 ชั่วโมง

เซสชัน 20 - A new era of discovery: AI and the frontiers of science with Demis Hassabis

  • Demis Hassabis ตั้งเป้าหมายดั้งเดิมของ DeepMind ไว้ว่า “solve intelligence”
  • ประเด็นหลักคือแนวโน้มที่ AI กำลังเปลี่ยนการค้นพบทางวิทยาศาสตร์ ผลิตภัณฑ์ และเครื่องมือวิจัย
  • AlphaFold ถูกยกขึ้นมาอีกครั้งในฐานะกรณีตัวอย่างของการแก้ โจทย์ยาก 50 ปี เรื่องโครงสร้างโปรตีน
  • Gemini for Science เชื่อมโยงกับทิศทางของโมเดลเพื่อวิทยาศาสตร์ที่ประกาศในคีย์โน้ต
  • Demis Hassabis อธิบายปัจจุบันว่าเป็นช่วงที่ยืนอยู่บน “foothills of the singularity” และมองว่าช่วงเวลาที่ intelligence ถูกแก้ได้น่าจะอยู่ราว บวกลบ 1 ปีจากปี 2030
  • โมเดลตระกูล Genie ถูกใช้ให้ Waymo ทดสอบสถานการณ์แบบ 1 in a billion ที่แทบไม่เกิดขึ้นจริงบนโลกจริง
  • ความคืบหน้าในการค้นพบยาของ Isomorphic Labs ถูกใช้เป็นตัวอย่างว่า AI เร่งวิทยาศาสตร์ได้อย่างไร
  • แอป Gemini มีผู้ใช้ต่อเดือน 900 ล้านคน และ AI Mode in Search ก็กลายเป็นพื้นผิวผลิตภัณฑ์สำคัญเช่นกัน
  • AI ไม่ได้ถูกใช้แค่เป็นฟีเจอร์ของผลิตภัณฑ์ แต่ยังเป็นเครื่องมือแก้ปัญหาด้านวิทยาศาสตร์และการวิจัยด้วย

เซสชัน 21 - A fireside chat on the evolution of the developer craft

  • ในยุค AI งานของนักพัฒนากำลังย้ายจากการเขียนโค้ดไปสู่ การออกแบบระบบ, การทำเอกสาร, และการ orchestration
  • แม้จะมีเครื่องมือและโมเดลใหม่ออกมาต่อเนื่อง แต่ไม่จำเป็นต้องตามทุกเทรนด์ทันที และควรเลือกเครื่องมือที่จะเรียนรู้อย่างตั้งใจ
  • การนำเอเจนต์เข้าทีมคล้ายกับการรับวิศวกรจูเนียร์หลายคนเข้ามา จึงทำให้เอกสารภายในและบันทึกการตัดสินใจด้านการออกแบบยิ่งสำคัญขึ้น
  • การสร้าง agentic workflow ที่ดีต้องกำหนดความรับผิดชอบของเอเจนต์แต่ละตัว วิธีสนทนาระหว่างหลายเอเจนต์ และตำแหน่งที่มนุษย์จะกำกับดูแล
  • UX ของเครื่องมือเขียนโค้ดหลายตัวกำลังคล้ายกันมากขึ้น ทำให้รูปแบบที่เรียนรู้จากเครื่องมือหนึ่งย้ายไปใช้อีกเครื่องมือได้
  • เมื่อต้องทำงานกับเอเจนต์ ต้องยอมปล่อยการควบคุมเส้นทางบางส่วน และหันไปจัดสมดุลผลลัพธ์กับเจตนาการออกแบบ
  • technical debt, cognitive debt และ intent debt อาจดีขึ้นเร็วขึ้นหรือแย่ลงเร็วขึ้นด้วย AI
  • การรัน 20 เอเจนต์ พร้อมกันอาจเกินขีดความสามารถด้านการรับรู้ของมนุษย์ จึงต้องบริหารอย่างตั้งใจ
  • นิสัยการเขียน prompt ที่ดีจะเปลี่ยนจากการพิมพ์คำค้นแบบเป็นชิ้น ๆ ไปเป็นการระบุเป้าหมายและบริบทให้ครบถ้วน
  • สิ่งที่สำคัญกว่าคำถามว่า “เขียนโค้ดทุกบรรทัดเองหรือไม่” คือ “มีบริบทและระบบตรวจสอบที่ทำให้เอเจนต์ทำงานได้หรือไม่”

เซสชัน 22 - Build core skills to thrive as an AI-era developer

  • แม้ในยุค AI ความสามารถพื้นฐานด้านวิศวกรรมซอฟต์แวร์ก็ยิ่งสำคัญมากขึ้น
  • AI อาจเป็น force multiplier ได้ แต่การประเมิน ผสานรวม และบำรุงรักษาผลลัพธ์ยังต้องอาศัยความเชี่ยวชาญเชิงลึก
  • ยิ่งเอเจนต์ทำงานได้อย่างอิสระมากขึ้น ก็ยิ่งต้องมีการ shift-left ที่ทำให้ intent ชัดเจนตั้งแต่เนิ่นๆ
  • System Design ขยายความหมายให้ครอบคลุมถึงสภาพแวดล้อม ผู้คน เอเจนต์ เครื่องมือ และวัฒนธรรม
  • ทีมไม่ควรใช้เอเจนต์แบบ out-of-box เท่านั้น แต่ต้องสร้างและดูแล agent role, profile, recipe, rule, skill ด้วยตนเอง
  • Specs, agent rules และ skills จะกลายเป็น source of truth ที่ส่งต่อ what และ why ของระบบให้เอเจนต์
  • การสร้าง realistic eval ต้องอาศัยทั้งความสามารถด้าน AI วิศวกรรมซอฟต์แวร์ ผู้ใช้ และธุรกิจร่วมกัน
  • ต้องสร้าง feedback loop ที่วิเคราะห์ agent trace เพื่อปรับปรุงการใช้งานเครื่องมือ agent skill และการออกแบบระบบ
  • วิศวกรที่เป็นมนุษย์จะเปลี่ยนบทบาทจาก conductor ของเอเจนต์รายตัว ไปเป็น orchestrator ของทีมเอเจนต์อะซิงโครนัสหลายตัว
  • หากต้องการมองระบบจากมุมของผู้ไม่หวังดี ก็สามารถกำหนด red team agent ไว้อย่างชัดเจนได้

เซสชัน 23 - Software engineering at the tipping point

  • เมื่อ AI ทำให้การเขียนโค้ดเร็วขึ้น ระบบนิเวศการพัฒนาทั้งหมดก็จะเผชิญแรงกดดันในระดับ software ecology
  • Google มีโครงสร้างที่โค้ดทั้งหมดรวมถึง Android และ Chrome อยู่ใน monorepo ที่ใช้ร่วมกัน และคอมมิตเข้า trunk
  • Google ใช้เครื่องมือภายในมานานแล้วที่ทำให้นักพัฒนาคนหนึ่งสามารถแก้ไขโค้ดได้เป็นหลักล้านบรรทัด
  • มีความเป็นไปได้สูงว่าระบบนิเวศการพัฒนาในปัจจุบันจะรองรับ ความเร็วเพิ่มขึ้น 10 เท่า ไม่ไหว
  • หากเอเจนต์ทำให้เกิดการคอมไพล์ การทดสอบ การคอมมิต และการใช้โทเค็นมากขึ้น ต้นทุนโครงสร้างพื้นฐานและคอขวดก็จะยิ่งเพิ่มขึ้น
  • เอเจนต์อาจสร้างโค้ดที่เขียนได้ง่าย แต่ไม่จำเป็นต้องเป็นโค้ดที่มนุษย์ดูแลรักษาได้ง่าย
  • จำเป็นต้องมี agentic skill ด้าน component reuse และ component isolation ที่บังคับให้เกิดการนำกลับมาใช้ซ้ำและการแยกส่วน
  • API และการเข้าถึงข้อมูลต้องป้องกันให้แข็งแกร่งราวกับว่าเปิดเผยต่อเอเจนต์โดยพฤตินัย
  • ประโยค “agents will find things you probably didn't want them to” สะท้อนความเสี่ยงของการออกแบบสิทธิ์การเข้าถึง
  • ในระบบนิเวศการพัฒนาปี 2030 วิธีการในปัจจุบันอาจดูล้าสมัยเหมือนยุค CD-ROM ในปี 2001

เซสชัน 24 - Vibe once, run anywhere with Google Antigravity and Flutter

  • เมื่อใช้ Antigravity ร่วมกับ Flutter ก็สามารถขยายไอเดียที่สร้างครั้งเดียวไปยังหลายแพลตฟอร์มได้
  • ตั้งแต่ช่วงเปิดตัว Gemini 3 ความสามารถของโมเดลก็เพิ่มขึ้นอย่างมาก และ Antigravity รองรับความสามารถนั้นมาตั้งแต่ต้น
  • Antigravity ให้ความสำคัญกับ feedback loop ที่เชื่อมการวางแผน การดำเนินการ และการตรวจสอบเข้าด้วยกันอย่างแน่นหนา
  • Antigravity สร้าง task list และ implementation plan ระหว่างดำเนินการจะบันทึก screenshot และ video และเมื่อเสร็จแล้วจะเขียนรายงานที่อธิบายทั้งสิ่งที่ทำและเหตุผล
  • ในขั้นตอนการตรวจสอบ จะมีการรันแอป ถ่าย screenshot คลิกปุ่มใน Chrome และรันทดสอบต่อเนื่องกัน
  • ใน Flutter ความเป็น strongly typed ของ Dart และ analysis server จะส่งสัญญาณข้อผิดพลาดเชิงวัตถุ เช่น function signature และรูปแบบคลาส ให้กับ LLM
  • Flutter คือ cross-platform UI toolkit ที่มอบพิกเซลและฟังก์ชันเดียวกันบนหลายหน้าจอ
  • stateful hot reload ของ Flutter มอบประสบการณ์พัฒนาที่รีบิลด์แอประหว่างรันได้ในเวลา น้อยกว่า 1 วินาที
  • ยิ่งเอเจนต์สร้างโค้ดมากขึ้น มนุษย์ก็ยิ่งต้องกำหนดเป้าหมายการออกแบบและทิศทางของผลิตภัณฑ์ รวมถึงตรวจทานผลลัพธ์จากเอเจนต์
  • Antigravity มอบลูปการทำงานของเอเจนต์ ส่วน Flutter มอบผลลัพธ์ที่สม่ำเสมอบนหลายแพลตฟอร์ม จึงเกิดเวิร์กโฟลว์ “vibe once, run anywhere”

1 ความคิดเห็น

 
hmmhmmhm 1 시간 전

Flash แพงเกินไป ตอนนี้ฉันจะไปอยู่กับการโฮสต์ gemma บน OpenRouter ตลอดกาล