ทุกอย่างที่ประกาศใน Google I/O 2026
(io.google)- แกนหลักคือ Gemini 3.5 Flash, Gemini Omni Flash, Antigravity 2.0, Google AI Studio, Gemma 4, Android 17, Chrome/Web, Firebase, Google Play, และ ทักษะของนักพัฒนาในยุค AI
- Google ไม่ได้เน้นแค่การเปิดตัวโมเดลเท่านั้น แต่ยังชู เวิร์กโฟลว์การพัฒนาที่เอเจนต์เข้าถึงผลิตภัณฑ์จริง เบราว์เซอร์ คลาวด์ แอปมือถือ ข้อมูล เอกสาร และสภาพแวดล้อมการทดสอบได้จริง ขึ้นมาเป็นศูนย์กลาง
- เครื่องมือพัฒนาก้าวเลยระดับการเขียนโค้ดแทนไปสู่ การวางแผน การลงมือทำ การตรวจสอบ การดีบัก การดีพลอย การประเมินผล และการประสานงานเอเจนต์หลายตัว
- ทั้ง Android, Flutter, Chrome, Firebase และ Google Play ต่างขยายไปในแนวทาง ผสาน Gemini และเครื่องมือเอเจนต์เข้าไปในเวิร์กโฟลว์การพัฒนาเดิม
- มากกว่าการเขียนโค้ด ปัจจัยคอขวดที่ใหญ่กว่ากลายเป็น ต้นทุนการตรวจสอบ การให้บริบท สิทธิ์เข้าถึงเครื่องมือ การสังเกตการณ์รันไทม์ โครงสร้างพื้นฐานการทดสอบ รวมถึงการจัดทำเอกสารและการออกแบบระบบขององค์กร
เซสชัน 1 - Google keynote
- ทุกเดือนมีผู้คน มากกว่า 8.5 ล้านคน สร้างแอปและประสบการณ์ด้วยโมเดลของ Google
- Model API ของ Google ประมวลผลได้ราว 1.9 หมื่นล้านโทเค็น ต่อนาที
- การใช้งาน AI Search:
- AI Overviews มีผู้ใช้ มากกว่า 2.5 พันล้านคนต่อเดือน
- AI Mode มีผู้ใช้ มากกว่า 1 พันล้านคนต่อเดือน
- ผู้ใช้ที่ใช้งานต่อเดือนของ Gemini app เพิ่มจาก 400 ล้านคน ใน I/O ปีที่แล้ว เป็น มากกว่า 900 ล้านคน
- มีการสร้างภาพด้วยโมเดล Nano Banana ไปแล้ว มากกว่า 5 หมื่นล้านภาพ
- Gemini 3.5 Flash ใช้งานได้ทั้งในผลิตภัณฑ์และ API โดยมีจุดเด่นหลักคือความเร็วในการทำงานและความคุ้มค่าด้านต้นทุน
- Gemini Omni Flash เป็นโมเดลตัวแรกในตระกูล Omni โดยมุ่งขยายการรองรับอินพุตและเอาต์พุตแบบมัลติโหมดให้กว้างขึ้น
- Antigravity 2.0 เป็นแอปเดสก์ท็อปแบบสแตนด์อโลนที่ใช้งานได้ทั่วโลก โดยรวมการสนทนากับเอเจนต์ โปรเจกต์ และการจัดการงานไว้ในหน้าจอเดียว
- เดโมขนาดใหญ่ของ Antigravity:
- ใช้ เอเจนต์ย่อย 93 ตัว, การเรียกโมเดลมากกว่า 15,000 ครั้ง, และ 2.6 พันล้านโทเค็น เพื่อสร้างแกนหลักของระบบปฏิบัติการที่ทำงานได้จากโปรเจกต์ว่างเปล่า
- รันได้ด้วย เครดิต API ไม่ถึง 1,000 ดอลลาร์ โดยอาศัยประสิทธิภาพและความคุ้มค่าของ Gemini 3.5 Flash
เซสชัน 2 - Developer keynote
- Google นำเสนอแนวทางที่รวม โมเดล เครื่องมือเอเจนต์ แพลตฟอร์มผู้ใช้ และโครงสร้างพื้นฐาน เข้าด้วยกันสำหรับนักพัฒนา
- Managed agents จะเข้ามาอยู่ใน Gemini API และสามารถใช้ agent harness แบบเดียวกับ Antigravity ได้ในรูปแบบ API
- Google Antigravity 2.0 เป็นแอปเดสก์ท็อปที่ยึดเอเจนต์เป็นศูนย์กลาง โดยมีโครงสร้างที่ให้งานพัฒนาถูกแบ่งไปจัดการโดยเอเจนต์หลายตัว
- สามารถปรับแต่งและดีพลอยเวิร์กโฟลว์เอเจนต์ได้โดยตรงด้วย Antigravity SDK
- ใน Google AI Studio ผู้ใช้ใหม่สามารถดีพลอยขึ้น Cloud Run ได้ทันทีโดยไม่ต้องใช้บัตรเครดิต
- การเชื่อมต่อกับ Google Workspace ทำให้ AI Studio ใช้ข้อมูลจาก Workspace ได้ภายในเวิร์กโฟลว์การสร้างแอป
- ตอนนี้สามารถสร้าง แอป Android จากไอเดียได้โดยตรงใน Google AI Studio
- Gemma 4:
- ให้บริการภายใต้ไลเซนส์ Apache 2
- ทำยอด 100 ล้านดาวน์โหลด ได้ในเดือนแรก
- ยอดดาวน์โหลดรวมของ Gemma เพิ่มเป็น มากกว่า 500 ล้านครั้ง
- Chrome DevTools for Agents ใช้งานได้กับ Antigravity และเอเจนต์เขียนโค้ด มากกว่า 20 ตัว
- มีการ fine-tune Gemma 4 ด้วย LoRA เพื่อสร้างคำตอบคำสั่ง bash ที่ใช้ได้ทันทีใน CI pipeline และนำไปดีพลอยบนโน้ตบุ๊กภายในเครื่อง
เซสชัน 3 - Agent-first workflows from prompt to production
- หลังจากดีพลอยแอปที่สร้างใน AI Studio ด้วย Cloud Run และ Firebase แล้ว ยังเชื่อมต่อไปถึงการดีบักและการวิเคราะห์ในขั้นตอนปฏิบัติการผ่านเวิร์กโฟลว์เอเจนต์ได้
- เอเจนต์เข้าถึงเครื่องมือและข้อมูลของ Google Cloud ได้ผ่าน managed MCP server มากกว่า 50 ตัว
- Developer Knowledge MCP นำข้อมูลล่าสุดจากเอกสารของ Google เข้าไปในเครื่องมือเอเจนต์ เพื่อลดปัญหาเอกสารล้าสมัย
- สแนปช็อตเอกสารล่าสุดจะถูกส่งเข้าเครื่องมือเอเจนต์ประมาณทุก 8-12 ชั่วโมง
- ใช้ Data Agent Kit และ BigQuery MCP เพื่อวิเคราะห์ Firestore, BigQuery และข้อมูลล็อก รวมถึงสร้างแดชบอร์ด
- Antigravity สามารถตรวจสอบข้อผิดพลาดของแอป ค้นหาไฟล์ที่เกี่ยวข้อง แก้ไข และต่อเนื่องไปถึงการคอมมิตบน GitHub ได้
- remediation agent และ CI agent ที่ดีพลอยบน Cloud Run เชื่อมต่อกับ Eventarc, Pub/Sub และ Gemini เพื่อตรวจสอบและแก้ไขข้อผิดพลาด
- เอเจนต์หลายตัวส่งต่องานถึงกันในรูปแบบ A2A(agent-to-agent)
- การพัฒนาเอเจนต์ไม่ได้จบแค่การสร้างต้นแบบ แต่ขยายไปถึง การดีพลอย การมอนิเตอร์ การวิเคราะห์ข้อมูล และการกู้คืนอัตโนมัติ
เซสชัน 4 - What’s new in Android
- Android 17 เพิ่มข้อจำกัดด้านหน่วยความจำและเครื่องมือที่เกี่ยวข้อง เพื่อไม่ให้การใช้หน่วยความจำมากเกินไปของแอปทำลายประสบการณ์ผู้ใช้
- Android 17 กำหนดเงื่อนไขอย่าง excessive memory, cold start และ excessive CPU ให้เป็นเป้าหมายสำหรับการวิเคราะห์อัตโนมัติ
- แอปที่กำหนดเป้าหมายเป็น Android 17 จำเป็นต้องมีสิทธิ์ ACCESS_LOCAL_NETWORK หากต้องการค้นหาและเชื่อมต่ออุปกรณ์ในเครือข่ายภายใน
- Google เดินหน้าตอกย้ำทิศทางการสร้าง Android UI ด้วย Jetpack Compose
- Compose 1.10 และ Compose 1.11 มีทั้งการปรับปรุงด้านประสิทธิภาพ, hybrid UI และ API ใหม่
- การเชื่อมต่อ AppFunctions กับ Gemini ยังอยู่ในขั้นพรีวิวแบบปิด และทำให้แอปสามารถเป็นเป้าหมายการ orchestration ของ Gemini ได้
- สามารถทดสอบฟีเจอร์ใหม่บางส่วนได้ผ่าน Developer Preview ของ ML Kit Prompt API
- Android 17 มาพร้อม Eclipsa Video, การปรับปรุงคุณภาพเสียง HE-AAC และการปรับปรุงด้านกล้องและสื่อบนพื้นฐานของ CameraX และ Media3
- แอปจอใหญ่กำลังขยับไปสู่แนวทางที่ยึดข้อจำกัดแบบมือถือเดิมน้อยลง โดยใช้ Navigation 3 และไลบรารี Compose Adaptive
- Compose 1.6 สำหรับ Wear OS รองรับ Navigation 3 และ mode manager ที่ช่วยจัดการคอนเทนต์ในสถานะประหยัดพลังงาน
เซสชัน 5 - What’s new in Chrome
- Chrome มุ่งเน้นให้เว็บไซต์ทำงานได้ดีสำหรับผู้ใช้ที่ใช้งาน เอเจนต์และเครื่องมือแบบเอเจนต์
- แทนที่จะพึ่งพาเฉพาะความรู้พื้นฐานของโมเดล Chrome ต้องการเชื่อม Baseline และความสามารถเว็บล่าสุดเข้ากับเครื่องมือพัฒนา
- ตั้งแต่ปีที่แล้วมี 55 ฟีเจอร์ ที่เข้าสู่สถานะ Baseline Widely Available
- ณ เวลาที่ประกาศ มี 52 ฟีเจอร์ อยู่ในสถานะ Baseline Newly Available
- เนื่องจาก Chrome อัปเดตทุก 4 สัปดาห์ หากเอเจนต์เขียนโค้ดไม่รู้จักฟีเจอร์เว็บล่าสุด ก็มีแนวโน้มจะสร้าง implementation แบบล้าสมัยได้ง่าย
- Prompt API ของ Chrome จะพร้อมใช้งานใน Chrome 148
- Navigation API, View Transitions, HTML-in-Canvas และ declarative partial updates ถูกนำเข้ามาอยู่ในเวิร์กโฟลว์การพัฒนา
- นักพัฒนา Chrome extension จะสามารถตรวจสอบและดีบักการติดตั้ง, service worker, side panel และ popup ได้แบบอัตโนมัติ
- Chrome กำลังขยายไปสู่แนวทางที่ให้เอเจนต์เข้าถึง skill ระดับสูง เช่น web performance, identity, security และคู่มือกรณีใช้งานทั่วไป มากกว่า 100 แบบ
- หากต้องการลดการทำซ้ำของแพตเทิร์นความเข้ากันได้แบบเก่า จำเป็นต้องป้อนข้อมูลฟีเจอร์เว็บล่าสุดและข้อมูลการรองรับของเบราว์เซอร์ให้เอเจนต์
เซสชัน 6 - มีอะไรใหม่ใน Google AI
- ตระกูลโมเดล Gemini เป็นตระกูลโมเดลแบบมัลติโหมดที่รองรับอินพุตข้อความ รูปภาพ เสียง วิดีโอ และโค้ด รวมถึงเอาต์พุตได้หลายรูปแบบ
- บทบาทของ Gemini 3.5 Pro และ Flash:
- Gemini 3.5 Pro เน้นการแก้ปัญหาที่ซับซ้อน
- Gemini 3.5 Flash รับบทด้านความสมดุลของประสิทธิภาพ ความเร็ว และต้นทุน
- ฟีเจอร์ Build ของ AI Studio ใช้ 3.5 Flash เป็นโมเดลเริ่มต้น
- สามารถทดลองใช้ Nano Banana 2 ได้โดยตรงใน AI Studio
- Gemini Omni Flash เป็นโมเดลที่สามารถสร้างเอาต์พุตซึ่งรวมถึงวิดีโอจากอินพุตได้
- Gemini Live และ Live API รองรับการโต้ตอบด้วยเสียง
- Interactions API เป็นฟีเจอร์สำหรับโต้ตอบกับเอเจนต์ภายใน AI Studio
- การเข้าถึง Gemma 4:
- สามารถทดลองได้ใน AI Studio playground
- ใช้งานการเรียกผ่าน Gemini API ได้ฟรีบางส่วน
- มี หน้าต่างบริบท 256,000 โทเค็น และสามารถหาได้บน Hugging Face
- ยังมีการเปิดตัว Gemini Robotics 1.6, Genie 3, Antigravity 2.0 รวมถึงกลยุทธ์ลดต้นทุนด้วยการผสมโมเดลแบบเปิดและโมเดลแบบปิดลิขสิทธิ์เข้าด้วยกัน
เซสชัน 7 - สร้างประสบการณ์ AI ยุคถัดไปด้วย Google AI Studio และ Google Antigravity
- Google AI Studio ขยายจากการเป็นเพียง model playground ไปสู่พื้นที่สำหรับเปลี่ยนไอเดียให้เป็นแอปและนำไป deploy
- โมเดล เอเจนต์ การสร้างแอป การเชื่อมต่อกับ Workspace และการ deploy ไปยัง Cloud Run ถูกรวมอยู่ในเวิร์กโฟลว์เดียว
- ส่วนแอปของ AI Studio จะเปิดให้ใช้งานเร็ว ๆ นี้ และจะรองรับการสร้างและ deploy แอปได้โดยตรงมากขึ้น
- มีการเพิ่มฟีเจอร์ส่งออกโค้ดที่สร้างใน AI Studio ไปยัง Antigravity ได้ในครั้งเดียว
- Antigravity 2.0 ไม่ได้มีหน้าที่แค่เขียนโค้ด แต่ยังทำหน้าที่เป็น mission control สำหรับประสานงานหลายงานผ่านเอเจนต์
- Antigravity 2.0 วาง task list, implementation plan และการตรวจสอบไฟล์ที่เปลี่ยนแปลงเป็นแกนหลักของเวิร์กโฟลว์
- สามารถจัดการ code review และการตรวจสอบการเปลี่ยนแปลงได้โดยตรงภายใน Antigravity 2.0
- เป็นโครงสร้างที่มอบงานหนักให้เอเจนต์ เช่น การทดสอบบนเบราว์เซอร์ การวางแผน การเขียนฟีเจอร์หลายไฟล์ และการตรวจสอบแบบ end-to-end
- สามารถสร้างแอปธุรกิจใหม่ได้ภายในประมาณ 20 นาที ด้วย Google AI Studio และต่อยอดเพิ่มเติมด้วย Antigravity
- Google AI Studio คือจุดเริ่มต้นแบบรวดเร็วของ “prompt to app” ส่วน Antigravity คือเครื่องมือที่ช่วยยกระดับแอปไปสู่งานพัฒนาจริง
เซสชัน 8 - ปลดล็อกความสามารถเว็บสมัยใหม่ในเวิร์กโฟลว์ AI coding ของคุณ
- หาก coding agent ไม่รู้จักความสามารถเว็บสมัยใหม่ ก็มีแนวโน้มที่จะสร้างโค้ดตามมาตรฐานความเข้ากันได้ของเบราว์เซอร์แบบเก่า
- Chrome เปิดตัว 50 ฟีเจอร์ใหม่ ในช่วง 1 ปีที่ผ่านมา แต่เพราะ knowledge cutoff ของโมเดล ทำให้หลายฟีเจอร์ยังไม่ไปถึงตัวโมเดล
- ในตัวอย่าง Interest Invokers API พบปัญหาที่เอเจนต์ใช้ชื่อแอตทริบิวต์เก่าอย่าง
interesttarget - Modern Web Guidance คือแพ็กเกจความรู้ที่ช่วยให้เอเจนต์ค้นหาฟีเจอร์เว็บสมัยใหม่และแนวทางการใช้งานที่แนะนำ
- เอเจนต์จะทำการค้นหาเชิงความหมายภายในแพ็กเกจในเครื่องก่อนตอบ
- ขนาดและโครงสร้างของไกด์:
- ปัจจุบันมีไกด์มากกว่า 100 รายการ
- เป็นโครงสร้างที่ไม่ได้เปิดเผย skill ของแต่ละฟีเจอร์เป็นเครื่องมือระดับบนทั้งหมด แต่จะค้นหาและนำมาใช้เมื่อจำเป็น
- ไกด์ให้ทั้งแนวทางการใช้งานสมัยใหม่ที่เหมาะสมที่สุด และคำแนะนำ fallback ไปพร้อมกัน
- หากไม่มีข้อกำหนดเรื่องการรองรับเบราว์เซอร์ เอเจนต์จะถือว่า Baseline Widely Available เป็นสมมติฐานเริ่มต้น
- หากระบุเงื่อนไขอย่าง “รองรับเฉพาะ Chrome 144 ขึ้นไป” ใน
AGENTS.mdเอเจนต์จะหลีกเลี่ยง fallback ที่ไม่จำเป็นได้ - ทีม Chrome รันการประเมินทุกวันกับโมเดลอย่าง Gemini 3.1, Claude Opus 4.7 และ GPT 5.5
เซสชัน 9 - มีอะไรใหม่ใน Firebase
- Firebase กำลังขยับไปสู่การเป็น agent-native platform ที่ทั้งมนุษย์และเอเจนต์สามารถใช้สร้างและขยายแอปได้
- Firebase Data Connect พัฒนาไปเป็น Firebase SQL Connect ที่รองรับการพัฒนาแอปบนพื้นฐาน SQL
- custom resolver ของ Firebase SQL Connect สามารถเชื่อมต่อบริการ Google Cloud อย่าง Cloud Functions และ BigQuery ได้
- Firestore รองรับ geo search, native full text search และ semantic match
- Firebase AI Logic รองรับโมเดลรุ่นล่าสุด และสามารถสร้างความสามารถ AI ที่รับรู้ตำแหน่งได้ด้วย Maps grounding
- ความสามารถควบคุมการสร้างภาพของ Nano Banana ก็ใช้งานได้ใน Firebase AI Logic
- Firebase AI Logic รองรับการอนุมานแบบ local และ hybrid บน iOS, Chrome และ Android และจะ fallback ไปใช้ cloud-hosted model เมื่อไม่มีโมเดลในเครื่อง
- Dart support for Cloud Functions in Firebase เปิดให้ใช้งานใน experimental preview
- AI Studio เชื่อมต่อกับ Google Workspace ทำให้แอปสามารถใช้ข้อมูลจาก Sheets, Docs, Gmail และ Calendar ได้
- Firebase agent skills ใช้ได้บน Android, iOS, web และ Flutter และยังขยายการรองรับ Crashlytics ด้วย
เซสชัน 10 - มีอะไรใหม่ใน Google Play
- Play Billing รองรับ วิธีชำระเงินท้องถิ่นมากกว่า 300 แบบ ใน มากกว่า 65 ตลาด
- Google Play มีผู้ใช้ที่พร้อมซื้อกว่า 890 ล้านคน
- มีการขยายตัวเลือกที่ให้ใช้งานทั้ง Google Play Billing และการชำระเงินทางเลือกควบคู่กันได้ พร้อมทั้งมีการประกาศค่าธรรมเนียมบริการที่ต่ำลง
- การค้นพบแอปขยายไปยัง Gemini app, Android และเว็บ ทำให้ผู้ใช้ค้นหาแอปและเกมได้ภายใน Gemini
- Gemini แนะนำแอปโดยอาศัยความสามารถจริงของแอปและข้อมูล store listing แทนการแสดงรายการลิงก์แบบคงที่
- ในบางหัวข้อ ผู้ใช้ Gemini และ Play สามารถสำรวจคอนเทนต์ภาพยนตร์และทีวีได้มากกว่า 450,000 รายการ
- ใน Play Console หากอัปโหลดไฟล์แบบมีโครงสร้าง เช่น Eclipsa Video หรือ Google Sheets, Gemini จะช่วยกรอก listing ล่วงหน้า
- Gemini เตรียมช่วยงานใน Play Console เช่น bulk price changes, import skills และ metadata configuration
- ด้วย in-app subscription management API ผู้ใช้สามารถเปลี่ยนแพ็กเกจสมาชิกได้ง่ายภายในแอป
- ปีที่แล้ว Google Play Billing ป้องกันความพยายามฉ้อโกงได้ 3.4 พันล้านดอลลาร์ และ abusive refunds ได้ 130 ล้านดอลลาร์
เซสชัน 11 - นิยามยุคของ agentic AI
- Gemini, Search, แอป Gemini และ Google DeepMind ต่างขับเคลื่อน AI แบบ agentic ไปในทิศทางเดียวกัน
- Gemini 3.5 Flash สามารถใช้งานได้ภายใน Search ด้วย
- Search ต้องหาสมดุลระหว่างคำตอบที่รวดเร็วกับ agentic task ที่ยาวกว่า
- Gemini Spark ทำหน้าที่เป็น always-on agent ที่คอยจัดการงานที่ผู้ใช้ฝากไว้เบื้องหลัง
- โมเดลต้องทำงานได้ครอบคลุมทั้งผลิตภัณฑ์ของ Google และ ecosystem ภายนอก ไม่ใช่แค่ตอบแชตอย่างเดียวอีกต่อไป
- เครื่องมือภายในที่แปลจาก Python ไปเป็น Go:
- งานแปลโปรแกรมเดิมที่มีชุดทดสอบอยู่แล้วไปเป็นภาษาอื่น เป็นปัญหาที่ชัดเจนกว่าสำหรับโมเดล
- เครื่องมือภายในบางตัวเร็วขึ้น 10-20 เท่า ภายในชั่วข้ามคืน
- โครงสร้างพื้นฐานซอฟต์แวร์ภายในของ Google ก็อาจปรับเปลี่ยนได้เร็วขึ้นเพื่อให้เข้ากับโลกแบบ agentic ใหม่นี้
- ฮาร์ดแวร์ ขนาดโมเดล การนำไปใช้ในผลิตภัณฑ์ และ feedback loop ต้องทำงานสอดประสานกัน เพื่อให้ Gemini เข้าไปอยู่ในผลิตภัณฑ์ทั้งหมดของ Google ได้
- จุดโฟกัสของคำถามกำลังย้ายจาก “โมเดลทำอะไรได้บ้าง” ไปเป็น “จะวางโมเดลลงในผลิตภัณฑ์และเวิร์กโฟลว์อย่างไร”
เซสชัน 12 - What’s new in Android development tools
- เครื่องมือพัฒนา Android ถูกออกแบบโดยคำนึงไม่ใช่แค่นักพัฒนาที่เป็นมนุษย์ แต่รวมถึง AI agent ที่จะถูกนำไปใช้งานใน codebase ด้วย
- Android Studio Otter รองรับบัญชี Gemini Enterprise และ Google One
- Android Studio สามารถนำโมเดลแบบโลคัลและโมเดลระยะไกลมาใช้ได้
- Android Bench ทำหน้าที่เป็นเกณฑ์สำหรับตัดสินว่าจะใช้โมเดลใดกับงานพัฒนา Android
- สามารถขอให้แปลง UI ได้โดยตรงจาก Compose Preview เพื่อให้เอเจนต์ทำงานด้วยบริบทที่ดีขึ้น
- สามารถใช้ agent-based new project wizard เพื่อสร้างแอป Android แบบ adaptive ได้ด้วย prompt เพียงอย่างเดียว
- Android Studio มี skill ราว 10 รายการ ที่ช่วยงานอย่างการรวม adaptive API และการแปลงจาก XML ไปเป็น Compose
- Android CLI ใหม่รองรับเวิร์กโฟลว์ LLM และในการสร้างโปรเจกต์ใหม่ใช้โทเค็นน้อยกว่าเครื่องมือ Gradle LLM อื่น ๆ มากกว่า 70%
- สามารถรวม Antigravity CLI, Android CLI และ Android skill เข้าด้วยกัน เพื่อเริ่มพัฒนาแอป Android ใน Antigravity ได้เช่นกัน
- ใน Android Studio Quail และอุปกรณ์ Android 17 การเชื่อมต่ออุปกรณ์จะยังคงอยู่แม้เปลี่ยนเครือข่ายหรือรีสตาร์ตโน้ตบุ๊ก
เซสชัน 13 - What’s new in Flutter
- เปิดตัว Flutter 3.44 พร้อมกับ Dart 3.12
- ปีนี้มี contributor มากกว่า 1,700 คน เข้าร่วมในโปรเจกต์ Flutter
- มีนักพัฒนามากกว่า 1.5 ล้านคน สร้างงานด้วย Flutter ในแต่ละเดือน
- ใน Flutter 3.44 สามารถทดลอง rendering mode ใหม่ได้บนอุปกรณ์ Android ที่รองรับ Vulkan และใช้ Android API 34 ขึ้นไป
- Flutter ถูกนำไปใช้ในระบบ infotainment ของ Toyota 2026 RAV4
- Cloud Functions for Firebase ที่ใช้ Dart มีกรณีที่ลด cold start ได้ต่ำถึง 10ms ด้วย AOT compilation
- Firebase AI Logic เพิ่ม server prompt template เข้ามา ทำให้ไม่จำเป็นต้องใส่ prompt ไว้ตรง ๆ ภายในแอป
- Firebase Agent Skills for Flutter มอบแนวทางให้เอเจนต์สำหรับการสร้างแอป Flutter และ Firebase แบบ full-stack
- รองรับ LiteRT-LM ในแพ็กเกจ
flutter_gemmaเร็ว ๆ นี้ - บน Flutter desktop นั้น Canonical เข้าร่วมเป็นทั้ง lead maintainer และ strategic steward
เซสชัน 14 - What’s new in the Gemma open model family
- Gemma 4 ขึ้นเป็นโมเดลสาธารณะที่ทรงพลังที่สุดในตระกูล Gemma
- มีให้เลือกหลายขนาดตั้งแต่ 2B ถึง 31B ใช้งานได้ทั้งบนมือถือ โน้ตบุ๊ก และคลาวด์
- Gemma เริ่มต้นในปี 2024 ด้วยตระกูลโมเดลตั้งแต่ 1B ถึง 27B
- Gemma 4 เป็นโมเดลแบบ open weight และเข้ากันได้กับ ecosystem โอเพนซอร์ส
- ด้วย MTP และ speculative decoding ทำให้เพิ่ม decode speed ได้สูงสุด 3 เท่า
- มี day-zero implementation ของ Gemma 4 พร้อมสำหรับ ecosystem ของ Android
- ผ่าน Android API สามารถรันโมเดล Gemma ขนาดเล็กบนโทรศัพท์ได้โดยตรง หรือใช้โมเดล Gemma แบบโลคัลเพื่อเขียนแอป Android ในสภาพแวดล้อมที่เข้าถึง Gemini API ได้ยาก
- ใช้ ADK(agent development kit) บน Cloud Run ร่วมกับ Gemma 31B เพื่อสร้างเอเจนต์ที่เข้าใจฐานข้อมูลและค้นหาคำตอบได้
- Gemma 4 สามารถรันในเบราว์เซอร์หรือสภาพแวดล้อมโลคัลผ่านอินเทอร์เฟซที่เข้ากันได้กับ OpenAI ของ Transformers.js, Ollama และ LM Studio
- คลาวด์สำหรับองค์กร เครื่องภายใน เบราว์เซอร์ และมือถือ ล้วนกลายเป็นสภาพแวดล้อมสำหรับรัน Gemma ได้
เซสชัน 15 - What’s new in Web UI
- การอัปเดต Web UI ปี 2026 ครอบคลุมฟีเจอร์หลักพร้อมสถานะ Baseline
- ทุกฟีเจอร์มีป้ายความเข้ากันได้ เช่น Baseline Widely Available, Newly Available และ Limited Available
- ด้วย contrast-color API ทำให้เลือกสีที่มีคอนทราสต์เหมาะสมใน CSS ได้ง่ายขึ้น
- ฟีเจอร์
meta name="text-scale"ใน Chrome 146 รองรับการตั้งค่าขนาดตัวอักษรของระบบ - ผู้ใช้ทั้ง Android และ iOS มากกว่า 30% เปลี่ยนขนาดตัวอักษรเริ่มต้น
- ตั้งแต่ Chrome 134 เป็นต้นมา dialog element รองรับความสามารถอย่าง declarative light dismiss ของ popover
- สามารถทดลอง two-phase View Transitions ได้ใน Chrome Canary
- scroll-driven animations เข้ามาใน Chrome ตั้งแต่ปี 2023 และ Interop 2026 ช่วยเพิ่มความสามารถในการทำงานร่วมกัน
- HTML-in-Canvas API ทำให้สามารถใส่เนื้อหา DOM จริงลงไปใน Canvas ได้
- ใน Chrome 149 มีการเพิ่มรูปแบบการใช้งานใหม่ของ gap decorations และ shape outside
เซสชัน 16 - Adaptive development for the expanding Android ecosystem
- Android ไม่ได้เป็นระบบนิเวศสำหรับมือถือเท่านั้นอีกต่อไป และอุปกรณ์หน้าจอใหญ่ที่เปิดใช้งานอยู่ มากกว่า 580 ล้านเครื่อง ได้รับผลจากการลงทุนใน adaptive app
- ผู้ใช้ foldable ถูกจัดว่าเป็นกลุ่มผู้ใช้มูลค่าสูงกว่าใน adaptive app
- ใน Android 17 มีแนวโน้มจะยกเลิกการ opt-out ของ orientation และ resizability สำหรับแอปที่กำหนด target SDK 37
- Desktop emulator ใน Android Studio Quail Canary รองรับการทดสอบแอป Android ในรูปแบบเดสก์ท็อป
- Continue On API ของ Android 17 ช่วยให้ผู้ใช้ทำสิ่งที่ค้างไว้บนอุปกรณ์หนึ่งต่อบนอุปกรณ์ที่สองได้
- Google กำลังเร่งแนวทางการสร้างแอป Android แบบ Compose-first
- Compose 1.11 ปรับปรุงการรองรับ trackpad ให้ดีขึ้นในระดับ mouse และ pointer และเพิ่ม API สำหรับการทดสอบ non-touch input
- ใน Compose มีการเพิ่ม experimental API สำหรับ state-based styling
- Connected Displays เปิดให้ใช้งานทั่วไปผ่าน Android Feature Drop
- Compose, Navigation 3 และไลบรารี Compose Adaptive รองรับหลายหน้าจอ เช่น foldable, desktop, car, TV และ XR
เซสชัน 17 - Building the quantum-AI future with Hartmut Neven and James Manyika
- ประเด็นหลักคือแนวโน้มที่ quantum computing และ AI เร่งความก้าวหน้าซึ่งกันและกัน
- Hartmut Neven เริ่มทีม Quantum AI ของ Google ในปี 2012
- superposition และ qubit เป็นรากฐานของ quantum computing
- จำนวน bit string ที่เป็นไปได้บนชิป 105 qubit คือ 2 ยกกำลัง 105
- ขณะนี้ชุมชนได้ระบุอัลกอริทึมและปัญหาที่ quantum computer สามารถแก้ได้อย่างมีประโยชน์แล้ว มากกว่า 70 รายการ
- ในอนาคตจำนวนดังกล่าวอาจเพิ่มขึ้นมากกว่า 10 เท่า
- quantum error correction เป็นเทคโนโลยีหลักที่จำเป็นต่อการรักษาสถานะ superposition
- Google ประสบความสำเร็จในการลดข้อผิดพลาดของเครื่องจริงด้วย quantum error correction ในปี 2022
- Quantum Echoes เชื่อมโยงกับแนวทางการเรียนรู้จากข้อมูลที่ได้จาก NMR หรือ MRI
- Google เสนอว่าควรเร่งการเปลี่ยนผ่านสู่ post-quantum cryptography ให้แข็งแกร่งขึ้นภายในปี 2029
เซสชัน 18 - Scale AI with Google’s TPU software stack
- กล่าวถึงซอฟต์แวร์สแต็กโอเพนซอร์สสำหรับ การฝึก, การปรับจูนละเอียด, และการอนุมาน โมเดลบน TPU
- เวิร์กโฟลว์การพัฒนาโมเดลแบ่งเป็น pre-training, post-training และ serving/inference
- สามารถลองทำ post-training และ inference ได้ด้วย TPU ฟรีบน Kaggle และ Colab
- เดโม vLLM on TPU รันโมเดล Gemma 4 31B บน TPU และสรุปข้อมูลโภชนาการจากภาพอาหาร
- Gemma 4 เป็นโมเดลมัลติโหมดที่เหมาะกับงานรับภาพ ทำความเข้าใจเนื้อหา และสรุปผล
- การใส่ MTP เข้าไปใน TPU inference ของ vLLM ทำให้ได้ความเร็วเพิ่มขึ้นประมาณ 3 เท่า ในหลายงาน
- Tunix เป็นเฟรมเวิร์กน้ำหนักเบาสำหรับ post-training
- แทนที่จะใช้โมเดลขนาดใหญ่ มีการ fine-tune โมเดล 4B ให้ทำงานเดียวกันได้ และรันบนชิป Trillium เพียงตัวเดียว
- MaxText, Tunix, vLLM, JAX, PyTorch และ TPU ถูกจัดวางเป็นเครื่องมือตามแต่ละช่วงของวงจรชีวิตโมเดล
เซสชัน 19 - Supercharge your AI coding workflow with Chrome DevTools for agents
- Chrome DevTools for agents เป็นเครื่องมือที่ทำให้ coding agent สังเกตรันไทม์ของเบราว์เซอร์ได้โดยตรงผ่าน DevTools
- เช่นเดียวกับที่นักพัฒนามนุษย์ใช้ DevTools เพื่อเรียนรู้และดีบัก coding agent ก็ควรมี feedback loop แบบปิดเดียวกัน
- เอเจนต์สามารถเปิดอินสแตนซ์ Chrome จริง ท่องหน้าเว็บ กรอกฟอร์ม และเก็บ console log กับ network request ได้
- การเข้าถึง source map ช่วยให้ย้ายจากปัญหารันไทม์ไปยังไฟล์ซอร์สที่เกี่ยวข้องได้
- เครื่องมือนี้ให้มาในรูปแบบ NPM package พร้อมทั้ง MCP server และ CLI
- มี skill ให้ 6 รายการ:
- troubleshooting, Chrome DevTools และ Chrome DevTools CLI skill ช่วยเรื่องการใช้งานทั่วไปและแนวคิด
- accessibility debugging, memory leak debugging และ optimized LCP skill ใส่ความรู้เฉพาะทางให้กับเอเจนต์
- พื้นฐานการทำงานสร้างบน Puppeteer และเอเจนต์จะใช้ตัวห่อของเครื่องมือแทนการใช้ Puppeteer โดยตรง
- โดยค่าเริ่มต้นจะใช้โปรไฟล์เบราว์เซอร์แบบไม่ระบุตัวตนแยกต่างหาก และไม่เข้าถึง Chrome password manager
- CyberAgent ใช้ DevTools for agents ตรวจสอบ 236 Storybook story ของ 32 คอมโพเนนต์ ได้ภายใน 1 ชั่วโมง
เซสชัน 20 - A new era of discovery: AI and the frontiers of science with Demis Hassabis
- Demis Hassabis ตั้งเป้าหมายดั้งเดิมของ DeepMind ไว้ว่า “solve intelligence”
- ประเด็นหลักคือแนวโน้มที่ AI กำลังเปลี่ยนการค้นพบทางวิทยาศาสตร์ ผลิตภัณฑ์ และเครื่องมือวิจัย
- AlphaFold ถูกยกขึ้นมาอีกครั้งในฐานะกรณีตัวอย่างของการแก้ โจทย์ยาก 50 ปี เรื่องโครงสร้างโปรตีน
- Gemini for Science เชื่อมโยงกับทิศทางของโมเดลเพื่อวิทยาศาสตร์ที่ประกาศในคีย์โน้ต
- Demis Hassabis อธิบายปัจจุบันว่าเป็นช่วงที่ยืนอยู่บน “foothills of the singularity” และมองว่าช่วงเวลาที่ intelligence ถูกแก้ได้น่าจะอยู่ราว บวกลบ 1 ปีจากปี 2030
- โมเดลตระกูล Genie ถูกใช้ให้ Waymo ทดสอบสถานการณ์แบบ 1 in a billion ที่แทบไม่เกิดขึ้นจริงบนโลกจริง
- ความคืบหน้าในการค้นพบยาของ Isomorphic Labs ถูกใช้เป็นตัวอย่างว่า AI เร่งวิทยาศาสตร์ได้อย่างไร
- แอป Gemini มีผู้ใช้ต่อเดือน 900 ล้านคน และ AI Mode in Search ก็กลายเป็นพื้นผิวผลิตภัณฑ์สำคัญเช่นกัน
- AI ไม่ได้ถูกใช้แค่เป็นฟีเจอร์ของผลิตภัณฑ์ แต่ยังเป็นเครื่องมือแก้ปัญหาด้านวิทยาศาสตร์และการวิจัยด้วย
เซสชัน 21 - A fireside chat on the evolution of the developer craft
- ในยุค AI งานของนักพัฒนากำลังย้ายจากการเขียนโค้ดไปสู่ การออกแบบระบบ, การทำเอกสาร, และการ orchestration
- แม้จะมีเครื่องมือและโมเดลใหม่ออกมาต่อเนื่อง แต่ไม่จำเป็นต้องตามทุกเทรนด์ทันที และควรเลือกเครื่องมือที่จะเรียนรู้อย่างตั้งใจ
- การนำเอเจนต์เข้าทีมคล้ายกับการรับวิศวกรจูเนียร์หลายคนเข้ามา จึงทำให้เอกสารภายในและบันทึกการตัดสินใจด้านการออกแบบยิ่งสำคัญขึ้น
- การสร้าง agentic workflow ที่ดีต้องกำหนดความรับผิดชอบของเอเจนต์แต่ละตัว วิธีสนทนาระหว่างหลายเอเจนต์ และตำแหน่งที่มนุษย์จะกำกับดูแล
- UX ของเครื่องมือเขียนโค้ดหลายตัวกำลังคล้ายกันมากขึ้น ทำให้รูปแบบที่เรียนรู้จากเครื่องมือหนึ่งย้ายไปใช้อีกเครื่องมือได้
- เมื่อต้องทำงานกับเอเจนต์ ต้องยอมปล่อยการควบคุมเส้นทางบางส่วน และหันไปจัดสมดุลผลลัพธ์กับเจตนาการออกแบบ
- technical debt, cognitive debt และ intent debt อาจดีขึ้นเร็วขึ้นหรือแย่ลงเร็วขึ้นด้วย AI
- การรัน 20 เอเจนต์ พร้อมกันอาจเกินขีดความสามารถด้านการรับรู้ของมนุษย์ จึงต้องบริหารอย่างตั้งใจ
- นิสัยการเขียน prompt ที่ดีจะเปลี่ยนจากการพิมพ์คำค้นแบบเป็นชิ้น ๆ ไปเป็นการระบุเป้าหมายและบริบทให้ครบถ้วน
- สิ่งที่สำคัญกว่าคำถามว่า “เขียนโค้ดทุกบรรทัดเองหรือไม่” คือ “มีบริบทและระบบตรวจสอบที่ทำให้เอเจนต์ทำงานได้หรือไม่”
เซสชัน 22 - Build core skills to thrive as an AI-era developer
- แม้ในยุค AI ความสามารถพื้นฐานด้านวิศวกรรมซอฟต์แวร์ก็ยิ่งสำคัญมากขึ้น
- AI อาจเป็น force multiplier ได้ แต่การประเมิน ผสานรวม และบำรุงรักษาผลลัพธ์ยังต้องอาศัยความเชี่ยวชาญเชิงลึก
- ยิ่งเอเจนต์ทำงานได้อย่างอิสระมากขึ้น ก็ยิ่งต้องมีการ shift-left ที่ทำให้ intent ชัดเจนตั้งแต่เนิ่นๆ
- System Design ขยายความหมายให้ครอบคลุมถึงสภาพแวดล้อม ผู้คน เอเจนต์ เครื่องมือ และวัฒนธรรม
- ทีมไม่ควรใช้เอเจนต์แบบ out-of-box เท่านั้น แต่ต้องสร้างและดูแล agent role, profile, recipe, rule, skill ด้วยตนเอง
- Specs, agent rules และ skills จะกลายเป็น source of truth ที่ส่งต่อ what และ why ของระบบให้เอเจนต์
- การสร้าง realistic eval ต้องอาศัยทั้งความสามารถด้าน AI วิศวกรรมซอฟต์แวร์ ผู้ใช้ และธุรกิจร่วมกัน
- ต้องสร้าง feedback loop ที่วิเคราะห์ agent trace เพื่อปรับปรุงการใช้งานเครื่องมือ agent skill และการออกแบบระบบ
- วิศวกรที่เป็นมนุษย์จะเปลี่ยนบทบาทจาก conductor ของเอเจนต์รายตัว ไปเป็น orchestrator ของทีมเอเจนต์อะซิงโครนัสหลายตัว
- หากต้องการมองระบบจากมุมของผู้ไม่หวังดี ก็สามารถกำหนด red team agent ไว้อย่างชัดเจนได้
เซสชัน 23 - Software engineering at the tipping point
- เมื่อ AI ทำให้การเขียนโค้ดเร็วขึ้น ระบบนิเวศการพัฒนาทั้งหมดก็จะเผชิญแรงกดดันในระดับ software ecology
- Google มีโครงสร้างที่โค้ดทั้งหมดรวมถึง Android และ Chrome อยู่ใน monorepo ที่ใช้ร่วมกัน และคอมมิตเข้า trunk
- Google ใช้เครื่องมือภายในมานานแล้วที่ทำให้นักพัฒนาคนหนึ่งสามารถแก้ไขโค้ดได้เป็นหลักล้านบรรทัด
- มีความเป็นไปได้สูงว่าระบบนิเวศการพัฒนาในปัจจุบันจะรองรับ ความเร็วเพิ่มขึ้น 10 เท่า ไม่ไหว
- หากเอเจนต์ทำให้เกิดการคอมไพล์ การทดสอบ การคอมมิต และการใช้โทเค็นมากขึ้น ต้นทุนโครงสร้างพื้นฐานและคอขวดก็จะยิ่งเพิ่มขึ้น
- เอเจนต์อาจสร้างโค้ดที่เขียนได้ง่าย แต่ไม่จำเป็นต้องเป็นโค้ดที่มนุษย์ดูแลรักษาได้ง่าย
- จำเป็นต้องมี agentic skill ด้าน component reuse และ component isolation ที่บังคับให้เกิดการนำกลับมาใช้ซ้ำและการแยกส่วน
- API และการเข้าถึงข้อมูลต้องป้องกันให้แข็งแกร่งราวกับว่าเปิดเผยต่อเอเจนต์โดยพฤตินัย
- ประโยค “agents will find things you probably didn't want them to” สะท้อนความเสี่ยงของการออกแบบสิทธิ์การเข้าถึง
- ในระบบนิเวศการพัฒนาปี 2030 วิธีการในปัจจุบันอาจดูล้าสมัยเหมือนยุค CD-ROM ในปี 2001
เซสชัน 24 - Vibe once, run anywhere with Google Antigravity and Flutter
- เมื่อใช้ Antigravity ร่วมกับ Flutter ก็สามารถขยายไอเดียที่สร้างครั้งเดียวไปยังหลายแพลตฟอร์มได้
- ตั้งแต่ช่วงเปิดตัว Gemini 3 ความสามารถของโมเดลก็เพิ่มขึ้นอย่างมาก และ Antigravity รองรับความสามารถนั้นมาตั้งแต่ต้น
- Antigravity ให้ความสำคัญกับ feedback loop ที่เชื่อมการวางแผน การดำเนินการ และการตรวจสอบเข้าด้วยกันอย่างแน่นหนา
- Antigravity สร้าง task list และ implementation plan ระหว่างดำเนินการจะบันทึก screenshot และ video และเมื่อเสร็จแล้วจะเขียนรายงานที่อธิบายทั้งสิ่งที่ทำและเหตุผล
- ในขั้นตอนการตรวจสอบ จะมีการรันแอป ถ่าย screenshot คลิกปุ่มใน Chrome และรันทดสอบต่อเนื่องกัน
- ใน Flutter ความเป็น strongly typed ของ Dart และ analysis server จะส่งสัญญาณข้อผิดพลาดเชิงวัตถุ เช่น function signature และรูปแบบคลาส ให้กับ LLM
- Flutter คือ cross-platform UI toolkit ที่มอบพิกเซลและฟังก์ชันเดียวกันบนหลายหน้าจอ
- stateful hot reload ของ Flutter มอบประสบการณ์พัฒนาที่รีบิลด์แอประหว่างรันได้ในเวลา น้อยกว่า 1 วินาที
- ยิ่งเอเจนต์สร้างโค้ดมากขึ้น มนุษย์ก็ยิ่งต้องกำหนดเป้าหมายการออกแบบและทิศทางของผลิตภัณฑ์ รวมถึงตรวจทานผลลัพธ์จากเอเจนต์
- Antigravity มอบลูปการทำงานของเอเจนต์ ส่วน Flutter มอบผลลัพธ์ที่สม่ำเสมอบนหลายแพลตฟอร์ม จึงเกิดเวิร์กโฟลว์ “vibe once, run anywhere”
3 ความคิดเห็น
พอเห็นว่าตัวเองรู้สึกต่อต้านก่อนเวลาเกิดการเปลี่ยนแปลงกับสิ่งที่เคยชิน ก็เริ่มรู้สึกได้เลยว่าตัวเองแก่ขึ้นเรื่อย ๆ ฮือ
ความคิดเห็นจาก Hacker News
โดยส่วนตัวคิดว่าคีย์โน้ตครั้งนี้น่าเบื่อที่สุด
ตอนกดหยุดไว้เพื่อจะไปห้องน้ำ ยังลืมไปเลยว่าตัวเองกำลังดูอยู่ และดูเหมือนว่า Google จะพลาดไปว่า I/O และคีย์โน้ต มีความหมายอย่างไรต่อผู้ใช้
น่าจะดีกว่าถ้าจัดงานเฉพาะ Gemini แยกออกมาเหมือนงาน Android เมื่อสัปดาห์ก่อน และตอนนี้ก็มัวแต่ยัด AI เข้าไปในทุกผลิตภัณฑ์จนเส้นแบ่งระหว่างไลน์ผลิตภัณฑ์เริ่มเลือน
Google Home ก็เละเทะอยู่แล้ว ฟังก์ชันพื้นฐานยังล้มเหลวบ่อย แต่สิ่งที่ VP ของ Google Home พูดทุกครั้งกลับมีแต่เรื่อง Gemini ใช้เวลาตั้งหลายปีกว่าจะลดความถี่ที่อุปกรณ์หลุดออฟไลน์ได้
เซสชันต่าง ๆ ก็ดูจืดชืดเหมือนแค่เอา “ฟีเจอร์ใหม่ของ X” มาปนกับ “AI โน่นนี่”
ถ้าจะย่อให้เหลือสามคำก็คือ “ของใหม่ดีกว่า”
นั่นแหละคือเหตุผลที่ Google Home แย่ลง ไม่มีใครได้เลื่อนตำแหน่งจากการรักษาสถานะที่ทำงานได้ดีอยู่แล้ว ต้องออกฟีเจอร์ใหม่ให้แพลตฟอร์มนั้น แล้วใช้สถิติที่คัดเลือกมาเพื่อพิสูจน์ว่าเกิด “ผลกระทบ” ถึงจะได้เลื่อน
เหตุผลที่คีย์โน้ตเต็มไปด้วย AI ก็เหมือนกัน AI คือสนามรบสุดร้อนแรงที่ทรัพยากรกำลังถูกเทใส่ตอนนี้ และการใส่ AI ลงไปในทุกผลิตภัณฑ์ก็เปิดโอกาสให้คนจำนวนมากได้ปล่อยฟีเจอร์ใหม่และแสดง “ผลกระทบ”
I/O จะเป็นงานสำหรับนักพัฒนาก็จริง แต่ถ้าคิดว่า Wall St. ไม่ได้ดูอยู่ก็คงไร้เดียงสาเกินไป ก่อนเริ่ม I/O วันนั้นหุ้นร่วงไป 10 ดอลลาร์ แต่ระหว่างคีย์โน้ตขึ้นกลับมา 5 ดอลลาร์ ถึงจะไม่ยืนระยะ แต่ชัดเจนว่าคีย์โน้ตมีผลต่อราคาหุ้น และ Sundar ก็รู้เรื่องนี้ดี
แค่ได้อยู่ในยุคที่สังคมทั้งโลกกำลังเพิ่มปริมาณคอมพิวต์ในระดับนี้ก็ถือว่าเหลือเชื่อมากแล้ว
คุณภาพของ Gemini ก็ดีขึ้นอีก และยังมีเอเจนต์ที่ทำงานต่อเนื่องได้นานออกมาด้วย คนจำนวนมากที่ “ทำอะไรบางอย่างบนคอมพิวเตอร์” จะได้รับผลกระทบ
ถ้าสิ่งนี้เข้าไปอยู่ในระบบใช้งานจริง อาจมีคนเลือกปลดเพื่อนร่วมงาน 1-2 คนแล้วเอาเงินเดือนส่วนนั้นไปจ่ายเป็นโทเค็นแทน และก็คงเป็นแค่เรื่องของเวลาก่อนที่จะมีใครคิดแบบเดียวกันกับฉัน
ทั้งหมดนี้ไม่ได้จืดชืดเลย เลยไม่เข้าใจว่าทำไมถึงมีมุมมองที่ตรงข้ามกันได้สุดขั้วขนาดนี้
พอดูการนำเสนอที่จืดชืดเหมือนถูกออกแบบท่าทางไว้หมดแล้ว กับท่าทีที่ดูเหมือนกำลังอ่านพรอมป์ต์นอกจอ ก็ยิ่งรู้สึกว่า งานเปิดตัวของ Steve Jobs นั้นยอดเยี่ยมกว่ามาก
ไม่แน่ใจว่าเขาทำแบบนั้นจริงไหม แต่ภาพที่ออกมามันเป็นแบบนั้น และ Steve เก่งมากในการเปิดตัวสินค้า อย่างน้อยก็อยากให้คนอื่นพยายามเอาอย่างเขาบ้าง
Steve เป็นคนที่เกิดมาเพื่อคีย์โน้ตและเดโมเทคโนโลยีจริง ๆ และดูเหมือนบางคนก็เกิดมาพร้อมพรสวรรค์แบบนั้น
มันคือการทำให้ทุกอย่างด้อยคุณภาพแบบ AI ขนาดใหญ่ และดูแล้วก็ขมขื่น
อยากรู้ว่ามีอะไรเตรียมไว้สำหรับ โมเดล Gemma แบบโลคัล และ Flutter บ้าง
ตอนนี้กำลังทำแอปแบบรันโลคัลเต็มตัว โดยดาวน์โหลด Gemma 4 2B หรือใช้ AICore ที่ฝังมาใน Android กับ Foundation Models ของ Apple
ช่วงนี้โมเดลโลคัลดีขึ้นมาก ถึงขั้นมีทั้งเว็บเสิร์ชและการเรียกใช้เครื่องมือ ทำให้ในหลายกรณีแทบไม่ต้องพึ่งโมเดลคลาวด์แล้ว
ปุ่ม Join the livestream บน Firefox เดสก์ท็อปใช้ไม่ได้ แต่ใน Chrome ไม่มีปัญหา
น่าสนใจที่ 3.5 Flash ออกมาก่อน 3.5 Pro
ตามประวัติของ Gemini แล้ว Flash เหมือนจะเป็นโมเดลที่กลั่นมาจาก Pro เลยควรจะออกทีหลัง หรือว่าพวกเขาฝึกมันต่ออีกนิดจนกว่าจะชนะบนเบนช์มาร์ก?
ตอนนั้นมันยังแก้สคริปต์ Python 200 บรรทัดแบบไม่พลาดหนัก ๆ ไม่ได้เลย และยังทำพลาดแบบสลับลำดับอาร์กิวเมนต์ของการเรียกฟังก์ชันอีก
ถ้าโมเดลที่เล็กกว่าชนะในการประเมินแบบเอเจนต์ ก็มีแนวโน้มมากกว่าว่าการประเมินนั้นตั้งแต่แรกไม่ได้วัดคุณภาพของเอเจนต์จริง ๆ
สำหรับคนสร้างระบบ นั่นเป็นปัญหาที่ใหญ่กว่าการเลือกโมเดลเสียอีก
คิดถึงวันดี ๆ ในอดีตที่เรายังเป็นเจ้าของและควบคุมอุปกรณ์ของตัวเองได้อย่างสมบูรณ์ อยากได้แบบนั้นกลับมาอีก
ในด้านเทคโนโลยี ตอนนี้ดีกว่ามากชัด ๆ Linux ทุกวันนี้ยอดเยี่ยม การโฮสต์เองก็ถูกและเริ่มต้นง่าย
เลยไม่แน่ใจว่าถ้ามองในแง่การควบคุมอุปกรณ์ของตัวเอง ทุกวันนี้มันแย่ลงตรงไหนอย่างไร
บรรยากาศมันผิดไปหมด คิดถึงยุค I/O เก่า ๆ ที่เน้น Android และทุกคนเต็มไปด้วยความมองโลกในแง่ดี
มันเปลี่ยนจาก “คำตอบแบบ Google ต่อ WWDC และงานเปิดตัวของ Apple” ไปเป็น “AI ทุกที่พร้อมกัน”
พอมองสิ่งเจ๋ง ๆ ที่ Google เคยปล่อยออกมาช่วงปี 2008 ถึง 2020 ก็ยิ่งน่าเสียดายจริง ๆ
แน่นอนว่านี่ไม่ใช่ปัญหาของ Google เจ้าเดียว วงการคอนเฟอเรนซ์ใหญ่ ๆ โดยรวมก็กำลังเปลี่ยนไปแบบนี้ AI ล้วน ๆ อาจไม่ใช่ CES แต่ก็ใกล้เคียง
ตั้งแต่เปิดตัว Google Wave ในปี 2009 มา Google I/O ก็เป็นงานเทคโนโลยีที่ชอบที่สุด และตอนนั้นผมอินมากจริง ๆ
อีกไม่กี่ปีต่อมาก็มีโชว์กระโดดร่ม Google Glass เป็นช่วงเวลาที่สนุกมาก
เดโมที่เอามาโชว์คือ “แทนที่จะทำความรู้จักเพื่อนบ้าน ให้ AI agent มาวางแผนงานเลี้ยงของคนทั้งบล็อกแทน”
Spark หมายถึง openclaw ที่โฮสต์บนคลาวด์หรือเปล่า?
Flash แพงเกินไป ตอนนี้ฉันจะไปอยู่กับการโฮสต์ gemma บน OpenRouter ตลอดกาล