Gemini 3.5 Flash
(blog.google)- Gemini 3.5 Flash คือโมเดล Gemini 3.5 รุ่นแรกที่ผสานสติปัญญาระดับฟรอนเทียร์เข้ากับความสามารถในการลงมือทำ โดยมุ่งเป้าไปที่งานระยะยาวด้านเอเจนต์และการเขียนโค้ด
- ยังคงรักษาความเร็วของซีรีส์ Flash พร้อมทำผลงานเหนือกว่า Gemini 3.1 Pro ใน Terminal-Bench 2.1 ที่ 76.2%, GDPval-AA 1656 Elo และตัวชี้วัดอื่น ๆ
- ด้วยความเร็วประมวลผลตามเอาต์พุตโทเคนต่อวินาทีที่ เร็วกว่า 4 เท่า เมื่อเทียบกับโมเดลฟรอนเทียร์อื่น ๆ และในหลายกรณีมีต้นทุนต่ำกว่าครึ่งหนึ่ง จึงเหมาะกับงานเอเจนต์ระยะยาว
- ใช้งานหลายขั้นตอนได้ทั้งใน Antigravity และ AI Studio เช่น การพัฒนาแอป, แปลงโค้ด legacy ไปเป็น Next.js, สร้างเกมจากงานวิจัย, และสร้างต้นแบบ UX
- ให้บริการเป็น โมเดลพื้นฐาน ของแอป Gemini และ Search AI Mode รวมถึงถูกนำไปใช้ในเวิร์กโฟลว์ของ Gemini Spark และพาร์ตเนอร์องค์กร ขณะที่ 3.5 Pro มีกำหนดเปิดตัวในเดือนหน้า
การเปิดตัว Gemini 3.5 และขอบเขตการให้บริการ
- Gemini 3.5 คือชุดโมเดลล่าสุดที่ผสานสติปัญญาและความสามารถในการลงมือทำระดับฟรอนเทียร์ โดยถูกวางตำแหน่งให้เป็นโมเดลสำหรับสร้างเอเจนต์ที่มีความสามารถมากขึ้น
- โมเดลที่เปิดตัวเป็นรุ่นแรกคือ 3.5 Flash ซึ่งมอบประสิทธิภาพระดับฟรอนเทียร์ในงานเอเจนต์และการเขียนโค้ด โดยเน้นงานซับซ้อนระยะยาวที่ใช้งานได้จริง
- 3.5 Flash ให้บริการผ่านผลิตภัณฑ์และเครื่องมือสำหรับนักพัฒนาหลายรายการของ Google
- ให้บริการแก่ผู้ใช้ทั่วไปผ่านแอป Gemini และ AI Mode ของ Google Search
- นักพัฒนาสามารถใช้งานได้ผ่าน Google Antigravity, Gemini API ใน Google AI Studio และ Android Studio
- ให้บริการแก่องค์กรผ่าน Gemini Enterprise Agent Platform และ Gemini Enterprise
- 3.5 Pro ก็กำลังอยู่ระหว่างการพัฒนา ใช้งานภายในแล้ว และมีกำหนดเปิดตัวในเดือนหน้า
ประสิทธิภาพของ 3.5 Flash
- 3.5 Flash ยังคงรักษาความเร็วของซีรีส์ Flash พร้อมมอบสติปัญญาที่แข่งขันกับโมเดลเรือธงขนาดใหญ่ได้ในหลายมิติ
- เป็น โมเดลโค้ดดิ้งเชิงเอเจนต์ ที่ทรงพลังที่สุดของ Google โดยทำผลงานเหนือกว่า Gemini 3.1 Pro ในเบนช์มาร์กด้านการเขียนโค้ดและเอเจนต์ที่ยาก
- Terminal-Bench 2.1: 76.2%
- GDPval-AA: 1656 Elo
- MCP Atlas: 83.6%
- ความเข้าใจแบบมัลติโหมดของ CharXiv Reasoning: 84.2%
- ความเร็วประมวลผลตามเอาต์พุตโทเคนต่อวินาที เร็วกว่า 4 เท่า เมื่อเทียบกับโมเดลฟรอนเทียร์อื่น ๆ
- บนตัวชี้วัดของ Artificial Analysis โมเดลนี้อยู่ในควอดแรนต์ขวาบน แสดงให้เห็นว่าเป็นโมเดลที่ลดการแลกเปลี่ยนระหว่างคุณภาพกับเวลาแฝงได้
งานเอเจนต์ขนาดใหญ่
- ด้วยสมดุลระหว่างความเร็วและประสิทธิภาพ 3.5 Flash จึงเหมาะกับ งานเอเจนต์ระยะยาว
- ช่วยให้นักพัฒนาหรือผู้ตรวจสอบทำงานที่เดิมต้องใช้เวลาหลายวันหรือหลายสัปดาห์ให้เสร็จได้ในเวลาที่สั้นลง และในหลายกรณีมีต้นทุนต่ำกว่าครึ่งหนึ่งเมื่อเทียบกับโมเดลฟรอนเทียร์อื่น
- สามารถวางแผน สร้าง และทำซ้ำเพื่อแก้ปัญหาจริงได้อย่างรวดเร็ว
- พัฒนาแอปพลิเคชันใหม่
- บำรุงรักษาโค้ดเบส
- ช่วยเตรียมเอกสารทางการเงิน
- เมื่อทำงานร่วมกับ Antigravity harness ที่อัปเดตแล้ว จะกลายเป็นเอนจินสำหรับรันงานที่สามารถส่งเอเจนต์ย่อยแบบทำงานร่วมกันไปจัดการปัญหาขนาดใหญ่ในกรณีใช้งานที่ท้าทาย
- รักษาประสิทธิภาพระดับฟรอนเทียร์ไว้ได้ ขณะรันเวิร์กโฟลว์หลายขั้นตอนและงานเขียนโค้ดภายใต้การกำกับดูแลอย่างเสถียร
ตัวอย่างการใช้งาน Antigravity และ AI Studio
- 3.5 Flash รันเวิร์กโฟลว์หลายขั้นตอนใน Antigravity เพื่อเปลี่ยนชื่อและจัดหมวดหมู่แอสเซ็ตที่ไม่มีโครงสร้างโดยอัตโนมัติตามเกณฑ์แบบไดนามิก
- ใน Antigravity มีการใช้เอเจนต์สองตัวเพื่อสังเคราะห์ งานวิจัย AlphaZero และเขียนโค้ดเกมที่เล่นได้สมบูรณ์ภายใน 6 ชั่วโมง
- ใช้ Antigravity harness เพื่อแปลงโค้ดเบส legacy ที่ซับซ้อนให้เป็น Next.js
- ใน Antigravity ใช้เอเจนต์ย่อยสร้างภูมิทัศน์เมืองใหม่ และพัฒนาเกมผ่านลูปการปรับปรุงตนเองอย่างรวดเร็วของเอเจนต์ builder และ player สองตัว
- บนพื้นฐานมัลติโหมดที่แข็งแกร่งของ Gemini 3 ทำให้ 3.5 Flash สามารถสร้างเว็บ UI และกราฟิกที่สมบูรณ์และโต้ตอบได้มากขึ้น
- สร้างแอนิเมชันแบบโต้ตอบสำหรับงานวิจัย AI ใน AI Studio
- แปลงคำอธิบายข้อความธรรมดาให้เป็นฮาร์ดแวร์แบบโต้ตอบใน AI Studio
- รันหลายคอนเซปต์แบบขนานใน AI Studio เพื่อสร้างคอนเซปต์แบรนดิ้งครบชุดสำหรับงานระดมทุนของโรงเรียน
- สร้างแนวทาง UX ที่แตกต่างกันสำหรับขั้นตอน checkout ภายใน 60 วินาที ใน AI Studio
การใช้งานในองค์กรและโดยนักพัฒนา
- ความสามารถเชิงเอเจนต์ของ 3.5 Flash ถูกนำไปใช้แล้วในเวิร์กโฟลว์ของนักพัฒนาและองค์กร
- ระหว่างการพัฒนาชุดโมเดล Gemini 3.5 มีการทำงานร่วมกับพาร์ตเนอร์ในอุตสาหกรรมเพื่อระบุจุดที่งานซ้ำซ้อนและความซับซ้อนเกิดขึ้น
- พาร์ตเนอร์กำลังเห็นผลลัพธ์ตั้งแต่การทำเวิร์กโฟลว์อัตโนมัติหลายสัปดาห์ในธนาคารและฟินเทค ไปจนถึงการช่วยทีมวิทยาศาสตร์ข้อมูลค้นหาอินไซต์ในสภาพแวดล้อมข้อมูลที่ซับซ้อน
-
Shopify
- รันเอเจนต์ย่อยแบบขนานเพื่อวิเคราะห์ข้อมูลที่ซับซ้อนในระยะยาว และทำ การคาดการณ์การเติบโตของผู้ค้า ได้แม่นยำขึ้นในระดับโลก
-
Macquarie Bank
- กำลังนำร่องวิธีการเร่งการ onboarding ลูกค้า โดยให้โมเดลให้เหตุผลกับเอกสารซับซ้อนยาวกว่า 100 หน้า ค้นหาข้อมูลที่เกี่ยวข้อง และสร้างคำแนะนำที่เชื่อถือได้ด้วยเวลาแฝงต่ำ
-
Salesforce
- ผสาน 3.5 Flash เข้ากับ Agentforce เพื่อทำงานองค์กรที่ซับซ้อนแบบอัตโนมัติด้วยเอเจนต์ย่อยหลายตัวที่รักษาบริบทและรันการเรียกใช้เครื่องมือหลายรอบที่ซับซ้อน
-
Ramp
- รองรับ OCR ที่ฉลาดและเชื่อถือได้มากขึ้น โดยผสานความเข้าใจมัลติโหมดของใบแจ้งหนี้ที่ซับซ้อนเข้ากับการให้เหตุผลจากรูปแบบในอดีต
-
Xero
- ให้เอเจนต์จัดการเวิร์กโฟลว์ซับซ้อนที่กินเวลาหลายสัปดาห์ได้ด้วยตนเอง เช่น การระบุผู้ขายและการรวบรวมข้อมูลสำหรับแบบฟอร์มภาษี 1099 ช่วยให้ธุรกิจขนาดเล็กทำงานธุรการซ้ำ ๆ ได้อัตโนมัติ
-
Databricks
- ใช้เวิร์กโฟลว์เชิงเอเจนต์เพื่อติดตามและค้นหาข้อมูลแบบเรียลไทม์ ให้เหตุผลกับชุดข้อมูลขนาดใหญ่ เพื่อวินิจฉัยปัญหาและเสนอการแก้ไขและแนวทางแก้ปัญหา
การประยุกต์ใช้กับเอเจนต์ AI ส่วนบุคคลและ Search
- 3.5 Flash กลายเป็น โมเดลพื้นฐาน ในแอป Gemini และ AI Mode ของ Search ทั่วโลก
- ที่ Google I/O มีการเปิดตัวฟีเจอร์ใหม่ที่นำความสามารถเชิงเอเจนต์ของ 3.5 Flash ไปใช้ในชีวิตประจำวัน
- Gemini Spark คือเอเจนต์ AI ส่วนบุคคลที่ใช้ 3.5 Flash
- ทำงานตลอด 24 ชั่วโมง
- สำรวจชีวิตดิจิทัลและลงมือแทนผู้ใช้ตามคำสั่ง
- เริ่มเปิดให้ผู้ทดสอบที่เชื่อถือได้ตั้งแต่วันนี้
- มีกำหนดเปิดเบต้าให้ผู้สมัครสมาชิก Google AI Ultra ในสหรัฐฯ สัปดาห์หน้า
- ความสามารถด้านการเขียนโค้ดเชิงเอเจนต์ที่ดีขึ้นของ 3.5 Flash มอบประสบการณ์ที่ฉลาดขึ้นทั่วทั้ง Search
- เปิดตัวเอเจนต์ข้อมูลรูปแบบใหม่ที่ทำงานให้ผู้ใช้ตลอด 24 ชั่วโมง
- ทำให้เกิดประสบการณ์ UI เชิงกำเนิดที่ไดนามิกมากขึ้น
- Search ใช้ 3.5 Flash เพื่อสร้างสื่อภาพแบบโต้ตอบที่อธิบายรูปแบบ Gyroid
มาตรการความปลอดภัย
- Gemini 3.5 ได้รับการพัฒนาตาม Frontier Safety Framework
- มาตรการด้านความปลอดภัยไซเบอร์และ CBRN ได้รับการเสริมความแข็งแกร่ง ทำให้มีโอกาสสร้างเนื้อหาที่เป็นอันตรายน้อยลง และมีโอกาสปฏิเสธคำถามที่ปลอดภัยอย่างผิดพลาดน้อยลง
- มีการใช้เทคนิคการฝึกด้านความปลอดภัยและการบรรเทาความเสี่ยงแบบใหม่ที่ก้าวหน้ากว่าเดิม
- รวม เครื่องมือด้านการตีความ ที่ช่วยตรวจสอบและทำความเข้าใจการให้เหตุผลภายในของ AI ก่อนส่งคำตอบ
1 ความคิดเห็น
ความเห็นจาก Hacker News
นกกระทุงดูเข้าท่าพอสมควร: https://github.com/simonw/llm-gemini/issues/133#issuecomment...
แต่พอเป็นจักรยานกลับไม่ค่อยไหว ขาดแท่งที่เชื่อมระหว่างแป้นถีบกับล้อหลังไป แล้วเฟรมส่วนอื่นก็พันกันแปลก ๆ
แถมยังแพงอีกด้วย นกกระทุงตัวนั้นตัวเดียวราคา 13 เซ็นต์: https://www.llm-prices.com/#it=11&ot=14403&sel=gemini-3.5-fl...
ตัวอย่างนี้ดีขึ้นมากอย่างเห็นได้ชัด และรายละเอียดก็เยอะเกินเหตุ แต่รูปทรงพื้นฐานของเฟรมก็ยังผิดอยู่ดี ลองทำเป็นหน้าเว็บก็เห็นแพตเทิร์นเดียวกัน คือมันจะเพิ่มพวกปุ่มอะไรเข้าไปอีก
ผมลองเอา SVG นกกระทุงที่พังไปให้โมเดลภาพช่วยหาข้อบกพร่องแล้ว แต่มันก็ยังหาองค์ประกอบที่พังไม่เจออยู่ดี
https://www.gianlucagimini.it/portfolio-item/velocipedia/
ราคา ต่อล้านโทเค็น input/output:
Gemini 2.5 Flash: $0.30/$2.50
Gemini 3.0 Flash Preview: $0.50/$3.00
Gemini 3.5 Flash: $1.50/$9.00
ทิศทางของราคาน่าสนใจมาก ผมไม่คิดว่าเคยเห็น ขึ้นราคา 3 เท่า ในโมเดลรุ่นถัดไปที่ขนาดใกล้กันแบบนี้มาก่อน และการที่ 3 มีแต่ Preview ก็ชวนขำเหมือนกัน
3.5 Flash มีต้นทุนใกล้กับ Gemini 2.5 Pro ที่ราคา $1.25/$10
Gemini 2.5 Flash(27 คะแนน): $172(1.0x)
Gemini 2.5 Pro(35 คะแนน): $649(3.8x)
Gemini 3.0 Flash(46 คะแนน): $278(1.6x)
Gemini 3.5 Flash(55 คะแนน): $1,552(9.0x หรือ 2.4x เทียบกับ 2.5 Pro)
นี่คือการขึ้นราคาครั้งใหญ่ เมื่อเทียบกับ Gemini 3.0 Flash คือ 5.6 เท่า
เพราะแบบนั้น การมี ชั้น abstraction ที่ไม่ผูกกับผู้ให้บริการรายเดียวจึงสมเหตุสมผลมาก ถ้าใช้ Kotlin, Koog ถือว่าเยี่ยมมาก
หรืออีกทางหนึ่งอาจเป็นเพราะมันทำ benchmark ได้ดี เลยคิดว่าขึ้นราคาได้ แต่ก็ดูยังไม่มีส่วนแบ่งตลาดมากพอจะรองรับการตัดสินใจแบบนั้น
https://ai.google.dev/gemini-api/docs/models/gemini-3.5-flas...
การที่ Google ระบุโมเดลนี้เป็น Stable แทนที่จะเป็น Preview ก็น่าจับตา เมื่อเทียบกับแนวทางการเปิดตัวช่วงหลังถือว่าผิดปกติ
พอรวมกับการขึ้นราคา 3 เท่า มันเลยดูเหมือนว่าราคา Flash นี้ไม่ใช่มาตรการชั่วคราวที่จะค่อยย้อนกลับในภายหลัง แต่เป็น จุดต่ำสุดระยะยาว ที่ Google ต้องการ
อย่างไรก็ตาม ตอนนี้ยังตัดสินยากว่านี่เป็นเพราะ Google อ่านบรรยากาศแบบนี้อยู่เจ้าเดียว หรือทั้งอุตสาหกรรมกำลังเงียบ ๆ ปรับเส้นฐานของ inference ราคาถูกกันใหม่
https://gistpreview.github.io/?3496285c5dac5ba10ebbc0b201a1a...
Gemini 2.5 Pro - 5,325 tokens:
https://gistpreview.github.io/?cc5e0fefeaaffecd228c16c95e736...
Gemini 2.5 Flash - 7,556 tokens:
https://gistpreview.github.io/?263d6058fe526a62b8f270f0620ec...
Gemma 4 31B IT - 3,261 tokens ใน AI Studio:
https://gistpreview.github.io/?858a42b96af864859a3b89508619d...
Gemma 4 26B A4B IT - 4,034 tokens ใน AI Studio:
https://gistpreview.github.io/?4adb7703897e0c6b583f9de928e4a...
8112 tokens @ 52.97 TPS, 0.85s TTFT
https://gistpreview.github.io/?7bdefff99aca89d1bc12405323bd4...
เซสชันเต็ม: https://gist.github.com/abtinf/7bdefff99aca89d1bc12405323bd4...
สร้างด้วย LM Studio บน Macbook Pro M2 Max
https://huggingface.co/hesamation/Qwen3.6-35B-A3B-Claude-4.6...
https://gistpreview.github.io/?557f979c82701862bc26d24f10399...
https://claude.ai/public/artifacts/128ebe5a-add7-406a-9bce-6...
เวลามีใครพูดคำว่า "Flash" แล้วผมดันนึกถึง "ลองพิจารณา HTML5 แทน" ทันที แบบนี้แปลว่าผมแก่จริง ๆ ใช่ไหม?
Flash, ah, ah, saviour of the universe. Flash, ah, ah, he'll save every one of us!
ไม่รู้มากี่ปีแล้วที่ทุกครั้งที่ได้ยินคำว่า "flash" ผมจะนึกถึงสิ่งนี้ตลอด
เส้นตัดความรู้: มกราคม 2025
อัปเดตล่าสุด: พฤษภาคม 2026
ผมมีความรู้สึกไม่ดีอย่างมากกับความล่าช้านี้
ดังนั้นถ้าต้องการ reasoning ที่คุณภาพสูงขึ้น ก็ต้องโฟกัสการฝึกให้มากขึ้น และข้อมูลต้องมีคุณภาพสูงมากกับความหนาแน่นสูง
ถ้าการใช้เครื่องมือแข็งแรงพอ การที่โมเดลใช้ข้อมูลเก่าอาจไม่ใช่ประเด็นสำคัญนัก เพราะมันไปค้นข้อมูลล่าสุดได้ เพียงแต่ตอนนี้โมเดลส่วนใหญ่ยังไม่ค่อยทำแบบนั้นถ้าไม่โดนชี้นำสักหน่อย
เท่าที่ผมเข้าใจ ตระกูล Qwen 3 ทั้งหมดเริ่มจาก base model เดียวกัน แล้วใช้แค่การ fine-tuning/post-training เพื่อปรับหลายตัวชี้วัดให้ดีขึ้น ตระกูล Gemini 3 ก็อาจเหมือนกันทั้งหมด และตอนนี้ก็อาจกำลังฝึกโมเดลที่อิง Gemini 4 พร้อมความรู้ล่าสุดไปพร้อมกันอยู่ก็ได้
ผมใช้ google ai pro plan และลองใช้ 3.5 Flash ใน Antigravity แล้ว แต่แค่สองพรอมป์ต์ก็ใช้โควตาหมด ถ้าไม่ใช่บั๊กก็คือ ใช้งานไม่ได้จริง
ดูจากบรรยากาศใน Gemini subreddit เหมือนจะลดลงหนักกว่าเดิมมาก ผมเองก็น่าจะยกเลิก AI Pro เหมือนกัน
อัปเดตครั้งนี้ยังทำแอปพังด้วย แก้ข้อความทีไรแอปก็แครชทุกครั้ง ทั้งที่ผมใช้ Pixel อยู่แท้ ๆ
นาฬิกา 2000 โทเค็น ของ Gemini 3.5 Flash ก็ไม่เลวเลยนะ https://clocks.brianmoore.com/
โมเดลที่แทบจะเหมือนเดิม แต่ ขึ้นราคา 3 เท่า งั้นเหรอ ก่อนหน้านี้บอกว่า AI จะถูกลงและถูกใช้ไปทุกที่ไม่ใช่เหรอ
ราคานี่เหลือเชื่อมาก
Gemini 3.5 Pro ก็น่าจะขึ้นราคาตามไปด้วย 12 x 5 = 60?
Google ดูเหมือนอยากให้พวกเราไปใช้ โมเดลจากจีน