Gemini 2.5 Deep Think ใช้งานได้ในแอป Gemini
(blog.google)- Gemini 2.5 Deep Think ถูกนำเข้าใช้งานในแอป Gemini สำหรับ สมาชิก Google AI Ultra เท่านั้น
- เทคนิคการคิดแบบขนาน (parallel thinking) และ ผลการวิจัยใหม่ ถูกนำมาใช้ โดยอิงจากโมเดลที่ได้ระดับเหรียญทองใน IMO เพื่อปรับให้เหมาะกับการใช้งานจริงมากขึ้น
- แสดง ประสิทธิภาพยอดเยี่ยม ในงานที่ซับซ้อนหลากหลาย เช่น การแก้ปัญหาเชิงสร้างสรรค์, การให้เหตุผลทางคณิตศาสตร์และวิทยาศาสตร์ และการพัฒนาอัลกอริทึม
- เพื่อเพิ่มประสิทธิภาพ โมเดลได้ขยาย เวลาในการคิด (Thinking Time) เพื่อสำรวจไอเดียและวิธีแก้ปัญหาหลายๆ อย่างพร้อมกัน และสร้างการคิดเชิงลึกพร้อมผลลัพธ์ที่สร้างสรรค์ยิ่งขึ้น
- เพื่อการพัฒนา AI ที่ปลอดภัยและมีความรับผิดชอบ มีการเสริมการประเมินและมาตรการรับมือ และได้ประกาศแผนขยายการใช้งานผ่าน API และองค์กรในอนาคต
เปิดตัว Gemini 2.5 Deep Think
- ฟีเจอร์ Gemini 2.5 Deep Think ถูกนำเสนอให้ผู้ใช้ Google AI Ultra เข้าถึงได้ผ่าน แอป Gemini
- เวอร์ชันนี้สะท้อนข้อเสนอแนะจากผู้ทดสอบที่เชื่อถือได้และผลการวิจัยล่าสุด
- อิงจากโมเดลระดับ ทองคำ ในการแข่งขันนานาชาติทางคณิตศาสตร์ (IMO) ล่าสุด ปรับความเร็วและความเป็นไปได้ในการใช้งานให้เหมาะกับประสบการณ์ผู้ใช้จริงมากขึ้น
- การเปิดตัวครั้งนี้ขยายศักยภาพของ Gemini ในฐานะเครื่องมือการแก้ปัญหาเชิงสร้างสรรค์ และวางแผนยกระดับฟีเจอร์จากข้อเสนอแนะของนักคณิตศาสตร์และนักวิจัย
หลักการทำงานของ Deep Think
- นำ เทคนิคการคิดแบบขนาน มาใช้ให้ Gemini สำรวจ แนวคิดและวิธีแก้ปัญหาหลายอย่างได้พร้อมกัน เมื่อเจอปัญหาซับซ้อน และสามารถเปรียบเทียบ/ผสมผสานผลลัพธ์ได้
- ขยาย เวลาในการให้เหตุผล (Thinking Time) ของโมเดลเพื่อให้สามารถสำรวจสมมติฐานหลากหลายอย่างลึกซึ้ง และค้นหาวิธีแก้ปัญหาที่สร้างสรรค์มากขึ้น
- โมเดลได้รับการฝึกผ่าน การเรียนรู้แบบเสริมแรง เพื่อใช้ประโยชน์จาก เส้นทางการให้เหตุผลที่ขยายเพิ่ม นี้ได้อย่างเต็มที่ เพิ่มความสามารถในการแก้ปัญหาที่แม่นยำและลึกซึ้ง
ประสิทธิภาพหลักและการใช้งานของ Deep Think
- การพัฒนาและออกแบบแบบค่อยเป็นค่อยไป: มีประสิทธิภาพสูงในงานที่พัฒนาระบบหรือการออกแบบที่ซับซ้อนแบบเป็นขั้นตอน
- การค้นพบด้านวิทยาศาสตร์และคณิตศาสตร์: มีจุดแข็งในงานสำรวจเชิงสร้างสรรค์ขั้นสูง เช่น การให้เหตุผลทางคณิตศาสตร์หรือการตีความงานวิจัยทางวิทยาศาสตร์
- การพัฒนาอัลกอริทึมและโค้ด: บรรลุผลงานระดับแนวหน้าในปัญหาการเขียนโค้ดที่ซับซ้อน ซึ่งต้องพิจารณาการจัดโครงสร้างปัญหา ความซับซ้อนเชิงเวลา และการแลกเปลี่ยน (trade-off) อย่างครบถ้วน
- ใน Benchmark ล่าสุด (เช่น LiveCodeBench V6, Humanity’s Last Exam) แสดงให้เห็นว่าได้ ผลงานระดับสูงสุดด้านโค้ด/ความรู้/การให้เหตุผล เมื่อเทียบกับโมเดลเดิม
ความปลอดภัยและการพัฒนา AI อย่างมีความรับผิดชอบของ Gemini
- Gemini 2.5 Deep Think แสดง ความปลอดภัยของเนื้อหา และ โทนที่เป็นกลาง ที่ดีขึ้นในการประเมินความปลอดภัยเมื่อเทียบกับโมเดล Pro เดิม
- ความเสี่ยงได้รับการประเมินควบคู่ไปกับความซับซ้อนที่เพิ่มขึ้น โดยเสริมการประเมิน Frontier Safety และมาตรการตอบสนองที่จำเป็น
- ผลการประเมินความปลอดภัยแบบละเอียดสามารถตรวจสอบได้ใน Model Card
วิธีใช้ Deep Think
- สมาชิก Google AI Ultra สามารถเลือก 2.5 Pro จากตัวเลือกดรอปดาวน์ของโมเดลในแอป Gemini แล้วกดสวิตช์ Deep Think ที่แถบคำสั่งเพื่อใช้งานได้ตามจำนวนครั้งต่อวันที่กำหนด
- ทำงานเชื่อมต่อแบบอัตโนมัติกับการรันโค้ด, Google Search และเครื่องมืออื่นๆ ได้ ทำให้สามารถสร้างคำตอบที่ยาวขึ้นอย่างชัดเจน
- ในระยะใกล้ข้างหน้าจะมีการทดสอบเพิ่มเติมสำหรับ Gemini API และการใช้งานระดับองค์กร
1 ความคิดเห็น
ความเห็นจาก Hacker News
ลองทดสอบ agent Deep Think ตัวใหม่แล้ว แต่พอใส่พรอมป์ต์ไปแค่ห้าครั้งก็ชนลิมิตใช้งานรายวันทันที จ่าย $250 ต่อเดือนแล้วได้บริการระดับนี้ก็น่าผิดหวังพอสมควร เมื่อเทียบกับ o3-pro หรือ Grok 4 Heavy แล้วความคุ้มค่าด้านราคาดูด้อยกว่ามาก ในคอมมูนิตี้ AI ฟีเจอร์นี้เป็นแทบจะส่วนเดียวที่ทำให้คนสนใจว่าพอจะอธิบายราคาค่าสมัคร Google Ultra ได้ แต่ Google กลับให้โมเดลที่ดีที่สุดใช้ฟรีใน AI Studio ขณะที่คนจ่ายเงินจริงแบบผู้สมัคร Ultra กลับเจอนโยบายคิดค่าบริการแบบนี้ ก็ไม่เข้าใจจริง ๆ เรื่องประสิทธิภาพนั้น พอลองป้อนสถานการณ์ปัญหาธุรกิจยาก ๆ เข้าไป มันก็ให้วิธีแก้ที่ชัดเจนและโน้มน้าวได้ดี ซึ่งสอดคล้องกับผลประชุมภายในของเรา แต่สุดท้าย o3 ก็ให้ข้อสรุปคล้ายกันได้ในราคาที่ถูกกว่ามาก เพียงแต่รายงานของ o3 ดูจัดระเบียบน้อยกว่าเล็กน้อย คงต้องลองใช้อีกสักพักถึงจะรู้
ทุกคน นี่คือผลลัพธ์ที่ได้เมื่อใส่พรอมป์ต์ให้ Gemini Deep Think ว่า “ช่วยวาดภาพ SVG ของนกเพลิแกนขี่จักรยานให้หน่อย” https://www.svgviewer.dev/s/5R5iTexQ ผมลองก่อน Simon Willison อีก!
ถ้าอยากลองรันเอง สามารถใช้ LLM cli ของ simonw กับปลั๊กอิน llm-consortium ได้ ข้อดี 1: ผสมหลายโมเดลใช้งานได้อย่างอิสระ ตั้งค่าชุดที่ต้องการได้โดยไม่ขึ้นกับแล็บ ข้อดี 2: ใช้ปลั๊กอิน llm-model-gateway เพื่อต่อเข้ากับแอปของตัวเองหรือเครื่องมือช่วยเขียนโค้ดผ่าน local API ได้ในครั้งเดียว https://x.com/karpathy/status/1870692546969735361
มีทั้งคำสั่งติดตั้ง ตัวอย่างคำสั่ง และตัวอย่างว่าทำ consortium of consortium ได้ด้วย เขาเขียนไว้เองทั้งหมด
https://GitHub.com/irthomasthomas/llm-consortium
llm serveมันไม่ใช่โมเดลตัวเดียวกับที่ได้เหรียญทองใน IMO (International Mathematical Olympiad) เมื่อไม่กี่สัปดาห์ก่อน แต่เป็นสายพันธุ์ใกล้เคียงกันมาก https://x.com/OfficialLoganK/status/1951262261512659430 ตอนนี้ยังไม่มีให้ใช้ผ่าน API
แนวทางครั้งนี้คล้ายกับ Grok 4 Heavy: รันเอเจนต์ “ให้เหตุผล” หลายตัวแบบขนาน แล้วเอาคำตอบมาเทียบกันก่อนเลือกอันที่ดีที่สุด ใช้เวลาราว 30 นาที ผลลัพธ์ยอดเยี่ยม แต่ถ้าจะเทียบ benchmark กันอย่างยุติธรรม ก็ควรเทียบกับ Grok 4 Heavy มากกว่า Grok 4 ซึ่งเป็นโมเดลแบบเอเจนต์เดี่ยวและเร็วกว่า
OpenAI ขึ้นราคาเป็น $200, Anthropic มี $100 และ $200, Gemini อยู่ที่ $250, ส่วน Grok ไปได้ถึง $300 มีแค่ OpenAI ที่บอกว่า “แทบไม่จำกัด” และผมก็ยังไม่เคยชนลิมิตในแผน ChatGPT Pro จริง ๆ แต่ Claude Max เคยชนลิมิตหลายครั้ง สงสัยว่าทำไมบริษัทพวกนี้ถึงไม่เปิดเผยลิมิตให้ชัดเจน
ช่วงไม่กี่เดือนที่ผ่านมา พอใช้ Gemini แล้วกลับรู้สึกว่ามันแย่ลงเรื่อย ๆ มี hallucination บ่อยมาก และถึงจะชี้ให้เห็น มันก็ยังดื้อ เชื่อถือได้ยากขึ้น
มีประกาศว่าผู้สมัคร Google AI Ultra สามารถใช้ Deep Think ในแอป Gemini ได้ตั้งแต่วันนี้ โดยให้จำนวนพรอมป์ต์แบบคงที่ แต่คำว่า “ชุดคงที่” นี้หมายถึงจำนวนคงที่ หรือหมายถึงประเภทพรอมป์ต์ที่กำหนดไว้ อยากรู้รายละเอียดให้ชัดกว่านี้
เวลาจัดตารางด้วย Gemini CLI ต่อให้สั่งชัดเจนและคอยแทรกแซงหลายรอบว่าอย่าทำอะไรนอกลู่นอกทาง มันก็ยังพยายามแก้เองจนทำให้แผนพังบ่อย ๆ