- Gemini 3 ของ Google ได้พัฒนาไปไกลกว่าการเป็นแชตบอตสนทนาธรรมดา สู่ AI คู่หูดิจิทัล ที่ทำงานจริงได้ เช่น เขียนโค้ด ท่องเว็บ และจัดการไฟล์
- Antigravity ที่เปิดตัวพร้อมกัน เป็น เครื่องมือแบบเอเจนต์ ที่เข้าถึงคอมพิวเตอร์ของผู้ใช้เพื่อเขียนโปรแกรมได้อย่างอัตโนมัติ และใช้ ระบบ Inbox เพื่อขออนุมัติหรือความช่วยเหลือ
- Gemini 3 สามารถทำงานตามคำสั่งของผู้ใช้ได้ตั้งแต่ สร้างเว็บไซต์ วิเคราะห์ข้อมูล ไปจนถึงเขียนงานวิจัย และแสดงให้เห็นถึง ความสามารถด้านการวิจัยระดับ PhD
- แม้ยังมีข้อผิดพลาดอยู่ แต่เป็นข้อผิดพลาดในระดับ ความต่างด้านวิจารณญาณและความเข้าใจ ทำให้มีลักษณะใกล้เคียง “สมาชิกทีม AI” ที่ทำงานร่วมกับมนุษย์
- บทความเน้นย้ำว่าเรากำลัง “เปลี่ยนผ่านจากยุคของแชตบอตสู่ยุคของคู่หูดิจิทัล” และมนุษย์กำลังเปลี่ยนบทบาทจากผู้คอยแก้ความผิดพลาดของ AI ไปเป็น ผู้จัดการที่คอยกำกับงานของ AI
การมาของ Gemini 3 และการเปลี่ยนแปลงตลอด 3 ปี
- Google Gemini 3 ที่ปรากฏขึ้นราว 3 ปีหลังการเปิดตัว ChatGPT เป็นตัวอย่างที่สะท้อนความเร็วของพัฒนาการด้าน AI
- ในยุค GPT-3.5 ปี 2022 AI ยังทำได้เพียงสร้างย่อหน้าหรือบทกวีอย่างง่าย
- แต่ในปี 2025 Gemini 3 พัฒนาไปถึงระดับที่สามารถเขียนโค้ดและออกแบบ เกมแบบอินเทอร์แอ็กทีฟ ได้ด้วยตัวเอง
- Gemini 3 สร้าง เกมที่เล่นได้จริง ชื่อ “Candy-Powered FTL Starship Simulator” ตามคำขอของผู้ใช้
- สิ่งนี้แสดงให้เห็นว่า AI ได้พัฒนาจากยุคที่เพียงอธิบายข้อความ ไปสู่ขั้นที่ ลงมือสร้างโค้ดและอินเทอร์เฟซได้โดยตรง
Antigravity และ AI แบบเอเจนต์
- Google เปิดตัวเครื่องมือสำหรับนักพัฒนาชื่อ Antigravity พร้อมกับ Gemini 3
- เป็นระบบที่คล้ายกับ Claude Code หรือ OpenAI Codex โดยสามารถเข้าถึงคอมพิวเตอร์ของผู้ใช้และเขียนโค้ดได้อย่างอัตโนมัติ
- Antigravity นำแนวคิด Inbox มาใช้ โดยเมื่อ AI ต้องการการอนุมัติหรือความช่วยเหลือระหว่างทำงาน ก็จะส่งการแจ้งเตือนไปยังผู้ใช้
- ผู้ใช้สามารถสั่งงานเป็นภาษาอังกฤษ และ AI จะนำไปปฏิบัติในรูปแบบโค้ด
- ตัวอย่างเช่น วิเคราะห์ไฟล์บทความจดหมายข่าวของผู้เขียน และสร้าง เว็บไซต์ที่สรุปการคาดการณ์เกี่ยวกับ AI ขึ้นมาโดยอัตโนมัติ
- AI สามารถค้นหาเว็บ รันโค้ด ทดสอบบนเบราว์เซอร์ และแพ็กผลลัพธ์ให้อยู่ในรูปแบบที่นำไป deploy บน Netlify ได้
Gemini 3 ในฐานะ AI เพื่อการทำงานร่วมกัน
- Gemini 3 แบ่งปันความคืบหน้าอย่างโปร่งใสระหว่างทำงานผ่าน การขออนุมัติจากผู้ใช้
- ผู้ใช้สามารถตรวจสอบและแก้ไขข้อเสนอของ AI ระหว่างการทำงานร่วมกัน
- กระบวนการนี้ให้ประสบการณ์ที่ใกล้เคียงกับ “การบริหารจัดการ AI”
- AI ยังไม่สมบูรณ์แบบ แต่ข้อผิดพลาดส่วนใหญ่อยู่ในระดับ ความต่างด้านวิจารณญาณ หรือ การตีความเจตนาไม่ตรงกัน และแทบไม่พบปัญหา hallucination แบบเดิม
- การทำงานร่วมกับ Gemini 3 มีลักษณะคล้ายกับ “การบริหารสมาชิกในทีม” มากกว่าการพิมพ์พรอมป์ตอย่างง่าย และเน้นปฏิสัมพันธ์ที่ลึกขึ้น
ความสามารถด้านการวิจัยและการประเมินว่า “ระดับ PhD”
- Gemini 3 สามารถทำงานด้าน การวิเคราะห์ชุดข้อมูลวิจัยและการเขียนงานวิชาการ
- กู้คืนและจัดระเบียบไฟล์ข้อมูลคราวด์ฟันดิงเก่า พร้อมทำการวิเคราะห์ใหม่
- เขียน งานวิชาการความยาว 14 หน้า ในหัวข้อ “การก่อตั้งสตาร์ทอัปและกลยุทธ์ธุรกิจ”
- AI สามารถตั้งสมมติฐานด้วยตนเอง ทำการวิเคราะห์ทางสถิติ และสร้าง ตัวชี้วัดของตัวเอง (การวัดความแปลกใหม่ของไอเดีย)
- ผลลัพธ์มีคุณภาพในระดับนักศึกษาบัณฑิตศึกษา แม้เทคนิคทางสถิติและการพัฒนาทฤษฎีบางส่วนยังไม่สมบูรณ์
- แต่เมื่อให้คำสั่งเพิ่มเติม คุณภาพก็พัฒนาขึ้นอย่างมาก
- ผู้เขียนประเมินว่า “สติปัญญาระดับ PhD อยู่ไม่ไกลแล้ว”
การเปลี่ยนผ่านสู่คู่หูดิจิทัล
- Gemini 3 เป็น AI คู่หูที่ทั้งคิดและลงมือทำได้ และผู้คนนับพันล้านทั่วโลกสามารถเข้าถึงได้
- พัฒนาการของ AI ยังไม่มีสัญญาณชะลอตัว ขณะที่ การเติบโตของโมเดลแบบเอเจนต์ และ ความสำคัญของทักษะการบริหาร AI เด่นชัดขึ้น
- ผู้เขียนอธิบายว่าเราอยู่ในช่วงที่ “ยุคของแชตบอตกำลังเปลี่ยนไปสู่ยุคของคู่หูดิจิทัล”
- มนุษย์ไม่ได้เป็นเพียงผู้แก้ข้อผิดพลาดของ AI อีกต่อไป แต่กำลังกลายเป็น ผู้จัดการที่คอยกำกับงานของ AI
- ท้ายที่สุด Gemini 3 ยังสาธิตความสามารถเชิงสร้างสรรค์ที่ก้าวพ้นข้อความ เช่น สร้างภาพปกบล็อกด้วยโค้ดเพียงอย่างเดียว
- อย่างไรก็ตาม การให้ AI เข้าถึงคอมพิวเตอร์ย่อมมี ความเสี่ยงด้านความปลอดภัย จึงต้องใช้อย่างระมัดระวัง
1 ความคิดเห็น
ความคิดเห็นบน Hacker News
ทุกครั้งที่เห็นบทความแบบนี้ มักมีสิ่งหนึ่งที่หายไปเสมอ — คือคำถามว่า “มันดีไหม มันแม่นยำไหม”
edgeDetect(image)ความสำเร็จหรือล้มเหลวจะแตกต่างกันไปตามแต่ละโมเดลน่าสนใจที่จนถึงตอนนี้ วิธีโต้ตอบกับ AI ส่วนใหญ่ยังคงยึด กล่องข้อความ เป็นศูนย์กลาง
ปัญหา “ภาพหลอน (hallucination)” ยังคงมีอยู่
สำหรับคำถามว่า “มันมีสติปัญญาระดับ PhD หรือไม่?” ในฐานะนักศึกษาปริญญาโท/เอก ฉันก็รู้สึกคล้ายกัน
ความก้าวหน้าของ Google เกิดขึ้นทั้งในด้าน ซอฟต์แวร์และฮาร์ดแวร์
Gemini 3 น่าประทับใจ แต่ก็ยังให้ความรู้สึกว่าอยู่ภายใน ข้อจำกัดของวรรณกรรมที่มีอยู่เดิม
GPT-3 เปิดตัวในเดือนมิถุนายน 2020 ส่วน ChatGPT เป็นเวอร์ชัน 3.5
คำพูดที่ว่า “Human in the loop” กำลังพัฒนาจาก มนุษย์ที่คอยแก้ข้อผิดพลาดของ AI ไปเป็น มนุษย์ที่คอยสั่งการ AI นั้นได้ยินมานานแล้ว
มีคำถามว่าการ รันเครื่องมืออย่าง Claude Code หรือ Antigrav บนระบบโลคัลโดยตรง ปลอดภัยหรือไม่