• อีลอน มัสก์เปิดเผยความคืบหน้าการฝึกโมเดลใหม่ของ Grok ด้วยตนเองบน X (Twitter) ระหว่างวันที่ 15–17 พฤษภาคม
  • เวอร์ชันที่เปิดเผยอยู่ในปัจจุบัน (v4.3) อิงจากโมเดลพื้นฐาน V8 ขนาด 0.5T พารามิเตอร์ และกำลังปรับปรุงต่อเนื่องทุก ๆ ไม่กี่วัน
  • ส่วน V9 ที่กำลังพัฒนาภายในมีขนาด 1.5T พารามิเตอร์ โดยเขาระบุว่า “เพิ่งฝึกเสร็จไปเมื่อกี้”
    • มัสก์บอกว่าขั้นตอนนี้มักถูกเรียกว่า “pre-training” แต่ชี้ว่าเป็น “คำเรียกที่ไม่ถูกต้อง”
    • เมื่อเทียบกับ V8 ทั้งการคัดสรรข้อมูล สูตรการฝึก และขนาดโมเดล ล้วนได้รับการอัปเกรดครั้งใหญ่
    • ต่างจาก V8 ที่ฝึกบน Hopper, V9 ถูกปรับให้เหมาะกับสถาปัตยกรรม Blackwell
  • ขั้นถัดไปคือการฝึกเสริม (supplemental training หรือขั้นที่มักถูกเรียกว่า “mid-training”) โดยจะเพิ่มข้อมูลจาก Cursor เข้าไป
  • มัสก์ระบุว่า “V9 แสดงประสิทธิภาพที่ยอดเยี่ยมมากอยู่แล้ว แม้ก่อนใส่ข้อมูลจาก Cursor”

▍เบื้องหลัง: ดีล SpaceX-Cursor

  • ในเดือนเมษายน 2026 SpaceX (ที่ควบรวมกับ xAI ไปเมื่อกุมภาพันธ์ปีก่อน) ได้ทำสัญญาออปชันเพื่อเข้าซื้อ Cursor ภายในปีนี้ที่มูลค่า 6 หมื่นล้านดอลลาร์ หรือจ่าย 1 หมื่นล้านดอลลาร์เป็นค่าตอบแทนสำหรับความร่วมมือ
  • ก่อนสัญญานี้ไม่นาน วิศวกรอาวุโสของ Cursor อย่าง Andrew Milich และ Jason Ginsberg ได้ย้ายไปร่วมงานกับ xAI และเข้าร่วมในโครงสร้างที่รายงานตรงต่อมัสก์
  • เป็นการผสานซูเปอร์คอมพิวเตอร์ xAI Colossus (กำลังประมวลผลเทียบเท่า H100 จำนวน 1 ล้านตัว) เข้ากับผลิตภัณฑ์สำหรับนักพัฒนาและเครือข่ายการกระจายของ Cursor
  • เดิม Cursor เช่าชิป xAI หลายหมื่นตัวเพื่อใช้ฝึกโมเดลของตนเอง (Composer) และกระแสนี้ก็ถูกทำให้เป็นทางการผ่านสัญญาฉบับนี้
  • กล่าวคือ คำพูดเรื่อง “การฝึกเสริมด้วยข้อมูล Cursor” สำหรับ Grok V9 ครั้งนี้ ไม่ได้หมายถึงแค่ความร่วมมือธรรมดา แต่หมายถึงการที่ซินเนอร์จีด้านข้อมูลจากสัญญาออปชันเข้าซื้อกิจการ เริ่มเข้าสู่ไปป์ไลน์การฝึกโมเดลจริงแล้ว

▍ประเด็นน่าอ่าน

  • น่าสนใจที่มัสก์ปฏิเสธคำมาตรฐานของอุตสาหกรรมอย่าง “pre-training” อย่างเปิดเผย และเน้นการแบ่งขั้นเป็น “supplemental training” / “mid-training”
  • สิ่งที่ Cursor ถือครองไม่ใช่แค่โค้ด แต่คือ “ข้อมูลพฤติกรรมการเขียนโค้ด” เช่น พฤติกรรมการแก้ไขแบบเรียลไทม์ ผลการทดสอบ ล็อก และภาพหน้าจอของนักพัฒนาหลายล้านคน → เป็นทรัพย์สินที่มีมูลค่าสูงที่สุดสำหรับการฝึก coding agent
  • ในสถานการณ์ที่ Anthropic Claude และ OpenAI Codex ครองตลาดการเขียนโค้ดอยู่ การเคลื่อนไหวนี้จึงถูกมองว่าเป็นไพ่ที่ตรงที่สุดของ xAI ในการลดช่องว่าง

ที่มา:

ยังไม่มีความคิดเห็น

ยังไม่มีความคิดเห็น