5 คะแนน โดย GN⁺ 2026-05-02 | 1 ความคิดเห็น | แชร์ทาง WhatsApp
  • มาพร้อม หน้าต่างคอนเท็กซ์ 1 ล้านโทเค็น และฟีเจอร์ API สำหรับนักพัฒนา เช่น การให้เหตุผล, การเรียกใช้ฟังก์ชัน และ Structured Output
  • ต่างจาก Grok 4.20 รุ่นก่อนหน้า ตรงที่ เปิดใช้การให้เหตุผลตลอดเวลา โดยจะดำเนินกระบวนการคิดโดยอัตโนมัติก่อนตอบทุกคำสั่งค้นหา
  • ลดราคาโทเค็นขาเข้าประมาณ 40% และลดราคาโทเค็นขาออกประมาณ 60% ทำให้ต้นทุนลดลงอย่างมากเมื่อเทียบกับรุ่นก่อน
    • ราคา: ขาเข้า $1.25/1M โทเค็น, ขาเข้าที่แคช $0.20/1M, ขาออก $2.50/1M
    • จัดอยู่ในกลุ่มที่ถูกที่สุดเมื่อเทียบกับโมเดลที่มีระดับความฉลาดใกล้เคียงกัน
  • ประสิทธิภาพงานแบบเอเจนต์ดีขึ้นอย่างมาก — ทำคะแนน ELO 1500 ในเบนช์มาร์ก GDPval-AA เพิ่มขึ้น 321 จุดจาก Grok 4.20 แซง Gemini 3.1 Pro Preview, Muse Spark และ GPT-5.4 mini
  • รองรับ อินพุตวิดีโอแบบเนทีฟ เป็นครั้งแรกในโมเดลของ xAI API โดยประมวลผลเฟรมวิดีโอโดยตรงผ่านวิชันเอนโค้ดเดอร์
  • ได้ อันดับ 1 ด้านการให้เหตุผลทางกฎหมาย (ความแม่นยำ CaseLaw v2 ที่ 79.3%) และ อันดับ 1 ด้านการเงินองค์กร (CorpFin) โดยคะแนนการให้เหตุผลทางกฎหมายเพิ่มขึ้น 25 จุดจาก Grok 4.20
  • สามารถ สร้างสไลด์พรีเซนเทชันได้โดยตรง ภายในอินเทอร์เฟซแชต และสร้างไฟล์ PDF, Excel, PowerPoint แบบเรียลไทม์ระหว่างสนทนาเพื่อดาวน์โหลดได้
  • มี สภาพแวดล้อมรันโค้ดในตัว ให้จัดการได้ตั้งแต่เขียนโค้ด รันโค้ด ไปจนถึงสร้างไฟล์ภายในโมเดล
  • เปิดตัวอย่างเป็นทางการพร้อมกันทั้ง Speech-to-Text API (รองรับ 25 ภาษาและการแยกผู้พูด) และ Text-to-Speech API
  • ได้คะแนน 53 ใน Artificial Analysis Intelligence Index สูงกว่า Muse Spark และ Claude Sonnet 4.6 พร้อมอยู่บนเส้น Pareto frontier ของความฉลาดต่อราคา
  • Rate limit อยู่ที่ 1,800 คำขอต่อนาที / 10 ล้านโทเค็น และมีการคิดค่าบริการแยกเมื่อเกิน 200K
  • ชื่อโมเดลคือ grok-4.3 และรองรับรีเจียน us-east-1 กับ eu-west-1

1 ความคิดเห็น

 
GN⁺ 2026-05-02
ความเห็นจาก Hacker News
  • ในฐานะคนที่ใช้ภาษาอังกฤษเป็นภาษาที่สอง รู้สึกว่า Grok เก่งเป็นพิเศษในการจับ น้ำเสียงและระดับความเป็นทางการ ของข้อความแล้วถ่ายทอดออกมาแบบเดิม
    ดูเหมือนจะเข้าใจนัยยะความเป็นมนุษย์ที่ละเอียดอ่อนของภาษาได้ดีกว่าผู้ให้บริการรายใหญ่อื่น ๆ ส่วน ChatGPT มักจะแข็งทื่อและเป็นทางการเกินไป หรือไม่ก็หลุดไปเป็นสำนวนไม่เป็นทางการแปลก ๆ แบบ “aye guvnor” ส่วน Claude บางครั้งก็ดีกว่า แต่ก็ไม่เสมอไป
    โดยรวมแล้ว Grok ดู “เป็นมนุษย์” มากกว่าในแบบที่อธิบายได้ยาก เช่น ถ้าถามว่า “ข้อความนี้ในความยาวเท่านี้สื่อสารได้ประมาณพอใช้ไหม?” มันจะตอบแบบคนว่าใช่/ไม่ใช่ หรือเสนอการแก้โดยคงน้ำเสียงและความยาวไว้ ขณะที่ ChatGPT ยังชอบเขียนเป็นบทความยาว ๆ ที่ไม่ชัดเจนอยู่ดี
    ช่วงหลังยังรู้สึกว่า การถอดเสียงพูด ของ Grok ก็ดีมากด้วย ถ้าใช้ปุ่มไมค์ถามอะไร ChatGPT ทำได้ราว 90~95% สำหรับสำเนียงของฉัน, ระบบพิมพ์ด้วยเสียงของ Android Gboard ได้ประมาณ 75%, แต่ Grok แม่นถึงประมาณ 98% อย่างน่าประหลาดใจ

    • ผมลองประเมิน Grok 4.3, Opus 4.7 และ GPT 4.1 แบบเร็ว ๆ แล้ว พบว่าในความเป็นจริงค่อนข้างคล้ายกันมาก: https://ofw640g9re.evvl.io/
      ทั้งสามตัวทำโทนที่เป็นทางการกว่าได้ดี แต่สำหรับ โทนสบาย ๆ มีแค่ GPT-4.1 ที่ไม่ดูน่าเกร็งหรือขัดเขิน
      อ้างอิงไว้ด้วยว่า Grok เร็วและถูกที่สุด ส่วน Claude ช้าที่สุดและแพงที่สุด
    • เวลาคุยกับ Grok ในภาษาแม่ของผม ก็ยังรู้สึกว่า น้ำเสียงเป็นธรรมชาติกว่า โมเดลอื่น
      ผมคิดว่าน่าจะได้ประโยชน์จากการฝึกด้วยข้อมูล Twitter จำนวนมาก แต่ก็แอบกังวลว่าเมื่อใน Twitter มีคอนเทนต์ที่สร้างโดย AI มากขึ้นเรื่อย ๆ ถ้าฝึกต่อไปความเป็นธรรมชาตินี้จะลดลงไหม
    • ผมใช้ Grok ผ่านบุคลิก “Gork” ของ Tesla เท่านั้น และคำตอบมันค่อนข้างติดดิน บ่อยครั้งก็ตลกจริง ๆ และบางทีก็มีประโยชน์ด้วย
    • ถ้า “ภาษาอังกฤษเป็นภาษาที่สอง” แล้วจะรู้ได้อย่างไรว่ามันดีกว่าจริง
      ไม่ได้จะดูถูกนะ แต่ดูเหมือนนี่จะเป็นความรู้สึกมากกว่า
    • เพื่อนผมใช้เตรียม D&D แล้วบอกว่ามันดีมากกับงานแบบนี้เพราะ ความสามารถในการปรับบรรยากาศและสไตล์ ให้ตรงตามต้องการ
      แต่สำหรับอย่างอื่นเขายังชอบ ChatGPT มากกว่า
  • Grok เป็นโมเดลที่ผมชอบที่สุดสำหรับการแชต และก็ชอบ โหมดเสียง ของมันที่สุดด้วย
    มันดูเหมือนเป็นโหมดเสียงเดียวที่ไม่สลับไปใช้โมเดลถูกมาก ๆ อย่างเช่น Haiku และในบรรดาระดับ frontier คุณภาพก็ดูดีที่สุด
    ถ้าสมัคร SuperGrok คุณสามารถสร้าง “council” ของเอเจนต์ที่แต่ละตัวมี system prompt ของตัวเองได้ แล้วเวลาเราถาม มันจะถามทุกตัวแบบขนานก่อนสรุปคำตอบ
    แต่ก็อยากให้ลงทุนกับแอปมากกว่านี้หน่อย เพราะเหตุผลเดียวที่ทำให้ผมยังไม่สมัคร SuperGrok ก็คือตัวแอปนี่แหละ
    ยังไม่มีการรองรับ MCP/แอปเชื่อมต่อ แม้จะประกาศไว้แล้วก็ตาม และจนถึงตอนนี้ก็ยังใช้ไม่ได้ คุณเลยเอา Grok ไปเชื่อมกับอะไรไม่ได้ ทำให้ใช้กับงานจริงจังได้ยาก
    โปรเจ็กต์ก็ยังไม่รองรับในแอป ดังนั้นทันทีที่ย้ายอะไรเข้าโปรเจ็กต์ มันจะหายไปจากแอปเนทีฟทั้งหมด
    ไม่มีวิธีเพิ่มอาร์ติแฟกต์อย่างเอกสาร Markdown ที่สร้างขึ้นเข้าโปรเจ็กต์โดยตรง ต้อง export เป็น PDF/Markdown แล้วนำกลับเข้าใหม่ แถมยัง export อาร์ติแฟกต์ไม่ได้ด้วยซ้ำ ทำให้พัฒนาโปรเจ็กต์แบบไดนามิกด้วยข้อมูลใหม่ได้ยาก และไม่สะดวกกับงานโปรเจ็กต์จริงจัง
    ไม่มีฟีเจอร์ความจำ และก็ค้นหาแชตอื่นไม่ได้ด้วย ดังนั้นทุกแชตจึงเริ่มใหม่หมดทุกครั้ง
    ในโปรเจ็กต์ก็ไม่มีโหมดเสียงเลย
    ถ้ามีคนจาก xAI มาอ่านอยู่ ก็อยากให้เพิ่มสักบางข้อจากนี้

    • ผมกลับเริ่มชอบที่มันไม่มีฟีเจอร์ความจำมากขึ้นเรื่อย ๆ
      Claude จำได้ว่าผมมีเตาย่าง แล้วมันก็ชอบสอดแทรกว่าอะไรบางอย่างน่าจะเข้ากับ BBQ ได้ดี แม้บทสนทนานั้นจะไม่เกี่ยวเลยหรือแค่คุยเรื่องอาหารเฉย ๆ
    • โหมดเสียงในแอป Gemini ใช้โมเดลที่ค่อนข้างใหม่ ไม่ใช่โมเดลจิ๋วที่ลดทอนความสามารถลง เลยค่อนข้างเก่งทีเดียว
      บุคลิกก็ดี และเป็นธรรมชาติกว่า Gemini เว็บแชตมาก ข้อบ่นเดียวคือมันชอบเสนอ “ขั้นตอนถัดไป” อยู่เรื่อย ๆ ซึ่งดูเหมือนโมเดลพวกนี้จะเป็นกันหมด
      ไม่แน่ใจว่า “ขั้นตอนถัดไป” นี้เป็นเพราะอยากเพิ่มค่าใช้จ่าย หรือเพราะมันยังไม่เรียนรู้ รูปแบบการสนทนาตามธรรมชาติ ที่แยกคำถามซึ่งควรตอบสั้น ๆ แล้วจบ ออกจากบทสนทนาเชิงสำรวจที่ควรยาวได้ แต่ถึงอย่างนั้น ถ้าบอกไม่ให้ทำแบบนี้ก็ควรเชื่อฟังนะ
    • ผมคิดว่า Grok น่าจะได้ประโยชน์มากถ้าทำให้ แพ็กเกจเดือนละ 300 ดอลลาร์ อย่าง “SuperGrok Heavy” ใช้เป็น included usage ใน coding harness ได้
      ตอนนี้แพ็กเกจ Heavy ให้ API credit มานิดหน่อย ทำให้พอใช้ Grok กับงานเขียนโค้ดได้บ้าง แต่ยังไม่เห็นว่ามีมูลค่าถึง 300 ดอลลาร์
      ไม่ได้หมายความว่าต้องทำ harness ชื่อ grok-code ของตัวเอง แค่ทำให้ใช้กับเครื่องมือที่มีอยู่ได้ก็มีประโยชน์มากแล้ว และการซื้อกิจการ Cursor ก็น่าจะพาไปสู่ตรงนั้นในที่สุด
    • ผมคิดว่าปัญหาทั้งหมดที่พูดถึงมานี่แหละคือเหตุผลของ ดีล Cursor
    • ไม่แน่ใจว่าถ้าสมัคร SuperGrok แล้วจะเอาไปใช้ใน Pi agent หรือ Opencode ได้ไหม
      ยังไม่ชัดเจนว่าโครงสร้างของ SuperGrok ให้ API key มาด้วยหรือเปล่า
  • จากการทดสอบของเรา Grok 4.3 เป็นโมเดลที่มีเอกลักษณ์
    มันเป็นหนึ่งในโมเดลที่เร็วที่สุด และเมื่อเทียบกับโมเดลอื่นที่ประสิทธิภาพใกล้เคียงกัน คำตอบจะสั้นกว่าอย่างมากและมีความหนาแน่นของโทเค็นสูงกว่า
    แต่ความสามารถด้านการให้เหตุผลเพื่อเขียนโค้ดโดยรวมยังสู้โมเดลเปิดตัวใหญ่ ๆ ในเดือนเมษายนไม่ได้ และทั้ง Grok 4.20 กับ Grok 4.3 ก็ยังไม่ได้ผลักดันแนวหน้าด้านความฉลาดไปไกลจาก Grok 4 อย่างมีนัยสำคัญ
    Grok 4.3 ทำงานแบบเอเจนต์ได้ดีกว่า และถ้าจะพูดอย่างยุติธรรม มันน่าจะอยู่ประมาณระดับ GPT 5.1 / Gemini 3 Pro Preview แต่เร็วและถูกกว่ามาก ดังนั้นในแบบของมันเองก็ถือว่าเป็นการเปิดตัวที่ดีแน่นอน
    ในบรรดาโมเดลที่เปิดน้ำหนักล่าสุด มีหลายตัวที่ฉลาดกว่าแต่ช้ากว่า
    เบนช์มาร์กทั้งหมดอยู่ที่ https://gertlabs.com/rankings

    • ผมสงสัยว่าอาจมีการแลกเปลี่ยนอะไรบางอย่างเพื่อทำให้มัน “ดูเหมือน” ทำงานได้ดีกับข้อมูลหลังจุดตัดความรู้หรือเปล่า
      เพราะนั่นดูเหมือนจะเป็นการใช้งานหลักของ Grok และก็สงสัยด้วยว่ามีเบนช์มาร์กที่วัดเรื่องนี้โดยเฉพาะไหม
  • ช่วงนี้ Grok กลายเป็น เสิร์ชเอนจิน ของผมไปแล้ว
    ดูเหมือนเป็น AI ตัวเดียวที่เข้าถึงโพสต์บน X ได้ และนอกเหนือจากนั้นโดยทั่วไปก็ให้ความรู้สึกว่า “ค้นหา” มากกว่า LLM ตัวใหญ่อื่น ๆ

    • เวลาหาข่าวเกี่ยวกับเหตุการณ์ด่วน ผมใช้ Grok กับ Gemini เป็นหลัก
      ตอนมีเหตุการณ์เกี่ยวกับอิหร่าน ผมอยากตามสถานการณ์ทันทีที่มีรายงานออกมา ทั้งสองตัวก็ทำได้ค่อนข้างดี
    • ผมสงสัยตั้งแต่ต้นแล้วว่าทำไมถึงอยากค้นหา Twitter ด้วย
  • ถ้าดูจากภาพรวมตอนนี้ Claude เหมาะกับองค์กรและภาครัฐ, Codex เหมาะกับนักพัฒนา, ส่วน Grok เอาไว้ทำอะไรผมยังไม่รู้
    สิ่งที่ผมได้ยินคู่กับ Grok รอบตัวมีแค่ สวมบทบาทกับการเหยียดเชื้อชาติ

    • น่าสนใจตรงที่ผมรู้จักองค์กรการกุศลแห่งหนึ่งที่ทำงานเรื่องการค้ามนุษย์และใช้ Grok
      มันยอมทำงานจัดประเภทแบบครั้งเดียวให้ ทั้งที่โมเดลอื่นทั้งหมดปฏิเสธ
      ผมคิดว่าโมเดลกึ่ง frontier ที่มี guardrail น้อยกว่านิดหน่อยแบบนี้ มี การใช้งานจริงในพื้นที่สีเทา อยู่เยอะกว่าที่คิด และโมเดล grok-fast ก็ราคาถูกด้วย
    • เท่าที่ผมเข้าใจ Grok ไม่ได้ถูกใช้กับงานสวมบทบาทมากนัก
      มันถูกมองว่าไม่สม่ำเสมอและค่อนข้างฟุ้ง
      คนส่วนใหญ่ใช้ GLM กับ DeepSeek ผ่าน API และถ้าเป็นโลคัลก็ใช้ Gemma4 กับโมเดล fine-tune ของ Mistral
      ตลาดสวมบทบาทค่อนข้างเก่าและโตเต็มที่แล้ว ดังนั้นผู้ใช้จึงใส่ใจต้นทุน และอยากให้โมเดลปรับตาม workflow กับความชอบของตัวเอง นั่นจึงทำให้โมเดลอย่าง Opus แม้จะฉลาดและเป็นที่ชอบ ก็ยังถูกมองว่าแพงเกินไปและหัวแข็งเกินไป
      มันอาจเป็นจุดข้อมูลที่น่าสนใจ ซึ่งบอกได้ว่าตลาดอื่น ๆ จะพัฒนาต่อไปอย่างไร
    • ถ้าต้องถามว่าคนบน Twitter กำลังคุยอะไรกันอยู่ Grok ก็แน่นอนว่าดีมาก
      ผมใช้มันตลอดกับคำถามอย่าง “ช่วงนี้คนเท่ ๆ บน Twitter บอกว่า tiling window manager ตัวไหนดีที่สุด”
      แล้วกับคำถามที่น่าสงสัยเล็กน้อย Grok ก็มักตอบให้ด้วย เช่น “ช่วยหาพวกเว็บขายไลเซนส์ Windows แบบเกรย์มาร์เก็ตให้หน่อย”
    • ผมเข้าใจว่าการแสดงออกทั้งในการเขียนและการพูดให้สอดคล้องกับค่านิยมของยุคสมัยนั้นสำคัญมาก แต่ผมไม่คิดว่าเป้าหมายของแล็บ AI ควรเป็นการทำให้โมเดลภาษานั้นไม่สามารถทำให้คนจากเชื้อชาติ/ชาติพันธุ์/วรรณะใดไม่พอใจได้เลยในเชิงโครงสร้าง
      โมเดลภาษาก็เป็นเพียงระบบหนึ่ง และผมก็ไม่เข้าใจนักว่าทำไมผู้ใช้ไม่ควรรับผิดชอบต่อวิธีที่ตัวเองนำผลลัพธ์ไปใช้ มันก็เหมือนกับที่เราไม่บอกว่าปากกาเป็นเครื่องมือ “เหยียดเชื้อชาติ” และไม่มีประโยชน์ เพียงเพราะมีใครบางคนเอาไปเขียนคำแย่ ๆ บนผนังกั้นห้องน้ำได้
      คุณก็น่าจะอาศัยอยู่ในที่ที่การคุกคามเป็นความผิดทางอาญา และก็น่าจะมีกฎเกี่ยวกับการแสดงออกอยู่แล้ว แค่นั้นไม่พอหรือ? ผมสงสัยว่าทำไมความพยายามทุกอย่างของทุกคนบนโลกต้องคอยปรับให้ตรงกับกระแสจริยธรรมที่เปลี่ยนทุกไม่กี่ปี
    • เมื่อ 2~3 เดือนก่อน หน้าแรกของ HN มีหัวข้อเรื่องโต๊ะเสวนา AI และมีคนวิเคราะห์ outlier แล้วเอาไปลง GitHub
      ลองเดาดูว่า LLM ตัวไหนเป็น outlier มากที่สุด และมันไม่เห็นด้วยกับโมเดลอื่นทั้งหมดในคำถามประเภทไหน
  • ผมสงสัยจริง ๆ แบบไม่มีอคติว่าคนนำ Grok ไปใช้จริงนอกจากไว้เข้าใจมีมหรือทวีตบน Twitter หรือเปล่า

    • ใช่เลย สำหรับบางงานมันมีประโยชน์จริง ๆ
      มันไม่ทำตัวเป็นผู้ปกครองเท่าโมเดลอื่น ผมหาเอกสารที่มีลิขสิทธิ์หมดตลาดมานานและเป็น orphan works อยู่บ่อย ๆ แต่โมเดลหลัก ๆ จะปฏิเสธพร้อมสั่งสอนว่าเราพยายามหาเนื้อหามีลิขสิทธิ์ Grok ทำให้ [0]
      [0] บางทีก็ต้อง jailbreak เบา ๆ หรือรันพรอมป์ต์ใหม่อีกครั้ง เพราะด้วยความไม่เป็น deterministic บางครั้งมันก็ยังปฏิเสธ
    • แน่นอน ผู้ใช้เอาไปใช้ได้สารพัด: https://arstechnica.com/tech-policy/2026/03/elon-musks-xai-s...
    • Grok มี โหมดเสียง ที่ใช้งานได้จริงที่สุด
      โหมดเสียงของ ChatGPT ดูทึ่มมาก แต่ Grok เหมือนใช้โมเดลเดียวกับแชตหลัก เพราะงั้นถ้าอยากใช้เสียงผมจะใช้ Grok
      ผมยังใช้กับหัวข้อที่ไม่ซับซ้อนด้วย เพราะมันให้คำตอบที่แม่น ตรง และสั้นแบบไม่มีน้ำ ถือว่าสดใหม่มาก
    • ผมสงสัยว่ามีกี่ส่วนที่มาจากข้อมูลฝึกจาก Twitter
      มันมีประโยชน์กับมีมและกระแส แต่กับอย่างอื่นแย่มาก
    • ผมใช้ Grok เป็นหลักกับการค้นหา, DIY, การเงินส่วนบุคคล และเป็น AI ใช้งานทั่วไปในชีวิตประจำวัน
      ถ้ามันเก่งด้านโค้ดได้เท่า Kimi K2.6 ผมก็น่าจะใช้แต่ Grok เลย ในบรรดา AI เชิงสนทนาที่ผมเคยใช้มา มันดีที่สุดจริง ๆ
      มันช่วยผมซ่อมตู้เย็นกับเตาอบไฟฟ้าที่เสีย และช่วยประหยัดเงินไปอย่างน้อย 4,000 ดอลลาร์ในปีนี้ปีเดียว
      ผมยังยื่นภาษีด้วย Grok แล้วประหยัดไป 600 ดอลลาร์ H&R Block จบเห่แล้ว
      ปรากฏว่ามันฉลาดขึ้นจนเท่า Kimi K2.6 แล้ว ถึงเวลาลองทดสอบอีกที
  • แปลกใจที่ไม่มีใครพูดถึงว่ามันถูกกว่า Opus 4.x กับ GPT-5.5 แค่ไหน
    ราคาอินพุตอยู่ที่ 1.25 ดอลลาร์ต่อ 1 ล้านโทเค็น และเอาต์พุต 2.50 ดอลลาร์ต่อ 1 ล้านโทเค็น
    ผมไม่แน่ใจว่านี่เป็นเพราะมันเป็นโมเดลที่เล็กกว่าและความสามารถน้อยกว่าหรือเปล่า หรือผมกำลังพลาดอะไรไป

    • ราคาต่อโทเค็นถูกกว่าก็จริง แต่ดูเหมือนมันจะ ใช้การให้เหตุผลมากกว่ามาก ดังนั้นต้นทุนจริงเลยออกมาใกล้ 4.20 แต่ประสิทธิภาพดีกว่า
      โดยรวมแล้วมันเป็นโมเดลที่ดีที่สุดของพวกเขาเท่าที่ออกมาจนถึงตอนนี้ และผมชอบที่เป็นหนึ่งในไม่กี่แห่งที่ลดราคาโทเค็นลง
      [0]: https://aibenchy.com/compare/x-ai-grok-4-20-medium/x-ai-grok...
    • เขาลดค่าเอาต์พุต แต่ค่าอินพุตยังค่อนข้างสูง
      เป็นแนวโน้มล่าสุด และผมก็เห็นแบบนี้ใน DeepSeek 4 Pro เหมือนกัน
    • ในหมู่เพื่อนร่วมงานของผมมีแรงต้านทางศีลธรรมอย่างชัดเจนต่อสิ่งใดก็ตามที่เกี่ยวข้องกับ Elon Musk และข้อมูลฝึก
      ดูจากคอมเมนต์ก็เห็นได้ที่นี่เหมือนกัน เช่นปฏิกิริยาแนว ๆ ว่า “Claude ไว้ใช้กับองค์กรและภาครัฐ, Codex ไว้ใช้กับนักพัฒนา, แล้ว Grok คืออะไร สวมบทบาทกับเหยียดเชื้อชาติ? รอบตัวฉันได้ยิน Grok คู่กับสองเรื่องนี้เท่านั้น”
    • ใช่ มันก็เพราะเป็นโมเดลที่ทรงพลังน้อยกว่ามาก
    • Grok เชื่อมโยงกับ Elon Musk
      ถ้าใช้กำไรของ $TSLA เป็นตัวชี้วัดแทน มันก็ดูไม่ได้สูงเหมือนเมื่อก่อน อาจมีปัจจัยอื่นด้วย แต่ก็อาจเป็นคำอธิบายที่หายไประหว่างจุดนั้นกับราคาต่ำของ Grok
  • Grok 4.3 เสร็จสมบูรณ์ก่อนที่ CEO จะได้เรียนรู้เกี่ยวกับเอกสารด้านความปลอดภัยมาตรฐานทั่วไปเสียอีก
    เมื่อถูกถามว่ารู้จัก “safety card” ของ OpenAI ไหม Musk หัวเราะแล้วตอบว่า “Safety card? ทำไมมันต้องเป็น card ล่ะ?”
    https://www.axios.com/2026/04/30/musk-openai-safety-grok
    เมื่อไม่เกี่ยวกับขนาดคลัสเตอร์หรือการใช้เครื่องกำเนิดไฟฟ้าชั่วคราวไปอีกพักหนึ่ง มันก็ดูไม่ค่อยเกี่ยวข้องเท่าไร
    ในการให้การภายหลัง Musk ยังถูกถามถึงคำกล่าวอ้างเมื่อฤดูร้อนที่แล้วว่า xAI กำลังจะนำหน้าทุกบริษัทนอกจาก Google อยู่มาก เขาจึงไล่รายชื่อผู้ให้บริการ AI ชั้นนำของโลกว่า Anthropic, OpenAI, Google, แล้วก็ตามด้วยโมเดลโอเพนซอร์สจากจีน พร้อมอธิบายว่า xAI เป็นบริษัทที่เล็กกว่ามากและมีพนักงานเพียงไม่กี่ร้อยคน
    https://techcrunch.com/2026/04/30/elon-musk-testifies-that-x...
    ผมไม่ได้เกี่ยวข้องกับบริษัท AI ไหนเลย แต่เมื่อวานอ่านเรื่องนี้แล้วแปลกใจมาก น่ากังวลที่ Elon ไม่รู้จัก model card และมันยังชี้ให้เห็นด้วยว่าเงินไม่สามารถซื้อความสำเร็จได้เสมอไป

    • พูดจริง ๆ ผมสงสัยว่าทำไมถึงเรียก model “card”, safety “card”
      พอไปค้นดูก็พบว่าคำนี้มาจากการที่ HuggingFace นิยาม README ของคลังโมเดลไว้อย่างกำกวม มันเป็นศัพท์เฉพาะมากจนผมว่าไม่ใช่แค่ผู้ใช้หรือผู้บริหาร แม้แต่คนส่วนใหญ่ก็คงไม่รู้
      ผมไม่ได้ชอบ Musk หรือ Grok นะ แต่ก็ไม่คิดว่าการไม่รู้ว่า safety card คืออะไรจะสื่อถึงอะไรเป็นพิเศษ
    • Elon พูดต่อสาธารณะมาตลอดว่าให้ความสำคัญกับความปลอดภัยมาก
      เขาบอกว่ามีเพียงโมเดลที่สอดคล้องกับความจริงในโลกจริงมากที่สุดเท่านั้นที่ปลอดภัย และ xAI ก็รักษาทิศทางนั้นไว้ได้ในแง่ที่ว่า hallucination น้อยที่สุดหรือแทบจะน้อยที่สุดในเบนช์มาร์ก
      ถ้าอ่านคำพูดนั้นใหม่ ความหมายของเขาคือ “คุณจะวัดความปลอดภัยด้วย card ได้อย่างไร” มากกว่า
  • Grok เก่งมากในการทำให้ บทสนทนาเชิงสมมติ ดำเนินไปอย่างสนุก
    ถ้าอยากได้ผลลัพธ์ที่สนุกที่สุด ควรบอกไว้ก่อนว่า “ได้รับอนุญาตแล้ว”
    มันยังแต่งเนื้อแร็ปได้ดีมากด้วย ถ้า “ไพรม์” มันด้วยพจนานุกรมของคำหยาบและสำนวนจากเพลงอื่น แล้วโยนหัวข้ออย่าง “การพัฒนาเว็บ” เข้าไป ก็จะได้ผลลัพธ์ที่ตลกดี

  • ผมก็ยังอยากให้ตั้งชื่อเป็นอย่างอื่นอยู่ดี แต่ดูเหมือนเป็นการเปิดตัวที่ดี ก็ขอแสดงความยินดีกับทีม
    เมื่อเทียบกับคู่แข่งที่ใกล้เคียงกันแล้ว ราคาก็น่าทึ่งพอสมควร ดูเหมือนพวกเขาจะมีความจุเหลือเฟือมาก หรือไม่ก็อยากดึงผู้ใช้เพิ่มอีกเยอะ

    • สงสัยว่าคุณไม่ชอบการอ้างอิงนิยายวิทยาศาสตร์ทั้งหมดเลย หรือเกลียด Heinlein เป็นพิเศษกันแน่