1 คะแนน โดย GN⁺ 3 시간 전 | 1 ความคิดเห็น | แชร์ทาง WhatsApp
  • Anthropic กลายเป็นสตาร์ตอัป AI ที่มีมูลค่าสูงที่สุดในโลก แซงหน้า OpenAI ในด้านมูลค่าประเมินหลังการระดมทุนรอบใหม่
  • มูลค่าประเมินของ Anthropic ผู้พัฒนา Claude เข้าใกล้ 1 ล้านล้านดอลลาร์ แล้ว โดยเพิ่มขึ้นเกือบ 3 เท่าจากราว 3.8 แสนล้านดอลลาร์ในเดือนกุมภาพันธ์
  • บริษัทระดมทุนได้ 6.5 หมื่นล้านดอลลาร์ในรอบ Series H โดยมี Altimeter Capital, Dragoneer, Greenoaks และ Sequoia Capital เป็นนักลงทุนหลัก
  • แรงขับเคลื่อนการเติบโตมาจาก ผู้ช่วย AI Claude และ Claude Code ที่นักพัฒนาใช้งานอย่างแพร่หลาย โดยรายได้ต่อปีเพิ่มจาก 1 หมื่นล้านดอลลาร์เป็น 4.7 หมื่นล้านดอลลาร์
  • OpenAI ถูกประเมินมูลค่าไว้ที่ 8.52 แสนล้านดอลลาร์ หลังรอบระดมทุน 1.22 แสนล้านดอลลาร์ในเดือนมีนาคม และทั้งสองบริษัทต่างกำลังพิจารณาการเสนอขายหุ้นต่อสาธารณะ

มูลค่าประเมินและการระดมทุน

  • Anthropic กลายเป็นสตาร์ตอัป AI ที่มีมูลค่าสูงที่สุดในโลก แซงหน้า OpenAI ในด้านมูลค่าตลาดหลังการระดมทุนรอบใหม่
  • มูลค่าประเมินของ Anthropic ผู้พัฒนา Claude เข้าใกล้ 1 ล้านล้านดอลลาร์
  • Anthropic ระดมทุนได้ 6.5 หมื่นล้านดอลลาร์ในรอบ Series H
  • นักลงทุนหลักได้แก่ Altimeter Capital, Dragoneer, Greenoaks และ Sequoia Capital
  • มูลค่าประเมินใหม่นี้สูงขึ้นเกือบ 3 เท่าเมื่อเทียบกับราว 3.8 แสนล้านดอลลาร์ในเดือนกุมภาพันธ์
  • แพ็กเกจการลงทุนนี้รวมถึงเงินลงทุนที่ตกลงไว้ก่อนหน้าแล้วด้วย เช่น 5 พันล้านดอลลาร์จาก Amazon

ปัจจัยการเติบโตและการแข่งขัน

  • ปัจจัยขับเคลื่อนการเติบโตของ Anthropic คือความนิยมของ ผู้ช่วย AI Claude และบริการ Claude Code ที่นักพัฒนาซอฟต์แวร์ใช้อย่างแพร่หลาย
  • รายได้ต่อปีของบริษัทเพิ่มขึ้นจากราว 1 หมื่นล้านดอลลาร์เป็น 4.7 หมื่นล้านดอลลาร์
  • Anthropic เปิดตัวโมเดล AI ใหม่ Claude Opus 4.8 และระบบปิด Claude Mythos Preview ที่ให้ฟีเจอร์ความปลอดภัยไซเบอร์ที่เสริมความสามารถสำหรับลูกค้าองค์กร
  • Krishna Rao CFO ของ Anthropic ระบุว่า ความต้องการผลิตภัณฑ์ Claude ยังคงเพิ่มขึ้นอย่างรวดเร็วทั่วโลก
  • OpenAI ถูกประเมินมูลค่าไว้ที่ 8.52 แสนล้านดอลลาร์ หลังรอบระดมทุน 1.22 แสนล้านดอลลาร์ในเดือนมีนาคม
  • บริษัท AI รายใหญ่กำลังเตรียมเข้าตลาดหุ้น และตามรายงานของ CNBC ระบุว่า OpenAI อาจยื่น IPO ได้ภายในไม่กี่สัปดาห์ข้างหน้า
  • Anthropic ก็กำลังพิจารณาการเสนอขายหุ้นต่อสาธารณะเช่นกัน แต่ยังไม่ได้เปิดเผยช่วงเวลาที่แน่ชัด

1 ความคิดเห็น

 
GN⁺ 3 시간 전
ความเห็นจาก Hacker News
  • อยากให้เหล่านักพัฒนาเลิกพูดเสียทีว่าพวกตน ไม่ถูกการตลาดชักจูง เห็นกลุ่มที่คุยกันแต่เรื่อง Claude บ่อยมาก จนเหมือนงานปาร์ตี้ Tupperware ยุคใหม่
    เพื่อนร่วมงานคนหนึ่งมั่นใจมากว่า Claude ดีกว่า ผมเลยใช้ Claude Code กับ Codex harness ให้ทำ PR ที่ต้องการอยู่ไม่กี่อันด้วย gpt5.5 และ opus4.7 แล้วให้เขาดูแค่โค้ดและทายว่าเป็นโมเดลไหน แต่เขาแยกไม่ออก
    คิดว่า 99% ของคนที่นี่ก็คงแยกไม่ออกเหมือนกัน ถ้าให้ทดสอบ 5 โมเดลที่ผลลัพธ์ทั้งหมดมาจากโมเดลเดียวกัน สุดท้ายก็เป็นแค่ความรู้สึกล้วนๆ

    • ไม่เข้าใจว่าทำไมถึงคาดหวังว่าจะมองออกถึง ลายเซ็นของโมเดล จาก PR แค่สองอัน ทั้งที่มี benchmark จำนวนมากที่อิงจากการทดสอบหลายร้อยครั้งอยู่แล้ว ซึ่งบอกว่า GPT-5.5 กับ Opus-4.8 ให้ผลใกล้เคียงกัน และก็ยังยากจะเข้าใจด้วยว่าการทดสอบเหล่านั้นกำลังตรวจอะไร
      ถ้าสมัครใช้ทั้งสองตัวแล้วรันด้วยการใช้เหตุผลสูงสุด ก็จะเห็นจุดแข็งและจุดอ่อนสัมพัทธ์ของแต่ละโมเดลได้ การไล่ดูโค้ดอย่างเดียวไม่ได้ทำให้เห็นเสมอไป บางปัญหาโมเดลหนึ่งจะวนอยู่นาน ขณะที่อีกโมเดลหาส่วนที่เหมาะของ codebase เจอและเสนอวิธีแก้ที่มีประสิทธิภาพ
      antirez ก็เคยบอกว่าสำหรับงาน optimization ที่เขาทำอยู่ GPT-5.5 ดีกว่า Opus ในทางกลับกันก็มีงานอีกกลุ่มที่ GPT-5.5 พลาดซ้ำๆ แต่ Opus แก้ได้เร็วกว่า ช่วงนี้ผมก็เจอโค้ดที่ทั้งคู่ยังหาทางแก้ที่ดีไม่ได้ ซึ่งโมเดลภาษาขนาดใหญ่ก็เป็นแบบนี้อยู่แล้ว
      ที่เห็นคนพูดถึง Claude มากกว่า เป็นเพราะมันออกนำไปก่อน Codex มาช้ากว่าไปก้าวหนึ่ง และตอนแรก GPT ก็ยังสู้ Opus ไม่ได้ ตอนนี้เรากำลังทดสอบกันหลังจากช่องว่างนั้นแคบลงแล้ว
    • การเรียกสิ่งนี้ว่า ปาร์ตี้ Tupperware ฟังดูใช้อารมณ์เกินไป เหมือนจงใจมองข้ามปัจจัยหลายอย่างที่สำคัญกับนักพัฒนา เพื่อจะอ้างว่ามันเท่ากัน และไม่ได้มองกระบวนการสร้างซอฟต์แวร์จริงๆ
      การทดสอบนั้นดูแค่ผลลัพธ์สุดท้ายและมองข้ามกระบวนการสร้างทั้งหมด Claude Code ออกมาก่อนอยู่พักหนึ่งและดีกว่า แล้วถ้าได้ผลลัพธ์เท่ากันจะเปลี่ยนเครื่องมือไปทำไม
      Claude Code นำหน้าในกระบวนการสร้างซอฟต์แวร์แบบเอเจนต์อยู่นาน และตอนนี้ผมก็ยังชอบความสามารถของมันมากกว่า มองว่า Opus 4.7 เป็นการถอยหลังครั้งใหญ่ และก็รู้สึกว่าผลลัพธ์แย่ลงทุกวันเพราะ Claude Code เปลี่ยนฟีเจอร์บ่อยเกินไป แต่ก็แยกยากเหมือนกัน เพราะผมกำลังลองทดสอบขีดจำกัดว่าต้องระบุให้น้อยแค่ไหนถึงจะยังได้ผลลัพธ์ที่ดี
      การเรียกความจริงเชิงรูปธรรมทั้งหมดนี้ว่าเป็นแค่การตลาด ดูเหมือนเป็นการพยายามโปรโมต Codex ให้เป็น เครื่องมือที่ดีพอ โดยไม่มองว่ามันเดินทางมาอย่างไรและต่อไปจะไปทางไหน
    • ดูเหมือนคุณจะประเมินสูงเกินไปว่าแต่ละนักพัฒนามีทางเลือกมากแค่ไหน บริษัททำสัญญา Claude Code membership ไว้ ก็เลยต้องใช้ Claude Code และใช้ Codex ไม่ได้
      ได้ยินบ่อยว่าคนในที่ทำงานใช้สมาชิก Claude Code แต่แทบไม่เคยได้ยินเรื่องสมาชิก Codex ในที่ทำงานเลย Anthropic เจาะลูกค้าองค์กรได้ดีกว่า OpenAI มาก ในช่วงที่ OpenAI ไปไล่ตามสินค้าสำหรับผู้บริโภคอย่าง Sora
    • ถึงจะแยกไม่ออกว่าโค้ดเขียนด้วย Vim หรือ VS Code แต่สำหรับคนที่เขียนโค้ดเอง ความต่างมันใหญ่ เครื่องมือไม่ได้เลือกกันจาก ผลลัพธ์สุดท้ายอย่างเดียว
    • เรื่องแบบนี้ตลกดีเสมอ ไม่ว่าคนเราจะฉลาดจริงแค่ไหน หรือคิดว่าตัวเองฉลาดแค่ไหน เราทุกคนล้วนถูกชักจูงได้ง่าย และ การทดสอบแบบปิดบังข้อมูล ก็ทำได้ง่ายอย่างน่าตกใจ
      มั่นใจหรือว่าคุณแยก A กับ B ออก ได้สิ ก็ลองดู ไม่ว่าจะเปรียบเทียบไวน์ชั้นดีบนโต๊ะอาหารหรือเปรียบเทียบเอเจนต์ก็เหมือนกัน ลองใช้ตัวเลือกหนึ่ง แล้วลองอีกตัวเลือกหนึ่ง หรือบางทีทั้งหมดอาจเป็นตัวเลือกเดียวกันก็ได้ ถ้าคุณยังแยกอย่างสม่ำเสมอไม่ได้ ก็แปลว่าคุณก็เป็นมนุษย์แบบเดียวกับพวกเราทุกคนนั่นแหละ
      พอรู้ผลแล้วใครๆ ก็พูดได้ว่าเดาถูก แต่ความต่างจริงจะปรากฏใน blind test หรือไม่ก็ไม่ปรากฏเลย
  • ผมคิดว่า Sam Altman เป็นคนที่แย่มาก และอยากเอาเงินของผมไปใช้ที่อื่น
    การทำให้โมเดลแนวหน้ากลายเป็นสินค้าโภคภัณฑ์ เป็นสิ่งที่หลีกเลี่ยงไม่ได้ ดูเหมือน OpenAI ยังคิดว่าตัวเองแข่งกันด้วยเทคโนโลยี แต่ถ้ารู้ว่าจริงๆ แล้วกำลังแข่งกันด้วยประสบการณ์ผู้ใช้และภาพลักษณ์ในตลาด ก็น่าจะเข้าใจด้วยว่าความสับสนของ Altman ที่สร้าง PR เชิงลบอย่างต่อเนื่อง สุดท้ายอาจทำให้เสียทุกอย่าง

    • ไม่รู้เลยว่าจะพูดได้อย่างไรว่าการสนับสนุน Dario ดีกว่า
      ไม่ว่าวงการไหน คนที่อยู่บนสุดแทบไม่มีใครเป็น คนดีพอใช้ พวกเขาไม่ได้ใส่ใจผู้ใช้อย่างจริงใจ แค่อยากได้เงินเท่านั้น
    • Dario ก็แย่พอๆ กับ Sam
    • Altman ดูจะเป็นคนไม่ค่อยดีจริง แต่ถ้าคิดว่า Anthropic อยู่ฝ่ายธรรมะ ก็มีข่าวร้ายให้รู้ อันที่จริงมันอาจแย่กว่า OpenAI เสียอีก
    • แนวคิดที่ว่าความฉลาดจะกลายเป็นสินค้าโภคภัณฑ์นั้นขัดกับสัญชาตญาณโดยสิ้นเชิง
      ความคิดนี้ตั้งอยู่บนความเชื่อว่าความฉลาดจะไม่สามารถก้าวล้ำเราไปได้ ซึ่งเมื่อไปถึงขีดสุดแล้ว แทบจะแน่นอนว่าเป็นความเชื่อที่ผิด มีความเป็นไปได้สูงว่าจะเกิด ปัญญาเหนือมนุษย์ จำนวนมากขึ้นมา เหมือนสิ่งมีชีวิตในธรรมชาติ
  • นี่มันเป็นมุกตลกชัด ๆ
    Anthropic ฉวยจังหวะช่วงสั้น ๆ ที่มัน เด่นด้านโค้ด กว่าได้ดีมาก และนั่นก็นำไปสู่สัญญากับลูกค้าองค์กร
    แต่พอถึงรอบต่อสัญญา ก็กลับเปลี่ยนไปคิดเงินกับองค์กรเดิมเหล่านั้นแบบว่า นอกจากค่า seat แล้ว ทุกโทเคนก็ต้องจ่ายตามราคา API ทั้งที่ผู้ใช้ก็คาดหวังอย่างสมเหตุสมผลว่าการใช้งานทั้งหมดน่าจะรวมอยู่ในค่า seat แล้ว และราคา API นั้นก็ขึ้นมาหลายรอบในช่วงปีเดียวจนจำไม่ไหว
    ด้วยแรงส่งจากความนิยมในยุค Sonnet 3.5 และความล่าช้าในการจัดซื้อขององค์กร รายได้เลยพุ่งแบบแทบจะเหมือนจับลูกค้าเป็นตัวประกัน แล้วก็เอารายได้ที่พุ่งนั้นไปหนุนมูลค่าบริษัท
    องค์กรพวกเดิมจะเห็นบิลแล้วช็อกก่อนจะจากไปเอง นี่เป็นวิธีคิดระยะสั้นที่เหลือเชื่อ
    ผมมองว่า OpenAI เป็นบริษัทที่ดีกว่า ทั้งในแง่ความโปร่งใส การปล่อยโอเพนซอร์ส วิธีจัดการเรื่องอย่าง OpenClaw วิธีแข่งขัน แบรนด์ก็แข็งแรงกว่ามาก การเข้าถึงผู้บริโภคก็ดีกว่า และสำหรับผมกับอีกหลายคน แอปเขียนโค้ดกับโมเดลของมันก็ดีกว่าด้วย
    การที่ Anthropic ทำตัวเป็นปฏิปักษ์กับลูกค้าซ้ำแล้วซ้ำเล่าเพื่อปั่นรายได้ระยะสั้นนั้น ไม่ใช่ธุรกิจที่ ยั่งยืนในระยะยาว
    บริษัทที่ยังอายุน้อยขนาดนี้แต่มีประวัติแนวล่อด้วยของราคาถูกแล้วค่อยสลับเงื่อนไขยาวขนาดนี้ถือว่าแปลกมาก มีทั้งการขึ้นราคาซ้ำ ๆ ลด rate limit ซ้ำ ๆ เปลี่ยนเงื่อนไข บล็อกการเรียกที่มี "OpenClaw" อยู่ ไปจนถึงการหักหลังทั้งพาร์ตเนอร์ IDE และพาร์ตเนอร์องค์กร
    ในมุมผม ใครก็ตามที่ไว้ใจ Anthropic ล้วนถูกเอาเปรียบไปบ้างแล้วทั้งนั้น อีกไม่นานน่าจะได้ชื่อว่าเป็น Oracle แห่งวงการ AI
    ผมไม่ให้มูลค่าถึงครึ่งของ OpenAI ด้วยซ้ำ

    • องค์กรต่าง ๆ ก็กำลังทยอยออกไปแล้ว มีทั้งอาการช็อกจากบิล และกระแสความรู้สึกของนักพัฒนาที่เริ่มไหลไปทาง Codex ด้วย แน่นอน อีกเดือนสองเดือนลมก็คงเปลี่ยนอีก
      การได้เห็น Claude Code ถูก ทำเป็นสินค้าโภคภัณฑ์ เร็วขนาดนี้ก็น่าสนใจดี
      แต่ผมไม่เห็นด้วยอย่างมากกับคำบอกว่า OpenAI มีแบรนด์ที่ดีกว่ามาก Anthropic สร้างภาพลักษณ์ว่าเป็นบริษัทที่มีจริยธรรมและมีความเป็นมนุษย์มากกว่าในสองเจ้านี้ได้ค่อนข้างสำเร็จ จะจริงหรือไม่จริงก็ไม่สำคัญ
    • ผมไม่ค่อยเห็นด้วยบางส่วน ตั้งแต่ Opus 4.5 ในเดือนตุลาคม กระแสความรู้สึกของนักพัฒนาต่อ การพัฒนาแบบเอเจนต์ เปลี่ยนไปอย่างมาก หลายทีมเพิ่งเริ่มเห็นคุณค่าที่เป็นรูปธรรมจาก Anthropic มากกว่าเดิมอย่างชัดเจนเมื่อไม่นานมานี้
      ของอย่าง OpenClaw ยังไม่ใช่ส่วนหนึ่งของสภาพแวดล้อมองค์กรที่จริงจังอยู่ดี เพราะมีความเสี่ยงด้านความปลอดภัย
      ผมไม่เข้าใจว่าทำไมถึงคิดว่าการตั้งราคาต่อ seat ใน AI จะยัง viable ได้แม้แค่ครึ่งเดียว องค์กรที่ผมรู้จักหลายแห่งกลับเพิ่งเริ่มอนุมัติการใช้จ่ายจริงจังหลังเปลี่ยนไปคิดราคาแบบ API เพราะเห็นว่ามูลค่าที่ได้มันสูงมากอยู่แล้ว
    • ความโกรธและการพูดเกินจริงระดับนี้ดูมากเกินไปนะ คุณจะไม่ชอบ Anthropic และไม่เห็นด้วยกับแนวทางธุรกิจของมันก็ได้ แต่ขนาดตามมาตรฐานอินเทอร์เน็ตก็ยังแรงเกินไป
    • Anthropic ไม่เคยทำตัวเป็นปฏิปักษ์กับผมในฐานะลูกค้า
  • ตอนนี้ Sam Altman ดูเหมือนจะกลายเป็น ภาระ ต่อความสำเร็จของ OpenAI ไปพอสมควรแล้ว แรงขับสำคัญส่วนหนึ่งที่ทำให้ Anthropic โตแบบระเบิดในช่วง 6 เดือนที่ผ่านมา น่าจะมาจากการที่คนมองมันว่าเป็น “สตาร์ตอัป AI ที่ไม่ได้ถูกบริหารโดย Sam Altman”
    เทคโนโลยีของ Anthropic ยอดเยี่ยมมาก แต่สินทรัพย์ที่ใหญ่ที่สุดของมันตอนนี้ดูเหมือนจะเป็นการที่มัน “ไม่ใช่ OpenAI” ไม่ว่าจะถูกหรือผิด แต่นั่นชัดเจนว่าเป็นปัจจัยที่ฉุด OpenAI ไว้อยู่ตอนนี้

    • ผมไม่แน่ใจว่าคนส่วนใหญ่สนใจหรือรับรู้เรื่องนี้ด้วยซ้ำไหม ChatGPT ยังใหญ่กว่าแบบทิ้งห่างในตลาดผู้บริโภคและด้านการรับรู้แบรนด์
      สิ่งที่ Anthropic ทำได้ดีมากจริง ๆ คือ เจาะเข้าไปอยู่ภายในองค์กร
      ตลอด 6 เดือนที่ผ่านมา ผมเห็นด้วยตาว่าพนักงานทั่วไปในองค์กรรับ Claude cowork ไปใช้กันเยอะมาก และทุกคนก็ประทับใจกับสิ่งที่มันช่วยทำให้จริง ๆ
      OpenAI ดูเหมือนอยากเป็นบริษัทแบบ Google มากกว่า แต่ในบริบทนี้ฝั่งผู้บริโภคอาจไม่ใช่สนามที่ดีขนาดนั้น
    • เรื่องที่น่าทึ่งคือ Anthropic เองก็ไม่ใช่ผู้ใหญ่สมบูรณ์แบบชัด ๆ แต่ Altman กลับทำให้พวกเขาดูเป็น ฝ่ายที่ดีกว่า จนเหมือนช่วยเสริมการตลาดให้
      ตอนที่ Anthropic ไปเถียงกับ Department of War ด้วยเงื่อนไขที่อ่อนมาก ถ้าเป็นบริษัท AI ที่มีศีลธรรมจริงก็คงไม่เข้าไปพัวพันกับอาชญากรรมสงครามตั้งแต่แรก แต่นั่นก็เป็นบททดสอบของ Altman แค่ต้องยืนจุดยืนเดียวกันก็พอแล้ว แต่เขาเป็นพวกโรคจิตจนสอบตกแม้แต่บททดสอบพื้นฐานแบบนั้น
    • ไม่รู้ว่าคุณเคยดูคลิปที่ Dario Amodei พูดหรือเปล่า ผมไม่ชอบทั้งคู่เลย แต่ Dario ดูเหมือนชอบทำให้คนกลัวด้วยคำพูดที่ไม่ระวังเป็นงานอดิเรก และน้ำเสียงก็เหมือนกำลังเลียนแบบ Elizabeth Holmes
      ไม่มีอะไรที่เขาพูดหรือทำแล้วทำให้ดูเป็น คนที่น่าเชื่อถือกว่า เลย
  • ต่อให้โมเดลของ OpenAI ดีกว่าโมเดลของ Anthropic อย่างมีนัยสำคัญ ผมก็ไม่อยากสนับสนุน Altman เลยคงจะไม่ใช้

    • คุณคิดว่า Amodei ต่างกันงั้นเหรอ?
    • เขามีอำนาจในโลกจริงระดับไหนกัน? เขามีโปรเจกต์ที่คนแคร์หรือมีผลงานที่ใครต้องพึ่งพาไหม?
      ผมสงสัยจริง ๆ ว่าคุณมีเวลาว่างมากพอจะไปสนใจคนที่อยู่สูงกว่าทีมที่สร้างและซัพพอร์ต API ที่คุณซื้ออยู่ตั้ง 7 ชั้นได้ยังไง
  • เมื่อคืนผมได้ยินเด็ก ๆ เถียงกันว่า “พ่อฉันตัวใหญ่มาก” “พ่อฉันใหญ่กว่าบ้านอีก” “ไม่สิ พ่อฉันใหญ่กว่ารถไฟเหาะอีก” “งั้นเหรอ? พ่อฉัน 50 กม.” “หมายถึงตัวสูงเหรอ?” “ใช่ พ่อฉันยาวกว่าเธออีก”
    มันตลกมาก ผมสูงประมาณ 5 ฟุต 7 นิ้วในวันที่สภาพดีที่สุด และรู้สึกว่า มูลค่าประเมิน ก็ทำงานแบบนี้แหละ เรากำลังเชิดชูยักษ์สูง 5 ฟุตกันอยู่

  • เหมือนยูนิคอร์นที่ติดจรวดแล้วมัวแต่มองกันเองจนไม่ทันสังเกตว่าโลกได้ลอยห่างออกไปไกลแล้ว
    พวกมันจะฆ่าพวกเราทั้งหมด หรือไม่ก็ฆ่ากันเอง อย่างน้อยที่สุด พวกมันก็ไม่ได้ ทำให้โลกน่าอยู่ขึ้น อย่างที่เคยสัญญาไว้

    • สำหรับ Dario แล้วให้ความรู้สึกแบบ “เดี๋ยวฉันจะเผาโลกให้เป็นเถ้าถ่านก่อน แล้วค่อยทำให้มันดีขึ้น เชื่อฉันสิ” มาก
  • นี่เป็นจังหวะที่ดีที่จะกลับไปดูบทสนทนาที่เคยคุยกับ gwern เกี่ยวกับ oAI และ Anthropic อีกครั้ง: https://news.ycombinator.com/item?id=40816755 รวมถึงคำทำนายเมื่อราว 2 ปีก่อน
    โดยสรุปแล้ว ทุกวันนี้ความเชี่ยวชาญด้านบทกวีดูจะไม่ใช่จุดโฟกัสหลักอีกต่อไป และอาจถึงขั้นเป็นผลเสียต่อโลกด้วยซ้ำ เราเปลี่ยนจากการสเกลการฝึกไปเป็นการสเกลแบบ “test-time” ซึ่งส่วนตัวฉันไม่ชอบชื่อนี้เลย ดูเหมือน Ilya จะไม่ได้จำเป็นนัก แต่ก็อยากรู้จริงๆ ว่าเขากำลังสร้างอะไรอยู่
    คำทำนายของฉันที่ว่าฝั่งที่ได้เปรียบคือฝั่งที่ฝังตัวลึก ร่ำรวยมาก และกลายเป็นส่วนหนึ่งของโครงสร้างพื้นฐานระดับโลก ดูจะยังใช้ได้ดีอยู่ ข้อเสนอที่ว่า oAI/MS จะใช้ความเป็นผู้นำในปี 2024 เพื่อทิ้งห่างต่อไปนั้นผิด
    เราแทบไม่ได้พูดกันมากนักถึงการมองโค้ดดิ้งเป็นผลิตภัณฑ์ที่ขับเคลื่อนมูลค่าและพฤติกรรม ซึ่งน่าสนใจมาก ในเดือนมิถุนายน 2024 ตอนนั้นน่าจะยังเหลืออีกราว 6 เดือนกว่าจะได้เห็นความสามารถจริงในรูปแบบใดรูปแบบหนึ่ง
    ดูเหมือนทั้งคู่จะคิดว่าน่าจะมีหรืออาจมีบริษัทที่ทะลุขึ้นมาเป็นตัวจริงเพียงรายเดียว ฉันเคยแนะนำให้ซื้อแบบกระจายตะกร้า แต่เมื่อ GOOG, oAI และ Anthropic ต่างก็ทำรายได้จำนวนมากในไตรมาส/ปีที่ผ่านมา มันก็ชัดแล้วว่าไม่ใช่แบบนั้น
    พื้นที่ของ Anthropic ที่ในปี 2024 ยังดูเป็นช่วงต้น แต่ตอนนี้ฉันมองว่ามีมูลค่าสูงมาก คือกลุ่ม mechanistic interpretability (mechinterp) ฉันยังไม่เห็นงานเปิดเผยจากแล็บอื่นที่คุณภาพใกล้ Anthropic ได้จริงๆ
    กลุ่มนี้เข้าสู่ช่วงที่สร้างผลงานได้อย่างชัดเจนแล้ว และฉันคิดว่ามีโอกาสสูงมากที่จะมอบความได้เปรียบเชิงกลยุทธ์ที่ยั่งยืนจริง ในฐานะเครื่องมือสำหรับผู้กำหนดรสนิยมที่กำลังถือหางเสือเรืออยู่ ในปี 2024 interpretability ดูแทบจะเป็นปัญหาที่แตะต้องไม่ได้ แต่ตอนนี้กลับดูเหมือนว่าเราทำอะไรได้มากขึ้นมากด้วยการค่อยๆ เซาะไปทีละนิดอย่างสม่ำเสมอ

    • วงการ mechanistic interpretability โดยรวมตอนนี้ถูกประเมินต่ำไปมาก เห็นด้วยว่าทีม Anthropic กำลังทำงานที่เข้มงวดที่สุด และตอนนี้ก็มี Goodfire ร่วมอยู่ด้วย
      พวกเขากำลังทำสิ่งที่ใกล้เคียงที่สุดกับ การติดตามความคิด แบบ in vivo ในสายประสาทวิทยา ซึ่งถ้ามองในฐานะหัวข้องานวิจัย มันคืออะไรที่เหมือนนิยายวิทยาศาสตร์แบบดิบเถื่อนมาก แต่ถึงอย่างนั้นคนทั่วไปส่วนใหญ่กลับเหมือนไม่รู้เลยว่ามีเรื่องแบบนี้เกิดขึ้น
      เมื่อนำไปรวมกับแนวคิดที่สำรวจในงานวิจัย “universal subspace hypothesis” มันเริ่มเชื่อมช่องว่างจากวิศวกรรมไปสู่ขอบเขตที่เป็นปรัชญาและจิตวิญญาณมากขึ้น แต่ฉันออกนอกเรื่องไปแล้ว
  • Codex gtp-5.5 เหนือกว่า opus 4.7 มากในโปรเจกต์ขนาดใหญ่

    • ฉันค่อนข้างเชื่อแรงๆ ว่าเหตุผลที่ gpt-5.x ทำได้ดีในโปรเจกต์ใหญ่ เป็นเพราะมันถูกฝึกอย่างหนักกับ apply_patch primitive โดยเฉพาะ
      implementation ของ apply_patch อย่างเป็นทางการออกแบบมาดีมาก มันเป็นกระบวนการ 2 ขั้นตอนที่ยังไม่ทำการเปลี่ยนแปลงจริงจนกว่าไฟล์ทั้งหมดในชุดการเปลี่ยนจะไม่กำกวม การ feedback ข้อผิดพลาดก่อนคอมมิตมักแก้ปัญหา anchoring ได้ด้วยการลองเพิ่มอีกแค่หนึ่งหรือสองครั้ง
      โดยทั่วไปจะเป็นโฟลว์ประมาณ “อ่านไฟล์ A L1:154, อ่านไฟล์ B L1:123, ลอง apply patch, ทั้ง A และ B มี anchor error, อ่านไฟล์ A L43:67, อ่านไฟล์ B L50:74, ลอง apply patch, patch สำเร็จ, รัน compile และ unit test”
      implementation นี้ยังคืนเลขบรรทัดปัจจุบันที่พบปัญหามาด้วย ดังนั้น feedback ของ anchor error จึงมีประโยชน์อย่างมหาศาล
      เทคนิคอย่างการแทนที่ทั้งไฟล์หรือการพึ่ง find-and-replace ยังมีประโยชน์ในบริบทที่แยกขาดมากกว่า แต่ถ้าต้องรีแฟกเตอร์เกิน 20 ไฟล์ คุณต้องมีอะไรแบบ apply_patch วิธีที่อาศัยเลขบรรทัดเฉพาะของตำแหน่งที่จะถูกแทนจริงนั้นตันสนิทในสถานการณ์แก้ไขที่ซับซ้อน
      https://developers.openai.com/api/docs/guides/tools-apply-pa...
    • ฉันก็มีประสบการณ์เหมือนกัน Codex gtp-5.5 แสดง สัญชาตญาณที่ดีกว่า เขียนโค้ดน้อยกว่า และหาเจอว่าต้องแก้ตรงไหนกันแน่
      ถึงอย่างนั้นตอนขยับจาก opus 4.7 ไป 4.8 คาแรกเตอร์ก็ดีขึ้นมาก 4.7 มันตามใจเกินไป
    • GPT-5.5 เป็นโปรแกรมเมอร์ที่ดีกว่า แต่ Opus 4.8 ยังเป็น นักออกแบบระบบและนักออกแบบผลิตภัณฑ์ ที่ดีกว่า
      Codex ออกแนวมองเห็นต้นไม้แต่ไม่เห็นป่า แต่ความสามารถในการทำการเปลี่ยนแปลงขนาดใหญ่ให้สำเร็จในโค้ดเบสใหญ่ๆ นั้นดีกว่ามาก Claude Code ทำพลาดมากกว่า แต่มีรสนิยมดีกว่า และเข้าใจการพัฒนาซอฟต์แวร์ที่เป็นสำนวนและสง่างามได้ดีกว่า
      ถ้าพอมีทรัพยากร แนะนำให้สลับใช้ทั้งคู่
    • ปัญหาของ Codex/GPT คือมันพูดมากเกินไป โดยเฉพาะใน JavaScript และ Python มักมี helper function เยอะ มีฟังก์ชัน 1-2 บรรทัดที่ใช้แค่จุดเดียวเยอะ และมี type หรืออ็อบเจ็กต์คล้าย proxy เยอะด้วย
      ฉันเลยใส่คำสั่งเฉพาะเพื่อหลีกเลี่ยงสิ่งนี้ แต่ถึงอย่างนั้นครึ่งหนึ่งของเวลาก็ยังหมดไปกับการสู้กับ ความเยิ่นเย้อ ของมัน
      ตอนนี้ฉันสร้างแค่โครงของฟังก์ชัน/คลาสที่รู้ว่าต้องใช้ไว้เป็น NotImpelmented แล้วสั่งให้มันไป implement เฉพาะในตำแหน่งนั้นเท่านั้น มันดีขึ้นนิดหน่อย แต่ก็ยังต้องสู้กับการนิยามฟังก์ชันซ้อนในฟังก์ชันอยู่ดี
    • ในแง่ไหนกัน? ในหมวดโค้ดของ LM Arena, Opus 4.7 ได้ 1567 -/+ 7 และ GPT-5.5 Codex ได้ 1505 -/+ 10 ฉันใช้อยู่ทั้งคู่ตอนนี้
      ประสบการณ์ช่วงหลังของฉันเอนมาทาง Opus โดยตอนนี้คือ 4.8 แต่คำพูดที่ว่า GPT-5.5 Codex ดีกว่านี่ก็น่าสนใจพอที่ทำให้ฉันทดลองเพิ่ม
  • ตอนนี้ฉันคิดว่าสิ่งที่สำคัญกว่าการไล่ตามรีลีสตัวใหม่แวววาวด้วยการย้ายไปมาระหว่างบริษัท คือการมี เวิร์กโฟลว์ที่แข็งแรง และความเข้าใจว่าโมเดลที่ตัวเองใช้งานทำงานอย่างไรและทำอะไรได้บ้าง
    ฉันเพิ่งจบโปรเจกต์ใหญ่โปรเจกต์แรกด้วย Codex และเชื่อได้ยากว่า Claude จะดีกว่ามาก มันอาจดีกว่าหรือแย่กว่านิดหน่อย แต่ตอนนี้ทุกตัวเก่งมากจนสิ่งที่สร้างความต่างคือผู้ใช้

    • ถ้าคุณทำงานในวงการนี้มานาน มันไม่ใช่เรื่องใหม่เลย
      เราถกเถียงกันแบบนี้มาตลอดว่าเทคโนโลยีที่ฉันเลือกดีกว่าของคุณหรือไม่ เป็นสงครามศาสนาแบบเดิม แค่เปลี่ยนชนิดของเทคโนโลยี
      คำแนะนำวันนี้ก็เหมือนกับเมื่อ 10, 20, 30 ปีก่อน เลือกสิ่งที่เหมาะกับตัวเองแล้วสร้างของดีๆ ก็พอ
      จริงๆ แล้วไม่มีใครสนใจหรอกว่าคุณสร้างมันอย่างไร ไม่ว่าผลงานจะดีหรือแย่ และถ้ามันแย่ คุณก็ยังโทษเครื่องมือได้
    • ทั้ง Anthropic และ OpenAI ต่างก็มีแรงจูงใจสูงมากในการสร้าง vendor lock-in ตอนนี้ โดยเฉพาะสำหรับผู้ใช้รายใหญ่ ฉันคิดว่าความสามารถในการย้ายข้ามบริษัทได้ยังสำคัญมาก
      ตอนนี้มันยังไม่ควรยาก แต่ต่อไปอาจยากกว่านี้มาก