1 คะแนน โดย GN⁺ 4 시간 전 | 1 ความคิดเห็น | แชร์ทาง WhatsApp
  • ขณะที่ ข้อจำกัดการเข้าถึง Mythos·Fable 5 ของรัฐบาลสหรัฐยืดเยื้อออกไป Sakana AI จากญี่ปุ่นและ 360 จากจีนต่างมุ่งเป้าไปที่ช่องว่างที่เกิดขึ้นด้วย Fugu และ Tulongfeng/Yitianzhen ตามลำดับ
  • Fugu ของ Sakana AI ถูกแนะนำว่าเป็นโมเดลที่สามารถแข่งขันกับ Fable 5·Mythos Preview ได้ และถูกออกแบบเป็นโมเดลสำหรับเอเจนต์ที่ประสานงาน API ของหลายโมเดล
  • Tulongfeng ของ 360 มุ่งเน้นการค้นหาช่องโหว่ซอฟต์แวร์โดยอัตโนมัติ ส่วน Yitianzhen เน้นการทำระบบอัตโนมัติสำหรับการป้องกันทางไซเบอร์และการรับมือเหตุการณ์
  • Sakana AI ระบุว่าช่วงเวลาเปิดตัวเป็นเรื่องบังเอิญ แต่ชูจุดขายว่าเป็น “frontier capability ที่ไม่มีความเสี่ยงจากการควบคุมการส่งออก” พร้อมมุ่งเป้าไปยังบริษัทญี่ปุ่นและหน่วยงานภาครัฐ
  • แม้ความสำคัญของโมเดลสหรัฐยังคงอยู่ แต่ข้อจำกัดการส่งออกกลับกลายเป็นแรงเร่งให้บริษัทในโตเกียวและจีนผลักดัน ทางเลือกท้องถิ่น ที่ปรับให้เข้ากับภาษาและบริบทในพื้นที่เร็วขึ้น

ช่องว่างของโมเดลที่เกิดจากข้อจำกัดการส่งออกของ Anthropic

  • Reuters รายงานว่า 360 บริษัทไซเบอร์ซีเคียวริตี้ของจีน เปิดตัว Tulongfeng ในวันพุธ
    • 360 ระบุว่า Tulongfeng สามารถแข่งขันกับ Mythos โมเดล AI เฉพาะทางด้านไซเบอร์ซีเคียวริตี้ของ Anthropic ได้
    • ปัจจุบัน Mythos และเวอร์ชันที่ถูกจำกัดมากกว่าคือ Fable 5 ไม่เปิดให้ผู้ใช้ที่ไม่ใช่ชาวอเมริกันใช้งาน ภายใต้มาตรการของรัฐบาล Trump Administration
  • ช่วงต้นสัปดาห์เดียวกัน Sakana AI ที่มีฐานในโตเกียวได้เปิดตัว Fugu ซึ่งเป็นคำภาษาญี่ปุ่นที่แปลว่าปลาปักเป้า
    • Fugu ถูกอธิบายว่า “ทัดเทียมกับโมเดลชั้นนำอย่าง Fable 5 และ Mythos Preview ของ Anthropic”
    • มันถูกออกแบบมาสำหรับเอเจนต์ และสามารถประสานการเข้าถึง API ของโมเดลอื่นได้
  • ทั้งสองผลิตภัณฑ์เปิดตัวหลังจากคำสั่งของรัฐบาลสหรัฐที่เกี่ยวข้องกับ Anthropic ออกมาแล้ว 2 สัปดาห์

กลยุทธ์ Fugu ของ Sakana AI

  • โฆษกของ Sakana AI ระบุว่าการเปิดตัว Fugu ที่เกิดขึ้นพร้อมกับข้อจำกัดการส่งออก Mythos/Fable เป็นเรื่อง “entirely coincidental
    • อย่างไรก็ตาม เว็บไซต์ของบริษัทโปรโมตว่าเป็น “frontier capability ที่ไม่มีความเสี่ยงจากการควบคุมการส่งออก”
    • Sakana AI อธิบายว่าเริ่มพัฒนา Fugu มาตั้งแต่ปีก่อน และงานวิจัยที่เกี่ยวข้องได้เผยแพร่ในงาน ICLR ช่วงฤดูใบไม้ผลิปีนี้
  • บริษัทก่อตั้งร่วมกันในปี 2023 โดย David Ha และ Llion Jones อดีตพนักงาน Google และ Ren Ito อดีตพนักงาน Mercari และ Stability AI
    • บริษัทสร้างโมเดล generative AI ราคาประหยัดที่ทำงานได้ดีกับชุดข้อมูลขนาดเล็ก และถูกปรับให้เหมาะกับภาษาญี่ปุ่นและวัฒนธรรมญี่ปุ่น
  • กลุ่มลูกค้าเป้าหมายของ Fugu คือ บริษัทญี่ปุ่นและหน่วยงานภาครัฐ ที่ต้องการลดความเสี่ยงจากการเผชิญกับการควบคุมการส่งออกที่เข้มงวดยิ่งขึ้น
    • Sakana AI ไม่ได้มองว่านี่เป็นแนวโน้มที่เอเชียจะแยกตัวออกจาก AI ของสหรัฐอย่างถาวร
    • โฆษกระบุว่า “U.S. models remain important to Asia”
  • ในบทความความเห็นบน Project Syndicate นั้น Ren Ito โต้แย้งว่าลำดับความสำคัญแรกของรัฐบาลกลางสหรัฐควรเป็นการรักษาการเข้าถึงของพันธมิตรใกล้ชิด และ AI ไม่ควรเป็นเทคโนโลยีที่ถูกกักตุน แต่ควรเป็นเทคโนโลยีที่พัฒนาร่วมกัน
  • David Ha เขียนบน X ว่า “Orchestration Models are the next frontier, beyond bigger models
    • เขามองว่าการทำให้โครงสร้างพื้นฐานระดับชาติพึ่งพาผู้ให้บริการเพียงรายเดียวเป็นเรื่องเสี่ยง และการควบคุมการส่งออกล่าสุดทำให้ไม่อาจเพิกเฉยต่อความเสี่ยงนั้นได้
    • เขาเขียนว่า “Access to top models can disappear overnight” พร้อมอธิบายว่าปัญญารวมหมู่เป็นเครื่องมือป้องกันเชิงปฏิบัติต่อการกระจุกตัวของอำนาจ

AI ความปลอดภัยของ 360 และตรรกะเรื่องสินทรัพย์เชิงยุทธศาสตร์

  • ตามรายงานของ Reuters และ Quartz นั้น 360 ได้เปิดตัว เครื่องมือความปลอดภัย AI สองรายการ
    • Tulongfeng: ออกแบบมาเพื่อค้นหาช่องโหว่ซอฟต์แวร์โดยอัตโนมัติ
    • Yitianzhen: สร้างขึ้นเพื่อทำระบบอัตโนมัติสำหรับการป้องกันทางไซเบอร์และการตอบสนองต่อเหตุการณ์
  • Zhou Hongyi ผู้ก่อตั้ง 360 มองว่า AI สำหรับการตรวจจับช่องโหว่เป็น สินทรัพย์เชิงยุทธศาสตร์ของชาติ ตามรายงานของ Reuters
    • เขาชี้ถึงความเสี่ยงของ “one-way transparency” ที่มีเพียงบางฝ่ายเท่านั้นที่เข้าถึงขีดความสามารถขั้นสูงในการตรวจหาช่องโหว่ได้
  • 360 ไม่ได้ตอบคำขอความเห็นจาก TechCrunch

การเติบโตของ Anthropic และการผงาดของทางเลือกท้องถิ่น

  • Anthropic เคยระบุว่า ณ เดือนพฤษภาคม 2026 บริษัทมีรายได้ต่อปีแบบ annualized มากกว่า 4.7 หมื่นล้านดอลลาร์
    • อย่างไรก็ตาม บริษัทไม่ได้เปิดเผยว่าพึ่งพาลูกค้าองค์กรในเอเชียมากเพียงใด
  • ในช่วงไม่กี่สัปดาห์หลังคำสั่งควบคุมการส่งออกมีผล Sakana AI และ 360 ได้เข้ามาเติมพื้นที่ว่างที่เกิดจากข้อจำกัดในการเข้าถึงโมเดลของ Anthropic
  • แม้บริษัทสหรัฐอาจเรียกความเชื่อมั่นกลับคืนมาได้หลังมาตรการแบนสิ้นสุดลง แต่ ทางเลือกท้องถิ่น ที่ได้รับการฝึกให้เข้าใจภาษาและนัยบริบทในพื้นที่ได้ดีกว่า ก็กำลังเติมเต็มช่องว่างนั้นไปแล้ว

1 ความคิดเห็น

 
GN⁺ 4 시간 전
ความคิดเห็นจาก Hacker News
  • ผมได้ลองใช้ โมเดล Fugu กับ C# และ Unity ในงานจริงผ่าน MCP, OpenCode แล้ว แค่ให้รีวิวระบบธีมและวางแผนเปลี่ยนสีก็ใช้โควตา 5 ชั่วโมงของแพ็กเกจ $20 หมดในครั้งเดียว
    ผมอัปเกรดเป็นแพ็กเกจ $100 เพื่อดูผลลัพธ์การ implement แต่แย่กว่า Opus และช้ามาก แถมยังใช้โควตา 5 ชั่วโมงชุดใหม่จนหมด และกินโควตารายสัปดาห์ไป 35% แล้วด้วย แต่ก็ยังแทบไม่ถึงระดับที่ Opus ทำได้ด้วยเวลาและค่าใช้จ่ายน้อยกว่ามาก
    ข้อมูลนี้ก็เอาไปตัดสินใจกันเอง แต่ดูเหมือนเป็นการเสียเงินฟรี

    • Fugu ไม่ใช่โมเดลอิสระ แต่เป็นโครงสร้างที่เรียกใช้โมเดล SaaS เดิมหลายตัวอย่าง OpenAI, Anthropic อยู่เบื้องหลัง แล้วรวบรวมคำตอบมาสร้างผลลัพธ์
      เขาอ้างว่าหลังจากรวมผลลัพธ์จากหลายโมเดล AI แล้วใช้โมเดล proprietary ของตัวเองทำผลลัพธ์สุดท้าย จะได้คุณภาพดีกว่าโมเดล backend เดี่ยว ๆ แต่ผมสงสัยว่าโมเดลของตัวเองนั้นมีอยู่จริงไหม และเก่งพอหรือเปล่า
      ต่อให้ข้ออ้างนั้นถูกจริง ก็ดูเหมือนทำได้ง่าย ๆ โดยให้ฝั่งไคลเอนต์อย่าง Claude Code สร้างผลลัพธ์สุดท้ายด้วยโมเดลที่มีสมรรถนะใกล้เคียงกับโมเดลเบื้องหลัง และบริการนี้ก็ดูน่าสงสัย
    • ในฐานะคนที่ให้บริการคล้ายกันสำหรับ Godot แทน Unity ถ้าใช้ โมเดลระดับสูงอย่าง Opus ก็เป็นไปได้ที่แพ็กเกจ $20 จะหมดไปกับพรอมป์เดียว
      ถ้าต้องจ่ายราคา API เต็ม ๆ และแบกรับการอุดหนุน 10 เท่าไม่ไหว ก็จะออกมาเป็นแบบนั้น
    • ผมทดสอบ Fable ใน Cursor แล้วถามไอเดียว่าจะทำให้เว็บไซต์ข้อมูลที่สร้างไว้ดู “เป็น Claude” น้อยลงได้อย่างไร ปรากฏว่าใช้เงินไป $40 ใน 10 นาที และได้ CSS styling ที่ไร้ประโยชน์ที่สุดและยังดูเป็น Claude สุด ๆ ออกมา
      ตัวเว็บไซต์เองสร้างด้วย Opus อยู่แล้ว จึงมองได้ว่าผลลัพธ์แย่กว่า Opus
      ผมเคยเจอประสบการณ์เดียวกันกับโมเดลอเมริกันด้วย บางทีโมเดลเอเชียพวกนั้นก็อาจเป็นแนว Mythos เหมือนกัน
    • อยากรู้ว่าใช้ Unity MCP ตัวไหน
      ตอนนี้กำลังลองใช้ MCP ทางการอยู่ แต่อยากรู้ว่าคนอื่นใช้ตัวไหนกัน
      ฝั่ง coplay ที่ดัง ๆ ผมเจอปัญหาแพ็กเกจชนกัน
    • งานค้นหา/วิจัยบนเว็บก็คล้ายกัน และ แย่เมื่อเทียบกับ Opus
      ครึ่งหนึ่งพลาดไปเลย ส่วนอีกครึ่งเป็นข้อมูลเก่าหรือไม่ได้ตรวจสอบ
  • Fugu Ultra ดูเหมือนไม่ใช่โมเดลจริง ๆ แต่เป็นระบบที่ route ไปยังหลายโมเดล คล้าย cloud harness และดูคล้าย Fusion ของ OpenRouter
    “ไม่ใช่โมเดลขนาดยักษ์ตัวเดียว แต่ Fugu คือระบบ orchestration แบบ multi-agent ที่ผ่านการฝึกมา เป็นโมเดลภาษาที่ route งานไปยังพูลของ foundation model ที่สลับเปลี่ยนได้ และถูกฝึกให้เรียกอินสแตนซ์ของตัวเองแบบ recursive” - https://openrouter.ai/sakana/fugu-ultra
    [0] https://sakana.ai/fugu/
    [1] https://openrouter.ai/openrouter/fusion

  • คำว่า “Mythos-like” เริ่มน่ารำคาญแล้ว
    ผู้ใช้ทั่วไปไม่มีวิธีเทียบ นอกจากดู benchmark

    • “Mythos-like” ก็แค่หมายถึง ถูก hype ด้วยข่าวลือ และในที่นี้ใช้ถูกแล้ว
    • สตาร์ทอัพ AI เอเชียก็อ้างแรง ๆ เหมือนกัน ทั้งที่ไม่มีวิธีเปรียบเทียบจริง ๆ และประเด็นหลักของการเข้ามาแทรกแซงโดย Trump ก็น่าจะเป็นการป้องกันไม่ให้ distill Faible
    • ไม่มี benchmark สาธารณะไม่ใช่หรือ?
  • ถ้าไม่มี benchmark ที่เชื่อถือได้ สิ่งที่พวกนี้เหมือน Mythos ก็มีแค่รับข้อความเข้าแล้วส่งข้อความออกเท่านั้น

    • ตอนนี้แทบไม่ดู benchmark แล้ว
      พอมีโมเดลใหม่ออกมา ก็เอาไปลองใช้ตรง ๆ กับ codebase ซอฟต์แวร์ระบบ proprietary ขนาดใหญ่ของเราและผลิตภัณฑ์ที่ออกจริง หรือโปรเจกต์ที่จะเปิดตัวสักวันหนึ่ง
      ค่อนข้างชัดเจนว่าโมเดลไหนช่วยให้งานดีขึ้นหรือเร็วขึ้น และตอนนี้โชคดีที่มีงบ token ให้ใช้ได้เท่าที่จำเป็น
      ไม่ต้องการ benchmark, evaluation, marketing หรือ system card อะไรแล้ว บนเว็บก็อ่านแค่ทิป วิธีทำงานจริง และข่าวเปิดตัว
      ผมแชร์ประสบการณ์กับเพื่อนร่วมงาน แต่ที่เหลือทั้งหมดคือ noise
    • ถ้าถูก hype เกินจริง เหมือน Mythos ก็เพิ่มข้อนั้นเข้าไปในรายการ “Mythos-like” ได้ด้วย
      สิ่งที่น่าจะขาดไปคือฉากที่ CEO ออกมาเตือนโลกว่า “โมเดลของเราอันตรายเกินกว่าจะเปิดเผยบนอินเทอร์เน็ต ใครสักคนควรหยุดมันก่อนจะสายเกินไป”
    • ใน paper มี benchmark อยู่: https://arxiv.org/abs/2606.21228
  • รายชื่อนักลงทุนน่าประทับใจ: https://sakana.ai/company-info/?lang=en
    เมื่อไม่กี่วันก่อนก็ขึ้น headline บน HN และมีคอมเมนต์เกิน 100 ความเห็น: https://news.ycombinator.com/item?id=48624782

    • บริษัทเหล่านี้เคยออกโมเดลมาก่อนหรือเปล่า?
      ยากจะเชื่อว่าอยู่ ๆ ก็ปล่อย โมเดลระดับ Mythos ออกมา
      DeepSeek, Z.ai, Alibaba/Qwen ทำมานานกว่ามาก และในช่วง 18 เดือนที่ผ่านมาได้ปล่อยโมเดลที่ค่อย ๆ ยกระดับสมรรถนะอย่างต่อเนื่อง
      ยากจะเชื่อว่าบริษัทใหม่ ๆ ที่ไม่มี release ก่อนหน้าเลย จะอยู่ ๆ ปล่อยโมเดลระดับ Mythos ออกมาได้
    • ปีก่อนก็มี การถอนคำกล่าวอ้าง ที่ค่อนข้างน่าอับอายด้วย
      https://techcrunch.com/2025/02/21/sakana-walks-back-claims-t...
  • ก่อนสิ้นปีนี้น่าจะมี การแบน LLM ต่างชาติ ด้วยเหตุผลเรื่อง “ความกังวลด้านความปลอดภัย”
    คงไม่เกี่ยวกับประสิทธิภาพจริง
    แต่ Anthropic ได้ตั้ง baseline ของระบบแนว Mythos ไว้แล้ว และสิ่งใดก็ตามที่เข้ากับนิยามหลวม ๆ นั้นคงถูกมองว่าเป็นอันตรายต่อสาธารณะ

    • ในทางปฏิบัติแล้วมันจะทำงานได้อย่างไร?
    • ถ้าเป็นอย่างนั้นก็คงได้บอกลาเทคโนโลยีอเมริกัน และยินดีต้อนรับจีน
      ไม่มีใครจะรอ และเมื่อ genie ออกจากขวดไปแล้ว ก็เอากลับเข้าไปไม่ได้
    • การพูดเหมือนว่าโมเดลพัฒนาไปก็ไม่มีความเสี่ยงจริง ๆ นั้นไร้เหตุผล
      รู้สึกเหมือนอยู่ในอีกความเป็นจริงหนึ่งที่ตอนนี้ดูเหมือนมีแค่ Claude ที่พูดจาฉลาด
      งานเขียนของมนุษย์แทบทั้งหมดดูเหมือนภาพหลอนและคำพูดเพ้อเจ้อเชิงโชว์ออฟ
  • มองแบบเหน็บแนม ถ้าโมเดลแค่พอใช้ได้ ก็ยากที่จะโต้แย้ง ข้ออ้างว่าอยู่ระดับ Mythos
    เพราะตอนนี้ใช้ Mythos ไม่ได้แล้ว

    • อะไรที่เหมือน Mythos คืออะไร?
      ในฐานะคนที่ไม่เคยมีสิทธิ์เข้าถึง เลยสงสัย
  • ความประทับใจแรกคือ “ถ้าไม่มี เบนช์มาร์กจากบุคคลที่สาม ก็ไสหัวไป”
    โดยส่วนตัวไม่เคยได้ยินชื่อทั้งสองบริษัทนี้เลย
    จะให้เชื่อเฉย ๆ ว่าทัดเทียมกับโมเดลที่ดีที่สุดในตลาดงั้นเหรอ?
    Sakana อธิบายโมเดลของตัวเองว่าเป็น “Orchestration Model” ถ้าอย่างนั้นจริง ๆ แล้วหมายความว่าเอาหลายโมเดลมาต่อกันหรือเปล่า?

    • การสร้างโมเดลที่ดีมันยากขนาดนั้นจริง ๆ หรือหัวใจอยู่ที่ ขนาดทรัพยากร ที่ทุ่มลงไปฝึก?
      ถามเพราะไม่รู้จริง ๆ
      แน่นอนว่ามันคงไม่ใช่เรื่องเล็ก ๆ แต่การสร้างบนเทคนิคเดิมที่รู้กันอยู่แล้วต้องใช้ความลับระดับสุดยอดของโลกจริงหรือ?
      รู้สึกว่ายังมีผลไม้ที่ห้อยต่ำให้เก็บอีกเยอะ และปัจจัยจำกัดคือเวลาและทรัพยากร
    • คอมเมนต์ในโพสต์เปิดตัวที่ขึ้น HN เมื่อไม่นานมานี้ดูจะมองว่ามัน คล้าย OpenRouter มากกว่าจะเป็นโมเดลจริง ๆ
    • ตามความรู้สึกของผม ใช่เลย
      ดูเหมือนจะอ้างว่าเป็นโครงสร้างที่ทากาวเชื่อมแบบไดนามิก ณ ตอนใช้งาน มากกว่าจะเป็นส่วนผสมของโมเดลใหม่
      ปฏิกิริยาตอนนั้นก็ดูได้ที่นี่: https://news.ycombinator.com/item?id=48624782 (6 วันที่แล้ว, 244 คะแนน, 133 ความเห็น)
    • Anthropic ให้เบนช์มาร์กจากบุคคลที่สามหรือเปล่า?
      ตอนนั้นก็พูดแบบนั้นไหม?
      มันสำคัญก็จริง แต่ทัศนคตินั้นไม่ถูกต้อง
  • ผมเป็นคนง่าย ๆ ถ้าไม่มี เบนช์มาร์ก บน https://arena.ai/leaderboard ก็ถือว่าเป็นของหลอก 100%

    • เทียบกับ ARC AGI แล้วเป็นยังไง?
  • เหมือนหลายคอมเมนต์ที่นี่ ผมก็ทดสอบ Fugu กับโมเดลอื่น ๆ บางตัวแล้ว ซึ่งเป็นโมเดลที่ค่อนข้างแพง
    เงิน $20 ไม่พอให้จบเวิร์กโฟลว์ทั้งหมด แต่ทำได้บน Opus
    แน่นอนว่าแม้แต่ Opus ถ้าอยากได้ผลลัพธ์ที่ดีที่สุดก็อาจต้องขัดเกลาพรอมป์ต์ให้มากขึ้นตั้งแต่แรก แต่จนถึงตอนนี้ประสบการณ์เป็นแบบนั้น
    การทดสอบครั้งต่อไปจะลองด้วย ระบบแบบเอเจนต์ แล้วดูประสิทธิภาพ