สตาร์ตอัป AI เอเชียเปิดตัวโมเดลทางเลือกแทน Anthropic Mythos
(techcrunch.com)- ขณะที่ ข้อจำกัดการเข้าถึง Mythos·Fable 5 ของรัฐบาลสหรัฐยืดเยื้อออกไป Sakana AI จากญี่ปุ่นและ 360 จากจีนต่างมุ่งเป้าไปที่ช่องว่างที่เกิดขึ้นด้วย Fugu และ Tulongfeng/Yitianzhen ตามลำดับ
- Fugu ของ Sakana AI ถูกแนะนำว่าเป็นโมเดลที่สามารถแข่งขันกับ Fable 5·Mythos Preview ได้ และถูกออกแบบเป็นโมเดลสำหรับเอเจนต์ที่ประสานงาน API ของหลายโมเดล
- Tulongfeng ของ 360 มุ่งเน้นการค้นหาช่องโหว่ซอฟต์แวร์โดยอัตโนมัติ ส่วน Yitianzhen เน้นการทำระบบอัตโนมัติสำหรับการป้องกันทางไซเบอร์และการรับมือเหตุการณ์
- Sakana AI ระบุว่าช่วงเวลาเปิดตัวเป็นเรื่องบังเอิญ แต่ชูจุดขายว่าเป็น “frontier capability ที่ไม่มีความเสี่ยงจากการควบคุมการส่งออก” พร้อมมุ่งเป้าไปยังบริษัทญี่ปุ่นและหน่วยงานภาครัฐ
- แม้ความสำคัญของโมเดลสหรัฐยังคงอยู่ แต่ข้อจำกัดการส่งออกกลับกลายเป็นแรงเร่งให้บริษัทในโตเกียวและจีนผลักดัน ทางเลือกท้องถิ่น ที่ปรับให้เข้ากับภาษาและบริบทในพื้นที่เร็วขึ้น
ช่องว่างของโมเดลที่เกิดจากข้อจำกัดการส่งออกของ Anthropic
- Reuters รายงานว่า 360 บริษัทไซเบอร์ซีเคียวริตี้ของจีน เปิดตัว Tulongfeng ในวันพุธ
- 360 ระบุว่า Tulongfeng สามารถแข่งขันกับ Mythos โมเดล AI เฉพาะทางด้านไซเบอร์ซีเคียวริตี้ของ Anthropic ได้
- ปัจจุบัน Mythos และเวอร์ชันที่ถูกจำกัดมากกว่าคือ Fable 5 ไม่เปิดให้ผู้ใช้ที่ไม่ใช่ชาวอเมริกันใช้งาน ภายใต้มาตรการของรัฐบาล Trump Administration
- ช่วงต้นสัปดาห์เดียวกัน Sakana AI ที่มีฐานในโตเกียวได้เปิดตัว Fugu ซึ่งเป็นคำภาษาญี่ปุ่นที่แปลว่าปลาปักเป้า
- Fugu ถูกอธิบายว่า “ทัดเทียมกับโมเดลชั้นนำอย่าง Fable 5 และ Mythos Preview ของ Anthropic”
- มันถูกออกแบบมาสำหรับเอเจนต์ และสามารถประสานการเข้าถึง API ของโมเดลอื่นได้
- ทั้งสองผลิตภัณฑ์เปิดตัวหลังจากคำสั่งของรัฐบาลสหรัฐที่เกี่ยวข้องกับ Anthropic ออกมาแล้ว 2 สัปดาห์
กลยุทธ์ Fugu ของ Sakana AI
- โฆษกของ Sakana AI ระบุว่าการเปิดตัว Fugu ที่เกิดขึ้นพร้อมกับข้อจำกัดการส่งออก Mythos/Fable เป็นเรื่อง “entirely coincidental”
- อย่างไรก็ตาม เว็บไซต์ของบริษัทโปรโมตว่าเป็น “frontier capability ที่ไม่มีความเสี่ยงจากการควบคุมการส่งออก”
- Sakana AI อธิบายว่าเริ่มพัฒนา Fugu มาตั้งแต่ปีก่อน และงานวิจัยที่เกี่ยวข้องได้เผยแพร่ในงาน ICLR ช่วงฤดูใบไม้ผลิปีนี้
- บริษัทก่อตั้งร่วมกันในปี 2023 โดย David Ha และ Llion Jones อดีตพนักงาน Google และ Ren Ito อดีตพนักงาน Mercari และ Stability AI
- บริษัทสร้างโมเดล generative AI ราคาประหยัดที่ทำงานได้ดีกับชุดข้อมูลขนาดเล็ก และถูกปรับให้เหมาะกับภาษาญี่ปุ่นและวัฒนธรรมญี่ปุ่น
- กลุ่มลูกค้าเป้าหมายของ Fugu คือ บริษัทญี่ปุ่นและหน่วยงานภาครัฐ ที่ต้องการลดความเสี่ยงจากการเผชิญกับการควบคุมการส่งออกที่เข้มงวดยิ่งขึ้น
- Sakana AI ไม่ได้มองว่านี่เป็นแนวโน้มที่เอเชียจะแยกตัวออกจาก AI ของสหรัฐอย่างถาวร
- โฆษกระบุว่า “U.S. models remain important to Asia”
- ในบทความความเห็นบน Project Syndicate นั้น Ren Ito โต้แย้งว่าลำดับความสำคัญแรกของรัฐบาลกลางสหรัฐควรเป็นการรักษาการเข้าถึงของพันธมิตรใกล้ชิด และ AI ไม่ควรเป็นเทคโนโลยีที่ถูกกักตุน แต่ควรเป็นเทคโนโลยีที่พัฒนาร่วมกัน
- David Ha เขียนบน X ว่า “Orchestration Models are the next frontier, beyond bigger models”
- เขามองว่าการทำให้โครงสร้างพื้นฐานระดับชาติพึ่งพาผู้ให้บริการเพียงรายเดียวเป็นเรื่องเสี่ยง และการควบคุมการส่งออกล่าสุดทำให้ไม่อาจเพิกเฉยต่อความเสี่ยงนั้นได้
- เขาเขียนว่า “Access to top models can disappear overnight” พร้อมอธิบายว่าปัญญารวมหมู่เป็นเครื่องมือป้องกันเชิงปฏิบัติต่อการกระจุกตัวของอำนาจ
AI ความปลอดภัยของ 360 และตรรกะเรื่องสินทรัพย์เชิงยุทธศาสตร์
- ตามรายงานของ Reuters และ Quartz นั้น 360 ได้เปิดตัว เครื่องมือความปลอดภัย AI สองรายการ
- Tulongfeng: ออกแบบมาเพื่อค้นหาช่องโหว่ซอฟต์แวร์โดยอัตโนมัติ
- Yitianzhen: สร้างขึ้นเพื่อทำระบบอัตโนมัติสำหรับการป้องกันทางไซเบอร์และการตอบสนองต่อเหตุการณ์
- Zhou Hongyi ผู้ก่อตั้ง 360 มองว่า AI สำหรับการตรวจจับช่องโหว่เป็น สินทรัพย์เชิงยุทธศาสตร์ของชาติ ตามรายงานของ Reuters
- เขาชี้ถึงความเสี่ยงของ “one-way transparency” ที่มีเพียงบางฝ่ายเท่านั้นที่เข้าถึงขีดความสามารถขั้นสูงในการตรวจหาช่องโหว่ได้
- 360 ไม่ได้ตอบคำขอความเห็นจาก TechCrunch
การเติบโตของ Anthropic และการผงาดของทางเลือกท้องถิ่น
- Anthropic เคยระบุว่า ณ เดือนพฤษภาคม 2026 บริษัทมีรายได้ต่อปีแบบ annualized มากกว่า 4.7 หมื่นล้านดอลลาร์
- อย่างไรก็ตาม บริษัทไม่ได้เปิดเผยว่าพึ่งพาลูกค้าองค์กรในเอเชียมากเพียงใด
- ในช่วงไม่กี่สัปดาห์หลังคำสั่งควบคุมการส่งออกมีผล Sakana AI และ 360 ได้เข้ามาเติมพื้นที่ว่างที่เกิดจากข้อจำกัดในการเข้าถึงโมเดลของ Anthropic
- แม้บริษัทสหรัฐอาจเรียกความเชื่อมั่นกลับคืนมาได้หลังมาตรการแบนสิ้นสุดลง แต่ ทางเลือกท้องถิ่น ที่ได้รับการฝึกให้เข้าใจภาษาและนัยบริบทในพื้นที่ได้ดีกว่า ก็กำลังเติมเต็มช่องว่างนั้นไปแล้ว
1 ความคิดเห็น
ความคิดเห็นจาก Hacker News
ผมได้ลองใช้ โมเดล Fugu กับ C# และ Unity ในงานจริงผ่าน MCP, OpenCode แล้ว แค่ให้รีวิวระบบธีมและวางแผนเปลี่ยนสีก็ใช้โควตา 5 ชั่วโมงของแพ็กเกจ $20 หมดในครั้งเดียว
ผมอัปเกรดเป็นแพ็กเกจ $100 เพื่อดูผลลัพธ์การ implement แต่แย่กว่า Opus และช้ามาก แถมยังใช้โควตา 5 ชั่วโมงชุดใหม่จนหมด และกินโควตารายสัปดาห์ไป 35% แล้วด้วย แต่ก็ยังแทบไม่ถึงระดับที่ Opus ทำได้ด้วยเวลาและค่าใช้จ่ายน้อยกว่ามาก
ข้อมูลนี้ก็เอาไปตัดสินใจกันเอง แต่ดูเหมือนเป็นการเสียเงินฟรี
เขาอ้างว่าหลังจากรวมผลลัพธ์จากหลายโมเดล AI แล้วใช้โมเดล proprietary ของตัวเองทำผลลัพธ์สุดท้าย จะได้คุณภาพดีกว่าโมเดล backend เดี่ยว ๆ แต่ผมสงสัยว่าโมเดลของตัวเองนั้นมีอยู่จริงไหม และเก่งพอหรือเปล่า
ต่อให้ข้ออ้างนั้นถูกจริง ก็ดูเหมือนทำได้ง่าย ๆ โดยให้ฝั่งไคลเอนต์อย่าง Claude Code สร้างผลลัพธ์สุดท้ายด้วยโมเดลที่มีสมรรถนะใกล้เคียงกับโมเดลเบื้องหลัง และบริการนี้ก็ดูน่าสงสัย
ถ้าต้องจ่ายราคา API เต็ม ๆ และแบกรับการอุดหนุน 10 เท่าไม่ไหว ก็จะออกมาเป็นแบบนั้น
ตัวเว็บไซต์เองสร้างด้วย Opus อยู่แล้ว จึงมองได้ว่าผลลัพธ์แย่กว่า Opus
ผมเคยเจอประสบการณ์เดียวกันกับโมเดลอเมริกันด้วย บางทีโมเดลเอเชียพวกนั้นก็อาจเป็นแนว Mythos เหมือนกัน
ตอนนี้กำลังลองใช้ MCP ทางการอยู่ แต่อยากรู้ว่าคนอื่นใช้ตัวไหนกัน
ฝั่ง coplay ที่ดัง ๆ ผมเจอปัญหาแพ็กเกจชนกัน
ครึ่งหนึ่งพลาดไปเลย ส่วนอีกครึ่งเป็นข้อมูลเก่าหรือไม่ได้ตรวจสอบ
Fugu Ultra ดูเหมือนไม่ใช่โมเดลจริง ๆ แต่เป็นระบบที่ route ไปยังหลายโมเดล คล้าย cloud harness และดูคล้าย Fusion ของ OpenRouter
“ไม่ใช่โมเดลขนาดยักษ์ตัวเดียว แต่ Fugu คือระบบ orchestration แบบ multi-agent ที่ผ่านการฝึกมา เป็นโมเดลภาษาที่ route งานไปยังพูลของ foundation model ที่สลับเปลี่ยนได้ และถูกฝึกให้เรียกอินสแตนซ์ของตัวเองแบบ recursive” - https://openrouter.ai/sakana/fugu-ultra
[0] https://sakana.ai/fugu/
[1] https://openrouter.ai/openrouter/fusion
คำว่า “Mythos-like” เริ่มน่ารำคาญแล้ว
ผู้ใช้ทั่วไปไม่มีวิธีเทียบ นอกจากดู benchmark
ถ้าไม่มี benchmark ที่เชื่อถือได้ สิ่งที่พวกนี้เหมือน Mythos ก็มีแค่รับข้อความเข้าแล้วส่งข้อความออกเท่านั้น
พอมีโมเดลใหม่ออกมา ก็เอาไปลองใช้ตรง ๆ กับ codebase ซอฟต์แวร์ระบบ proprietary ขนาดใหญ่ของเราและผลิตภัณฑ์ที่ออกจริง หรือโปรเจกต์ที่จะเปิดตัวสักวันหนึ่ง
ค่อนข้างชัดเจนว่าโมเดลไหนช่วยให้งานดีขึ้นหรือเร็วขึ้น และตอนนี้โชคดีที่มีงบ token ให้ใช้ได้เท่าที่จำเป็น
ไม่ต้องการ benchmark, evaluation, marketing หรือ system card อะไรแล้ว บนเว็บก็อ่านแค่ทิป วิธีทำงานจริง และข่าวเปิดตัว
ผมแชร์ประสบการณ์กับเพื่อนร่วมงาน แต่ที่เหลือทั้งหมดคือ noise
สิ่งที่น่าจะขาดไปคือฉากที่ CEO ออกมาเตือนโลกว่า “โมเดลของเราอันตรายเกินกว่าจะเปิดเผยบนอินเทอร์เน็ต ใครสักคนควรหยุดมันก่อนจะสายเกินไป”
รายชื่อนักลงทุนน่าประทับใจ: https://sakana.ai/company-info/?lang=en
เมื่อไม่กี่วันก่อนก็ขึ้น headline บน HN และมีคอมเมนต์เกิน 100 ความเห็น: https://news.ycombinator.com/item?id=48624782
ยากจะเชื่อว่าอยู่ ๆ ก็ปล่อย โมเดลระดับ Mythos ออกมา
DeepSeek, Z.ai, Alibaba/Qwen ทำมานานกว่ามาก และในช่วง 18 เดือนที่ผ่านมาได้ปล่อยโมเดลที่ค่อย ๆ ยกระดับสมรรถนะอย่างต่อเนื่อง
ยากจะเชื่อว่าบริษัทใหม่ ๆ ที่ไม่มี release ก่อนหน้าเลย จะอยู่ ๆ ปล่อยโมเดลระดับ Mythos ออกมาได้
https://techcrunch.com/2025/02/21/sakana-walks-back-claims-t...
ก่อนสิ้นปีนี้น่าจะมี การแบน LLM ต่างชาติ ด้วยเหตุผลเรื่อง “ความกังวลด้านความปลอดภัย”
คงไม่เกี่ยวกับประสิทธิภาพจริง
แต่ Anthropic ได้ตั้ง baseline ของระบบแนว Mythos ไว้แล้ว และสิ่งใดก็ตามที่เข้ากับนิยามหลวม ๆ นั้นคงถูกมองว่าเป็นอันตรายต่อสาธารณะ
ไม่มีใครจะรอ และเมื่อ genie ออกจากขวดไปแล้ว ก็เอากลับเข้าไปไม่ได้
รู้สึกเหมือนอยู่ในอีกความเป็นจริงหนึ่งที่ตอนนี้ดูเหมือนมีแค่ Claude ที่พูดจาฉลาด
งานเขียนของมนุษย์แทบทั้งหมดดูเหมือนภาพหลอนและคำพูดเพ้อเจ้อเชิงโชว์ออฟ
มองแบบเหน็บแนม ถ้าโมเดลแค่พอใช้ได้ ก็ยากที่จะโต้แย้ง ข้ออ้างว่าอยู่ระดับ Mythos
เพราะตอนนี้ใช้ Mythos ไม่ได้แล้ว
ในฐานะคนที่ไม่เคยมีสิทธิ์เข้าถึง เลยสงสัย
ความประทับใจแรกคือ “ถ้าไม่มี เบนช์มาร์กจากบุคคลที่สาม ก็ไสหัวไป”
โดยส่วนตัวไม่เคยได้ยินชื่อทั้งสองบริษัทนี้เลย
จะให้เชื่อเฉย ๆ ว่าทัดเทียมกับโมเดลที่ดีที่สุดในตลาดงั้นเหรอ?
Sakana อธิบายโมเดลของตัวเองว่าเป็น “Orchestration Model” ถ้าอย่างนั้นจริง ๆ แล้วหมายความว่าเอาหลายโมเดลมาต่อกันหรือเปล่า?
ถามเพราะไม่รู้จริง ๆ
แน่นอนว่ามันคงไม่ใช่เรื่องเล็ก ๆ แต่การสร้างบนเทคนิคเดิมที่รู้กันอยู่แล้วต้องใช้ความลับระดับสุดยอดของโลกจริงหรือ?
รู้สึกว่ายังมีผลไม้ที่ห้อยต่ำให้เก็บอีกเยอะ และปัจจัยจำกัดคือเวลาและทรัพยากร
ดูเหมือนจะอ้างว่าเป็นโครงสร้างที่ทากาวเชื่อมแบบไดนามิก ณ ตอนใช้งาน มากกว่าจะเป็นส่วนผสมของโมเดลใหม่
ปฏิกิริยาตอนนั้นก็ดูได้ที่นี่: https://news.ycombinator.com/item?id=48624782 (6 วันที่แล้ว, 244 คะแนน, 133 ความเห็น)
ตอนนั้นก็พูดแบบนั้นไหม?
มันสำคัญก็จริง แต่ทัศนคตินั้นไม่ถูกต้อง
ผมเป็นคนง่าย ๆ ถ้าไม่มี เบนช์มาร์ก บน https://arena.ai/leaderboard ก็ถือว่าเป็นของหลอก 100%
เหมือนหลายคอมเมนต์ที่นี่ ผมก็ทดสอบ Fugu กับโมเดลอื่น ๆ บางตัวแล้ว ซึ่งเป็นโมเดลที่ค่อนข้างแพง
เงิน $20 ไม่พอให้จบเวิร์กโฟลว์ทั้งหมด แต่ทำได้บน Opus
แน่นอนว่าแม้แต่ Opus ถ้าอยากได้ผลลัพธ์ที่ดีที่สุดก็อาจต้องขัดเกลาพรอมป์ต์ให้มากขึ้นตั้งแต่แรก แต่จนถึงตอนนี้ประสบการณ์เป็นแบบนั้น
การทดสอบครั้งต่อไปจะลองด้วย ระบบแบบเอเจนต์ แล้วดูประสิทธิภาพ