เปิดตัว GLM 5.2
(twitter.com/jietang)- GLM-5.2 เป็นโมเดลโอเพนซอร์สที่รองรับ 1M context สำหรับการใช้งานจริง และรองรับการทำงานแบบอิสระในงานระยะยาว โดยมอบรากฐานสำหรับการสร้างแอปพลิเคชันเอเจนต์ที่ซับซ้อน
- ในสถานการณ์ที่การเข้าถึง frontier model ถูกปิดกั้นอย่างกะทันหันด้วย เหตุผลที่ไม่ใช่ด้านเทคนิค วิทยาศาสตร์ควรเป็นของโลก และเส้นทางสู่ AGI ไม่ควรถูกกักไว้หลังกำแพงสูง
- AGI ไม่ควรเป็นสิทธิพิเศษที่ถูกผูกขาดโดยกฎของคนส่วนน้อยและถูกเรียกคืนได้ทุกเมื่อ แต่ควรเป็น รากฐานร่วมกัน ที่มนุษยชาติใช้สำรวจขอบเขตของสติปัญญาและแก้โจทย์ที่ซับซ้อนไปด้วยกัน
- GLM-5.2 เป็นโมเดลโอเพนซอร์สที่ทรงพลังที่สุดของ Zhipu จนถึงตอนนี้ และยังคงทำหน้าที่เป็นเอนจินหลักสำหรับการสร้าง โมเดลโค้ดดิ้ง ที่แข็งแกร่งที่สุดในประเทศ
- จะเปิดให้ผู้ใช้ GLM Coding Plan ระดับ Lite / Pro / Max ใช้งานก่อน และ API มีกำหนดเปิดเผยในสัปดาห์หน้า ทำให้การเข้าถึง frontier intelligence เข้าใกล้อีกขั้น
ข้อความสำคัญ
- การจำกัด frontier model บางตัวอย่างกะทันหันถูกมองว่าเป็นเรื่องน่าเสียดายอย่างยิ่ง และยิ่งในช่วงเวลาที่การเข้าถึงถูกตัดขาดด้วยเหตุผลที่ไม่ใช่ด้านเทคนิค ก็ยิ่งตอกย้ำจุดยืนว่าวิทยาศาสตร์ควรเป็นของโลก
- เส้นทางสู่ AGI ไม่ควรถูกล้อมด้วยกำแพงสูง และ AGI ควรเป็น รากฐานสำคัญ ที่มนุษยชาติใช้ร่วมกันเพื่อสำรวจขอบเขตของสติปัญญาและแก้ความท้าทายที่ซับซ้อน
- AGI ไม่ควรเป็นสิทธิพิเศษที่กฎของคนส่วนน้อยผูกขาดและเพิกถอนได้ทุกเมื่อ และเมื่อเผชิญกับการปิดกั้นและข้อจำกัดจากภายนอก ก็จำเป็นต้องมีความเปิดกว้างอย่างถึงราก
- frontier intelligence ควรรักษาความเป็น โอเพนซอร์ส การเข้าถึงได้ และความสามารถในการสร้างต่อ และควรมอบให้แก่นักพัฒนาทุกคนที่ทุ่มเท
การเปิดเผย GLM-5.2 และกำหนดการใช้งาน
- GLM-5.2 เป็นโมเดลโอเพนซอร์สที่ทรงพลังที่สุดที่ Zhipu เปิดเผยจนถึงปัจจุบัน
- โมเดลนี้รองรับ หน้าต่าง context 1M ที่ใช้งานได้จริง และยังคงรักษาความได้เปรียบอย่างต่อเนื่องในการทำงานระยะยาวให้เสร็จสิ้นได้อย่างอิสระ
- มอบรากฐานที่มั่นคงสำหรับการสร้างแอปพลิเคชันเอเจนต์ที่ซับซ้อน และยังคงทำหน้าที่เป็นเอนจินหลักสำหรับการสร้างโมเดลโค้ดดิ้งที่แข็งแกร่งที่สุดในประเทศ
- GLM-5.2 จะเปิดให้ผู้ใช้ GLM Coding Plan อย่างเป็นทางการในเวลา 5:21 โดยครอบคลุมผู้ใช้ Lite / Pro / Max ทั้งหมด
- API มีกำหนดเปิดเผยในสัปดาห์หน้า และ ModelKey คือ
GLM-5.2
1 ความคิดเห็น
ความคิดเห็นจาก Hacker News
ตามประกาศของผู้ก่อตั้ง Z.ai ระบุว่า GLM-5.2 เป็นโมเดล “เปิดทั้งหมด” และในสถานการณ์ที่การเข้าถึงโมเดลระดับแนวหน้าบางตัวถูกจำกัดอย่างกะทันหันด้วยเหตุผลที่ไม่ใช่ด้านเทคนิค สติปัญญาระดับแนวหน้าควรเปิดให้ทุกคนเข้าถึง
GLM-5.2 เป็นโมเดลโอเพนซอร์สที่แข็งแกร่งที่สุดของ Zhipu จนถึงตอนนี้ และชูจุดเด่นเรื่อง หน้าต่างคอนเท็กซ์ 1M ที่ใช้งานได้จริง กับความสามารถในการทำงานระยะยาวได้อย่างอิสระ
ระบุว่าจะเปิดให้ผู้ใช้ Lite / Pro / Max ของ GLM Coding Plan ก่อน และ API มีกำหนดเปิดในสัปดาห์หน้า
https://x.com/jietang/status/2065784751345287314
ดูแตกต่างจากโมเดลจีนแบบ open weights อื่น ๆ อย่าง Qwen
ตอนนี้ดูเหมือนว่ายังไม่มีบล็อกโพสต์ทางการที่รวมผลเบนช์มาร์กไว้ แต่ก็รู้สึกขอบคุณอีกครั้งที่สถาบันวิจัย AI ของจีนเผยแพร่ผลงานแบบนี้และมีส่วนช่วยต่อโลกด้วย ไลเซนส์แบบเปิดกว้าง
เหตุการณ์ Fable 5 ยิ่งตอกย้ำว่าโมเดลเปิดแบบนี้มีคุณค่าแค่ไหน
ถึงอย่างนั้นก็น่าประทับใจมากและใช้งานได้ดีพอสมควร
มันดูอ่อนกว่าชัดเจนในงานด้านสถาปัตยกรรมหรือโจทย์ซับซ้อน แต่คงมีไม่มากนักที่คาดหวังอย่างอื่น
โดยเฉพาะด้าน ดีไซน์และส่วนติดต่อผู้ใช้ ดูเหมือนจะทำได้ดีเกินขนาดตัว แม้อาจเป็นเพียงรสนิยมส่วนตัว
ในช่วงไม่กี่วันที่ผ่านมา สถาบันวิจัยจีนปล่อย MiniMaxM3, KimiK2.7 และ GLM5.2 ออกมา ขณะที่ฝั่งสหรัฐฯ กำลังเซ็นเซอร์โมเดล
อ่านแล้วแทบเหมือนนิยาย
ในกรณีของ Anthropic ตอนนี้จะพูดว่าสหรัฐฯ กำลังเซ็นเซอร์โมเดลก็อาจพอได้ แต่ดูเหมือนจะอธิบายได้ดีกว่าว่าเป็นเรื่องการทุจริต การแก้แค้น การรีดไถ และความไร้ความสามารถโดยทั่วไปของรัฐบาลทรัมป์
ดูเหมือนจะไม่ใช่ไลบรารี C++ ที่คาดหวังไว้อย่าง OpenGL Mathematics
เมื่อดูการกระทำล่าสุดของรัฐบาลสหรัฐฯ ต่อ Fable แนวโน้มนี้ยิ่งดูเหมือนอนาคตมากขึ้น
จะพึ่งพาผลิตภัณฑ์เชิงกลยุทธ์ที่ผู้เล่นซึ่งเอาแน่เอานอนไม่ได้สามารถล็อกประตูใส่เมื่อไรก็ได้ไม่ได้
โมเดลแบบ open weights โดยพื้นฐานแล้วแทบจะมีภูมิคุ้มกันต่อสถานการณ์แบบนั้น
รัฐบาลสหรัฐฯ สามารถทำให้การซื้อขาย ดาวน์โหลด หรือใช้งานโมเดล open weights จากต่างประเทศกลายเป็นเรื่องผิดกฎหมายได้
อาจบังคับใช้กับรายบุคคลได้ยาก แต่บริษัทต่าง ๆ ก็คงทำตามเป็นหลัก และถ้าไปถึงขั้นใช้มาตรการคว่ำบาตร ก็มีโอกาสถูกถอดจากโฮสติ้งที่อยู่ในสหรัฐฯ อย่าง GitHub ด้วย
ยิ่งไปกว่านั้น เรากำลังมุ่งหน้าอย่างรวดเร็วไปสู่ระดับ การเฝ้าระวังมวลชน ที่น่ากลัว ซึ่งอาจช่วยให้บังคับใช้ได้
สถานการณ์ Fable กำลังสร้างแบบอย่างที่อันตรายมาก และมันทำให้กังวลกับอนาคต เพราะดูเหมือนว่าเรากำลังแพ้ในการต่อสู้เพื่อเสรีภาพด้านข้อมูลและการคำนวณ
ฝ่ายที่คอยส่งเสริมเรื่องไร้สาระนี้ก็คือ Anthropic
มันลดคุณภาพผลลัพธ์ลงโดยไม่บอกกล่าว และปฏิเสธคำขอโดยอ้างเรื่อง “ความปลอดภัย”
ต่อให้รัฐบาลไม่ได้สั่งให้ถอดโมเดลออกจากชาวต่างชาติ สถานการณ์ก็คงยังแย่มากอยู่ดีเพราะตัว Anthropic เองก็ห่วย
Anthropic ปล่อยเรื่องนี้ออกมาตรงกับเวลา 17:21 น. ตามเวลาจีน ที่ได้รับจดหมายสั่งห้าม Fable จากรัฐบาลพอดี และยังพูดถึงอย่างชัดเจนว่าสถานการณ์ที่โมเดลอื่นใช้งานไม่ได้กำลังเกิดขึ้น
มันดูแปลกพอสมควร
หรืออาจมีการแก้ไขโพสต์ภายหลังหรือเปล่า
การเปิดตัวครั้งนี้ดูเหมือนถูกเร่งให้เร็วขึ้นเพื่อเกาะกระแสดราม่า Mythos
เหมือนจะเป็นแนว “เสียดายที่ใช้ Fable ไม่ได้ งั้นมาลองของเราช่วงสุดสัปดาห์นี้แทน” และเดิมทีอาจตั้งใจจะเปิดตัวในสัปดาห์หน้า เลยดูเหมือนเบนช์มาร์กยังไม่พร้อมครบ
กำลังรอการเปิดตัว 5.2 flash
แม้เวลาจะผ่านไปสักพักแล้ว แต่ก็ยังรู้สึกว่า 4.7 flash เป็นหนึ่งในโมเดลโค้ดดิ้งแบบรันโลคัลที่แข็งแกร่งที่สุด
ในบรรดาโมเดลโลคัลตอนนี้ Qwen-3.5 ยังดีที่สุด
ส่วน 3.6 ใช้ VRAM เกิน 24GB ไปนิดหน่อย ซึ่งพอถึงจุดนั้นก็ไม่ใช่การใช้ GPU สำหรับผู้บริโภคแล้ว
อยากให้มี บล็อกโพสต์ ที่อธิบายความสามารถของโมเดลใหม่ สิ่งที่คาดหวังได้ มันถูกลงไหม เร็วขึ้นไหม หรือคุณภาพเอาต์พุตดีขึ้นไหม
ถึงอย่างนั้นก็ยังขอบคุณที่ปล่อยออกมา
อยากรู้ว่าจริง ๆ แล้วต้องใช้ ทรัพยากรคอมพิวต์ แค่ไหน รวมถึงความต้องการในแต่ละรูปแบบ
และอยากรู้ว่ามีการใช้การปรับแต่งของ Google อย่าง TurboQuant, MTP หรือมีนวัตกรรมภายในอื่น ๆ ที่ทำให้ผู้ใช้ทั่วไปสามารถเข้าถึงคุณภาพระดับแนวหน้าแบบรันโลคัลได้จริงหรือไม่
มันไม่ใช่โมเดลโลคัลในความหมายที่สมเหตุสมผล แต่เพราะเป็นโมเดลเปิด พอน้ำหนักโมเดลถูกปล่อยออกมาในราวหนึ่งสัปดาห์ ก็น่าจะมีผู้ให้บริการอนุมานจากภายนอกหลายรายที่มาแข่งกันด้านราคาต่อโทเค็น
ไม่มีอะไรอย่างโมเดลโลคัลที่ทำงานได้อย่างมีประสิทธิภาพบนฮาร์ดแวร์ผู้บริโภค และใครก็ตามที่พูดแบบนั้นก็กำลังโกหกหรือหลงผิด