เส้นทางสู่การโอเพนซอร์สเอนจินอนุมานของ DeepSeek
(github.com/deepseek-ai)- ทีม DeepSeek เปิดเผยแผนในการนำเอนจินอนุมานภายใน (DeepSeek Inference Engine) กลับคืนสู่โอเพนซอร์ส
- เอนจินอนุมานเดิมพัฒนาบนพื้นฐานของ vLLM และกำลังพิจารณาการแบ่งปัน เนื่องจากความต้องการใช้งานสำหรับการดีพลอยโมเดล DeepSeek-V3 และ R1 เพิ่มขึ้น
- การเปิดเผยทั้งหมดทำได้ยาก เนื่องจากโค้ดเดิม การพึ่งพาโครงสร้างพื้นฐาน และภาระด้านการบำรุงรักษา จึงเปลี่ยนทิศทางเป็น การมีส่วนร่วมแบบแยกเป็นโมดูลและตามหน่วยฟังก์ชัน
- ต่อจากนี้จะมีแผน ร่วมมืออย่างใกล้ชิดกับชุมชนโอเพนซอร์ส เพื่อแบ่งปันการปรับแต่งประสิทธิภาพและฟังก์ชันที่นำกลับมาใช้ซ้ำได้
- DeepSeek จะเดินหน้าอย่างจริงจังในด้าน การปรับแต่งการอนุมาน และการซิงก์การสนับสนุน Day-0 กับชุมชนเมื่อมีการเปิดตัวโมเดล
เส้นทางสู่การโอเพนซอร์สเอนจินอนุมานของ DeepSeek
กระแสตอบรับจาก Open Source Week และการมีส่วนร่วมต่อเนื่อง
- ใน Open Source Week ที่จัดขึ้นเมื่อไม่นานมานี้ ได้เปิดซอร์สไลบรารีหลายตัว
- ท่ามกลางกระแสตอบรับเชิงบวกจากชุมชน เกิดความร่วมมือ การอภิปราย และการแก้บั๊กอย่างคึกคัก
- จากจุดนี้ DeepSeek จึง ตัดสินใจแบ่งปันเอนจินอนุมานภายในในรูปแบบโอเพนซอร์ส
เทคโนโลยีพื้นฐาน
- เฟรมเวิร์กการฝึกของ DeepSeek พัฒนาบน PyTorch
- เอนจินอนุมานถูกพัฒนาขึ้นจากฟอร์กยุคแรกของโปรเจกต์ vLLM และมีการปรับแต่งจำนวนมากให้เหมาะกับโมเดลของ DeepSeek
ข้อจำกัดเชิงปฏิบัติของการเปิดโอเพนซอร์สทั้งชุด
- ความต่างของโค้ดเบส: เริ่มต้นจาก vLLM fork เมื่อกว่าหนึ่งปีก่อน แม้โครงสร้างจะคล้ายกัน แต่มีการเปลี่ยนแปลงไปมาก
- การพึ่งพาโครงสร้างพื้นฐานภายใน: ผูกติดอย่างมากกับอินฟราภายในของ DeepSeek เช่น เครื่องมือจัดการคลัสเตอร์ ทำให้ภายนอกนำไปใช้ได้ยาก
- ทรัพยากรดูแลรักษาไม่เพียงพอ: ในฐานะทีมวิจัยขนาดเล็ก จึงยังไม่มีศักยภาพเพียงพอในการดูแลโปรเจกต์โอเพนซอร์สขนาดใหญ่ได้อย่างต่อเนื่อง
ทางเลือก: ร่วมมือกับโปรเจกต์โอเพนซอร์สที่มีอยู่เดิม
จากนี้จะมีส่วนร่วมในแนวทางต่อไปนี้:
- แยกฟังก์ชันออกเป็นโมดูล: แบ่งองค์ประกอบที่นำกลับมาใช้ซ้ำได้ออกเป็นไลบรารีอิสระแล้วนำไปมีส่วนร่วม
- แบ่งปันการปรับแต่งประสิทธิภาพ: นำจุดปรับปรุงด้านประสิทธิภาพและแนวคิดการออกแบบจากการใช้งานภายในไปสะท้อนสู่โปรเจกต์โอเพนซอร์สเดิม
คำขอบคุณต่อชุมชนและวิสัยทัศน์
- หากไม่มีชุมชนโอเพนซอร์ส ความก้าวหน้าในการพัฒนา AGI คงเป็นไปไม่ได้
- ตั้งแต่ระบบปฏิบัติการ ภาษา เฟรมเวิร์ก ML ไปจนถึงเอนจินอนุมาน รากฐานของนวัตกรรม AI คือระบบนิเวศโอเพนซอร์ส
- DeepSeek จะยังคงร่วมมือกับชุมชนอย่างต่อเนื่อง เพื่อให้ ประโยชน์ของ AGI สามารถสร้างคุณูปการต่อมนุษยชาติทั้งหมดได้
> [!NOTE]
> บทความนี้เป็นคำอธิบายเกี่ยวกับ กลยุทธ์การทำให้โค้ดเบส DeepSeek Inference Engine เป็นโอเพนซอร์ส
> ในอนาคตเกี่ยวกับการเปิดตัวโมเดล DeepSeek มีแผนจะ ขยายความร่วมมือกับชุมชนโอเพนซอร์สและพาร์ตเนอร์ฮาร์ดแวร์ต่อไป
> โดยเฉพาะก่อนการเปิดตัวโมเดล จะมีการ แบ่งปันและจัดแนวเทคโนโลยีด้านการอนุมานล่วงหน้า เพื่อประสานระบบนิเวศให้สามารถรองรับ SOTA ได้ตั้งแต่ Day-0 บนสภาพแวดล้อมฮาร์ดแวร์ที่หลากหลาย
1 ความคิดเห็น
ความคิดเห็นจาก Hacker News
ในเดือนมีนาคม vLLM ได้นำการปรับปรุงจากงานวิจัยของ DeepSeek มาใช้ ทำให้ประสิทธิภาพของ DeepSeek บน vLLM v0.7.3 ดีขึ้นมากกว่า 3 เท่า
เห็นด้วยกับแนวคิดเรื่องจุดแตกแขนงของโค้ดเบส
แรงจูงใจของบริษัท AI เชิงพาณิชย์ในการแบ่งปันผลวิจัยและองค์ความรู้
"ในคอมมูนิตี้โอเพนซอร์สมีของน่าสนใจอยู่ แต่การจะทำให้รันได้นอกบริษัทต้องจัดระเบียบอีกมาก และก็ไม่มีคนเพียงพอจะดูแลมันอย่างเหมาะสมหลังปล่อยออกไป"
ได้เห็นงานวิศวกรรมที่ดีของ DeepSeek
สงสัยว่านี่เป็นกลยุทธ์ที่จีนใช้ปล่อยเครื่องมือ AI, โมเดล และอื่น ๆ แบบโอเพนซอร์สจำนวนมาก เพื่อตอบโต้การครอบงำของสหรัฐฯ หรือไม่
tl;dr "ฟอร์กของ vLLM ดูแลต่อไปไม่ไหวแล้ว และตอนนี้จะสร้างใหม่ต่อสาธารณะ"
รู้สึกว่านี่เป็นวิธีหนึ่งในการทำ censorship