เส้นทางสู่การโอเพนซอร์สเอนจินอนุมานของ DeepSeek

(github.com/deepseek-ai)

8 คะแนน โดย GN⁺ 2025-04-15 | 1 ความคิดเห็น | แชร์ทาง WhatsApp

ทีม DeepSeek เปิดเผยแผนในการนำเอนจินอนุมานภายใน (DeepSeek Inference Engine) กลับคืนสู่โอเพนซอร์ส
เอนจินอนุมานเดิมพัฒนาบนพื้นฐานของ vLLM และกำลังพิจารณาการแบ่งปัน เนื่องจากความต้องการใช้งานสำหรับการดีพลอยโมเดล DeepSeek-V3 และ R1 เพิ่มขึ้น
การเปิดเผยทั้งหมดทำได้ยาก เนื่องจากโค้ดเดิม การพึ่งพาโครงสร้างพื้นฐาน และภาระด้านการบำรุงรักษา จึงเปลี่ยนทิศทางเป็น การมีส่วนร่วมแบบแยกเป็นโมดูลและตามหน่วยฟังก์ชัน
ต่อจากนี้จะมีแผน ร่วมมืออย่างใกล้ชิดกับชุมชนโอเพนซอร์ส เพื่อแบ่งปันการปรับแต่งประสิทธิภาพและฟังก์ชันที่นำกลับมาใช้ซ้ำได้
DeepSeek จะเดินหน้าอย่างจริงจังในด้าน การปรับแต่งการอนุมาน และการซิงก์การสนับสนุน Day-0 กับชุมชนเมื่อมีการเปิดตัวโมเดล

เส้นทางสู่การโอเพนซอร์สเอนจินอนุมานของ DeepSeek

กระแสตอบรับจาก Open Source Week และการมีส่วนร่วมต่อเนื่อง

ใน Open Source Week ที่จัดขึ้นเมื่อไม่นานมานี้ ได้เปิดซอร์สไลบรารีหลายตัว
ท่ามกลางกระแสตอบรับเชิงบวกจากชุมชน เกิดความร่วมมือ การอภิปราย และการแก้บั๊กอย่างคึกคัก
จากจุดนี้ DeepSeek จึง ตัดสินใจแบ่งปันเอนจินอนุมานภายในในรูปแบบโอเพนซอร์ส

เทคโนโลยีพื้นฐาน

เฟรมเวิร์กการฝึกของ DeepSeek พัฒนาบน PyTorch
เอนจินอนุมานถูกพัฒนาขึ้นจากฟอร์กยุคแรกของโปรเจกต์ vLLM และมีการปรับแต่งจำนวนมากให้เหมาะกับโมเดลของ DeepSeek

ข้อจำกัดเชิงปฏิบัติของการเปิดโอเพนซอร์สทั้งชุด

ความต่างของโค้ดเบส: เริ่มต้นจาก vLLM fork เมื่อกว่าหนึ่งปีก่อน แม้โครงสร้างจะคล้ายกัน แต่มีการเปลี่ยนแปลงไปมาก
การพึ่งพาโครงสร้างพื้นฐานภายใน: ผูกติดอย่างมากกับอินฟราภายในของ DeepSeek เช่น เครื่องมือจัดการคลัสเตอร์ ทำให้ภายนอกนำไปใช้ได้ยาก
ทรัพยากรดูแลรักษาไม่เพียงพอ: ในฐานะทีมวิจัยขนาดเล็ก จึงยังไม่มีศักยภาพเพียงพอในการดูแลโปรเจกต์โอเพนซอร์สขนาดใหญ่ได้อย่างต่อเนื่อง

ทางเลือก: ร่วมมือกับโปรเจกต์โอเพนซอร์สที่มีอยู่เดิม

จากนี้จะมีส่วนร่วมในแนวทางต่อไปนี้:

แยกฟังก์ชันออกเป็นโมดูล: แบ่งองค์ประกอบที่นำกลับมาใช้ซ้ำได้ออกเป็นไลบรารีอิสระแล้วนำไปมีส่วนร่วม
แบ่งปันการปรับแต่งประสิทธิภาพ: นำจุดปรับปรุงด้านประสิทธิภาพและแนวคิดการออกแบบจากการใช้งานภายในไปสะท้อนสู่โปรเจกต์โอเพนซอร์สเดิม

คำขอบคุณต่อชุมชนและวิสัยทัศน์

หากไม่มีชุมชนโอเพนซอร์ส ความก้าวหน้าในการพัฒนา AGI คงเป็นไปไม่ได้
ตั้งแต่ระบบปฏิบัติการ ภาษา เฟรมเวิร์ก ML ไปจนถึงเอนจินอนุมาน รากฐานของนวัตกรรม AI คือระบบนิเวศโอเพนซอร์ส
DeepSeek จะยังคงร่วมมือกับชุมชนอย่างต่อเนื่อง เพื่อให้ ประโยชน์ของ AGI สามารถสร้างคุณูปการต่อมนุษยชาติทั้งหมดได้

[!NOTE]
บทความนี้เป็นคำอธิบายเกี่ยวกับ กลยุทธ์การทำให้โค้ดเบส DeepSeek Inference Engine เป็นโอเพนซอร์ส
ในอนาคตเกี่ยวกับการเปิดตัวโมเดล DeepSeek มีแผนจะ ขยายความร่วมมือกับชุมชนโอเพนซอร์สและพาร์ตเนอร์ฮาร์ดแวร์ต่อไป
โดยเฉพาะก่อนการเปิดตัวโมเดล จะมีการ แบ่งปันและจัดแนวเทคโนโลยีด้านการอนุมานล่วงหน้า เพื่อประสานระบบนิเวศให้สามารถรองรับ SOTA ได้ตั้งแต่ Day-0 บนสภาพแวดล้อมฮาร์ดแวร์ที่หลากหลาย

1 ความคิดเห็น

GN⁺ 2025-04-15

ความคิดเห็นจาก Hacker News

ในเดือนมีนาคม vLLM ได้นำการปรับปรุงจากงานวิจัยของ DeepSeek มาใช้ ทำให้ประสิทธิภาพของ DeepSeek บน vLLM v0.7.3 ดีขึ้นมากกว่า 3 เท่า
- แต่ก็ยังมีพื้นที่ให้ปรับปรุงอีกมาก
- มีการเบนช์มาร์กด้วย vLLM ได้ 5K โทเค็น/วินาทีบนชุดข้อมูล sharegpt และ 12K โทเค็น/วินาทีบน random 2000/100
- ตามภาพรวมของระบบอนุมาน DeepSeek-V3/R1 แต่ละโหนด H800 ให้ค่าเฉลี่ยอินพุต 73.7k โทเค็น/วินาทีระหว่าง prefill (รวม cache hit) หรือเอาต์พุต 14.8k โทเค็น/วินาทีระหว่าง decoding
- DeepSeek ใช้งานสถาปัตยกรรมการอนุมานแบบอื่น แต่สิ่งนี้ก็แสดงให้เห็นว่ายังมีช่องให้ปรับปรุงอีกมาก
- หวังว่าจะได้เห็นโอเพนซอร์สมากขึ้น
เห็นด้วยกับแนวคิดเรื่องจุดแตกแขนงของโค้ดเบส
- การแตกฟอร์กช่วงแรกจาก vLLM แล้วคัสตอมให้เข้ากับโมเดล DeepSeek ทำให้ขยายต่อได้ยาก
- แนวทางแยกเป็นซับไลบรารีที่ดูแลรักษาได้และแชร์ข้อมูลกันโดยตรง เป็นวิธีที่ดีในการร่วมมือกับคอมมูนิตี้
- แม้จะมีอุปสรรค แต่ก็ไม่ได้เลือกทางง่ายที่ไม่ต้องมีส่วนร่วม
- อาจจะดีกว่าหากแชร์เพียงข้อมูลเกี่ยวกับเทคนิค แต่ถึงอย่างนั้นก็ยังเป็นการแบ่งปันความรู้อยู่ดี
- ดูเหมือนว่าสิ่งที่พวกเขาไม่ทำจะง่ายกว่า
- ขอชื่นชมพวกเขา
แรงจูงใจของบริษัท AI เชิงพาณิชย์ในการแบ่งปันผลวิจัยและองค์ความรู้
- เหตุใด Google จึงเผยแพร่สถาปัตยกรรม Transformer
- พวกเขาอาจต้องการทำสิ่งที่ดีเพื่อมนุษยชาติและผลักดันความก้าวหน้า
- สงสัยว่าผู้บริหารบริษัทจะทำสิ่งที่ขัดกับผลประโยชน์ทางการค้าได้อย่างไร
- สงสัยว่ามีตรรกะทางธุรกิจที่สนับสนุนการแบ่งปันข้อมูลและทรัพย์สินทางปัญญาหรือไม่
"ในคอมมูนิตี้โอเพนซอร์สมีของน่าสนใจอยู่ แต่การจะทำให้รันได้นอกบริษัทต้องจัดระเบียบอีกมาก และก็ไม่มีคนเพียงพอจะดูแลมันอย่างเหมาะสมหลังปล่อยออกไป"
- หลายบริษัทอยู่ในจุดนี้
- อยากให้โอเพนซอร์สพร้อมโน้ตว่า "พวกเราจะไม่ดูแลสิ่งนี้ แต่สามารถฟอร์กได้ตามสบาย"
ได้เห็นงานวิศวกรรมที่ดีของ DeepSeek
- หวังว่าจะมีต่อไปเรื่อย ๆ
สงสัยว่านี่เป็นกลยุทธ์ที่จีนใช้ปล่อยเครื่องมือ AI, โมเดล และอื่น ๆ แบบโอเพนซอร์สจำนวนมาก เพื่อตอบโต้การครอบงำของสหรัฐฯ หรือไม่
- คิดว่าเป็นผลดีต่อ市場
tl;dr "ฟอร์กของ vLLM ดูแลต่อไปไม่ไหวแล้ว และตอนนี้จะสร้างใหม่ต่อสาธารณะ"
รู้สึกว่านี่เป็นวิธีหนึ่งในการทำ censorship

เส้นทางสู่การโอเพนซอร์สเอนจินอนุมานของ DeepSeek

เส้นทางสู่การโอเพนซอร์สเอนจินอนุมานของ DeepSeek

กระแสตอบรับจาก Open Source Week และการมีส่วนร่วมต่อเนื่อง

เทคโนโลยีพื้นฐาน

ข้อจำกัดเชิงปฏิบัติของการเปิดโอเพนซอร์สทั้งชุด

ทางเลือก: ร่วมมือกับโปรเจกต์โอเพนซอร์สที่มีอยู่เดิม

คำขอบคุณต่อชุมชนและวิสัยทัศน์

บทความที่เกี่ยวข้อง

1 ความคิดเห็น

ความคิดเห็นจาก Hacker News