8 คะแนน โดย GN⁺ 2025-04-15 | 1 ความคิดเห็น | แชร์ทาง WhatsApp
  • ทีม DeepSeek เปิดเผยแผนในการนำเอนจินอนุมานภายใน (DeepSeek Inference Engine) กลับคืนสู่โอเพนซอร์ส
  • เอนจินอนุมานเดิมพัฒนาบนพื้นฐานของ vLLM และกำลังพิจารณาการแบ่งปัน เนื่องจากความต้องการใช้งานสำหรับการดีพลอยโมเดล DeepSeek-V3 และ R1 เพิ่มขึ้น
  • การเปิดเผยทั้งหมดทำได้ยาก เนื่องจากโค้ดเดิม การพึ่งพาโครงสร้างพื้นฐาน และภาระด้านการบำรุงรักษา จึงเปลี่ยนทิศทางเป็น การมีส่วนร่วมแบบแยกเป็นโมดูลและตามหน่วยฟังก์ชัน
  • ต่อจากนี้จะมีแผน ร่วมมืออย่างใกล้ชิดกับชุมชนโอเพนซอร์ส เพื่อแบ่งปันการปรับแต่งประสิทธิภาพและฟังก์ชันที่นำกลับมาใช้ซ้ำได้
  • DeepSeek จะเดินหน้าอย่างจริงจังในด้าน การปรับแต่งการอนุมาน และการซิงก์การสนับสนุน Day-0 กับชุมชนเมื่อมีการเปิดตัวโมเดล

เส้นทางสู่การโอเพนซอร์สเอนจินอนุมานของ DeepSeek

กระแสตอบรับจาก Open Source Week และการมีส่วนร่วมต่อเนื่อง

  • ใน Open Source Week ที่จัดขึ้นเมื่อไม่นานมานี้ ได้เปิดซอร์สไลบรารีหลายตัว
  • ท่ามกลางกระแสตอบรับเชิงบวกจากชุมชน เกิดความร่วมมือ การอภิปราย และการแก้บั๊กอย่างคึกคัก
  • จากจุดนี้ DeepSeek จึง ตัดสินใจแบ่งปันเอนจินอนุมานภายในในรูปแบบโอเพนซอร์ส

เทคโนโลยีพื้นฐาน

  • เฟรมเวิร์กการฝึกของ DeepSeek พัฒนาบน PyTorch
  • เอนจินอนุมานถูกพัฒนาขึ้นจากฟอร์กยุคแรกของโปรเจกต์ vLLM และมีการปรับแต่งจำนวนมากให้เหมาะกับโมเดลของ DeepSeek

ข้อจำกัดเชิงปฏิบัติของการเปิดโอเพนซอร์สทั้งชุด

  • ความต่างของโค้ดเบส: เริ่มต้นจาก vLLM fork เมื่อกว่าหนึ่งปีก่อน แม้โครงสร้างจะคล้ายกัน แต่มีการเปลี่ยนแปลงไปมาก
  • การพึ่งพาโครงสร้างพื้นฐานภายใน: ผูกติดอย่างมากกับอินฟราภายในของ DeepSeek เช่น เครื่องมือจัดการคลัสเตอร์ ทำให้ภายนอกนำไปใช้ได้ยาก
  • ทรัพยากรดูแลรักษาไม่เพียงพอ: ในฐานะทีมวิจัยขนาดเล็ก จึงยังไม่มีศักยภาพเพียงพอในการดูแลโปรเจกต์โอเพนซอร์สขนาดใหญ่ได้อย่างต่อเนื่อง

ทางเลือก: ร่วมมือกับโปรเจกต์โอเพนซอร์สที่มีอยู่เดิม

จากนี้จะมีส่วนร่วมในแนวทางต่อไปนี้:

  • แยกฟังก์ชันออกเป็นโมดูล: แบ่งองค์ประกอบที่นำกลับมาใช้ซ้ำได้ออกเป็นไลบรารีอิสระแล้วนำไปมีส่วนร่วม
  • แบ่งปันการปรับแต่งประสิทธิภาพ: นำจุดปรับปรุงด้านประสิทธิภาพและแนวคิดการออกแบบจากการใช้งานภายในไปสะท้อนสู่โปรเจกต์โอเพนซอร์สเดิม

คำขอบคุณต่อชุมชนและวิสัยทัศน์

  • หากไม่มีชุมชนโอเพนซอร์ส ความก้าวหน้าในการพัฒนา AGI คงเป็นไปไม่ได้
  • ตั้งแต่ระบบปฏิบัติการ ภาษา เฟรมเวิร์ก ML ไปจนถึงเอนจินอนุมาน รากฐานของนวัตกรรม AI คือระบบนิเวศโอเพนซอร์ส
  • DeepSeek จะยังคงร่วมมือกับชุมชนอย่างต่อเนื่อง เพื่อให้ ประโยชน์ของ AGI สามารถสร้างคุณูปการต่อมนุษยชาติทั้งหมดได้

> [!NOTE]
> บทความนี้เป็นคำอธิบายเกี่ยวกับ กลยุทธ์การทำให้โค้ดเบส DeepSeek Inference Engine เป็นโอเพนซอร์ส
> ในอนาคตเกี่ยวกับการเปิดตัวโมเดล DeepSeek มีแผนจะ ขยายความร่วมมือกับชุมชนโอเพนซอร์สและพาร์ตเนอร์ฮาร์ดแวร์ต่อไป
> โดยเฉพาะก่อนการเปิดตัวโมเดล จะมีการ แบ่งปันและจัดแนวเทคโนโลยีด้านการอนุมานล่วงหน้า เพื่อประสานระบบนิเวศให้สามารถรองรับ SOTA ได้ตั้งแต่ Day-0 บนสภาพแวดล้อมฮาร์ดแวร์ที่หลากหลาย

1 ความคิดเห็น

 
GN⁺ 2025-04-15
ความคิดเห็นจาก Hacker News
  • ในเดือนมีนาคม vLLM ได้นำการปรับปรุงจากงานวิจัยของ DeepSeek มาใช้ ทำให้ประสิทธิภาพของ DeepSeek บน vLLM v0.7.3 ดีขึ้นมากกว่า 3 เท่า

    • แต่ก็ยังมีพื้นที่ให้ปรับปรุงอีกมาก
    • มีการเบนช์มาร์กด้วย vLLM ได้ 5K โทเค็น/วินาทีบนชุดข้อมูล sharegpt และ 12K โทเค็น/วินาทีบน random 2000/100
    • ตามภาพรวมของระบบอนุมาน DeepSeek-V3/R1 แต่ละโหนด H800 ให้ค่าเฉลี่ยอินพุต 73.7k โทเค็น/วินาทีระหว่าง prefill (รวม cache hit) หรือเอาต์พุต 14.8k โทเค็น/วินาทีระหว่าง decoding
    • DeepSeek ใช้งานสถาปัตยกรรมการอนุมานแบบอื่น แต่สิ่งนี้ก็แสดงให้เห็นว่ายังมีช่องให้ปรับปรุงอีกมาก
    • หวังว่าจะได้เห็นโอเพนซอร์สมากขึ้น
  • เห็นด้วยกับแนวคิดเรื่องจุดแตกแขนงของโค้ดเบส

    • การแตกฟอร์กช่วงแรกจาก vLLM แล้วคัสตอมให้เข้ากับโมเดล DeepSeek ทำให้ขยายต่อได้ยาก
    • แนวทางแยกเป็นซับไลบรารีที่ดูแลรักษาได้และแชร์ข้อมูลกันโดยตรง เป็นวิธีที่ดีในการร่วมมือกับคอมมูนิตี้
    • แม้จะมีอุปสรรค แต่ก็ไม่ได้เลือกทางง่ายที่ไม่ต้องมีส่วนร่วม
    • อาจจะดีกว่าหากแชร์เพียงข้อมูลเกี่ยวกับเทคนิค แต่ถึงอย่างนั้นก็ยังเป็นการแบ่งปันความรู้อยู่ดี
    • ดูเหมือนว่าสิ่งที่พวกเขาไม่ทำจะง่ายกว่า
    • ขอชื่นชมพวกเขา
  • แรงจูงใจของบริษัท AI เชิงพาณิชย์ในการแบ่งปันผลวิจัยและองค์ความรู้

    • เหตุใด Google จึงเผยแพร่สถาปัตยกรรม Transformer
    • พวกเขาอาจต้องการทำสิ่งที่ดีเพื่อมนุษยชาติและผลักดันความก้าวหน้า
    • สงสัยว่าผู้บริหารบริษัทจะทำสิ่งที่ขัดกับผลประโยชน์ทางการค้าได้อย่างไร
    • สงสัยว่ามีตรรกะทางธุรกิจที่สนับสนุนการแบ่งปันข้อมูลและทรัพย์สินทางปัญญาหรือไม่
  • "ในคอมมูนิตี้โอเพนซอร์สมีของน่าสนใจอยู่ แต่การจะทำให้รันได้นอกบริษัทต้องจัดระเบียบอีกมาก และก็ไม่มีคนเพียงพอจะดูแลมันอย่างเหมาะสมหลังปล่อยออกไป"

    • หลายบริษัทอยู่ในจุดนี้
    • อยากให้โอเพนซอร์สพร้อมโน้ตว่า "พวกเราจะไม่ดูแลสิ่งนี้ แต่สามารถฟอร์กได้ตามสบาย"
  • ได้เห็นงานวิศวกรรมที่ดีของ DeepSeek

    • หวังว่าจะมีต่อไปเรื่อย ๆ
  • สงสัยว่านี่เป็นกลยุทธ์ที่จีนใช้ปล่อยเครื่องมือ AI, โมเดล และอื่น ๆ แบบโอเพนซอร์สจำนวนมาก เพื่อตอบโต้การครอบงำของสหรัฐฯ หรือไม่

    • คิดว่าเป็นผลดีต่อ市場
  • tl;dr "ฟอร์กของ vLLM ดูแลต่อไปไม่ไหวแล้ว และตอนนี้จะสร้างใหม่ต่อสาธารณะ"

  • รู้สึกว่านี่เป็นวิธีหนึ่งในการทำ censorship