2 คะแนน โดย GN⁺ 2023-07-31 | 1 ความคิดเห็น | แชร์ทาง WhatsApp
  • SF Compute เป็นกลุ่มที่รวบรวมสตาร์ตอัปและสถาบันวิจัยเพื่อร่วมกันซื้อและแบ่งปันทรัพยากรคอมพิวต์สำหรับการฝึกโมเดลขนาดใหญ่
  • แทนที่สตาร์ตอัปแต่ละรายจะต้องซื้อ GPU cluster ของตนเอง กลุ่มจะซื้อคลัสเตอร์ที่มีจำนวน GPU รวมเป็นสัดส่วนกับจำนวนสตาร์ตอัป
  • ตัวจัดตารางงานจะจัดสรรทรัพยากรคอมพิวต์ให้สตาร์ตอัปทุกแห่งอย่างเป็นธรรมตามสัดส่วนความเป็นเจ้าของ
  • ด้วยวิธีนี้ สตาร์ตอัปสามารถใช้ GPU 512 ตัวเพื่อเร่งการฝึกโมเดลภายในหนึ่งสัปดาห์ และหลีกเลี่ยงความยุ่งยากจากการต้องใช้งาน GPU 128 ตัวอย่างต่อเนื่องตลอดหนึ่งเดือน
  • หากมีทรัพยากรคอมพิวต์ว่างอยู่ ตัวจัดตารางงานสามารถจัดสรรทรัพยากรให้สตาร์ตอัปมากกว่าโควตาที่ยุติธรรมได้
  • โมเดลนี้คล้ายกับที่สถาบันวิจัยขนาดใหญ่อย่าง OpenAI และ DeepMind ใช้ แต่โดยทั่วไปเข้าถึงได้ง่ายกว่าสำหรับสตาร์ตอัปที่มีคลัสเตอร์ขนาดเล็กและสัญญาระยะยาว
  • เป้าหมายคือการให้บริการทรัพยากรคอมพิวต์ในราคาราว $2.00 ต่อ H100 GPU 1 ตัว พร้อมการจัดสรรแบบระเบิดโหลดและสัญญาระยะสั้น
  • สตาร์ตอัปสามารถเข้าร่วมกลุ่มได้โดยกรอกแบบฟอร์มหรือติดต่อผู้จัด
  • สตาร์ตอัปสามารถถอนตัวออกจากคลัสเตอร์ได้โดยแจ้งล่วงหน้า และสามารถเพิ่มสตาร์ตอัปรายใหม่เข้าเป็นชุดได้
  • กลุ่มอาจจัดเตรียมทรัพยากรเกินไว้เล็กน้อยเพื่อรองรับการทดลองขนาดเล็กหรือคำขอจากเพื่อนในราคาที่ดี
  • การเงินสำหรับการซื้อคลัสเตอร์สามารถกระจายความเสี่ยงได้ด้วยความช่วยเหลือจากธนาคาร
  • กลุ่มมีแผนจะนำ H100 GPU จำนวน 512 ตัวขึ้นออนไลน์ภายใน 4-6 สัปดาห์ และอาจเพิ่มทรัพยากรเพิ่มเติมหากมีความต้องการสูง
  • มี mailing list สำหรับดีบักโครงสร้างพื้นฐานและกลุ่ม Slack เพื่อให้สมาชิกขอความช่วยเหลือเกี่ยวกับปัญหาโครงสร้างพื้นฐานได้

1 ความคิดเห็น

 
GN⁺ 2023-07-31
ความคิดเห็นบน Hacker News
  • ผู้แสดงความคิดเห็นพูดถึงโปรเจกต์ลักษณะคล้ายกันที่เคยมีส่วนร่วมก่อนหน้านี้ พร้อมอวยพรให้โปรเจกต์นี้ประสบความสำเร็จ
  • ผู้แสดงความคิดเห็นทบทวนถึงการเปลี่ยนแปลงด้านความพร้อมใช้งานของ TPU และความท้าทายที่เคยพบในโปรเจกต์ก่อนหน้า
  • ผู้แสดงความคิดเห็นแสดงท่าทีมองโลกในแง่ดีต่อโปรเจกต์ปัจจุบัน และแนะนำให้ทีมเปิดรับไอเดียจากผู้อื่นอย่างจริงจัง
  • ผู้แสดงความคิดเห็นอีกรายเปรียบเทียบโมเดลธุรกิจของโปรเจกต์กับผู้ให้บริการคลาวด์อย่าง AWS และ Azure
  • มีข้อเสนอให้โฮสต์โครงสร้างพื้นฐานไว้นอกแคลิฟอร์เนียเนื่องจากต้นทุนที่สูง
  • มีคำถามเกี่ยวกับการเปรียบเทียบโปรเจกต์นี้กับ Lambda Labs
  • มีคำถามเกี่ยวกับศักยภาพการใช้งานของโปรเจกต์สำหรับนักศึกษามหาวิทยาลัยและระดับบัณฑิตศึกษา
  • แนะนำให้ใช้ vast.ai สำหรับงานแมชชีนเลิร์นนิงแบบงานอดิเรก
  • มีการกล่าวถึงแนวคิดของสหกรณ์ GPU
  • มีคำถามเกี่ยวกับที่มาของชื่อโปรเจกต์และแผนการมีส่วนร่วมของชุมชน
  • มีคำถามเกี่ยวกับการระดมทุนเพื่อซื้อ H100
  • ความคิดเห็นมีข้อความแสดงข้อผิดพลาดอยู่สองรายการ