Fly.io ตอนนี้มี GPU แล้ว
(fly.io)AI เจ๋งจริง ๆ
- Fly.io คือบริการคลาวด์สาธารณะรูปแบบใหม่ที่สามารถวางพลังประมวลผลไว้ใกล้ผู้ใช้ได้
- ตอนนี้สามารถใช้ GPU เพื่อประมวลผลงาน AI ในสภาพแวดล้อมเอดจ์คอมพิวติงได้
- Fly.io ช่วยให้สามารถรันแอปแบบฟูลสแตกหรือแพลตฟอร์มพัฒนาที่อิงกับ Fly Machines API ใกล้กับผู้ใช้ได้
กรณีใช้งานจริงของการใช้ GPU บน Fly.io
- สามารถดีพลอยโค้ดของตัวเองและโมเดลที่ต้องการบนคลาวด์แบ็กโบนของ Fly.io ได้
- เมื่อใช้ GPU ของ Fly.io ก็สามารถรันแอป GPU ที่ใช้ Ollama (เพื่อน ๆ ในสายสร้างข้อความ) ได้อย่างง่ายดายเพียงสองขั้นตอน
- สามารถดีพลอยแอปได้โดยเพิ่มการตั้งค่าใน
fly.tomlและรันคำสั่งfly apps create sandwich_ai && fly deploy
ความเร็วแสงก็มีขีดจำกัด
- การเปิดใช้งาน GPU ได้อย่างรวดเร็วนั้นดี แต่ Fly.io แสดงศักยภาพได้อย่างแท้จริงกับงาน inference ที่เอดจ์
- ตัวอย่างเช่น แอปที่ให้ผู้ใช้กรอกวัตถุดิบที่มีอยู่ในครัว แล้วรับสูตรแซนด์วิชได้ทันที
- Fly.io มี GPU อยู่ในดาต้าเซ็นเตอร์ทั่วโลก และทำให้สามารถรันโปรแกรมเดียวกันได้ในทุกภูมิภาคที่รองรับ GPU
ใช้เมื่อจำเป็นจริง ๆ เท่านั้น
- GPU เป็นอุปกรณ์ประมวลผลแบบขนานที่ทรงพลัง แต่ไม่ได้ราคาถูก
- สามารถเพิ่มส่วน
servicesในไฟล์fly.tomlเพื่อกำหนดวิธีสเกลขึ้นและสเกลลงของแอปได้ - สามารถตั้งค่าเพื่อไม่ต้องจ่ายค่า GPU ในช่วงที่ผู้ใช้ไม่ได้ขอสูตรแซนด์วิช
รายละเอียดเพิ่มเติม
- มี GPU ให้ใช้งานได้ในหลายภูมิภาคของสหรัฐฯ ยุโรป และซิดนีย์
- มีตัวเลือก GPU และราคาให้เลือกหลากหลาย และโดยค่าเริ่มต้นทุกการดีพลอยจะใช้ AMD EPYC CPU 8 คอร์
- สามารถเชื่อมต่อโวลุ่มได้สูงสุด 500GB และยังมีส่วนลดสำหรับรีเสิร์ฟด์อินสแตนซ์และโฮสต์เฉพาะด้วย
GN⁺ ความเห็น:
- Fly.io มุ่งเน้นการยกระดับประสบการณ์ผู้ใช้ด้วยการให้บริการคลาวด์ที่ล้ำสมัย ซึ่งสามารถประมวลงาน AI ในสภาพแวดล้อมเอดจ์คอมพิวติงได้
- บริการที่ใช้ GPU นี้นำเสนอโซลูชันที่คำนึงถึงทั้งความเร็วในการทำ inference และความคุ้มค่าด้านต้นทุน โดยเหมาะอย่างยิ่งกับแอปพลิเคชันที่ต้องการพลังประมวลผลสูงแบบเรียลไทม์
- บริการนี้เป็นความก้าวหน้าที่น่าสนใจและมีประโยชน์อย่างมาก เพราะช่วยให้เข้าถึงเทคโนโลยี AI ได้ง่ายขึ้น และช่วยให้นักพัฒนาสร้างแอปพลิเคชันใหม่ ๆ ที่สร้างสรรค์ได้
1 ความคิดเห็น
ความคิดเห็นจาก Hacker News
cogที่ replicate ใช้อยู่ได้หรือไม่ และสามารถรันโมเดลที่แพ็กเกจไว้ล่วงหน้าด้วย prediction API แบบเดียวกันได้หรือเปล่า ผู้ใช้นี้มองว่า replicate อาจทำให้ลังเล แต่ถ้า Fly รองรับแนวทางนี้ก็น่าจะมอบประสบการณ์ที่ลื่นไหลกว่า