NVBeacon - แอปสำหรับดูสถานะ NVIDIA GPU ระยะไกลจากแถบเมนูบน macOS
(github.com/jaein4722)เนื่องจากผมทำงานด้านงานวิจัย AI จึงต้องรันการเทรนบนเซิร์ฟเวอร์ GPU ส่วนกลางบ่อย ๆ ทุกครั้งก็ต้องคอยเปิดเทอร์มินัลเพื่อตรวจ nvidia-smi ว่ามี GPU ว่างหรือไม่ โปรเซสเทรนยังทำงานอยู่ไหม และมีการใช้ util กับ memory ได้ถูกต้องหรือเปล่า ซึ่งเวิร์กโฟลว์แบบนี้ค่อนข้างยุ่งยากพอสมควร
ผมเลยลองทำแอปที่สามารถดูสถานะของเซิร์ฟเวอร์ NVIDIA GPU ระยะไกลได้ทันทีจากแถบเมนูบน macOS แอปจะเชื่อมต่อเซิร์ฟเวอร์ผ่าน SSH เพื่อดึงข้อมูลมาแสดง และออกแบบให้ทำงานได้โดยไม่ต้องติดตั้งเอเจนต์หรือโปรแกรมเพิ่มเติมใด ๆ ฝั่งเซิร์ฟเวอร์
คุณสามารถดูสถานะ GPU ของเซิร์ฟเวอร์ที่เชื่อมต่อไว้ได้ทันทีจากแถบเมนู พร้อมตรวจสอบข้อมูลรายโปรเซสได้ด้วย นอกจากนี้ยังดึง UID ของแต่ละโปรเซสมาได้ ซึ่งปกติดูได้ไม่ง่ายนักจาก nvidia-smi เพียงอย่างเดียว ทำให้เห็นได้ชัดขึ้นว่าใครกำลังรันงานอะไรอยู่บ้าง ผมพยายามใช้การตั้งค่า SSH เดิมให้ได้มากที่สุด และใส่ใจเรื่องการหาโปรเซสที่ผมรันเองให้เจอได้อย่างรวดเร็วด้วย
เดิมทีเป็นเครื่องมือที่ทำไว้ใช้เอง แต่พอให้คนรอบตัวช่วยทดสอบแบบง่าย ๆ ก็ได้เสียงตอบรับดีกว่าที่คิด เลยตัดสินใจเปิดเผยออกมาครับ ตอนนี้รองรับเฉพาะ macOS
ถ้ามีใครอยู่ในสภาพแวดล้อมคล้ายกันและต้องใช้งานเซิร์ฟเวอร์ GPU บ่อย ๆ ลองเอาไปใช้ดูได้เลยนะครับ ถ้ามีจุดที่ใช้งานไม่สะดวกหรือมีฟีเจอร์ที่อยากได้เพิ่มเติม ก็ยินดีมากหากส่งฟีดแบ็กมาให้ครับ!
2 ความคิดเห็น
ว้าว... น่าจะมีประโยชน์มากเลยนะ
ขอบคุณครับ!
เรากำลังปรับปรุงอย่างต่อเนื่องเพื่อให้ใช้งานได้สะดวกยิ่งขึ้น