- Raspberry Pi AI HAT+ 2 มาพร้อม Hailo 10H NPU และ RAM LPDDR4X 8GB ทำให้สามารถทำ การอนุมาน LLM แบบโลคัล ได้อย่างอิสระ
- ให้ประสิทธิภาพ 40 TOPS(INT8) โดยใช้พลังงานสูงสุด 3W แต่ในการทดสอบจริงกลับพบว่า ช้ากว่า CPU ของ Pi 5
- ข้อจำกัดด้านพลังงาน (3W) และ ความจุ RAM (8GB) กลายเป็นคอขวด ทำให้สำหรับการรันโมเดลขนาดกลาง Pi 5 รุ่น 16GB มีประสิทธิภาพมากกว่า
- ในงาน ประมวลผลภาพ (Computer Vision) ทำความเร็วได้ เร็วกว่า AI HAT รุ่นเดิม 10 เท่า แต่มี ปัญหาความเข้ากันได้ของซอฟต์แวร์ และ ข้อผิดพลาดเมื่อรันหลายโมเดลพร้อมกัน
- หากไม่ใช่กรณีที่ต้องการ ทำงานวิชัน + การอนุมานพร้อมกัน ในสภาพแวดล้อมพลังงานต่ำ คุณค่าของมันจะเด่นกว่าในฐานะ บอร์ดสำหรับพัฒนาและแพลตฟอร์มทดลอง
สเปกและจุดเด่นหลักของ AI HAT+ 2
- รุ่นใหม่นี้มี ราคา 130 ดอลลาร์ และมาพร้อม Hailo 10H NPU กับ RAM LPDDR4X 8GB
- Hailo 10H ให้ ประสิทธิภาพการอนุมาน INT8 ที่ 40 TOPS และ ประสิทธิภาพด้านวิชันแบบ INT4 ที่ 26 TOPS
- สามารถ รัน LLM ได้อย่างอิสระ โดยไม่กิน CPU หรือหน่วยความจำระบบของ Pi
- ปัญหา ไม่สามารถอัปเกรด RAM ได้ ยังคงมีอยู่ แต่เมื่อนำไปใช้เป็น AI coprocessor ก็ช่วยลดภาระด้านหน่วยความจำได้
- ถูกมองว่า ถูกกว่าและกะทัดรัดกว่าการต่อ eGPU และใช้งานได้จริงกว่า NPU ที่ฝังมาใน ‘AI PC’ ของ Microsoft
การประเมินประสิทธิภาพจริง
- การทดสอบเปรียบเทียบรันโมเดลเดียวกันบน Raspberry Pi 5 รุ่น RAM 8GB โดยใช้ CPU และ NPU แยกกัน
- ในโมเดลส่วนใหญ่ CPU ของ Pi 5 ทำงานได้เร็วกว่า Hailo 10H
- มีเพียงโมเดล Qwen2.5 Coder 1.5B เท่านั้นที่ให้ผลใกล้เคียงกัน
- แม้ Hailo 10H จะมี ประสิทธิภาพต่อพลังงาน สูง แต่ก็ถูกจำกัดด้วย เพดานพลังงาน 3W
- ขณะที่ SoC ของ Pi 5 ใช้พลังงานได้สูงสุด 10W
ข้อจำกัดในการรัน LLM และกรณีของ Qwen 30B
- RAM 8GB เป็นข้อจำกัดใหญ่ที่สุดสำหรับการรัน LLM
- โมเดลขนาดกลางต้องการ RAM 10~12GB และเหมาะกับ Pi 5 รุ่น 16GB มากกว่า
- ByteShape สามารถบีบอัดโมเดล Qwen3 30B A3B Instruct ให้เหลือ 10GB เพื่อรันบน Pi 5 รุ่น 16GB ได้สำเร็จ
- แม้คุณภาพจะลดลง แต่ยัง ทำงานพื้นฐานอย่างการสร้างแอปง่าย ๆ ได้
- เมื่อใช้ llama.cpp รันโมเดลบน Pi 5 พบว่าแม้จะช้า แต่ก็ยัง ใช้งานทำงานจริงบางอย่างได้ด้วยโมเดลโลคัล
ประสิทธิภาพงานวิชันและปัญหาซอฟต์แวร์
- ในงาน Computer Vision ทำความเร็วได้ เร็วกว่าการใช้ CPU ของ Pi 10 เท่า
- จากการทดสอบด้วย Camera Module 3 สามารถตรวจจับคีย์บอร์ด มอนิเตอร์ โทรศัพท์มือถือ เมาส์ และวัตถุอื่น ๆ ได้อย่างแม่นยำ
- อย่างไรก็ตาม โค้ดตัวอย่างของ Hailo (hailo-rpi5-examples) ยัง รองรับ AI HAT+ 2 ได้ไม่สมบูรณ์
- เมื่อตั้งค่าด้วยตนเองอาจเกิด การโหลดโมเดลล้มเหลว หรือ ข้อผิดพลาดอื่น ๆ
- เมื่อ รันหลายโมเดลพร้อมกัน (วิชัน + LLM) พบ segmentation fault และปัญหา ‘device not ready’
- เนื่องจาก ไม่มีตัวอย่างการทำงานจาก Hailo จึงไม่สามารถทดสอบได้ครบถ้วน
บทสรุปและความเป็นไปได้ในการใช้งาน
- แม้ RAM 8GB จะมีประโยชน์ แต่ Pi 5 รุ่น 16GB ยังเป็นตัวเลือกที่เร็วและยืดหยุ่นกว่า
- ใช้งานได้จริงเฉพาะในกรณีที่ ต้องทำประมวลผลภาพและการอนุมานพร้อมกันในสภาพแวดล้อมพลังงานต่ำ
- ชุดอย่าง AI Camera (70 ดอลลาร์) หรือการจับคู่กับ AI HAT+ รุ่นเดิม (110 ดอลลาร์) อาจคุ้มค่ากว่า
- มีโอกาสนำไปใช้เป็นชุดพัฒนาสำหรับ รัน LLM ขนาดเล็ก (ต่ำกว่า 10W) หรือ อุปกรณ์ที่ใช้ Hailo 10H
- โดยรวมถูกมองว่า ฮาร์ดแวร์ล้ำหน้า แต่ซอฟต์แวร์ยังไม่สมบูรณ์ และเป็น ผลิตภัณฑ์ที่เหมาะกับงานเฉพาะทาง
1 ความคิดเห็น
ความคิดเห็นจาก Hacker News
ภายในเวลาไม่กี่นาที ก็ได้เห็นทั้งความเห็นว่า 8GB AI HAT สำหรับ RPi นั้นยอดเยี่ยมมาก และความเห็นที่ว่า M2 MAX 96GB MacBook ของฉันแทบไม่มีประโยชน์สำหรับ LLM
อย่างน้อยก็ยังปลอบใจได้ว่ากรณีหลังก็ยังเป็นโน้ตบุ๊กที่ยอดเยี่ยมอยู่ดี
ดูเหมือนว่า Raspberry จะสูญเสีย “ความมหัศจรรย์” และความมุ่งหมาย แบบในยุค Pi แรก ๆ ไปแล้ว
ช่วงเริ่มต้นมันสร้างตลาดใหม่ขึ้นมาได้ แต่ตอนนี้ให้ความรู้สึกเหมือนกำลังกระโดดเข้าไปในพื้นที่ที่อิ่มตัวแล้ว
แน่นอนว่าเข้าใจได้ว่าต้องขยายตัวเพื่อความอยู่รอด แต่ก็ดูเหมือนจะสร้าง “ช่วงเวลาแบบ Raspberry Pi” ขึ้นมาใหม่ไม่ได้อีกแล้ว
แม้จะอาจมีความต้องการแบบเดียวกับที่โซลูชันอย่าง Frigate เคยช่วยดันยอดขาย Coral TPU แต่ครั้งนี้ก็ดูเหมือนจะขาด คุณค่าเฉพาะตัวที่ชัดเจน
ตอนนี้ RPi ดูเหมือนกำลังเล็ง ตลาดเชิงพาณิชย์ เพราะมีราคาถูกกว่าบอร์ดฝังตัวสำหรับอุตสาหกรรม
ให้ความรู้สึกว่ากลุ่มเป้าหมายหลักกลายเป็นลูกค้าองค์กร มากกว่าผู้บริโภคทั่วไป
SBC เจ้าอื่นมักมีคุณภาพซอฟต์แวร์ย่ำแย่ แต่การจับคู่กับ Raspbian นั้นเป็นนวัตกรรมที่แท้จริง
RPi ยังคงเติมเต็มช่องว่างนี้อยู่
Pico สำหรับงานขนาดเล็ก, Pi รุ่นใหม่สำหรับงานขนาดใหญ่กว่า, และ Pi รุ่นเก่ากับ Zero ก็ยังขายอยู่
สินค้าที่เกี่ยวกับ AI ก็เป็นเพียงส่วนต่อเนื่องของแนวโน้มนี้ เป็นการขยายอย่างเป็นธรรมชาติสำหรับคนที่ทำ AI บน Pi5 อยู่แล้ว
แก่นของ Pi คือ GPIO + การประมวลผลทั่วไป และตอนนี้ AI ก็กลายเป็นส่วนหนึ่งของสิ่งนั้นแล้ว
สิ่งที่ทำได้ด้วย AI แบบรันในเครื่องเพิ่มขึ้นจนน่าทึ่ง และเปิดทางสู่การใช้งานใหม่ ๆ อย่าง การขับเคลื่อนอัตโนมัติของโดรนและหุ่นยนต์
ในความเป็นจริงมันไม่ได้ยิ่งใหญ่อะไรมาก
การรัน AI ด้วย RAM 8GB บน Pi ค่อนข้างน่าผิดหวัง
ในสหราชอาณาจักร ไม่เคยเห็น Hailo HAT ถูกโฆษณาว่าใช้กับ LLM มาก่อน
ส่วนใหญ่ถูกใช้สำหรับ การตรวจจับวัตถุในวิดีโอแบบเรียลไทม์ และฉันเองก็อยากลองใช้มันตรวจจับสัตว์หรือผู้มาเยือนในบ้านกับสวน
แม้เวอร์ชันล่าสุดของ Pimonori จะพูดถึงการรองรับ LLM และ VLM แต่การใช้งานแนวนั้นก็ดูสมจริงกว่ามาก
ถึงขั้นมีมุกว่า “8GB? สำหรับ LLM ของมดหรือไง?”
มันไม่เหมาะกับงานหนัก แต่ถ้าเป็นแค่การสร้างข้อความง่าย ๆ ก็ยังพอทำได้
เป็นของสำหรับทดลองกับ LLM ขนาดจิ๋วที่เฉพาะทางมาก
แต่ปัญหาคือ เมื่อเทียบกับราคาที่แพงแล้ว การปรับปรุงด้านการประมวลผลภาพมีไม่มาก และการรองรับซอฟต์แวร์ก็ยังขาดอยู่
ถ้าเป็นเมื่อไม่กี่ปีก่อน ผลิตภัณฑ์แบบนี้คงถูกเรียกว่าแค่ ตัวเร่ง ML
แต่ทุกวันนี้พอแปะชื่อว่า ‘AI’ ความคาดหวังก็เปลี่ยนไป ทำให้เสียงประเมินแตกออกเป็นหลายทาง
ไม่แน่ใจว่า LLM ขนาดเล็กมีประโยชน์ นอกเหนือจากงาน embedding หรือการฝึกสอน หรือไม่
ถ้าจะใช้เพื่อการฝึก ก็มีฮาร์ดแวร์ที่ดีกว่าและถูกกว่า ส่วนถ้าใช้ทำ embedding มันก็ทั้งช้าและแพง
โมเดลเล็ก ๆ เองก็สามารถ fine-tune ด้วยข้อมูลเฉพาะทาง จนให้ประสิทธิภาพเข้าใกล้โมเดลทั่วไปขนาดใหญ่กว่ามากได้
เป็นไอเดียที่น่าสนใจ แต่ถ้าเพื่อการใช้งานแบบนี้ Jetson Orin Nano น่าจะเป็นตัวเลือกที่ดีกว่า
เพียงแต่มีข้อเสียตรงที่ RAM ถูกใช้ร่วมกัน ทำให้เสียไปประมาณ 1GB เป็น overhead ของระบบปฏิบัติการ
การบอกว่า “รัน LLM ได้” ไม่ได้แปลว่า “การรัน LLM นั้นสมเหตุสมผล”
นี่เป็นตัวอย่างที่ชี้ให้เห็นว่า ตัวเลขสเปกกับประสบการณ์ใช้งานจริง นั้นคนละเรื่องกันโดยสิ้นเชิง
ถ้ามองจากมุม edge computing ความพยายามครั้งนี้ถือเป็นก้าวกระโดดที่มีความหมายของ ecosystem RPi
เมื่อมีตัวเร่งการอนุมานแบบใช้พลังงานต่ำในตัว ก็สามารถทำ AI แบบรันในเครื่องโดยไม่พึ่งคลาวด์ ได้
แม้จะยังอยู่ในระยะเริ่มต้น แต่ก็นับว่าเป็นทิศทางที่ถูกต้องสำหรับเวิร์กโหลด edge ของจริง