10 คะแนน โดย GN⁺ 2026-02-23 | 1 ความคิดเห็น | แชร์ทาง WhatsApp
  • ผู้ช่วย AI น้ำหนักเบาพิเศษที่ทำงานบนบอร์ด ESP32 โดยจำกัดขนาดเฟิร์มแวร์ทั้งหมดไว้ไม่เกิน 888KiB
  • เขียนด้วยภาษา C และสามารถ ประกอบการทำงานด้วยภาษาธรรมชาติ สำหรับการควบคุม GPIO, การตั้งเวลาแบบ cron, หน่วยความจำถาวร และเครื่องมือที่ผู้ใช้กำหนดเอง
  • อิมเมจทั้งหมดที่รวม Wi-Fi, TLS/การเข้ารหัส, ชุดใบรับรอง ยังอยู่ภายใน 888KiB และโค้ดแอปเองมีขนาดเพียงประมาณ 25KB
  • รองรับการเชื่อมต่อกับ แชตผ่าน Telegram และเว็บรีเลย์ รวมถึงผู้ให้บริการ LLM หลักอย่าง Anthropic·OpenAI·OpenRouter
  • ทดสอบแล้วบนบอร์ด ESP32-C3/S3/C6 และเผยแพร่เป็นโอเพนซอร์ส (สัญญาอนุญาต MIT) เพื่อรองรับ การทดลอง AI แบบฝังตัวและการขยายต่อยอด

ภาพรวมโปรเจ็กต์

  • zclaw คือ ผู้ช่วย AI ส่วนตัวสำหรับ ESP32 ที่ออกแบบมาโดยมีเป้าหมายให้ขนาดเฟิร์มแวร์ทั้งหมด ไม่เกิน 888KiB
    • เฟิร์มแวร์รวมทั้งลอจิกของ zclaw, รันไทม์ ESP-IDF/FreeRTOS, และ Wi-Fi·TLS·ชุดใบรับรอง ไว้ทั้งหมด
    • ตัวโค้ดแอปเองมีขนาดประมาณ 25KB คิดเป็นเพียงราว 4% ของอิมเมจทั้งหมด
  • เขียนขึ้นบนพื้นฐานของ ภาษา C และรองรับทั้ง การประกอบเครื่องมือผ่านคำสั่งภาษาธรรมชาติ, การควบคุม GPIO และ ฟังก์ชันการตั้งเวลา
  • ใช้คำว่า “Fun to use, fun to hack on” เพื่อเน้น การทดลองของนักพัฒนาและความสามารถในการขยายต่อยอด

ฟีเจอร์หลัก

  • มีอินเทอร์เฟซแชตผ่าน Telegram หรือเว็บรีเลย์
  • รองรับ การตั้งเวลาที่รับรู้โซนเวลา: สามารถตั้งงานแบบทำซ้ำหรือครั้งเดียวได้ เช่น daily, periodic, once
  • ขยายความสามารถได้ผ่าน เครื่องมือในตัวและเครื่องมือที่ผู้ใช้กำหนดเอง
  • รองรับ การอ่าน/เขียน GPIO และมี กลไกป้องกันในตัว เช่น gpio_read_all
  • มีฟังก์ชัน หน่วยความจำที่คงอยู่หลังรีบูต
  • เลือก persona ได้: neutral, friendly, technical, witty
  • รองรับ การเชื่อมต่อผู้ให้บริการ LLM: Anthropic, OpenAI, OpenRouter

การรองรับฮาร์ดแวร์

  • รุ่นที่ทดสอบแล้ว: ESP32-C3, ESP32-S3, ESP32-C6
    • ESP32 รุ่นย่อยอื่นก็อาจใช้งานได้หากตั้งค่าด้วยตนเอง
  • บอร์ดที่แนะนำ: Seeed XIAO ESP32-C3
  • มีสคริปต์สำหรับ ลูปการพัฒนาและแฮ็กแบบโลคัล
    • เช่น build.sh, flash.sh, provision-dev.sh, monitor.sh

การติดตั้งและการตั้งค่า

  • มีคำสั่ง บูตสแตรปแบบบรรทัดเดียวสำหรับ macOS/Linux
    • bootstrap.sh จะโคลนรีโพซิทอรีแล้วเรียกใช้ install.sh
  • สามารถจัดเก็บข้อมูลรับรองแบบเข้ารหัสได้ด้วย การแฟลชโหมดปลอดภัย (--flash-mode secure)
  • ตั้งค่า ข้อมูลรับรอง Wi-Fi และ LLM ได้ด้วย provision.sh
  • ข้อจำกัดการเรียก LLM เริ่มต้น: 100 ครั้งต่อชั่วโมง, 1000 ครั้งต่อวัน (เปลี่ยนได้ตอนคอมไพล์)
  • ใช้ สคริปต์ทดสอบ (web-relay.sh) เพื่อตรวจสอบการตอบสนองของอุปกรณ์ได้

ข้อมูลสัญญาอนุญาตและรีโพซิทอรี

  • สัญญาอนุญาต MIT
  • เว็บไซต์เอกสารทางการ: zclaw.dev

1 ความคิดเห็น

 
GN⁺ 2026-02-23
ความคิดเห็นจาก Hacker News
  • หรือว่าฉันอาจจะเข้าใจผิดเอง แต่สงสัยว่านี่เป็น LLM ขนาดเล็กที่ฝังมาในตัว หรือเป็นแค่ wrapper ที่ต้องพึ่งการเชื่อมต่ออินเทอร์เน็ต

    • เป็น wrapper โดยพื้นฐานแล้วใช้ OpenAI API ดูได้จากลิงก์โค้ด
    • โปรเจ็กต์แนว claw ส่วนใหญ่ก็มีโครงสร้างแบบ wrapper กันทั้งนั้น
  • สิ่งที่ทำให้การรัน claw บน ESP32 น่าสนใจไม่ใช่เรื่อง ประสิทธิภาพการคำนวณ แต่เป็นเพราะมันเปิดทิ้งไว้ได้ตลอดและแทบไม่ต้องดูแลรักษา
    ฉันรัน automation pipeline บน Linux server และปัญหาใหญ่ที่สุดไม่ใช่ตรรกะ AI แต่เป็นเรื่อง การดูแลโฮสต์ ต่างหาก ทั้งอัปเดต, OOM, รีบูต ฯลฯ
    ถ้า ESP32 ทำหน้าที่เป็นพร็อกซีให้ cloud API และจัดการ orchestration ของเครื่องมือในฝั่ง local มันกลับกลายเป็นเป้าหมายการ deploy ที่เสถียรกว่าสำหรับ agent loop แบบง่าย ๆ

    • อยากรู้ว่ามันติดตั้ง OS อะไรไว้ และอัปเดตกันอย่างไร
    • เห็นด้วยมาก ไมโครคอนโทรลเลอร์ เป็นเหมือนโฮสต์ที่กู้คืนตัวเองได้โดยปริยาย — ไม่มี package manager, ไม่มี kernel upgrade, ไม่มีการตั้งค่า cgroup พอรีเซ็ตแล้วก็กลับสู่สถานะเดิมทุกครั้ง ต่างจาก Linux ที่การดีบักหลัง “อัปเกรด apt ตามรอบแล้วพัง” เป็นเรื่องปกติ
    • แต่บน Linux ก็ทำให้เรียบง่ายได้ไม่ใช่หรือ? ฉันดูแล Apache server หลายเครื่อง และมันก็ทำงานได้ดีแทบไม่ต้องแตะเลยจนกว่าจะถึง EOL
    • แต่แบบนี้กลับมี จุดที่อาจล้มเหลว มากขึ้น ทั้ง cloud server, อินเทอร์เน็ต, การเชื่อมต่อไร้สาย แค่ขาดอย่างใดอย่างหนึ่งก็มีปัญหา ไม่ใช่ว่าเป็นแนวทางที่แย่ แต่ก็ไม่ได้ช่วยลดปัญหา
  • มีใครอธิบายเรื่อง ADC (ตัวแปลงอนาล็อกเป็นดิจิทัล) ของ ESP SoC จากมุมมองวิศวกรได้ไหม?
    คนที่เคยใช้บอกว่ามันจุกจิก แต่ก็เคยได้ยินว่าถ้าจัดการดี ๆ ก็ใช้งานได้ระดับเดียวกับชิป STM
    ESP32 เคยเป็นหนึ่งในชิปหลักไม่กี่ตัวที่ใช้ ISA ของตัวเอง ก่อนจะเปลี่ยนไปใช้ RISC-V

    • สเปกของ ADC ใน ESP32 ถูกกำหนดไว้แบบ หลวมมาก ถ้า “เคล็ดลับ” ที่ว่ารวมถึงการคาลิเบรตละเอียดหรือการวัดลักษณะเฉพาะซึ่งทำได้ยากในสายการผลิต นั่นก็คงเป็นคำตอบ
    • ISA เดิมของ ESP32 มาจาก IP ที่ซื้อกิจการมาจาก Tensilica
    • ADC ของ ESP32 ไม่ได้มีไว้สำหรับงานเสียงความเที่ยงตรงสูง แต่มีไว้สำหรับ การควบคุมอินพุตแบบง่าย ๆ เช่น ต่อโพเทนชิโอมิเตอร์เพื่อรับอินพุตทางกายภาพ ถ้าอยากได้ค่าที่นิ่งต้องเฉลี่ยหลายตัวอย่าง แต่สำหรับการเฝ้าดูแรงดันที่เปลี่ยนช้า ๆ ก็ถือว่าใช้ได้ดีพอ
  • มี claw แบบ ใช้งานร่วมกันหลายคน ไหม? เช่น เวอร์ชัน self-hosted ที่ทั้งครอบครัวใช้ร่วมกันได้
    เห็นว่ามีฟีเจอร์โปรไฟล์ใน OpenClaw แต่อยากรู้ว่ารองรับทั้งแชตส่วนตัวและแชตร่วมในเวลาเดียวกันหรือเปล่า

    • ฉันก็เคยทำอะไรคล้าย ๆ กันเอง เป็น บอต self-hosted บน Signal ที่รองรับ group chat
      ช่วงหลังเพิ่มฟีเจอร์ automation เรื่องของชำ เข้าไป — มันจะสร้างรายการร่างจากประวัติการสั่งซื้อก่อน พอสมาชิกในบ้านช่วยแก้ไข เอเจนต์ก็จะใช้เครื่องมือเบราว์เซอร์สร้างรถเข็นให้ ตอนนี้ยังจ่ายเงินเองด้วยมืออยู่ แต่ก็ใกล้เสร็จแล้ว โปรเจ็กต์แบบนี้น่าจะออกเป็นโอเพนซอร์สในไม่ช้า
  • ฉันมี ESP32 กับจอ OLED เล็ก ๆ อยู่หลายตัว กำลังคิดว่าจะเอามาทำเป็น ทามาก็อตจิอัจฉริยะ ดีไหม มีไอเดียอื่นอีกไหม?

    • ฉันก็เคยทำอะไรคล้ายกัน แต่สุดท้ายมันก็ลงเอยที่การเขียน state machine อยู่ดี LLM ตัดสินใจเองไม่ค่อยได้ว่า “ควรกินข้าวเมื่อไร” อะไรทำนองนั้น สุดท้ายก็ต้องคอยเพิ่มตัวแปรกับกฎไปเรื่อย ๆ จนหลงทิศหลงทาง
    • ฟังดูเจ๋งนะ เป็นรุ่น จอจิ๋ว 0.46 นิ้ว ใช่ไหม? เอาไปทำอะไรสนุก ๆ ได้หลายอย่างเลย
  • คิดไปคิดมา OpenClaw ก็เหมือน ROS (Robot Operating System) ของโลก AI agent
    มันเป็นโครงสร้างที่กำหนดวิธีปฏิสัมพันธ์ระหว่าง distributed node และเอาหลาย functional node มาประกอบเป็นระบบใหญ่ขึ้น

    • แต่มี สเปกหรือโปรโตคอล แบบนั้นอยู่จริงหรือ? จากที่ฉันเห็นมันใกล้เคียงกับแพลตฟอร์มที่เอาการเชื่อมต่อหลายแบบมายำรวมกันมากกว่า ลองใช้มาราวสัปดาห์หนึ่งแล้วรู้สึกแบบนั้น
  • ฉันเป็นคนง่าย ๆ แค่เห็น ESP32 ก็พร้อมกดโหวตขึ้นทันที

  • มีใครแนะนำ agent สไตล์ claw แบบเบา ๆ สำหรับ Linux ไหม? ไม่ต้องมีคอนเทนเนอร์หรือแซนด์บ็อกซ์

    • ฉันใช้ picoclaw อยู่
    • ถ้าต้องการแค่ WhatsApp กับเว็บแชต ฉันใช้เว็บฟรอนต์เอนด์ของตัวเองครอบบน piclaw ทำเป็นเว็บแอปที่เข้าได้ผ่าน Tailscale
    • zeroclaw ก็น่าลองเหมือนกัน
  • เป็นแพตเทิร์นที่ไม่ได้เห็นมานานแล้ว

    bash <(curl foo.sh)
    

    ปกติมักจะใช้

    curl foo.sh | bash
    

    ซึ่งทั้งคู่ก็ เสี่ยงด้านความปลอดภัย เหมือนกัน ฉันแนะนำวิธีด้านล่างมากกว่า

    curl foo.sh | tee /tmp/foo.sh | bash
    bash -c "$(curl foo.sh)"
    curl foo.sh -o /tmp/foo.sh && bash $_
    

    ฉันชอบวิธีสุดท้ายที่สุด

    • เคยได้ยินว่าการบันทึกลงไฟล์ชั่วคราวก่อนแล้วค่อยรัน ดีกว่า pipe curl เข้า bash ตรง ๆ แต่สุดท้ายแล้ว ปัญหาเรื่องความเชื่อใจ ก็ยังเหมือนเดิม ถ้าไม่ได้อ่านโค้ดเองก็ไม่มีทางปลอดภัยอย่างสมบูรณ์
    • ถ้าอยากให้ปลอดภัยขึ้นอีกหน่อย ก็ควรเพิ่ม การตรวจสอบแฮช เช่น
      t=$(mktemp) && [ -w $t ] && curl foo.sh -o $t && echo "$t ..." | sha256sum -c - && bash $t
      
    • ถ้าจะเอาให้เป๊ะจริง ๆ จะเขียนให้ ไม่ผูกกับเชลล์ใดเชลล์หนึ่ง ก็ได้เช่นกัน
  • โปรเจ็กต์แนว claw พวกนี้จริง ๆ แล้ว โครงสร้างไม่ได้มีอะไรซับซ้อนมาก แค่ให้ LLM มีสิทธิ์เรียก API ได้ก็ทำได้แล้ว

    • สิ่งที่ทำให้ฉันแปลกใจคือในกระแส OpenClaw มีคนจำนวนมากที่ ไม่เข้าใจแม้แต่แนวคิดพื้นฐานของคอมพิวเตอร์ ราวกับไม่เคยมองพ้นโฟลเดอร์ node_modules
    • ช่วงนี้ฉันก็กำลังพัฒนา claw เองอยู่ และคำว่า “ไม่ได้มีอะไรซับซ้อนมาก” มันก็เหมือน เห็นแค่ไม้อัดติดล้อสี่ล้อแล้วบอกว่ารถยนต์ก็ไม่ได้มีอะไร ถ้าจะทำผู้ช่วยส่วนตัวที่ดีจริง ๆ มันซับซ้อนกว่านั้นมาก
    • ถ้าทุกคนเริ่มรัน personal agent กันตลอด 24/7 จริง อาจต้องใช้ ทรัพยากรคอมพิวต์ มากกว่าที่คาดไว้เยอะก็ได้ แน่นอนว่าสุดท้ายจะเกิดขึ้นจริงไหมก็อีกเรื่อง
    • การเขียนโปรแกรมก็คล้ายกัน แค่พูดว่า “ก็มันก็แค่พิมพ์บนคีย์บอร์ดไม่ใช่เหรอ”
    • สุดท้ายแล้ว เดี๋ยวพวกเราก็คงได้รู้เองว่า ถ้าให้คุกกี้กับหนูแล้วจะเกิดอะไรขึ้น