14 คะแนน โดย GN⁺ 2026-02-22 | 2 ความคิดเห็น | แชร์ทาง WhatsApp
  • หลังจากมีการเพิ่มเอเจนต์ไว้เหนือ LLM ก็ได้เกิด เลเยอร์ Claws ที่รับหน้าที่ด้าน การออร์เคสเทรต การจัดตาราง การจัดการคอนเท็กซ์ การเรียกใช้เครื่องมือ และการคงอยู่ของสถานะ
  • เป็นการยกระดับนามธรรมของโครงสร้างการทำงานของเอเจนต์ขึ้นอีกขั้น เพื่อให้ได้ ระบบอัตโนมัติและความสามารถในการประกอบปรับแต่งในระดับที่สูงขึ้น
  • OpenClaw มีขนาดประมาณ 400,000 บรรทัดของโค้ด และมีความกังวลเกี่ยวกับโครงสร้างที่ต้องมอบหมายข้อมูลส่วนตัวและคีย์ให้ระบบ
  • มีความเสี่ยงด้านความปลอดภัยหลายประการปรากฏขึ้น เช่น รายงานอินสแตนซ์ที่ถูกเปิดเผย, ช่องโหว่ RCE, การปนเปื้อนซัพพลายเชน, และกรณี skills ในรีจิสทรีที่เป็นอันตรายหรือเสียหาย
  • ปัจจุบันระบบนิเวศนี้ยังใกล้เคียงกับ ‘ไวลด์เวสต์’ และแทบจะเป็นฝันร้ายด้านความปลอดภัย
  • NanoClaw มี คอร์เอนจินราว 4,000 บรรทัด จึงเป็นโครงสร้างที่ค่อนข้างเล็ก
    • ขนาดโค้ดเล็กพอที่จะทำความเข้าใจได้ทั้งระบบ จึงได้เปรียบในด้านการดูแล การตรวจสอบ และความยืดหยุ่น
  • โดยพื้นฐานแล้วจะรันทุกการทำงานใน สภาพแวดล้อมคอนเทนเนอร์
  • ใช้ แนวทางการกำหนดค่าผ่าน skills แทนไฟล์ตั้งค่า
    • คำสั่ง /add-telegram จะสั่งเอเจนต์ถึงวิธีแก้ไขโค้ดจริง
    • เป็นแนวทางใหม่ที่ขับเคลื่อนด้วย AI เพื่อลดไฟล์คอนฟิกที่ซับซ้อนและโครงสร้างเงื่อนไขแตกแขนง
  • แนวคิดเมตาที่ทำให้รีโพซิทอรีถูกฟอร์กได้ง่ายที่สุด และให้ skills แปลงมันไปเป็นการตั้งค่าหลากหลายแบบนั้นยอดเยี่ยมมาก
  • มีโปรเจกต์แตกแขนงหลายตัวเกิดขึ้น เช่น nanobot, zeroclaw, ironclaw, picoclaw
  • มีทางเลือกแบบคลาวด์โฮสติ้งด้วยเช่นกัน แต่สภาพแวดล้อมโลคัลเหมาะกับการทดลองและการขยายต่อมากกว่า
    • รวมถึงเชื่อมต่อกับอุปกรณ์โฮมออโตเมชันบนเครือข่ายภายในได้ง่ายด้วย
  • มีเสน่ห์เชิงแนวคิดในฐานะดิจิทัลเอเจนต์ส่วนบุคคลที่ทำงานอยู่บนอุปกรณ์จริง
  • Claws กำลังกลายเป็น เลเยอร์ใหม่ของ AI สแตก และกำหนดโครงสร้างของขั้นถัดไปหลังยุคเอเจนต์
  • แม้การตั้งค่าปลายทางที่เฉพาะเจาะจงของฉันยังไม่ลงตัว แต่ก็มีความคาดหวังสูงต่อมันในฐานะโครงสร้างที่ทดลองได้และขยายต่อได้

2 ความคิดเห็น

 
xguru 2026-02-22

NanoClaw – Claude Assistant ที่พัฒนาด้วย TypeScript เพียง 500 บรรทัดซึ่งรันอยู่ในสภาพแวดล้อมแยกคอนเทนเนอร์ของ Apple

ตอนเปิดตัวมี 500 บรรทัด แต่ตอนนี้น่าจะกลายเป็น 4000 บรรทัดแล้ว ??

 
GN⁺ 2026-02-22
ความคิดเห็นจาก Hacker News
  • มีการพบ การโจมตีส่วนบุคคล ในหลายคอมเมนต์จึงลบออก
    ใน HN ถึงจะเห็นต่างกันก็ห้ามโจมตีตัวบุคคลโดยเด็ดขาด เพราะทำลายจุดประสงค์ของเว็บ
    ถ้าไม่นานมานี้ยังไม่ได้อ่าน แนวทางปฏิบัติ แนะนำให้กลับไปอ่านอีกครั้ง

    • ไม่มีการโจมตีส่วนบุคคล มีแค่ความไม่พอใจที่เอาฟังก์ชันเดิมมา รีแบรนด์ ซ้ำไปมาเท่านั้น พอไม่มีนวัตกรรมจริงคนก็เลยหงุดหงิด ถ้าเรื่องแบบนี้เกิดขึ้นในยุคแรกของ REST API ตอนนั้นก็คงโกรธเหมือนกัน
  • ถ้ามองด้านความปลอดภัย การมี Claw ก็คล้ายกับการมีผู้ช่วยส่วนตัวหรือที่ปรึกษาเป็นมนุษย์
    เหมือนกับที่เราไม่ให้สิทธิ์เข้าถึงอีเมลส่วนตัวหรือบัญชีธนาคาร แต่จะตั้งค่าให้ใช้อีเมลแยกต่างหากและ บัตรบริษัท ที่จำกัดสิทธิ์แทน

    • แต่สำหรับนักการเมืองหรือผู้บริหาร การให้ผู้ช่วยจัดการอีเมลหรือ SNS ก็ค่อนข้างพบได้บ่อย
      ถึงจะไม่ให้บัญชีธนาคาร แต่บางครั้งก็ให้สิทธิ์เข้าถึงกับ นักบัญชีหรือที่ปรึกษาการเงิน
  • ตอนที่ผมสร้าง เครื่องมือเอเจนต์ แบบ CLI ผมใส่กลไกความปลอดภัยไว้แบบหนึ่ง
    ถ้าจะทำพฤติกรรมที่เสี่ยง เช่น ส่งอีเมลจำนวนมาก จะต้องใช้ รหัสผ่านใช้ครั้งเดียว (OTP)
    เครื่องมือจะสั่งให้เอเจนต์ขอ OTP จากผู้ใช้ และถ้าไม่มีการกรอกก็ไปต่อไม่ได้
    ผมยังไม่ได้ลองใช้ Claw แต่คิดว่าโครงสร้างที่ให้มนุษย์เข้ามาแทรกแบบนี้เป็นสิ่งจำเป็น
    เพราะแบบนี้ผมเลยสร้าง CLI สำหรับเอเจนต์ทั้งหมดเองเพื่อให้ควบคุมได้มากขึ้น

    • ทุกวันนี้การคอมพิวต์เหมือน Sim City มากขึ้นเรื่อย ๆ คือวางแผนคร่าว ๆ แล้วหวังให้ระบบจัดการที่เหลือเองอย่างดี ความงามของกฎที่คาดเดาได้เหมือนจะหายไปแล้ว
    • อีกแนวทางหนึ่งคือเลียนแบบขั้นตอนอนุมัติแบบองค์กร งานสำคัญจะมี ผู้อนุมัติ (approver) แยกต่างหาก และเอเจนต์จะส่งข้อความไปขออนุมัติจากคนนั้น เป็นการเชื่อถือช่องทางอนุมัติแทน OTP
    • แต่ก็มีคำถามว่าจะ บังคับใช้ เกณฑ์อย่าง “ห้ามส่งอีเมลถึงคนมากเกินไป” อย่างไร
    • ผมรัน Claw ของตัวเองบน fly.io งานที่ต้องมีมนุษย์เข้ามาเกี่ยวข้อง เช่น อีเมลหรือข้อความ Slack จะถูกแยกเป็น ‘activity’ สร้างลิงก์ขึ้นมา และจะรันได้ก็ต่อเมื่อผมกดอนุมัติ
    • ผมทำเวอร์ชันที่มี LLM ภายในและ ชั้น orchestration ด้านสิทธิ์ ภายนอก ผมมองว่าไม่จำเป็นต้องมี OTP ชั้นภายนอกจะส่งการแจ้งเตือนมาทาง Signal แล้วผมค่อยตัดสินใจอนุมัติเป็นครั้ง ๆ ไป
  • ถ้า Claw มีมาตั้งแต่ก่อนหน้านี้ อินเทอร์เน็ตอาจจะแตกต่างออกไป
    โครงสร้างแบบเมนูที่อิง โปรโตคอล Gopher แบบเรียบง่ายอาจเหมาะกับ LLM มากกว่า
    ต่อไปถ้าปฏิสัมพันธ์ที่มีเอเจนต์ฝั่งผู้ใช้เป็นศูนย์กลางเพิ่มขึ้น ก็อาจวิวัฒน์ไปในทิศทางนี้ได้

    • อนาคตแบบนี้ต้องสร้างขึ้นมาด้วยตัวเอง โลกที่ทุกบริการมีอยู่ในรูป API เท่านั้น และเอเจนต์ของผมเป็นคนประกอบมันเข้าด้วยกัน
      ถ้า YouTube, Gmail, HN, ธนาคาร, บริษัทไฟฟ้าทุกอย่างเป็น API ผู้ใช้ก็จะจัดอินเทอร์เฟซได้ตามที่ตัวเองต้องการ
      บริษัทต่าง ๆ คงคัดค้านเพราะการผูกขาดจะพังลง แต่เทคโนโลยีจะทำกำไรน้อยลงและมีคุณค่ามากขึ้น
    • ราวปี 1992 ก่อนยุคแท็ก IMG ผมเคยทดลองสร้างคู่ DNS อย่าง foo-www, foo-http
      ตอนที่ข้อเสนอ CGI ออกมา ผมคิดว่า “ไม่มีใครใช้ของนี้หรอก” แต่สุดท้ายทุกคนก็รองรับสเปกนั้นกันหมด เสียดายที่พลาด ความยืดหยุ่นในยุคแรกเริ่ม ไป
    • MCP ก็กำลังไปทางนั้นอยู่แล้ว เป็นโครงสร้างที่ LLM เข้าถึงบริการผ่านข้อความ
      ผมคุยกับอินสแตนซ์ OpenClaw บน Mac ของผมผ่าน Telegram อยู่แล้ว เท่ากับว่าตอนนี้ผมใช้อินเทอร์เฟซแบบใหม่แทน UI ของแอปอยู่
      การสร้าง อินเทอร์เฟซที่มีเอเจนต์เป็นศูนย์กลาง แทนหน้าต่างที่มนุษย์มอง แล้วเหลือแค่อินเทอร์เฟซสำหรับตรวจสอบ น่าจะสมเหตุสมผลกว่า
    • ในทางเทคนิคทุกเว็บไซต์สามารถมี API ได้ แต่เพราะ ปัญหาเรื่องแรงจูงใจ ส่วนใหญ่จึงไม่ต้องการ อย่างกรณี Google Search API
    • ดูแล้ว Claw คงเกิดขึ้นตั้งแต่ก่อนหน้านี้ไม่ได้ เพราะข้อมูลฝึก LLM เกิดจากการแพร่หลายของ WWW และถ้าไม่มีโครงสร้างพื้นฐานนั้น การฝึกขนาดใหญ่ก็คงเป็นไปไม่ได้เลย
  • แก่นแท้จริง ๆ ของ Claw คือมันเป็น เอเจนต์ที่ยึดผู้ใช้เป็นศูนย์กลาง
    AI ที่คนไม่ชอบคือ AI ที่บริษัทเป็นผู้ควบคุม ส่วน Claw เป็นสิ่งที่ผู้ใช้เป็นเจ้าของและถึงขั้นตั้งชื่อให้มันได้
    มันเหมือนความต่างระหว่างเพื่อนร่วมทางอย่าง R2D2 กับหุ่นโคลนที่พยายามขายของให้ผม

    • เห็นด้วย ผู้เล่นรายใหญ่เดิมอย่างผู้ขาย OS น่าจะพยายามรวม โมเดลที่ยึดผู้ใช้เป็นศูนย์กลาง แบบนี้เข้าไปในผลิตภัณฑ์ของตัวเอง ก็ต่อเมื่อมันผ่านช่วงวุ่นวายระดับหนึ่งไปแล้ว
    • แต่ก็ขึ้นอยู่กับว่าใครคือ “ผู้ใช้” คนที่เริ่มเอเจนต์ขึ้นมาหรือคนที่ต้องปฏิสัมพันธ์กับมัน เพราะแบบหลังอาจกลายเป็นผู้เสียหายได้
  • ผมสงสัยว่า “Claw” คืออะไรกันแน่
    มันคือ AI ที่เข้าถึงข้อมูลส่วนตัวอย่างอีเมลหรือเปล่า?
    ถ้ารันด้วย local LLM ในคอนเทนเนอร์จะปลอดภัยไหม?

    • สำหรับผมมันคือรูปแบบใหม่ของ ผู้ช่วยดิจิทัลส่วนตัว
      • ใช้งานโดยบุคคลโดยตรง
      • เข้าถึงเทอร์มินัลที่รันโค้ดได้
      • ผสานกับแอปแชต
      • มีความสามารถในการรันตามตารางเวลา
      • เข้าถึง ข้อมูลอ่อนไหว อย่างอีเมล ปฏิทิน และไฟล์
        สามารถรันได้ทั้งบนฮาร์ดแวร์ฝั่งผู้บริโภคหรือ VPS ตลาดใหม่กำลังเปิดขึ้น
    • สำหรับผมมันเหมือน cron-for-agents ที่ทำงานเป็นรอบ ๆ คอยเช็ก inbox แล้วจัดการงานให้โดยอัตโนมัติ
      มันใช้ข้อมูลรับรองของผมแบบ asynchronous เพื่อทำงาน เป็นอะไรที่เรียบง่ายแต่ก็น่าสนใจ
    • แต่การรันในคอนเทนเนอร์ไม่ได้ทำให้ ความเสี่ยงพื้นฐาน หายไป
    • บางคนเสียดสีว่า Claw ก็แค่ “สภาวะทางจิตที่ เปิดเผยตัวเองอย่างหุนหันพลันแล่น เพราะไม่อยากตกกระแส AI”
    • ถ้ามองเชิงเทคนิค Claw คือ “เอเจนต์ในคิว” กล่าวคือ LLM กับเครื่องมือทำงานเป็นลูป และลูปเหล่านั้นเชื่อมกันด้วยคิว
  • สรุปของผม: OpenClaw มี ความเสี่ยงด้านความปลอดภัยระดับ 5/5
    ต่อให้เป็น NanoClaw ที่ audit สมบูรณ์แล้วก็ยังน่าจะอยู่แถว 4/5
    ถ้ามีมนุษย์เข้ามาแทรกก็ดีขึ้น แต่ประโยชน์ใช้สอยจะลดลงอย่างมาก
    LLM เหมาะกับการสร้าง guardrail จากสเปกภาษา หรือจากการทดสอบ แต่ผมคิดว่าความเสถียรสำคัญกว่า

  • คิดว่าชื่อ “Claw” จะ ติดตลาด กลายเป็นคำเรียก AI เอเจนต์ส่วนตัวแบบ OpenClaw และพวกเดียวกัน

    • น่าสนใจที่ได้เห็น การแพร่กระจายแบบไวรัล ของคำศัพท์นี้ ภายหลังอาจทำให้ทนายปวดหัวเรื่องเครื่องหมายการค้าก็ได้ คล้ายกับ “press” ในระบบนิเวศ WordPress
  • กระแสเวิร์กโฟลว์เอเจนต์ช่วงนี้กำลังมองข้ามปัญหาพื้นฐานเรื่อง การไม่มีขอบเขตความปลอดภัย
    เมื่อ LLM มีสิทธิ์เข้าถึงเชลล์แบบไม่จำกัดและดึงข้อมูลที่ไม่น่าเชื่อถือเข้ามา ก็หลีกเลี่ยง indirect prompt injection ไม่ได้
    นอกจากนี้การยัด system prompt ขนาดใหญ่และ schema ของเครื่องมือเข้าไปในบริบทยังทำให้ความสามารถในการให้เหตุผลพื้นฐานของโมเดลลดลง และเพิ่มความเปราะบาง

    • จริง ๆ ทุกคนก็รู้ความเสี่ยงพวกนี้ แต่ยอมใช้เพราะ ความสะดวก มันสูงมาก
    • Information Flow Control เป็นอุดมคติที่ดี แต่ถ้าโปรโตคอลตลอดทุกช่องทางที่รวมกันไม่เปลี่ยน ก็แทบทำให้เป็นจริงไม่ได้
    • อยากรู้ว่าพอจะแชร์งานวิจัยที่เกี่ยวข้องได้ไหม
  • Claw แบรนด์ร้านค้า ออกมาก่อน GTA VI เสียอีก
    ผมลองทำเองแล้ว ใช้โค้ดแค่ 50 บรรทัดก็พอ
    มีแค่ไม่กี่บรรทัดของไลบรารี Telegram กับ claude -p prooompt ก็ได้แล้ว
    ดู โค้ดตัวอย่าง ULTRON ได้
    แน่นอนว่าตัวเอเจนต์ถูกมอบหมายออกไปภายนอก แต่แค่ Bash 50 บรรทัดก็ให้ผลลัพธ์ที่แทบสมบูรณ์แบบได้

    • แต่ถ้าจะให้เป็น Claw ของจริง ก็ต้อง เพิ่ม cron