130 คะแนน โดย xguru 2026-03-29 | 7 ความคิดเห็น | แชร์ทาง WhatsApp
  • เพียงพูดว่า "ช่วยตั้งค่า Harness ให้หน่อย" ก็สามารถ ออกแบบทีมเอเจนต์ผู้เชี่ยวชาญ ให้เหมาะกับโดเมน และ สร้างสกิลที่เอเจนต์จะใช้โดยอัตโนมัติ ได้ด้วย เมตาสกิล
  • รองรับแพตเทิร์นสถาปัตยกรรม 6 แบบ พร้อม การ orchestration ระหว่างเอเจนต์และ โปรโตคอลการจัดการข้อผิดพลาด
  • แพตเทิร์นสถาปัตยกรรม
    • Pipeline: งานที่พึ่งพากันตามลำดับ
    • Fan-out/Fan-in: งานอิสระแบบขนาน
    • Expert Pool: เลือกเรียกใช้ตามสถานการณ์
    • Generate-Validate: สร้างแล้วตรวจสอบคุณภาพ
    • Supervisor: เอเจนต์ศูนย์กลางกระจายงานแบบไดนามิก
    • Hierarchical Delegation: มอบหมายงานแบบลำดับชั้นจากบนลงล่างและทำซ้ำแบบ recursive
  • เวิร์กโฟลว์ 6 ขั้นตอน : วิเคราะห์โดเมน → ออกแบบสถาปัตยกรรมทีม (ทีมเอเจนต์ vs ซับเอเจนต์) → สร้างนิยามเอเจนต์ → สร้างสกิล → ผสานรวมและ orchestration → ตรวจสอบและทดสอบ
  • โหมดการทำงาน มี 2 แบบ:
    • ทีมเอเจนต์ (ค่าเริ่มต้น): วิธี TeamCreate + SendMessage + TaskCreate แนะนำเมื่อมีเอเจนต์ 2 ตัวขึ้นไปและต้องการการทำงานร่วมกัน
    • ซับเอเจนต์: เรียกใช้เครื่องมือ Agent โดยตรง เหมาะกับงานครั้งเดียวหรือกรณีที่ไม่ต้องมีการสื่อสาร
  • เมื่อรัน Harness จะมีการสร้างไฟล์นิยามเอเจนต์อัตโนมัติใน .claude/agents/ (เช่น analyst.md, builder.md, qa.md) และสร้างไฟล์สกิลใน .claude/skills/
  • ตัวอย่างโครงทีมที่สามารถสร้างได้
    • Deep Researchช่วยตั้งค่า harness สำหรับงานวิจัยให้หน่อย ฉันต้องการทีมเอเจนต์ที่สามารถค้นคว้าหัวข้อใดก็ได้จากหลายมุมมอง — การค้นหาบนเว็บ, เอกสารวิชาการ, ปฏิกิริยาจากชุมชน — แล้วทำ cross-validation ก่อนสรุปเป็นรายงานฉบับสมบูรณ์
    • การสร้างเว็บไซต์ช่วยตั้งค่า harness สำหรับการพัฒนาเว็บไซต์แบบฟูลสแตกให้หน่อย ต้องการทีมที่ประสานงานด้านดีไซน์, ฟรอนต์เอนด์ (React/Next.js), แบ็กเอนด์ (API), และ QA test ตั้งแต่ wireframe ไปจนถึง deployment แบบ pipeline
    • การผลิตเว็บตูนช่วยตั้งค่า harness สำหรับการสร้างตอนเว็บตูนให้หน่อย ต้องมีเอเจนต์สำหรับเขียนเรื่อง, prompt ออกแบบตัวละคร, วางแผน panel layout, และแก้ไขบทสนทนา โดยต้องรีวิวผลงานของกันและกันในมุมมองความสอดคล้องของสไตล์
    • การวางแผนคอนเทนต์ YouTubeช่วยตั้งค่า harness สำหรับการผลิตคอนเทนต์ YouTube ให้หน่อย ต้องการทีมที่มี supervisor agent คอยประสานงานด้านการสำรวจเทรนด์, การเขียนสคริปต์, การปรับ SEO ของชื่อ/แท็ก, และการวางคอนเซ็ปต์ thumbnail
    • Code Reviewช่วยตั้งค่า harness สำหรับ code review แบบครบวงจรให้หน่อย ต้องการทีมเอเจนต์ที่ตรวจสอบ architecture, ช่องโหว่ด้านความปลอดภัย, คอขวดด้านประสิทธิภาพ, และ code style แบบขนาน แล้วรวมผลลัพธ์เป็นรายงานเดียว
    • การเขียนเอกสารเทคนิคช่วยตั้งค่า harness สำหรับสร้างเอกสาร API อัตโนมัติจากโค้ดเบสนี้ให้หน่อย ต้องการทีมที่ทำงานแบบ pipeline ตั้งแต่การวิเคราะห์ endpoint, การเขียนคำอธิบาย, การสร้างตัวอย่างการใช้งาน, ไปจนถึงการรีวิวความสมบูรณ์
    • การออกแบบ Data Pipelineช่วยตั้งค่า harness สำหรับออกแบบ data pipeline ให้หน่อย ต้องการทีมเอเจนต์ที่มอบหมายงานแบบลำดับชั้นสำหรับการออกแบบ schema, ตรรกะ ETL, กฎตรวจสอบข้อมูล, และการตั้งค่า monitoring
    • แคมเปญการตลาดช่วยตั้งค่า harness สำหรับสร้างแคมเปญการตลาดให้หน่อย ต้องการทีมที่ทำการวิจัยตลาดเป้าหมาย, เขียนข้อความโฆษณา, ออกแบบคอนเซ็ปต์ภาพ, และวางแผน A/B test พร้อมการรีวิวคุณภาพแบบวนซ้ำ
  • revfactory/harness-100 — เปิดเผย Harness สำหรับทีมเอเจนต์ production-ready 100 ชุด ครอบคลุม 10 โดเมน (แพ็กเกจเกาหลี-อังกฤษรวม 200 ชุด)
    • แต่ละ Harness มีเอเจนต์ผู้เชี่ยวชาญ 4-5 คน, orchestration skill และสกิลเฉพาะโดเมน
    • ครอบคลุมการสร้างคอนเทนต์·การพัฒนาซอฟต์แวร์·ข้อมูล/AI·กลยุทธ์ธุรกิจ·การศึกษา·กฎหมาย·เฮลท์แคร์ เป็นต้น รวมเป็น ไฟล์ Markdown 1,808 ไฟล์
    • ทั้งหมดสร้างด้วยปลั๊กอิน Harness
  • ต้องเปิดใช้ ฟีเจอร์ทีมเอเจนต์ ของ Claude Code: CLAUDE_CODE_EXPERIMENTAL_AGENT_TEAMS=1

7 ความคิดเห็น

 
namojo 29 일 전

ผลลัพธ์จากการลองใช้จริงนั้นน่าทึ่งมาก โครงสร้างของ Harness ที่คุณมินโฮสร้างขึ้นเองทำงานแบบ fan in/out พร้อมสร้างมัลติเอเจนต์หลายตัวตามวัตถุประสงค์ให้สอดคล้องกับ instruction และมี orchestrator คอยจัดการโดยแยกแต่ละขั้นของงานออกเป็นหลาย phase เพื่อดำเนินการ

คุณภาพของผลลัพธ์อยู่ในระดับกึ่งมืออาชีพ ไม่ว่าจะเป็นรายงานหรือแม้แต่แอปพลิเคชัน ก็มีเอเจนต์หลากหลายบทบาทที่จำเป็น เช่น coder, tester, reviewer และ analyst ที่ทำงานได้อย่างมีคุณภาพสูง

คุณอาจคิดว่าเหมือน MCP หรือเครื่องมืออื่น ๆ ที่ทำให้ context คงขนาดใหญ่ตลอดเวลาและกินโทเค็นเร็วเพราะ Harness แต่ถ้าเปิดดู context จะเห็นได้ว่ามันถูกใช้อย่างมีประสิทธิภาพสูงสุด อย่างไรก็ตาม ถ้าต้องการทำผลลัพธ์ให้มีความอ่านง่ายหรือมีความสวยงามอย่างที่เราคิดไว้ ก็จำเป็นต้องทำ skill สำหรับสร้างภาพ nanobanana บนพื้นฐาน Gemini API แล้วนำมาต่อเพิ่ม

แม้ใช้ Claude Max 200 ก็น่าจะชน daily limit ภายในราว 1~2 ชั่วโมง และผมใช้ Opus

นี่คือผลลัพธ์จากการที่ผมบอกกำหนดการเที่ยวญี่ปุ่น แล้วขอให้มันสร้างหน้าแผนการท่องเที่ยวแบบอินเทอร์แอ็กทีฟในบทบาทไกด์ท่องเที่ยวญี่ปุ่น งานแบบนี้ใช้โทเค็นไม่มากและทำได้เร็วมาก

http://namojo.github.io/tokyo-tour

 
tested 2026-03-30

มีใครเคยลองใช้บ้าง ขอรีวิวหน่อย

 
xguru 2026-03-29

นี่เป็นผลงานที่คุณฮวังมินโฮ หัวหน้าทีมกลยุทธ์ AI Native ของ Kakao สร้างขึ้นครับ
ผมเคยเห็นบทความที่เขาแนะนำอยู่หลายครั้ง เลยรออยู่ว่าจะเปิดให้ใช้เมื่อไหร่
เดี๋ยวจะลองใช้ดูครับ!

 
edunga1 23 일 전

ถ้าคุณใช้งาน Claude Code agent team อยู่แล้ว ก็ไม่ได้มีอะไรพิเศษนัก
แต่การวางโครงสร้างพื้นฐานโดยใช้ agents หรือ skills เพื่อให้ข้อมูลอย่างโครงสร้างทีมสามารถสานต่อไปยังเซสชันใหม่ได้ด้วยนั้นสะดวกมาก
ถ้าจัดทีมด้วยตนเอง สิ่งที่คล้ายกับ boilerplate สำหรับทีมจะต้องทำซ้ำอยู่เรื่อย ๆ

มีปัญหาอยู่อย่างหนึ่งคือ เนื่องจากเป็นสภาพแวดล้อมที่พิจารณาทั้ง subagent และ agent team ทำให้ใน Supervisor pattern มักเกิดสถานการณ์ประหลาดที่ผู้ควบคุมไปมอบหมายงานให้ subagent ทั้งที่มีการสร้างทีมไว้แล้วอยู่บ่อยครั้ง

 
neocode24 2026-03-31

ตั้งไว้สูงสุด 100 แต่พอเริ่มปุ๊บก็ชนขีดจำกัดโทเค็นเลย ฮือ

 
neocode24 29 일 전

หาเวลาแล้ว เลยลองสรุปสิ่งที่นำไปใช้ดูครับ ได้นำไปใช้จริงกับโมโนเรโป VibeCoding แล้ว

ในบรรดา Mode A (พัฒนา), B (ตรวจสอบโค้ด), C (ผสานรวม: A+B) ผมเลือกใช้ Mode B กับโปรเจกต์ที่ดำเนินไปแล้ว
ทำให้สามารถพบรายการอย่างความไม่สอดคล้องกันของ type ระหว่างฟรอนต์เอนด์/แบ็กเอนด์ ซึ่ง static analysis จับไม่ได้
เลยสรุปกระบวนการนำไปใช้ไว้ครับ

https://blog.neocode24.com/blog/claude-code-harness-real-world/

 
wang3281 2026-03-30

ในฐานะคนที่กำลังทำ Harness เองเป็นการส่วนตัว ผมก็สงสัยเหมือนกันว่าผลลัพธ์ของการนำโอเพนซอร์สต่าง ๆ มาใช้นั้นออกมาเป็นอย่างไรผ่านการทดสอบแบบไหน มีเครื่องมือเบนช์มาร์กที่เป็นทางการและวัดผลเชิงปริมาณอยู่หรือเปล่า.. ปกติแล้วคนอื่น ๆ ตรวจสอบความมีประสิทธิผลกันอย่างไรโดยไม่อาศัยแค่ความรู้สึก ก็อยากรู้เหมือนกันครับ