25 คะแนน โดย GN⁺ 21 일 전 | 1 ความคิดเห็น | แชร์ทาง WhatsApp
  • ชุดผลิตภัณฑ์ API แบบประกอบผสมสำหรับสร้างและดีพลอยเอเจนต์ขนาดใหญ่บนคลาวด์ สามารถเปลี่ยนจากโปรโตไทป์สู่โปรดักชันได้ภายในไม่กี่วัน
  • จัดการอินฟราสตรักเจอร์ระดับโปรดักชันโดยอัตโนมัติ เช่น secure sandboxing, การจัดการข้อมูลรับรอง, และการควบคุมสิทธิ์ ทำให้ผู้ใช้โฟกัสได้เฉพาะการกำหนดงาน
  • รองรับเซสชันระยะยาว, การทำงานร่วมกันของหลายเอเจนต์, และ governance ตามความน่าเชื่อถือ พร้อมผสานการทำงานอย่างใกล้ชิดกับโมเดล Claude เพื่อให้ทำงานวนซ้ำอัตโนมัติและเพิ่มประสิทธิภาพได้
  • บริษัทชั้นนำอย่าง Notion, Rakuten, Asana, และ Sentry ใช้งานสิ่งนี้เพื่อให้ดีพลอยได้เร็วขึ้น 10 เท่าและสร้างเวิร์กโฟลว์อัตโนมัติ
  • ให้บริการแบบคิดค่าบริการตามการใช้งาน และเป็นแพลตฟอร์มที่ยกระดับประสิทธิภาพการดำเนินงานและผลิตภาพการพัฒนาในองค์กรอย่างมีนัยสำคัญ

ภาพรวมของ Claude Managed Agents

  • Claude Managed Agents เปิดให้ใช้งานในสถานะ public beta เป็น ชุดผลิตภัณฑ์ API แบบประกอบผสม สำหรับสร้างและดีพลอยเอเจนต์ขนาดใหญ่บนคลาวด์
  • เดิมทีการพัฒนาเอเจนต์ต้องใช้เวลาหลายเดือนเพราะต้องรองรับอินฟราสตรักเจอร์ด้านความปลอดภัย, การจัดการสถานะ, การควบคุมสิทธิ์, และการรับมือกับการอัปเกรดโมเดล แต่ Managed Agents ทำให้ เปลี่ยนจากโปรโตไทป์สู่โปรดักชันได้ภายในไม่กี่วัน
  • รองรับตั้งแต่ตัวรันงานเดี่ยวไปจนถึงไปป์ไลน์หลายเอเจนต์ที่ซับซ้อน ทำให้ผู้ใช้ โฟกัสกับประสบการณ์ผู้ใช้ได้โดยไม่ต้องแบกรับภาระด้านการปฏิบัติการ

สร้างและดีพลอยเอเจนต์ได้เร็วขึ้น 10 เท่า

  • การดีพลอยเอเจนต์ระดับโปรดักชันต้องมี การรันโค้ดในแซนด์บ็อกซ์, checkpoint, การจัดการข้อมูลรับรอง, การกำหนดขอบเขตสิทธิ์, และ end-to-end tracing
  • Managed Agents จัดการความซับซ้อนเหล่านี้แทน และผู้ใช้เพียง กำหนดงาน, เครื่องมือ, และ guardrail เท่านั้น
  • orchestration harness ที่มีมาในตัวจะจัดการจังหวะการเรียกใช้เครื่องมือ, การจัดการคอนเท็กซ์, และการกู้คืนจากข้อผิดพลาดโดยอัตโนมัติ
  • ความสามารถหลัก:
    • เอเจนต์ระดับโปรดักชัน: จัดการ secure sandboxing, การยืนยันตัวตน, และการรันเครื่องมือโดยอัตโนมัติ
    • เซสชันระยะยาว: ทำงานอัตโนมัติได้นานหลายชั่วโมง และยังคงรักษาความคืบหน้าและผลลัพธ์ไว้แม้การเชื่อมต่อหลุด
    • การทำงานร่วมกันของหลายเอเจนต์: สร้างและสั่งการเอเจนต์อื่นเพื่อทำงานซับซ้อนแบบขนานได้ (อยู่ในขั้น research preview)
    • governance ตามความน่าเชื่อถือ: มีการกำหนดขอบเขตสิทธิ์, การจัดการ ID, และการติดตามการทำงานในตัว

ออกแบบให้ผสานกับโมเดล Claude

  • โมเดล Claude ถูก ปรับให้เหมาะกับงานที่มีเอเจนต์เป็นศูนย์กลาง และ Managed Agents ก็ถูกออกแบบมาเพื่อใช้ศักยภาพนี้ให้เต็มที่
  • ผู้ใช้เพียง กำหนดผลลัพธ์และเกณฑ์ความสำเร็จ จากนั้น Claude จะประเมินและทำงานวนซ้ำด้วยตัวเองเพื่อบรรลุเป้าหมาย (มีให้ใน research preview)
  • หากจำเป็น ก็ยังรองรับ เวิร์กโฟลว์แบบ prompt-response แบบเดิม
  • ในการทดสอบภายใน งานสร้างไฟล์แบบมีโครงสร้างทำได้ ดีขึ้นสูงสุด 10 คะแนนเมื่อเทียบกับลูปพรอมป์ตมาตรฐาน
  • มี การติดตามเซสชัน, การวิเคราะห์แบบรวมศูนย์, และคู่มือแก้ปัญหา ฝังอยู่ใน Claude Console ทำให้ตรวจสอบการเรียกใช้เครื่องมือและกระบวนการตัดสินใจทั้งหมดได้

กรณีใช้งานจริง

  • หลายทีมทำให้การ ดีพลอยสู่โปรดักชันเร็วขึ้น 10 เท่า ได้ผ่าน Managed Agents
    • Coding agent: วิเคราะห์โค้ดเบส, วางแผนการแก้ไข, และสร้าง PR
    • Productivity agent: เข้าร่วมในโปรเจกต์, ดำเนินงาน, และส่งมอบผลลัพธ์
    • เอเจนต์ด้านการเงินและกฎหมาย: ประมวลผลเอกสารและดึงข้อมูลสำคัญ
  • ตัวอย่างจากบริษัทหลัก:
    • Notion

      • ให้บริการอัลฟาของ Custom Agents ที่สามารถมอบหมายงานให้ Claude ทำได้โดยตรงภายในเวิร์กสเปซ
      • วิศวกรสามารถดีพลอยโค้ด ขณะที่พนักงานสายความรู้สามารถทำงานหลายสิบอย่างแบบขนาน เช่น สร้างเว็บไซต์และงานพรีเซนเทชัน
    • Rakuten

      • ดีพลอย เอเจนต์ระดับองค์กร ที่ผสานกับ Slack และ Teams ไปยังฝ่ายผลิตภัณฑ์, ฝ่ายขาย, การตลาด, การเงิน, และ HR
      • ดีพลอยเอเจนต์เฉพาะทางแต่ละตัวได้ ภายใน 1 สัปดาห์
    • Asana

      • ผสานเอเจนต์ที่ทำงานร่วมกับมนุษย์เข้าไปในโปรเจกต์ผ่าน AI Teammates
      • ใช้ Managed Agents เพื่อสร้างความสามารถขั้นสูงได้ ภายในไม่กี่สัปดาห์
    • Vibecode

      • สร้าง AI-native app infrastructure ที่เชื่อมจากพรอมป์ตไปสู่การดีพลอยแอปด้วย Managed Agents
      • สามารถสร้างอินฟราสตรักเจอร์เดียวกันได้ เร็วขึ้น 10 เท่า
    • Sentry

      • รวมเอเจนต์ดีบัก Seer เข้ากับเอเจนต์เขียนแพตช์ที่ขับเคลื่อนด้วย Claude
      • ทำให้ตั้งแต่การตรวจพบบั๊กไปจนถึงการสร้าง PR เป็น โฟลว์เดียวแบบอัตโนมัติ และทำให้การผสานที่เดิมใช้เวลาหลายเดือนเสร็จได้ภายในไม่กี่สัปดาห์

คำกล่าวจากลูกค้า

  • Ansh Nanda (ผู้ร่วมก่อตั้ง): ในอดีตต้องจัดการ LLM ด้วยตนเองในแซนด์บ็อกซ์ แต่ตอนนี้ สร้างอินฟราสตรักเจอร์ได้เร็วขึ้น 10 เท่าด้วยโค้ดไม่กี่บรรทัด และคาดว่า AI-native app จะเพิ่มขึ้นอย่างมาก
  • Indragie Karunaratne (ผู้อำนวยการฝ่ายวิศวกรรม AI/ML ของ Sentry): Managed Agents มอบ รันไทม์ที่ปลอดภัยและมีการจัดการเต็มรูปแบบ ช่วยปรับปรุงประสบการณ์นักพัฒนาและลดภาระการปฏิบัติการ
  • Sanchan Saxena (หัวหน้าฝ่ายผลิตภัณฑ์ของ Atlassian): ผสานเอเจนต์เข้ากับเวิร์กโฟลว์ของ Jira และ ทำ sandboxing, session, และการจัดการสิทธิ์ให้เป็นอัตโนมัติ เพื่อเพิ่มประสิทธิภาพทางวิศวกรรม
  • Javed Qadrud-Din (CTO): Managed Agents สามารถ สร้างเครื่องมือที่จำเป็นได้ทันทีหน้างาน เพื่อรองรับทุกคำถามของผู้ใช้ และลดเวลาพัฒนาลง 10 เท่า
  • John Han (ผู้ร่วมก่อตั้ง): สร้างเอเจนต์เตรียมการประชุมให้เป็นระดับโปรดักชันได้ ภายในไม่กี่วัน พร้อมจัดการการเชื่อมต่อระบบภายนอกและการค้นหาเว็บโดยอัตโนมัติ
  • Eric Liu (PM ของ Notion): เซสชันระยะยาวและการจัดการหน่วยความจำช่วยให้ มอบหมายงานเปิดกว้างที่ซับซ้อน ได้
  • Yusuke Kaji (หัวหน้าฝ่าย AI ของ Rakuten): ดีพลอยเอเจนต์เฉพาะทางในแต่ละแผนกได้ ภายใน 1 สัปดาห์ พร้อมขยายใช้งานอย่างปลอดภัยและทำให้นวัตกรรมเข้าถึงได้กว้างขึ้น
  • Amritansh Raghav (CTO ของ Asana): เร่งความเร็วการพัฒนา AI Teammates ได้อย่างมาก และยกระดับประสบการณ์การทำงานร่วมกันระดับองค์กร

เริ่มต้นใช้งาน

  • Managed Agents ใช้ โมเดลคิดค่าบริการตามการใช้งาน โดยบวกเพิ่ม $0.08 ต่อชั่วโมงของเซสชัน จากอัตราโทเค็นมาตรฐานของ Claude Platform
  • ดูรายละเอียดราคาเพิ่มเติมได้ในเอกสารทางการ
  • สามารถดีพลอยเอเจนต์ตัวแรกได้ผ่าน Claude Console หรือ CLI และรองรับการผสานกับ Claude Code และ claude-api Skill
  • สามารถเริ่ม onboarding ได้ด้วยคำสั่ง “start onboarding for managed agents in Claude API”

พลิกโฉมการดำเนินงานขององค์กร

  • Managed Agents เป็นเครื่องมือที่สามารถ เปลี่ยนวิธีการดำเนินงานขององค์กรได้อย่างถึงราก โดยช่วยให้
    นักพัฒนาและทีมต่าง ๆ โฟกัสกับผลิตภาพและประสบการณ์ผู้ใช้แทนอินฟราสตรักเจอร์
  • มีแผนจะอัปเดตอย่างต่อเนื่องและขยายชุมชนผ่าน Claude Platform

1 ความคิดเห็น

 
GN⁺ 21 일 전
ความคิดเห็นจาก Hacker News
  • ฉันสงสัยว่านี่อาจจะนำไปสู่ การ orchestration ที่เหมาะสมที่สุด
    โอเพนซอร์สอาจออกทางเลือกที่ดีกว่าได้ไม่ทันเวลา
    จนถึงตอนนี้ผลลัพธ์ที่ดีที่สุดมาจากการ ผสมเอเจนต์ จากหลายบริษัท
    สิ่งที่สำคัญกว่า ‘planner’ คือ ‘worker’ เอเจนต์บางตัวเก่งกว่างานบางประเภทอย่างชัดเจน
    ตัวอย่างเช่น Opus 4.6 เรื่องการตรวจจับบั๊กนั้นเทียบกับ GPT 5.4 xhigh ไม่ติดเลย
    เหมือนกับที่ในโลกความเป็นจริง วิธีคิดที่หลากหลายในทีมช่วยเพิ่ม ความแข็งแกร่ง เอเจนต์แบบผสมก็ดูให้ผลคล้ายกัน

    • ถ้า Anthropic จะทำเวอร์ชันที่ดีที่สุดจริง ก็ต้องชนะบริษัท AI อื่นทั้งหมดในงานย่อยทุกอย่างให้ได้ก่อน (เอกสารเทคนิค, ไดอะแกรม, การตรวจจับบั๊ก ฯลฯ)
      แต่พวกเขาคงไม่ยอมให้เรียกโมเดลภายนอกอย่าง Codex จากในสแต็กของตัวเองแน่
    • สิ่งที่ฉันกังวลคือมันอาจลงเอยด้วยการเป็น ภาษาสำหรับ orchestration ที่เหมาะสมที่สุด
      เช่น ถ้า Claude เปลี่ยนการสื่อสารระหว่างเอเจนต์ทั้งหมดให้เป็นภาษาซูเมเรียนล่ะ?
      บริษัทใดบริษัทหนึ่งอาจผูกขาดความเชี่ยวชาญในภาษานั้นได้
    • ฉันเองก็พบว่าการผสมโมเดลจากหลายบริษัทดีที่สุด
      เขียนสเปกด้วย Opus → แก้ด้วย Gemini → กลับไปให้ Opus feedback → ฉันทบทวนเอง → build ด้วย Qwen3.5 → review ด้วย Opus
      เวิร์กโฟลว์นี้สมบูรณ์แบบมาก แต่พอ Anthropic เปลี่ยนนโยบาย มันก็พัง
    • ตอนนี้บริษัท AI ต่างๆ เหมือน ล็อบสเตอร์ในถัง
      ถ้าบริษัทหนึ่งออกโมเดลปิดมา บริษัทอื่นก็จะวิเคราะห์ ปรับปรุง แล้วปล่อยเป็นโอเพนซอร์ส
      สุดท้ายก็ฉุดกันเอง และภายหลังก็อาจกลายเป็นเหมือน คาร์เทล ได้
  • เห็นได้ชัดว่า Anthropic กำลังพยายามดึงนักพัฒนาเข้ามาอยู่บนแพลตฟอร์มของตัวเอง
    ถ้าจะไป IPO พวกเขาต้องเป็น บริษัทแพลตฟอร์ม ไม่ใช่แค่ผู้ให้โมเดล
    ทุกการเคลื่อนไหวตอนนี้ชี้ไปในทิศทางนั้น

  • ฉันใช้ Claude Code ทุกวัน แต่การทำให้ระบบลูกค้าต้องพึ่ง Anthropic นั้นเสี่ยง
    วิศวกรรมคุณภาพ ไม่ใช่จุดแข็งของพวกเขา และถ้า availability อยู่แค่ระดับ ‘single 9’ ก็น่าหนักใจ

  • ตอนนี้ยังเป็น ยุคเริ่มต้นของ agent framework คล้ายยุคเว็บก่อน PHP
    ทุกสัปดาห์มีทั้งแพตเทิร์นใหม่และโมเดลใหม่ออกมา ทำให้ทุก framework ถูกสร้างใหม่อยู่ตลอด
    LangChain พยายามจะเป็นแบบ Next.js/Vercel แต่ส่วนใหญ่ก็ยังแนะนำให้สร้างเอง
    Anthropic มีข้อได้เปรียบตรงที่ถือครองโมเดลเอง จึงอาจได้ความต้องการส่วนหนึ่งจากโซลูชันที่เข้าได้ง่าย แต่ปัญหา lock-in และความเร็วของการเปลี่ยนแปลงทางเทคนิคก็ยังอยู่

    • เห็นด้วย ตอนนี้เป็นช่วงที่มีโซลูชันทำไม่เสร็จลอยอยู่เต็มบล็อกกับ GitHub เป็นร้อยๆ ตัว
      LangChain ใกล้เคียงที่สุดแล้วแต่ก็ยังให้ความรู้สึก DIY สูงมาก
      แถมทุกคนยังใช้ vector DB และ reranking model คนละชุดปนกันไปหมด
  • ฉันก็กำลังสร้างอะไรคล้ายๆ กันเองอยู่ และแปลกใจที่แนวทางของ Anthropic ดูเหมือน ไอเดียที่เกิดขึ้นพร้อมกัน
    ต้องหลีกเลี่ยงการถูกมัดกับผู้ให้โมเดลรายเดียวอย่างเด็ดขาด
    สำหรับทีมเล็กอาจพอได้ แต่ในระบบซับซ้อนมันแทบเป็นการฆ่าตัวตาย
    ควรเปรียบเทียบและจัดชุดหลายโมเดล แล้วบริหารในสไตล์ของตัวเอง เหมือนการทำอาหารที่ต้องเลือก รสชาติ ให้เหมาะกับสถานการณ์

    • ที่จริงทุกคนก็กำลังสร้างอะไรคล้ายๆ กันอยู่ ทางที่จะไปมันมีจำกัด
    • อยากรู้ว่าเหตุผลที่ต้องเลี่ยง lock-in เป็นแค่เรื่องประสิทธิภาพ หรือเพราะ Anthropic อาจใช้ ข้อมูล telemetry แล้ววันหลังกลายเป็นคู่แข่งได้ด้วย
    • ฉันก็คิดเหมือนกัน การวางระบบแบบนี้บน แพลตฟอร์มรวมศูนย์ อย่าง openrouter ค่อนข้างง่าย
  • หน้าเว็บที่เอเจนต์พวกนั้นสร้างออกมามั่วมากจน ข้อความรีวิวทับกัน อ่านไม่ได้เลย

    • ของฉันขึ้นเป็นหน้าดำไปเลย
  • ฉันกำลังรัน คอนเทนเนอร์ Docker เพื่อสร้างเว็บ Jekyll ด้วย Anthropic Agentic SDK
    การตั้งค่าโครงสร้างพื้นฐานไม่ยากนัก สิ่งที่ยากจริงๆ คือทำให้เอเจนต์ทำพฤติกรรมตามที่ต้องการ
    สักวันหนึ่งอาจย้ายไปผู้ให้บริการรายอื่นหรือ self-hosting ก็ได้ เลยอยากรักษาอิสระไว้

  • ฉันยังคงใช้ชุด pydantic ai กับ dbos/temporal/celery ต่อไป
    ไม่อยากถูกผูกกับผู้ขายรายใดรายหนึ่ง อยากเลือกใช้ LLM ตัวไหนก็ได้อย่างอิสระ
    ต้องช่วยกันผลักดัน orchestration แบบโอเพนซอร์สต่อไป

  • ภายนอกดูเท่มาก แต่ก็อาจกลายเป็น ระเบิดค่าใช้จ่าย ได้
    ถ้าสะเพร่าแบบ AWS ก็อาจมีเอเจนต์นับพันตัววิ่งอยู่จนบิลพุ่งกระฉูด
    สำหรับ Anthropic นี่น่าจะเป็น โมเดลรายได้ ที่ยอดเยี่ยมมาก

  • ทิศทางแบบนี้เป็น ขั้นตอนที่คาดกันไว้แล้ว
    เป็นวิธีง่ายๆ ในการเพิ่มรายได้และเสริม lock-in ของผู้ใช้ โดยไม่ต้องทำให้โมเดลฉลาดขึ้น
    บทวิเคราะห์ที่เกี่ยวข้องสรุปไว้ดีในบทความนี้