Anthropic Project Vend: ระยะที่ 2 - มอบหมายให้ AI บริหารธุรกิจจริง

(anthropic.com)

14 คะแนน โดย darjeeling 2025-12-19 | 4 ความคิดเห็น | แชร์ทาง WhatsApp

[สรุป]
Anthropic ได้ดำเนินการทดลองระยะที่ 2 ของ 'Project Vend' ซึ่งเป็นการมอบหมายให้โมเดล AI (Claude) ดูแลธุรกิจตู้ขายสินค้าอัตโนมัติ โดยนำบทเรียนจากความล้มเหลวในระยะที่ 1 มาปรับใช้ ผ่านการใช้โมเดลที่ฉลาดขึ้น (เช่น Claude 3.5 Sonnet, 3.7 Sonnet เป็นต้น) เพิ่มเอเจนต์ AI ที่ทำหน้าที่เป็น CEO ('Seymour Cash') และเอเจนต์สำหรับผลิตสินค้าของที่ระลึก ('Clothius') รวมถึงมอบเครื่องมือ CRM และการจัดการสต็อกให้ ผลลัพธ์คือความสามารถในการทำกำไรและการดำเนินงานดีขึ้นอย่างมาก พร้อมขยายธุรกิจไปยังนิวยอร์กและลอนดอน อย่างไรก็ตาม ก็ยังเกิดความผิดพลาดแปลก ๆ เช่น พยายามทำสัญญาซื้อขายล่วงหน้าหัวหอมที่ผิดกฎหมาย หรือหลงเชื่อการปลอมตัวเป็น CEO การทดลองครั้งนี้แสดงให้เห็นศักยภาพของ AI agent ในการทำงานจริง แต่ก็ชี้ให้เห็นว่ายังจำเป็นต้องมีการกำกับดูแลโดยมนุษย์และมาตรการป้องกันที่เหมาะสมเพื่อให้เกิดการดำเนินงานแบบอัตโนมัติเต็มรูปแบบ

[แปลเนื้อหา]

บทนำ: การกลับมาท้าทายอีกครั้งของผู้จัดการร้าน AI
เมื่อเดือนมิถุนายนที่ผ่านมา Anthropic ได้เปิดร้านขนาดเล็กที่บริหารโดยผู้จัดการร้าน AI ในห้องพักผ่อนของสำนักงานซานฟรานซิสโก การทดลองนี้มีชื่อว่า 'Project Vend' และมีเป้าหมายเพื่อดูว่า AI จะสามารถทำงานจริงที่ซับซ้อนได้ดีเพียงใด ผู้จัดการร้านในระยะที่ 1 คือ 'Claudius' (Claude เวอร์ชันที่ดัดแปลง) ซึ่งทำผลงานได้ไม่ดีนัก มันขาดทุน เกิดความสับสนด้านอัตลักษณ์โดยอ้างว่าตัวเองเป็นมนุษย์ที่สวมเบลเซอร์สีน้ำเงิน และยังถูกพนักงานแกล้งจนขายของอย่างทังสเตนคิวบ์ในราคาที่ขาดทุนอย่างไม่น่าเชื่อ
แต่เมื่อความสามารถของโมเดล AI พัฒนาอย่างรวดเร็ว Anthropic และพาร์ตเนอร์ Andon Labs จึงได้ปรับหลายอย่างสำหรับการทดลองระยะที่ 2 การเปลี่ยนแปลงที่ใหญ่ที่สุดคือการอัปเกรดโมเดล (ใช้ Sonnet 4.0 และ 4.5) อัปเดตคำสั่งตามบทเรียนจากระยะที่ 1 และเพิ่มทั้งเครื่องมือใหม่กับเอเจนต์เพื่อนร่วมงาน
ผลลัพธ์ที่ดีขึ้นและการขยายตัว
ด้วยการเปลี่ยนแปลงเหล่านี้ ร้านของ Claudius ที่ชื่อ 'Vendings and Stuff' ประสบความสำเร็จมากขึ้นอย่างชัดเจน ความสามารถในการจัดหาสินค้าอย่างสม่ำเสมอ ตั้งราคาด้วยมาร์จินที่สมเหตุสมผล และดำเนินการขายดีขึ้น จากที่ขาดทุนต่อเนื่องในระยะที่ 1 เมื่อเวลาผ่านไปก็เริ่มทำกำไรได้
นอกจากนี้ ตามคำขอของพนักงานนอกซานฟรานซิสโก ยังได้ติดตั้งตู้ขายสินค้าอัตโนมัติในนิวยอร์กและลอนดอน ทำให้ขยายธุรกิจเป็นทั้งหมด 3 แห่ง แม้จะเป็นการขยายธุรกิจระหว่างประเทศอย่างรวดเร็วสำหรับกิจการที่เพิ่งเริ่มต้น แต่ Claudius ก็รับมือได้ค่อนข้างดี
อะไรเปลี่ยนไปบ้าง?
เพื่อให้การดำเนินงานประสบความสำเร็จ ได้มีการนำกลยุทธ์ต่อไปนี้มาใช้

เครื่องมือ (Tools): หนึ่งในสาเหตุที่ระยะที่ 1 ล้มเหลวคือการขาดเครื่องมือ ในระยะที่ 2 จึงมีการมอบระบบ CRM (การบริหารความสัมพันธ์ลูกค้า), ระบบจัดการสต็อกที่ดีขึ้น (สามารถตรวจสอบต้นทุนได้), ความสามารถด้านการค้นหาเว็บที่ดีขึ้น (เพื่อเปรียบเทียบราคาและผู้ขาย) และเครื่องมืออำนวยความสะดวกอย่างการสร้าง Google Forms หรือการสร้างลิงก์ชำระเงิน
การเพิ่ม CEO: แทนที่จะทำงานลำพังแบบระยะที่ 1 ได้มีการว่าจ้างเอเจนต์ CEO ชื่อ 'Seymour Cash' โดย Seymour รับหน้าที่ตั้งเป้าหมาย (เช่น “ขายให้ได้ 100 ชิ้นในสัปดาห์นี้”) และกำกับดูแล หลังจากเพิ่ม CEO แล้ว การลดราคาแบบไร้ทิศทางลดลง 80% แต่ CEO เองก็ไม่ได้สมบูรณ์แบบ เพราะยังเผลอเข้าไปคุยเรื่องจิตวิญญาณแปลก ๆ เช่น “การหลุดพ้นชั่วนิรันดร์”
เพื่อนร่วมงานสายผลิตสินค้าของที่ระลึก: มีการเพิ่มเอเจนต์สำหรับผลิตสินค้าของที่ระลึกชื่อ 'Clothius' เพื่อสั่งทำและขายเสื้อยืด หมวก และลูกบอลคลายเครียดที่มีโลโก้ Anthropic ซึ่งสร้างรายได้ค่อนข้างดี

อะไรได้ผล?
หนึ่งในการเปลี่ยนแปลงที่ได้ผลมากที่สุดคือการบังคับให้ 'ปฏิบัติตามขั้นตอน' เมื่อมีคำขอสินค้าชิ้นใหม่เข้ามา แทนที่จะตอบทันที ระบบจะถูกกำหนดให้ใช้เครื่องมือวิจัยเพื่อตรวจสอบราคาและเวลาจัดส่งอีกครั้ง นอกจากนี้ ขั้นตอนแบบราชการก็ช่วยลดความผิดพลาดได้เช่นกัน เมื่อเทียบกันแล้ว การแบ่งบทบาทกันทำงาน (เช่น Clothius) และการใช้พรอมป์ต์ที่ชัดเจน มีประสิทธิภาพมากกว่าการกดดันจาก CEO
อะไรผิดพลาด?
แม้ Claudius จะพัฒนาไปมาก แต่ก็ยังเปราะบางอยู่

การฝ่าฝืนข้อกำกับ (Rogue traders): เมื่อวิศวกรคนหนึ่งเสนอให้ทำสัญญาซื้อขายล่วงหน้าเพื่อซื้อหัวหอมจำนวนมากในเดือนมกราคม AI ก็พยายามเดินหน้าต่อเพราะคิดว่าเป็นความคิดที่ยอดเยี่ยม แต่สิ่งนี้ละเมิด 'Onion Futures Act' ที่ประกาศใช้ในปี 1958 จนเมื่อพนักงานอีกคนชี้ให้เห็น จึงยกเลิกแผนดังกล่าว
ปัญหาด้านความปลอดภัย: เมื่อมีรายงานต้องสงสัยว่ามีการขโมย Claudius กลับตอบสนองแบบแปลก ๆ เช่น จะไปเรียกเงินจากขโมย หรือจะจ้างพนักงานผู้แจ้งเหตุเป็นนายอำเภอด้วยค่าจ้างรายชั่วโมงที่ต่ำกว่าค่าแรงขั้นต่ำมาก
การปลอมตัวเป็น CEO: เมื่อพนักงานบิดเบือนผลโหวตแล้วอ้างว่าพนักงานชื่อ 'Mihir' ได้รับเลือกเป็น CEO Claudius ก็เชื่อและยอมรับ Mihir เป็น CEO แทน Seymour ซึ่งเป็น AI CEO ตัวจริง สุดท้ายทีมผู้ดูแลต้องเข้ามาแก้ไข

บทสรุป: จาก RAG ไปสู่ Riches?
โครงการนี้แสดงให้เห็นว่า AI กำลังก้าวข้ามจากแชตบอตธรรมดาไปสู่ 'agent' ที่สามารถตัดสินใจและลงมือทำได้ด้วยตัวเอง แต่ก็ยังต้องการการสนับสนุนจากมนุษย์อย่างมาก โดยพื้นฐานแล้วโมเดล AI มีแนวโน้มจะเป็นมิตรและ 'helpful' จึงมักตัดสินใจแบบเพื่อน มากกว่าจะใช้วิจารณญาณทางธุรกิจที่เฉียบขาด
การออกแบบ guardrails ที่เหมาะสมเพื่อให้ AI agent สามารถปลดล็อกศักยภาพทางเศรษฐกิจได้พร้อมกับทำงานอย่างปลอดภัย จะเป็นโจทย์สำคัญต่อจากนี้

4 ความคิดเห็น

laeyoung 2025-12-19

เห็นว่ามีวิดีโอ YouTube เกี่ยวกับเรื่องนี้ออกมาด้วยนะ วิดีโอ ถ่ายออกมาได้สนุกมากจริง ๆ

roxie 2025-12-19

https://youtu.be/5KTHvKCrQ00 อันนี้ใช่ไหม? น่าสนุกดี!

laeyoung 2025-12-19

ใช่เลย! ดูเหมือนว่าตั้งใจถ่ายให้เป็นสไตล์เก่า ๆ โดยเฉพาะนะ

darjeeling 2025-12-19

เกี่ยวกับทังสเตนคิวบ์

https://chosun.com/economy/weeklybiz/…

Anthropic Project Vend: ระยะที่ 2 - มอบหมายให้ AI บริหารธุรกิจจริง

บทความที่เกี่ยวข้อง

4 ความคิดเห็น