ส่วนใหญ่เห็นว่ามีการใช้ Claude เป็นหลัก สร้างเอเจนต์หลายตัว ตั้งค่าเวิร์กโฟลว์ให้ทำงานอัตโนมัติทั้งการออกแบบ การพัฒนา และการทดสอบครบทั้งหมด มีบทความเกี่ยวกับวิธีแบบนั้นอยู่มาก แต่ผมสงสัยว่าพอใช้งานจริงแล้วมันทำงานได้แค่ไหน อีกทั้งยังมีบทความจำนวนมากที่พูดถึงการใช้โมเดลต่างกันสำหรับงานออกแบบ พัฒนา ทดสอบ ฯลฯ ว่าโมเดลไหนเหมาะกับงานประเภทใด
ตอนนี้ผมใช้สิ่งที่เรียกว่า Cursor อยู่ ซึ่งสำหรับงานทั้งหมดที่กล่าวมา โมเดลจะตั้งค่าอัตโนมัติและทำทุกอย่างผ่านตัวนี้เพียงตัวเดียว แต่ก็ยังต้องคอยเฝ้าดู พูดคุย และช่วยกำหนดทิศทางให้มันอยู่เรื่อย ๆ เลยอยากทราบว่าถ้าใช้ Claude ตามวิธีที่กล่าวถึงข้างต้น มันจะเป็นอัตโนมัติได้อย่างสมบูรณ์หรือไม่ จากประสบการณ์ของผม ยิ่งโปรเจกต์ใหญ่เท่าไร ถ้าไม่คอยช่วยกำหนดทิศทางต่อเนื่อง ผลลัพธ์ก็มักจะออกนอกทางหรือไม่สมบูรณ์ เลยอยากทราบว่ามีบทความหรือวิดีโอที่อธิบายวิธีแบบ "อัตโนมัติเต็มรูปแบบ" อย่างละเอียดหรือไม่ เพราะเท่าที่ผมดูจากบทความหรือวิดีโอเหล่านั้น ยังไม่ค่อยเห็นวิธีที่ละเอียดพอจะทำตามได้
4 ความคิดเห็น
แทนที่จะมุ่งไปสู่สภาวะที่ทุกอย่างถูกทำให้เป็นอัตโนมัติทั้งหมด ผมคิดว่ากลยุทธ์ที่พอจะเป็นจริงได้มากกว่าคือการแยกงานออกเป็นส่วน ๆ แล้วกำหนดผู้รับผิดชอบของแต่ละงาน ตัวอย่างเช่น ให้ LLM รับหน้าที่งานอย่างการจดจำรูปแบบ การดึงความหมาย หรือการเชื่อมโยงกับความรู้ทั่วไป ส่วนการให้ความหมายเพิ่มเติม การใส่บริบท และการตัดสินใจ ให้มนุษย์เป็นคนทำ หากนำตัวอย่างนี้ไปใช้กับสถานการณ์การเขียนโค้ด ก็อาจมอบหมายให้ LLM สร้างโค้ดที่ทำซ้ำ ๆ หรือเขียน test case ขณะที่การตัดสินใจด้านสถาปัตยกรรมและการทำ domain modeling ยังคงเป็นหน้าที่ของมนุษย์ แบบนี้ประเด็นก็จะถูกทำให้แคบลงเหลือว่า เราจะทำให้การตัดสินใจเป็นอัตโนมัติได้ถึงระดับไหน และผมคิดว่าคุณก็น่าจะหากรณีตัวอย่างที่เป็นรูปธรรมมากขึ้นได้ง่ายขึ้น
ขอบคุณสำหรับคำตอบ ตามที่กล่าวไว้ในโพสต์ต้นฉบับ ฉันก็สะดุดตากับบทความลักษณะนั้นอยู่เหมือนกัน แต่ไม่ได้ลงลึกถึงวิธีที่เป็นรูปธรรม เลยสงสัยว่ามีเอกสารหรือข้อมูลที่เป็นที่รู้จักกันดีบ้างไหม
ผมเห็นบทความเกี่ยวกับวิธีใช้ AI เยอะมาก แต่ก็ยังไม่ค่อยรู้ว่าควรทำอย่างไร
ไม่แน่ใจว่าเป็นเพราะภาวะเศรษฐกิจหรือเปล่า แต่ช่วงหลังมานี้มีทั้งบทความและคอร์สสอนมากมายที่พูดราวกับว่า AI agent สามารถแก้ได้ทุกอย่าง อย่างไรก็ตาม ในความเป็นจริงตอนนี้ยังยากที่ AI เพียงอย่างเดียวจะทำทุกอย่างได้ครบ 100% ผมมองว่าแล้วแต่สาขา โดยมากน่าจะได้สูงสุดราว 70-80% และถ้าจะไปให้ไกลกว่านั้น ผมคิดว่าจำเป็นต้องมีผู้เชี่ยวชาญในสาขานั้นอย่างยิ่ง
ผมยังไม่เคยเห็นบทความหรือวิดีโอที่อธิบายแนวทางแบบ 'อัตโนมัติเต็มรูปแบบ' โดยตรง แต่ดูเหมือนว่าขณะนี้กำลังมีการพูดคุยและทดลองในประเด็นนี้กันอยู่เป็นวงๆ ในแต่ละพื้นที่
ผมคิดว่าบทความด้านล่างน่าจะเป็นคำใบ้สำหรับคำถามของคุณได้ครับ!
https://anthropic.com/engineering/…
https://openai.com/ko-KR/index/harness-engineering/
https://github.com/karpathy/autoresearch
https://www.minimax.io/news/minimax-m27-en