- เน้นให้เห็นถึงการติดตั้งใช้งานที่เรียบง่ายของ โครงสร้างลูปที่ผสาน LLM กับการใช้เครื่องมือ ผ่านประสบการณ์พัฒนา Sketch ผู้ช่วยเขียนโปรแกรมด้วย AI
- ด้วยโค้ดลูปเพียง 9 บรรทัด โมเดล LLM รุ่นใหม่อย่าง Claude 3.7 Sonnet ก็สามารถแก้ปัญหาจริงได้อย่างรวดเร็ว
- แม้จะมีเพียงเครื่องมืออเนกประสงค์อย่าง
bash ตัวเดียว ก็ยังช่วยทำงานซ้ำๆ และงานที่จุกจิกของนักพัฒนาให้เป็นอัตโนมัติได้ในระดับมาก
- นอกจากการแก้ปัญหาแล้ว ยังสามารถเชื่อมต่อเครื่องมือเพิ่มเติมเพื่อยกระดับคุณภาพและความเร็วในการทำซ้ำของ การแก้ไขข้อความหรืองานเฉพาะทาง
- มีแนวโน้มที่จะเห็น ลูปเอเจนต์ LLM แบบปรับแต่งเฉพาะ ถูกนำมาใช้กับงานอัตโนมัติในชีวิตประจำวันของนักพัฒนามากขึ้นเรื่อยๆ
บทนำ: ประสบการณ์การพัฒนาและโปรเจ็กต์ Sketch
- Philip Zeyliger และเพื่อนร่วมงานรู้สึกประหลาดใจกับประสิทธิภาพที่สูงของ โครงสร้างลูปเอเจนต์แบบเรียบง่ายที่ผสาน LLM กับการใช้เครื่องมือ ระหว่างพัฒนา Sketch เครื่องมือช่วยเขียนโปรแกรมที่ขับเคลื่อนด้วย AI
- โครงสร้างหลักคือโค้ดลูปเพียง 9 บรรทัด ซึ่งส่ง system prompt, ประวัติการสนทนา และข้อความล่าสุดไปยัง LLM API
- LLM จะสร้างผลลัพธ์ และหากจำเป็นก็จะส่งคืน tool_calls (คำขอเรียกใช้เครื่องมือ)
การผสานรวม LLM และการใช้เครื่องมือ
- “การใช้เครื่องมือ (tool use)” หมายถึงการที่ LLM ส่งคืน เอาต์พุตที่เป็นไปตามสคีมาที่กำหนดไว้ล่วงหน้า และผ่าน system prompt กับพรอมป์ต์อธิบายเครื่องมือ ทำให้ LLM เข้าถึงเครื่องมืออเนกประสงค์อย่าง
bash ได้
- LLM รุ่นใหม่ (เช่น Claude 3.7 Sonnet) สามารถทำงานอัตโนมัติกับปัญหาหลากหลายได้อย่างรวดเร็วด้วยเครื่องมืออเนกประสงค์เพียงตัวเดียว และบางกรณีก็แก้ได้ด้วยการรันครั้งเดียว (“one shot”)
- ก่อนหน้านี้ต้องค้นหาคำสั่ง
git ที่ซับซ้อน คัดลอกมาวาง และรวมโค้ดด้วยตนเอง แต่ตอนนี้สามารถสั่ง Sketch ให้จัดการได้ทันที
- แม้แต่ข้อผิดพลาด type check จำนวนมากที่เกิดขึ้นหลังจากเปลี่ยน type, Sketch ก็สามารถจัดการให้อัตโนมัติได้เป็นครั้งแรก
- ลูปเอเจนต์ทำงานแบบ ต่อเนื่องและปรับตัวได้ โดยหากยังไม่ได้ติดตั้งเครื่องมือก็จะติดตั้งให้อัตโนมัติ และยังปรับรับความแตกต่างของออปชันคำสั่งได้ด้วย
- ระหว่างใช้งาน บางครั้ง LLM อาจเสนอทางเลือกที่ไม่คาดคิด เช่น “ข้ามการทดสอบ” เมื่อการทดสอบล้มเหลว แต่โดยรวมแล้วคุณภาพของงานอัตโนมัติก็ดีขึ้น
การเพิ่มความหลากหลายและความเฉพาะทางของเครื่องมือ
- Sketch พบว่าเมื่อใช้ เครื่องมือเพิ่มเติมนอกเหนือจาก
bash (เช่น เครื่องมือแก้ไขข้อความ) จะช่วยยกระดับคุณภาพงานและทำให้เวิร์กโฟลว์การพัฒนามีประสิทธิภาพยิ่งขึ้น
- การให้ LLM แก้ไขข้อความอย่างแม่นยำด้วย
sed และเครื่องมือคล้ายกันนั้นยากกว่าที่คิด และรู้สึกได้ว่าเครื่องมือแบบเอดิเตอร์เชิงภาพ (visual) ทำได้ดีกว่า
แนวโน้มในอนาคตและการเปลี่ยนแปลงของเวิร์กโฟลว์
- คาดว่า โครงสร้างลูปเอเจนต์ จะถูกนำไปใช้มากขึ้นเรื่อยๆ กับ งานซ้ำๆ ในชีวิตประจำวันของนักพัฒนาที่เครื่องมืออัตโนมัติอเนกประสงค์แบบเดิมจัดการได้ยาก
- ตัวอย่างเช่น งานที่น่ารำคาญและต้องทำซ้ำอย่างการวิเคราะห์ความสัมพันธ์ระหว่าง stack trace กับ git commit ก็สามารถให้ LLM ช่วยประมวลผลขั้นต้นได้อย่างรวดเร็ว
- ในอนาคตคาดว่าจะได้เห็น ลูปเอเจนต์ LLM แบบสร้างเฉพาะและใช้ครั้งเดียว มากขึ้นในสภาพแวดล้อมของนักพัฒนา เช่น ในไดเรกทอรี bin/
- ผู้ใช้เพียงเตรียม bearer token ที่ต้องการ ก็สามารถทดลองใช้งานในสภาพแวดล้อมของตนเองได้อย่างง่ายดาย
ลิงก์อ้างอิง
1 ความคิดเห็น
ความคิดเห็นจาก Hacker News
?utm_source=hn&utm_medium=browserเข้าไปก่อนดีไหม// omitted for brevityจนใช้การไม่ได้ ผมเลยยอมแพ้ตรงนั้น อยากรู้ว่าเอเจนต์ต่าง ๆ ช่วยแก้ปัญหานี้ได้ไหม ตอนนี้ผมรู้สึกว่าประสบการณ์นี้พังโดยสิ้นเชิง และก็ยังกังวลว่าการให้สิทธิ์เข้าถึง bash ในสภาพแบบนั้นอันตรายเกินไป