AI เอเจนต์ที่ชนะ GPT-4o ด้วยพารามิเตอร์ 7B: Microsoft Fara-7B
(aisparkup.com)Fara-7B ที่พัฒนาโดย Microsoft Research เป็น AI เอเจนต์ขนาดเล็กระดับ 7 พันล้านพารามิเตอร์ ที่สามารถทำงานบนคอมพิวเตอร์ได้โดยตรง เช่น ท่องเว็บ กรอกฟอร์ม และจองบริการ โดยทำสถิติอัตราความสำเร็จ 73.5% บนเบนช์มาร์ก WebVoyager แซงหน้า GPT-4o (65.1%) และ UI-TARS (66.4%) โมเดลนี้ทำงานบนพีซีของผู้ใช้ได้โดยไม่ต้องพึ่งคลาวด์ ช่วยปกป้องความเป็นส่วนตัวของข้อมูล และใช้แนวทาง 'อธิปไตยระดับพิกเซล' ที่อาศัยเพียงภาพหน้าจอเพื่อจัดการการคลิกเมาส์ การพิมพ์คีย์บอร์ด การเลื่อนหน้าจอ ฯลฯ ได้อย่างมีประสิทธิภาพ (ทำงานเสร็จโดยเฉลี่ยใน 16 ขั้นตอน)
หลักการทำงานอยู่ที่การฝึกด้วยข้อมูลซึ่งสร้างและบีบอัดจากเส้นทางงานสังเคราะห์ 145,000 รายการผ่านระบบ Magentic-One และสามารถรันได้รวดเร็วบน NPU ของ Copilot+ PC ด้านความปลอดภัยมีฟีเจอร์ที่ขอการอนุมัติจากผู้ใช้ในจุด 'Critical Point' และสามารถติดตามหรือแทรกแซงการทำงานได้ผ่าน Magentic-UI เปิดเผยภายใต้สัญญาอนุญาต MIT บน Hugging Face และ Microsoft Foundry
ในเบนช์มาร์กอื่น ๆ (เช่น Online-Mind2Web 34.1%, DeepShop 26.2%) ก็แสดงประสิทธิภาพที่โดดเด่นเช่นกัน แต่ยังมีข้อจำกัดเรื่องความแม่นยำที่ลดลงหรือปัญหา hallucination เมื่อต้องจัดการงานที่ซับซ้อน Microsoft ประเมินว่านี่ยังอยู่ในระดับ 'proof of concept' และคาดว่าการโอเพนซอร์สจะช่วยขยายระบบนิเวศนักพัฒนา
สรุป: Fara-7B แสดงให้เห็นศักยภาพของโมเดลขนาดเล็ก และเป็นกรณีสำคัญที่เปิดทางสู่ยุคของผู้ช่วย AI ส่วนบุคคลที่พึ่งพาคลาวด์น้อยลง ในอนาคตคาดว่าจะพัฒนาให้ปลอดภัยและฉลาดยิ่งขึ้นด้วย reinforcement learning.
1 ความคิดเห็น
โมเดลขนาดเล็กไวต่อพรอมป์ต์มากเกินไปจนใช้งานได้ไม่ง่ายนัก.. ทางออกมีแค่การทดสอบซ้ำๆ เท่านั้นหรือ?