7 คะแนน โดย xguru 2024-04-29 | 2 ความคิดเห็น | แชร์ทาง WhatsApp
  • Apple เปิดตัว OpenELM ซึ่งเป็นโมเดลภาษา AI ขนาดเล็กพอที่จะรันได้โดยตรงบนสมาร์ตโฟน
  • OpenELM ย่อมาจาก "Open-source Efficient Language Models" และใช้งานได้บน Hugging Face ภายใต้ Apple Sample Code License
  • แม้จะเปิดเผยซอร์สโค้ดแล้ว แต่ไลเซนส์ยังมีข้อจำกัดบางส่วน จึงอาจไม่ตรงกับนิยาม "โอเพนซอร์ส" โดยทั่วไป

คุณสมบัติของโมเดล OpenELM

  • OpenELM ประกอบด้วย 8 โมเดลที่มีพารามิเตอร์ตั้งแต่ 270 ล้านถึง 3 พันล้านตัว
  • งานวิจัยระยะหลังมุ่งเน้นการสร้างโมเดลภาษา AI ขนาดเล็กที่มีความสามารถใกล้เคียงกับโมเดลภาษา AI ขนาดใหญ่เมื่อไม่กี่ปีก่อน
  • โมเดล OpenELM มีให้ 2 ประเภท คือเวอร์ชันที่พรีเทรนไว้ล่วงหน้า (pretrained) และเวอร์ชันที่ปรับด้วยคำสั่ง (instruction-tuned)
    • OpenELM-270M, OpenELM-450M, OpenELM-1_1B, OpenELM-3B
    • OpenELM-270M-Instruct, OpenELM-450M-Instruct, OpenELM-1_1B-Instruct, OpenELM-3B-Instruct

ข้อมูลฝึกและประสิทธิภาพของโมเดล OpenELM

  • OpenELM มี context window สูงสุด 2048 โทเค็น
  • ฝึกด้วยข้อมูลราว 1.8 ล้านล้านโทเค็น ซึ่งรวมถึงชุดข้อมูลที่เปิดใช้สาธารณะได้ เช่น RefinedWeb, PILE เวอร์ชันลบข้อมูลซ้ำ, ชุดย่อยของ RedPajama และชุดย่อยของ Dolma v1.6
  • ด้วย "layer-wise scaling strategy" ของ Apple ทำให้สามารถจัดสรรพารามิเตอร์ให้แต่ละเลเยอร์ได้มีประสิทธิภาพยิ่งขึ้น ช่วยประหยัดทรัพยากรการคำนวณและเพิ่มประสิทธิภาพของโมเดล
  • OpenELM ให้ความแม่นยำดีกว่า OLMo 1B ของ Allen AI อยู่ 2.36% แม้ใช้โทเค็นสำหรับพรีเทรนเพียงครึ่งเดียว

เอกสารที่เปิดเผยเพิ่มเติมและเป้าหมายของ Apple

  • Apple เปิดเผยโค้ดของไลบรารี CoreNet ที่ใช้ฝึก OpenELM และสูตรการฝึกที่ทำซ้ำได้
  • ถือเป็นกรณีที่ไม่ค่อยพบในบรรดาบริษัทเทคโนโลยีรายใหญ่ที่เปิดเผยถึงระดับ weights ด้วย เพื่อเน้นความโปร่งใส
  • เป้าหมายคือ "เสริมความแข็งแกร่งและทำให้ชุมชนนักวิจัยแบบเปิดมีความอุดมสมบูรณ์ยิ่งขึ้น" ผ่านการเปิดเผยซอร์สโค้ด, model weights และสื่อการฝึก
  • อย่างไรก็ตาม Apple เตือนว่า เนื่องจากโมเดลฝึกจากชุดข้อมูลสาธารณะ จึงมีความเป็นไปได้ที่จะให้ผลลัพธ์ที่ไม่ถูกต้อง เป็นอันตราย มีอคติ หรือชวนให้ไม่พอใจ

แนวโน้มต่อจากนี้

  • Apple ยังไม่ได้ผสานความสามารถของโมเดลภาษา AI ใหม่เข้าสู่อุปกรณ์ผู้บริโภค
  • อย่างไรก็ตาม มีการคาดกันว่าอัปเดต iOS 18 ที่น่าจะเปิดตัวในงาน WWDC เดือนมิถุนายน จะมีฟีเจอร์ AI ใหม่ที่ใช้การประมวลผลบนอุปกรณ์เพื่อคุ้มครองความเป็นส่วนตัวของผู้ใช้
  • และยังมีความเป็นไปได้ที่ Apple จะร่วมมือกับ Google หรือ OpenAI เพื่อยกระดับ Siri สำหรับงานประมวลผล AI ที่ซับซ้อนกว่านอกอุปกรณ์

2 ความคิดเห็น

 
[ความคิดเห็นนี้ถูกซ่อน]
 
tsboard 2024-04-29

สงสัยจริง ๆ ว่าอัปเดต iOS 18 จะเปลี่ยนไปมากแค่ไหน ตั้งตารอ M4 ที่เสริมความสามารถด้าน AI ด้วยเหมือนกัน!