เปิดตัวเบต้าแพลตฟอร์มเซอร์วิสใหม่ของ Mistral AI
- Mistral AI มอบโมเดลสร้างข้อความแบบเปิดที่ทรงพลังสำหรับนักพัฒนา พร้อมวิธีนำไปใช้งานและปรับแต่งได้อย่างมีประสิทธิภาพ
- วันนี้เริ่มเปิดให้เข้าถึงเบต้าของแพลตฟอร์มเซอร์วิสแรก ที่มีทั้ง chatbot endpoint สามรายการซึ่งสร้างข้อความตามคำสั่งข้อความ และ embedding endpoint
- แต่ละ endpoint มีจุดแลกเปลี่ยนระหว่างประสิทธิภาพ/ราคาที่แตกต่างกัน
Generative endpoint
mistral-tiny และ mistral-small ใช้สองโมเดลที่เปิดเผยอยู่ในปัจจุบัน ส่วน mistral-medium ใช้โมเดลต้นแบบที่กำลังทดสอบในสภาพแวดล้อมการใช้งานจริง
- โมเดลต่าง ๆ ผสานเทคนิคการจัดแนวที่มีประสิทธิภาพที่สุด เช่น efficient fine-tuning และ direct preference optimization เพื่อสร้างโมเดลที่ผู้ใช้ควบคุมได้ง่ายและใช้งานได้อย่างน่าพอใจ
Mistral-tiny รองรับเฉพาะภาษาอังกฤษ, Mistral-small รองรับหลายภาษาและโค้ด, และ Mistral-medium ถูกประเมินว่าเป็นหนึ่งในโมเดลบริการระดับท็อป
Embedding endpoint
Mistral-embed เป็นโมเดล embedding ที่ออกแบบโดยคำนึงถึงงานค้นหา และมี embedding dimension เท่ากับ 1024
- โมเดล embedding นี้ทำคะแนนด้านการค้นหาบน MTEB ได้ 55.26
API specification
- API ปฏิบัติตามสเปกของอินเทอร์เฟซ chatbot ยอดนิยมที่คู่แข่งเป็นผู้เสนอขึ้นเป็นรายแรก
- มีไลบรารีไคลเอนต์สำหรับ Python และ Javascript ให้ใช้ query endpoint ได้
- endpoint รองรับ system prompt เพื่อให้ผู้ใช้ตั้งค่าการกลั่นกรองผลลัพธ์ของโมเดลในระดับที่สูงขึ้นได้
จากการเข้าถึงเบต้าไปสู่การเปิดใช้งานทั่วไป
- ตั้งแต่วันนี้ ทุกคนก็สามารถลงทะเบียนและใช้งาน API ได้ โดยจะค่อย ๆ เพิ่มความจุของระบบอย่างต่อเนื่อง
- ทีมธุรกิจสามารถช่วยทำความเข้าใจความต้องการและเร่งกระบวนการเข้าถึงได้
- ระหว่างที่กำลังทำให้แพลตฟอร์มมีเสถียรภาพจนพร้อมเป็น self-service อย่างเต็มรูปแบบ อาจยังมีส่วนที่ไม่เสถียรอยู่บ้าง
คำขอบคุณ
- ขอขอบคุณ NVIDIA ที่สนับสนุนการผสาน TensorRT-LLM และ Triton รวมถึงร่วมพัฒนา sparse mixture of experts ที่เข้ากันได้กับ TRT-LLM
ความเห็นของ GN⁺
- ประเด็นสำคัญที่สุดของบทความนี้คือ Mistral AI ได้นำเสนอทั้งโมเดลสร้างข้อความและโมเดล embedding ใหม่ให้กับนักพัฒนา ทำให้สามารถใช้งานการสร้างข้อความและความสามารถด้าน embedding ที่ดียิ่งขึ้นได้
- เทคโนโลยีเหล่านี้จะช่วยเร่งความก้าวหน้าของปัญญาประดิษฐ์ และความสามารถในการรองรับหลายภาษาและโค้ดจะขยายโอกาสการประยุกต์ใช้ในตลาดโลกได้อย่างมาก
- สำหรับนักพัฒนา นี่คือโอกาสที่น่าตื่นเต้นในการสร้างโปรเจกต์และโซลูชันที่สร้างสรรค์ผ่านเครื่องมือและ API ใหม่ ๆ และเป็นข่าวที่ยิ่งเพิ่มความคาดหวังต่ออนาคตของเทคโนโลยี
1 ความคิดเห็น
ความคิดเห็นจาก Hacker News