- Mistral Large เป็นโมเดลสร้างข้อความล้ำสมัยที่มีความสามารถด้านการให้เหตุผลระดับแนวหน้า
- สามารถทำงานให้เหตุผลที่ซับซ้อนในหลายภาษา และใช้ได้กับงานทำความเข้าใจข้อความ การแปลงข้อความ และการสร้างโค้ด
- แสดงประสิทธิภาพที่แข็งแกร่งบนเบนช์มาร์ก MMLU และเป็นโมเดลที่มีอันดับสูงเป็นอันดับสองของโลกในบรรดาโมเดลที่เปิดให้ใช้งานทั่วไปผ่าน API
- 81.2% รองจาก GPT-4 ที่ 86.4%, Claude 2 ที่ 78.5%, และ Gemini Pro ที่ 71.8%
ฟีเจอร์ใหม่และจุดแข็งของ Mistral Large
- เชี่ยวชาญระดับเจ้าของภาษาในภาษาอังกฤษ ฝรั่งเศส สเปน เยอรมัน และอิตาลี พร้อมความเข้าใจเชิงลึกด้านไวยากรณ์และบริบททางวัฒนธรรม
- หน้าต่างคอนเท็กซ์ 32K โทเคนช่วยให้เรียกคืนข้อมูลที่ถูกต้องจากเอกสารขนาดใหญ่ได้
- ความสามารถในการปฏิบัติตามคำสั่งอย่างแม่นยำช่วยให้นักพัฒนาสามารถออกแบบนโยบาย moderation ของตนเองได้ และถูกนำไปใช้กับการตั้งค่า moderation ระดับระบบของ le Chat
- มีความสามารถด้าน function calling ในตัว ทำให้สามารถพัฒนาแอปพลิเคชันและปรับปรุงเทคสแต็กให้ทันสมัยในวงกว้างได้ เมื่อใช้งานร่วมกับโหมดจำกัดรูปแบบผลลัพธ์ที่มีใน la Plateforme
ให้บริการโมเดลบน Azure ผ่านความร่วมมือกับ Microsoft
- เป้าหมายของ Mistral คือทำให้ AI ชั้นนำเข้าถึงได้อย่างแพร่หลาย และเพื่อสิ่งนี้จึงนำเสนอทั้งโมเดลแบบเปิดและเชิงพาณิชย์บน Azure
- โมเดลของ Mistral ใช้งานได้ผ่าน La Plateforme และ Azure และยังสามารถนำไป deploy ลงในสภาพแวดล้อมของผู้ใช้โดยตรงได้
- La Plateforme โฮสต์อย่างปลอดภัยบนโครงสร้างพื้นฐานในยุโรปของ Mistral ส่วน Azure ให้บริการผ่าน Azure AI Studio และ Azure Machine Learning
- การ deploy ด้วยตนเองช่วยให้เข้าถึง model weights สำหรับกรณีใช้งานที่มีความอ่อนไหวสูงสุดได้ และสามารถอ่านกรณีศึกษาความสำเร็จหรือติดต่อทีมเพื่อดูข้อมูลเพิ่มเติม
ความสามารถของ Mistral Large
- Mistral Large แสดงความสามารถด้านการให้เหตุผลที่แข็งแกร่งเมื่อเทียบกับโมเดล LLM ชั้นนำบนเบนช์มาร์กมาตรฐาน
- ด้านความสามารถหลายภาษา Mistral Large ยังเหนือกว่า LLaMA 2 70B อย่างชัดเจนในภาษาฝรั่งเศส เยอรมัน สเปน และอิตาลี
- ยังแสดงประสิทธิภาพระดับสูงสุดในงานเขียนโค้ดและคณิตศาสตร์
Mistral Small ใหม่ ปรับแต่งมาสำหรับเวิร์กโหลดที่ต้องการ latency ต่ำ
- เปิดตัว Mistral Small ควบคู่กับ Mistral Large โดยเป็นโมเดลใหม่ที่ปรับแต่งด้าน latency และต้นทุน
- Mistral Small มีประสิทธิภาพดีกว่า Mixtral 8x7B และมี latency ต่ำกว่า เป็นโซลูชันกึ่งกลางที่ได้รับการขัดเกลาระหว่างการให้บริการแบบ open-weight กับโมเดลเรือธง
- Mistral Small ใช้นวัตกรรมด้าน RAG enablement และ function calling แบบเดียวกับ Mistral Large
- มีทั้ง endpoint แบบ open-weight ราคาที่แข่งขันได้ และ endpoint โมเดลแบบปรับแต่งใหม่ ช่วยให้มองเห็น trade-off ระหว่างประสิทธิภาพกับต้นทุนได้อย่างครอบคลุม
รูปแบบ JSON และ function calling
- โหมดรูปแบบ JSON บังคับให้ผลลัพธ์จากโมเดลภาษาเป็น JSON ที่ถูกต้อง
- ผ่าน function calling นักพัฒนาสามารถเชื่อมชุดเครื่องมือของตนเองเข้ากับ Mistral endpoint เพื่อให้โต้ตอบกับโค้ดภายใน API หรือฐานข้อมูลที่ซับซ้อนยิ่งขึ้นได้
- function calling และรูปแบบ JSON ใช้งานได้เฉพาะกับ mistral-small และ mistral-large เท่านั้น และมีแผนจะเพิ่มการกำหนดรูปแบบให้กับทุก endpoint เร็ว ๆ นี้
ความเห็นของ GN⁺
- Mistral Large เป็นโมเดลภาษา AI ที่รองรับหลายภาษาและมีความสามารถด้านการให้เหตุผลขั้นสูง โดยความสามารถในการทำงานซับซ้อนในหลายภาษานั้นน่าสนใจเป็นพิเศษ
- โมเดลนี้มีศักยภาพในการแข่งขันกับโมเดลที่มีอยู่แล้วอย่าง GPT-4 และการรองรับหลายภาษายังช่วยเพิ่มโอกาสในการนำไปใช้ในตลาดโลก
- ความร่วมมือกับ Azure เปิดโอกาสให้โมเดลของ Mistral AI เข้าถึงฐานผู้ใช้ที่กว้างขึ้น พร้อมเสริมความสามารถในการขยายตัวและการเข้าถึงของบริการ AI บนคลาวด์
- การเปิดตัวโมเดลที่ปรับแต่งมาอย่าง Mistral Small อาจเป็นตัวเลือกที่น่าสนใจสำหรับองค์กรที่ต้องการโซลูชัน AI ที่คุ้มค่าและมี latency ต่ำ
- ฟีเจอร์รูปแบบ JSON และ function calling ช่วยให้นักพัฒนาสามารถผสานโมเดล AI เข้ากับแอปพลิเคชันของตนได้ง่ายขึ้น เพิ่มความสามารถใช้งานจริงและความยืดหยุ่นของเทคโนโลยี AI
1 ความคิดเห็น
ความคิดเห็นบน Hacker News
ชื่นชมความตรงไปตรงมาของเอกสารการตลาด คิดว่าการแสดงคะแนนเบนช์มาร์กที่ต่ำกว่าผลิตภัณฑ์ผู้นำตลาดนั้นดีกว่าการที่ Google เลือกใช้เบนช์มาร์กแบบคัดเฉพาะ
แม้จะทำมาแล้วหลายอย่าง แต่ก็อยากให้มีการยืนยันอีกครั้งถึงคำมั่นว่าจะมีส่วนร่วมกับชุมชนโอเพนซอร์ส เพราะคิดว่านี่เป็นส่วนสำคัญของแบรนด์พวกเขา
หลังเหตุการณ์ miqu ก็เฝ้าดูโดยคาดหวังว่าจะมี open weights ออกมาเพิ่ม แต่ดูเหมือนคงต้องรอดูผลต่อไป
อัปเดตการเปลี่ยนแปลง: เปลี่ยนชื่อ API endpoint และเพิ่ม model endpoint, เปิดตัวโมเดลใหม่, อัปเดตโมเดลเดิม และแจ้งกำหนดการยุติการใช้งาน
ฟีเจอร์ API ใหม่: ใช้ function calling และ JSON mode ได้บนโมเดล Mistral Small และ Mistral Large
La Plateforme: เพิ่มระบบชำระเงินที่รองรับหลายสกุลเงิน และเปิดตัวฟีเจอร์แพลตฟอร์มสำหรับองค์กร
Le Chat: เปิดตัวอินเทอร์เฟซแชตใหม่ที่ช่วยให้โต้ตอบกับโมเดล Mistral ได้ง่ายขึ้น
ได้เพิ่มโมเดลใหม่เข้าไปในปลั๊กอินสำหรับเครื่องมือ LLM CLI แล้ว ตอนนี้ใช้งานได้ดังนี้
ได้ลองใช้ Le Chat เพื่อแก้ปัญหาการเขียนโค้ดบางอย่างที่เกิดขึ้นวันนี้ และมันให้คำตอบที่ดีกว่า ChatGPT (รวมถึง GPT-4) มาก ยังไม่แน่ใจว่าคุณภาพของ ChatGPT ลดลงเพื่อประหยัดต้นทุนอย่างที่บางคนเสนอหรือไม่ แต่สำหรับปัญหาไม่กี่ข้อนี้ คุณภาพคำตอบของ Mistral ดีกว่ามาก
ไม่เคยรู้มาก่อนว่ามี Le Chat อยู่ด้วย อยากได้คู่แข่งของ ChatGPT ที่ใช้ Mistral และก็ชอบด้วยที่เติม "le" ไว้หน้าชื่อผลิตภัณฑ์
บน Azure นั้น Mistral ถูกกว่า GPT-4 เล็กน้อย
สงสัยว่ากระแสเรื่อง open weights จบไปแล้วหรือยัง หรือว่าพวกเขาจะยังคงปิดต่อไป
ไม่มีข้อมูลเกี่ยวกับขนาดพารามิเตอร์อยู่ที่ไหนเลย จึงสงสัยว่านี่เป็นความตั้งใจหรือเป็นสิ่งที่ตัวเองมองข้ามไป
มันเหมือนกับการมีสถาปัตยกรรม CPU หลายแบบที่ใช้แทนกันได้ ทุกครั้งที่มี LLM ใหม่ออกมา ก็ทำให้รู้สึกมีความหวังมากขึ้นว่าการผูกขาดจะลดลงอย่างมากและทุกอย่างจะดีขึ้น แม้ไม่มีโมเดลโอเพนซอร์ส OpenAI ก็ดูเหมือนจะบรรลุภารกิจของพวกเขาไปแล้ว