เปิดตัวโมเดล Mistral Large

(mistral.ai)

8 คะแนน โดย GN⁺ 2024-02-27 | 1 ความคิดเห็น | แชร์ทาง WhatsApp

Mistral Large เป็นโมเดลสร้างข้อความล้ำสมัยที่มีความสามารถด้านการให้เหตุผลระดับแนวหน้า
สามารถทำงานให้เหตุผลที่ซับซ้อนในหลายภาษา และใช้ได้กับงานทำความเข้าใจข้อความ การแปลงข้อความ และการสร้างโค้ด
แสดงประสิทธิภาพที่แข็งแกร่งบนเบนช์มาร์ก MMLU และเป็นโมเดลที่มีอันดับสูงเป็นอันดับสองของโลกในบรรดาโมเดลที่เปิดให้ใช้งานทั่วไปผ่าน API
- 81.2% รองจาก GPT-4 ที่ 86.4%, Claude 2 ที่ 78.5%, และ Gemini Pro ที่ 71.8%

ฟีเจอร์ใหม่และจุดแข็งของ Mistral Large

เชี่ยวชาญระดับเจ้าของภาษาในภาษาอังกฤษ ฝรั่งเศส สเปน เยอรมัน และอิตาลี พร้อมความเข้าใจเชิงลึกด้านไวยากรณ์และบริบททางวัฒนธรรม
หน้าต่างคอนเท็กซ์ 32K โทเคนช่วยให้เรียกคืนข้อมูลที่ถูกต้องจากเอกสารขนาดใหญ่ได้
ความสามารถในการปฏิบัติตามคำสั่งอย่างแม่นยำช่วยให้นักพัฒนาสามารถออกแบบนโยบาย moderation ของตนเองได้ และถูกนำไปใช้กับการตั้งค่า moderation ระดับระบบของ le Chat
มีความสามารถด้าน function calling ในตัว ทำให้สามารถพัฒนาแอปพลิเคชันและปรับปรุงเทคสแต็กให้ทันสมัยในวงกว้างได้ เมื่อใช้งานร่วมกับโหมดจำกัดรูปแบบผลลัพธ์ที่มีใน la Plateforme

ให้บริการโมเดลบน Azure ผ่านความร่วมมือกับ Microsoft

เป้าหมายของ Mistral คือทำให้ AI ชั้นนำเข้าถึงได้อย่างแพร่หลาย และเพื่อสิ่งนี้จึงนำเสนอทั้งโมเดลแบบเปิดและเชิงพาณิชย์บน Azure
โมเดลของ Mistral ใช้งานได้ผ่าน La Plateforme และ Azure และยังสามารถนำไป deploy ลงในสภาพแวดล้อมของผู้ใช้โดยตรงได้
La Plateforme โฮสต์อย่างปลอดภัยบนโครงสร้างพื้นฐานในยุโรปของ Mistral ส่วน Azure ให้บริการผ่าน Azure AI Studio และ Azure Machine Learning
การ deploy ด้วยตนเองช่วยให้เข้าถึง model weights สำหรับกรณีใช้งานที่มีความอ่อนไหวสูงสุดได้ และสามารถอ่านกรณีศึกษาความสำเร็จหรือติดต่อทีมเพื่อดูข้อมูลเพิ่มเติม

ความสามารถของ Mistral Large

Mistral Large แสดงความสามารถด้านการให้เหตุผลที่แข็งแกร่งเมื่อเทียบกับโมเดล LLM ชั้นนำบนเบนช์มาร์กมาตรฐาน
ด้านความสามารถหลายภาษา Mistral Large ยังเหนือกว่า LLaMA 2 70B อย่างชัดเจนในภาษาฝรั่งเศส เยอรมัน สเปน และอิตาลี
ยังแสดงประสิทธิภาพระดับสูงสุดในงานเขียนโค้ดและคณิตศาสตร์

Mistral Small ใหม่ ปรับแต่งมาสำหรับเวิร์กโหลดที่ต้องการ latency ต่ำ

เปิดตัว Mistral Small ควบคู่กับ Mistral Large โดยเป็นโมเดลใหม่ที่ปรับแต่งด้าน latency และต้นทุน
Mistral Small มีประสิทธิภาพดีกว่า Mixtral 8x7B และมี latency ต่ำกว่า เป็นโซลูชันกึ่งกลางที่ได้รับการขัดเกลาระหว่างการให้บริการแบบ open-weight กับโมเดลเรือธง
Mistral Small ใช้นวัตกรรมด้าน RAG enablement และ function calling แบบเดียวกับ Mistral Large
มีทั้ง endpoint แบบ open-weight ราคาที่แข่งขันได้ และ endpoint โมเดลแบบปรับแต่งใหม่ ช่วยให้มองเห็น trade-off ระหว่างประสิทธิภาพกับต้นทุนได้อย่างครอบคลุม

รูปแบบ JSON และ function calling

โหมดรูปแบบ JSON บังคับให้ผลลัพธ์จากโมเดลภาษาเป็น JSON ที่ถูกต้อง
ผ่าน function calling นักพัฒนาสามารถเชื่อมชุดเครื่องมือของตนเองเข้ากับ Mistral endpoint เพื่อให้โต้ตอบกับโค้ดภายใน API หรือฐานข้อมูลที่ซับซ้อนยิ่งขึ้นได้
function calling และรูปแบบ JSON ใช้งานได้เฉพาะกับ mistral-small และ mistral-large เท่านั้น และมีแผนจะเพิ่มการกำหนดรูปแบบให้กับทุก endpoint เร็ว ๆ นี้

ความเห็นของ GN⁺

Mistral Large เป็นโมเดลภาษา AI ที่รองรับหลายภาษาและมีความสามารถด้านการให้เหตุผลขั้นสูง โดยความสามารถในการทำงานซับซ้อนในหลายภาษานั้นน่าสนใจเป็นพิเศษ
โมเดลนี้มีศักยภาพในการแข่งขันกับโมเดลที่มีอยู่แล้วอย่าง GPT-4 และการรองรับหลายภาษายังช่วยเพิ่มโอกาสในการนำไปใช้ในตลาดโลก
ความร่วมมือกับ Azure เปิดโอกาสให้โมเดลของ Mistral AI เข้าถึงฐานผู้ใช้ที่กว้างขึ้น พร้อมเสริมความสามารถในการขยายตัวและการเข้าถึงของบริการ AI บนคลาวด์
การเปิดตัวโมเดลที่ปรับแต่งมาอย่าง Mistral Small อาจเป็นตัวเลือกที่น่าสนใจสำหรับองค์กรที่ต้องการโซลูชัน AI ที่คุ้มค่าและมี latency ต่ำ
ฟีเจอร์รูปแบบ JSON และ function calling ช่วยให้นักพัฒนาสามารถผสานโมเดล AI เข้ากับแอปพลิเคชันของตนได้ง่ายขึ้น เพิ่มความสามารถใช้งานจริงและความยืดหยุ่นของเทคโนโลยี AI

1 ความคิดเห็น

GN⁺ 2024-02-27

ความคิดเห็นบน Hacker News

ชื่นชมความตรงไปตรงมาของเอกสารการตลาด คิดว่าการแสดงคะแนนเบนช์มาร์กที่ต่ำกว่าผลิตภัณฑ์ผู้นำตลาดนั้นดีกว่าการที่ Google เลือกใช้เบนช์มาร์กแบบคัดเฉพาะ
แม้จะทำมาแล้วหลายอย่าง แต่ก็อยากให้มีการยืนยันอีกครั้งถึงคำมั่นว่าจะมีส่วนร่วมกับชุมชนโอเพนซอร์ส เพราะคิดว่านี่เป็นส่วนสำคัญของแบรนด์พวกเขา
หลังเหตุการณ์ miqu ก็เฝ้าดูโดยคาดหวังว่าจะมี open weights ออกมาเพิ่ม แต่ดูเหมือนคงต้องรอดูผลต่อไป
อัปเดตการเปลี่ยนแปลง: เปลี่ยนชื่อ API endpoint และเพิ่ม model endpoint, เปิดตัวโมเดลใหม่, อัปเดตโมเดลเดิม และแจ้งกำหนดการยุติการใช้งาน
ฟีเจอร์ API ใหม่: ใช้ function calling และ JSON mode ได้บนโมเดล Mistral Small และ Mistral Large
La Plateforme: เพิ่มระบบชำระเงินที่รองรับหลายสกุลเงิน และเปิดตัวฟีเจอร์แพลตฟอร์มสำหรับองค์กร
Le Chat: เปิดตัวอินเทอร์เฟซแชตใหม่ที่ช่วยให้โต้ตอบกับโมเดล Mistral ได้ง่ายขึ้น
ได้เพิ่มโมเดลใหม่เข้าไปในปลั๊กอินสำหรับเครื่องมือ LLM CLI แล้ว ตอนนี้ใช้งานได้ดังนี้
ได้ลองใช้ Le Chat เพื่อแก้ปัญหาการเขียนโค้ดบางอย่างที่เกิดขึ้นวันนี้ และมันให้คำตอบที่ดีกว่า ChatGPT (รวมถึง GPT-4) มาก ยังไม่แน่ใจว่าคุณภาพของ ChatGPT ลดลงเพื่อประหยัดต้นทุนอย่างที่บางคนเสนอหรือไม่ แต่สำหรับปัญหาไม่กี่ข้อนี้ คุณภาพคำตอบของ Mistral ดีกว่ามาก
ไม่เคยรู้มาก่อนว่ามี Le Chat อยู่ด้วย อยากได้คู่แข่งของ ChatGPT ที่ใช้ Mistral และก็ชอบด้วยที่เติม "le" ไว้หน้าชื่อผลิตภัณฑ์
บน Azure นั้น Mistral ถูกกว่า GPT-4 เล็กน้อย
สงสัยว่ากระแสเรื่อง open weights จบไปแล้วหรือยัง หรือว่าพวกเขาจะยังคงปิดต่อไป
ไม่มีข้อมูลเกี่ยวกับขนาดพารามิเตอร์อยู่ที่ไหนเลย จึงสงสัยว่านี่เป็นความตั้งใจหรือเป็นสิ่งที่ตัวเองมองข้ามไป
มันเหมือนกับการมีสถาปัตยกรรม CPU หลายแบบที่ใช้แทนกันได้ ทุกครั้งที่มี LLM ใหม่ออกมา ก็ทำให้รู้สึกมีความหวังมากขึ้นว่าการผูกขาดจะลดลงอย่างมากและทุกอย่างจะดีขึ้น แม้ไม่มีโมเดลโอเพนซอร์ส OpenAI ก็ดูเหมือนจะบรรลุภารกิจของพวกเขาไปแล้ว

เปิดตัวโมเดล Mistral Large

ฟีเจอร์ใหม่และจุดแข็งของ Mistral Large

ให้บริการโมเดลบน Azure ผ่านความร่วมมือกับ Microsoft

ความสามารถของ Mistral Large

Mistral Small ใหม่ ปรับแต่งมาสำหรับเวิร์กโหลดที่ต้องการ latency ต่ำ

รูปแบบ JSON และ function calling

ความเห็นของ GN⁺

บทความที่เกี่ยวข้อง

1 ความคิดเห็น

ความคิดเห็นบน Hacker News