8 คะแนน โดย GN⁺ 2024-02-27 | 1 ความคิดเห็น | แชร์ทาง WhatsApp
  • Mistral Large เป็นโมเดลสร้างข้อความล้ำสมัยที่มีความสามารถด้านการให้เหตุผลระดับแนวหน้า
  • สามารถทำงานให้เหตุผลที่ซับซ้อนในหลายภาษา และใช้ได้กับงานทำความเข้าใจข้อความ การแปลงข้อความ และการสร้างโค้ด
  • แสดงประสิทธิภาพที่แข็งแกร่งบนเบนช์มาร์ก MMLU และเป็นโมเดลที่มีอันดับสูงเป็นอันดับสองของโลกในบรรดาโมเดลที่เปิดให้ใช้งานทั่วไปผ่าน API
    • 81.2% รองจาก GPT-4 ที่ 86.4%, Claude 2 ที่ 78.5%, และ Gemini Pro ที่ 71.8%

ฟีเจอร์ใหม่และจุดแข็งของ Mistral Large

  • เชี่ยวชาญระดับเจ้าของภาษาในภาษาอังกฤษ ฝรั่งเศส สเปน เยอรมัน และอิตาลี พร้อมความเข้าใจเชิงลึกด้านไวยากรณ์และบริบททางวัฒนธรรม
  • หน้าต่างคอนเท็กซ์ 32K โทเคนช่วยให้เรียกคืนข้อมูลที่ถูกต้องจากเอกสารขนาดใหญ่ได้
  • ความสามารถในการปฏิบัติตามคำสั่งอย่างแม่นยำช่วยให้นักพัฒนาสามารถออกแบบนโยบาย moderation ของตนเองได้ และถูกนำไปใช้กับการตั้งค่า moderation ระดับระบบของ le Chat
  • มีความสามารถด้าน function calling ในตัว ทำให้สามารถพัฒนาแอปพลิเคชันและปรับปรุงเทคสแต็กให้ทันสมัยในวงกว้างได้ เมื่อใช้งานร่วมกับโหมดจำกัดรูปแบบผลลัพธ์ที่มีใน la Plateforme

ให้บริการโมเดลบน Azure ผ่านความร่วมมือกับ Microsoft

  • เป้าหมายของ Mistral คือทำให้ AI ชั้นนำเข้าถึงได้อย่างแพร่หลาย และเพื่อสิ่งนี้จึงนำเสนอทั้งโมเดลแบบเปิดและเชิงพาณิชย์บน Azure
  • โมเดลของ Mistral ใช้งานได้ผ่าน La Plateforme และ Azure และยังสามารถนำไป deploy ลงในสภาพแวดล้อมของผู้ใช้โดยตรงได้
  • La Plateforme โฮสต์อย่างปลอดภัยบนโครงสร้างพื้นฐานในยุโรปของ Mistral ส่วน Azure ให้บริการผ่าน Azure AI Studio และ Azure Machine Learning
  • การ deploy ด้วยตนเองช่วยให้เข้าถึง model weights สำหรับกรณีใช้งานที่มีความอ่อนไหวสูงสุดได้ และสามารถอ่านกรณีศึกษาความสำเร็จหรือติดต่อทีมเพื่อดูข้อมูลเพิ่มเติม

ความสามารถของ Mistral Large

  • Mistral Large แสดงความสามารถด้านการให้เหตุผลที่แข็งแกร่งเมื่อเทียบกับโมเดล LLM ชั้นนำบนเบนช์มาร์กมาตรฐาน
  • ด้านความสามารถหลายภาษา Mistral Large ยังเหนือกว่า LLaMA 2 70B อย่างชัดเจนในภาษาฝรั่งเศส เยอรมัน สเปน และอิตาลี
  • ยังแสดงประสิทธิภาพระดับสูงสุดในงานเขียนโค้ดและคณิตศาสตร์

Mistral Small ใหม่ ปรับแต่งมาสำหรับเวิร์กโหลดที่ต้องการ latency ต่ำ

  • เปิดตัว Mistral Small ควบคู่กับ Mistral Large โดยเป็นโมเดลใหม่ที่ปรับแต่งด้าน latency และต้นทุน
  • Mistral Small มีประสิทธิภาพดีกว่า Mixtral 8x7B และมี latency ต่ำกว่า เป็นโซลูชันกึ่งกลางที่ได้รับการขัดเกลาระหว่างการให้บริการแบบ open-weight กับโมเดลเรือธง
  • Mistral Small ใช้นวัตกรรมด้าน RAG enablement และ function calling แบบเดียวกับ Mistral Large
  • มีทั้ง endpoint แบบ open-weight ราคาที่แข่งขันได้ และ endpoint โมเดลแบบปรับแต่งใหม่ ช่วยให้มองเห็น trade-off ระหว่างประสิทธิภาพกับต้นทุนได้อย่างครอบคลุม

รูปแบบ JSON และ function calling

  • โหมดรูปแบบ JSON บังคับให้ผลลัพธ์จากโมเดลภาษาเป็น JSON ที่ถูกต้อง
  • ผ่าน function calling นักพัฒนาสามารถเชื่อมชุดเครื่องมือของตนเองเข้ากับ Mistral endpoint เพื่อให้โต้ตอบกับโค้ดภายใน API หรือฐานข้อมูลที่ซับซ้อนยิ่งขึ้นได้
  • function calling และรูปแบบ JSON ใช้งานได้เฉพาะกับ mistral-small และ mistral-large เท่านั้น และมีแผนจะเพิ่มการกำหนดรูปแบบให้กับทุก endpoint เร็ว ๆ นี้

ความเห็นของ GN⁺

  • Mistral Large เป็นโมเดลภาษา AI ที่รองรับหลายภาษาและมีความสามารถด้านการให้เหตุผลขั้นสูง โดยความสามารถในการทำงานซับซ้อนในหลายภาษานั้นน่าสนใจเป็นพิเศษ
  • โมเดลนี้มีศักยภาพในการแข่งขันกับโมเดลที่มีอยู่แล้วอย่าง GPT-4 และการรองรับหลายภาษายังช่วยเพิ่มโอกาสในการนำไปใช้ในตลาดโลก
  • ความร่วมมือกับ Azure เปิดโอกาสให้โมเดลของ Mistral AI เข้าถึงฐานผู้ใช้ที่กว้างขึ้น พร้อมเสริมความสามารถในการขยายตัวและการเข้าถึงของบริการ AI บนคลาวด์
  • การเปิดตัวโมเดลที่ปรับแต่งมาอย่าง Mistral Small อาจเป็นตัวเลือกที่น่าสนใจสำหรับองค์กรที่ต้องการโซลูชัน AI ที่คุ้มค่าและมี latency ต่ำ
  • ฟีเจอร์รูปแบบ JSON และ function calling ช่วยให้นักพัฒนาสามารถผสานโมเดล AI เข้ากับแอปพลิเคชันของตนได้ง่ายขึ้น เพิ่มความสามารถใช้งานจริงและความยืดหยุ่นของเทคโนโลยี AI

1 ความคิดเห็น

 
GN⁺ 2024-02-27
ความคิดเห็นบน Hacker News
  • ชื่นชมความตรงไปตรงมาของเอกสารการตลาด คิดว่าการแสดงคะแนนเบนช์มาร์กที่ต่ำกว่าผลิตภัณฑ์ผู้นำตลาดนั้นดีกว่าการที่ Google เลือกใช้เบนช์มาร์กแบบคัดเฉพาะ

  • แม้จะทำมาแล้วหลายอย่าง แต่ก็อยากให้มีการยืนยันอีกครั้งถึงคำมั่นว่าจะมีส่วนร่วมกับชุมชนโอเพนซอร์ส เพราะคิดว่านี่เป็นส่วนสำคัญของแบรนด์พวกเขา

  • หลังเหตุการณ์ miqu ก็เฝ้าดูโดยคาดหวังว่าจะมี open weights ออกมาเพิ่ม แต่ดูเหมือนคงต้องรอดูผลต่อไป

  • อัปเดตการเปลี่ยนแปลง: เปลี่ยนชื่อ API endpoint และเพิ่ม model endpoint, เปิดตัวโมเดลใหม่, อัปเดตโมเดลเดิม และแจ้งกำหนดการยุติการใช้งาน

  • ฟีเจอร์ API ใหม่: ใช้ function calling และ JSON mode ได้บนโมเดล Mistral Small และ Mistral Large

  • La Plateforme: เพิ่มระบบชำระเงินที่รองรับหลายสกุลเงิน และเปิดตัวฟีเจอร์แพลตฟอร์มสำหรับองค์กร

  • Le Chat: เปิดตัวอินเทอร์เฟซแชตใหม่ที่ช่วยให้โต้ตอบกับโมเดล Mistral ได้ง่ายขึ้น

  • ได้เพิ่มโมเดลใหม่เข้าไปในปลั๊กอินสำหรับเครื่องมือ LLM CLI แล้ว ตอนนี้ใช้งานได้ดังนี้

  • ได้ลองใช้ Le Chat เพื่อแก้ปัญหาการเขียนโค้ดบางอย่างที่เกิดขึ้นวันนี้ และมันให้คำตอบที่ดีกว่า ChatGPT (รวมถึง GPT-4) มาก ยังไม่แน่ใจว่าคุณภาพของ ChatGPT ลดลงเพื่อประหยัดต้นทุนอย่างที่บางคนเสนอหรือไม่ แต่สำหรับปัญหาไม่กี่ข้อนี้ คุณภาพคำตอบของ Mistral ดีกว่ามาก

  • ไม่เคยรู้มาก่อนว่ามี Le Chat อยู่ด้วย อยากได้คู่แข่งของ ChatGPT ที่ใช้ Mistral และก็ชอบด้วยที่เติม "le" ไว้หน้าชื่อผลิตภัณฑ์

  • บน Azure นั้น Mistral ถูกกว่า GPT-4 เล็กน้อย

  • สงสัยว่ากระแสเรื่อง open weights จบไปแล้วหรือยัง หรือว่าพวกเขาจะยังคงปิดต่อไป

  • ไม่มีข้อมูลเกี่ยวกับขนาดพารามิเตอร์อยู่ที่ไหนเลย จึงสงสัยว่านี่เป็นความตั้งใจหรือเป็นสิ่งที่ตัวเองมองข้ามไป

  • มันเหมือนกับการมีสถาปัตยกรรม CPU หลายแบบที่ใช้แทนกันได้ ทุกครั้งที่มี LLM ใหม่ออกมา ก็ทำให้รู้สึกมีความหวังมากขึ้นว่าการผูกขาดจะลดลงอย่างมากและทุกอย่างจะดีขึ้น แม้ไม่มีโมเดลโอเพนซอร์ส OpenAI ก็ดูเหมือนจะบรรลุภารกิจของพวกเขาไปแล้ว