Leanstral 1.5
(docs.mistral.ai)- Leanstral 1.5 เป็นโมเดลอัปเดตที่ปรับให้เหมาะกับงานวิศวกรรมการพิสูจน์เชิงรูปนัยของ Lean 4 โดยมุ่งเน้นการพิสูจน์ทฤษฎีบทอัตโนมัติและการจัดรูปแบบเชิงรูปนัยอัตโนมัติ
- ขนาดโมเดลประกอบด้วย พารามิเตอร์รวม 119B และ พารามิเตอร์ที่ทำงานอยู่ 6.5B โดยออกแบบมาสำหรับการจัดการบริบทของการพิสูจน์และเอกสารที่ยาว
- ตัวระบุที่ให้ใช้งานคือ
labs-leanstral-1-5และในเอกสารถูกระบุเป็นโมเดล Labs v1.5 - ความยาวคอนเท็กซ์คือ 256k และรายการราคาแสดงเป็น $0 เพื่อเน้นการเข้าถึงสำหรับการทดลองและการประเมินผล
- สามารถใช้งานร่วมกับ Chat Completions, Function Calling, Agents, Structured Outputs, OCR, Document QnA, FIM, Embeddings, Moderations, Audio และ Batch Processing API
โมเดลที่ออกแบบมาสำหรับการพิสูจน์เชิงรูปนัยของ Lean 4
- Leanstral 1.5 เป็นเวอร์ชันอัปเดตของโมเดลงานวิศวกรรมการพิสูจน์เชิงรูปนัยของ Lean 4
- เป้าหมายการปรับแต่งหลักคือ การพิสูจน์ทฤษฎีบทอัตโนมัติ และ การจัดรูปแบบเชิงรูปนัยอัตโนมัติ
- โมเดลนี้ให้ใช้งานด้วยตัวระบุ
labs-leanstral-1-5
ขนาดโมเดลและคุณสมบัติพื้นฐาน
- โครงสร้างพารามิเตอร์ระบุเป็น 119B total parameters, 6.5B active
- ความยาวคอนเท็กซ์คือ 256k
- รายการราคาแสดงเป็น $0
- การจัดหมวดหมู่รีลีสคือ Labs v1.5
API สำหรับบทสนทนา เอเจนต์ และ Structured Output
- Chat Completions:
/v1/chat/completions - Function Calling:
/v1/chat/completions,/v1/conversations - Agents & Conversations:
/v1/agents,/v1/conversations - Built-In Tools:
/v1/agents,/v1/conversations - Structured Outputs:
/v1/chat/completions,/v1/conversations - Predicted Outputs:
/v1/chat/completions,/v1/conversations - Prefix:
/v1/chat/completions,/v1/conversations
การประมวลผลเอกสาร การเติมโค้ด และ Embeddings
- OCR:
/v1/ocr - Annotations - Structured:
/v1/ocr - BBox Extraction:
/v1/ocr - Document QnA:
/v1/chat/completions,/v1/conversations - FIM:
/v1/fim/completions - Embeddings:
/v1/embeddings
ความปลอดภัย เสียง และการประมวลผลแบบแบตช์
- Moderations:
/v1/moderations - Chat Moderations:
/v1/chat/moderations - Transcriptions:
/v1/audio/transcriptions - Text to Speech:
/v1/audio/speech - Timestamps:
/v1/audio/transcriptions - Batching:
/v1/batch
1 ความคิดเห็น
ความคิดเห็นจาก Hacker News
สงสัยเลยสมัคร ใส่เงินเข้าบัญชี แล้วลองใช้ดู แต่ใช้ไม่ได้ เห็นบอกว่าเป็นโมเดล Labs เลยพยายามเปิด Labs คราวนี้กลับขึ้น ข้อผิดพลาดที่ไม่ทราบสาเหตุ พอจะติดต่อฝ่ายสนับสนุนตามคำแนะนำ ก็ไม่มีฝ่ายสนับสนุน มีแต่ FAQ ที่ทำมาแบบลวก ๆ
FAQ ดูเหมือนเขียนด้วย vibe coding และระบบค้นหาก็แย่มาก ไม่ว่าจะใส่คำถามอะไร ก็ได้แต่คำตอบที่ไม่เกี่ยวข้องเลย แล้วผมก็นึกได้ว่า ถ้า AI เก่งเรื่องบริการลูกค้าจริง ทำไม บริษัท AI ถึงไม่ใช้ AI ของตัวเองให้บริการลูกค้าล่ะ?
[1]: https://news.ycombinator.com/item?id=43683012
จากมุมมองของบริษัทที่รำคาญว่าต้องเสียเงินไปแก้ปัญหาจริง ๆ นี่ก็ถือเป็นบริการลูกค้าที่ “ดี” แล้ว
ตลอด 1 ปีที่ติดต่อกับผู้รับผิดชอบคนนี้ นี่เป็นอีเมลตอบกลับอัตโนมัติเรื่องลาพักร้อนครั้งที่สี่แล้ว
ตัวอย่างมีแค่สองรายก็จริง แต่ทำให้ผมสันนิษฐานว่าบริษัทฝรั่งเศสไม่ค่อยชอบให้ติดต่อเป็นภาษาอังกฤษ
ออกนอกเรื่องนิดหน่อย แต่ค่อนข้างเศร้าที่ EU แทบไม่มีอะไรในตลาด LLM ระดับ frontier จริง ๆ โดยเฉพาะเมื่อคิดถึงเรื่องล่าสุดที่สหรัฐฯ จำกัดการเข้าถึงโมเดลระดับล้ำหน้าจริง ๆ อย่างสิ้นเชิง
นี่เป็นเพราะขาดเงินทุนและโครงสร้างพื้นฐานล้วน ๆ หรือเปล่า?
แทนที่จะดูว่าเศรษฐกิจ EU ทั้งหมดจะมีส่วนกับโมเดลระดับ frontier ได้แค่ไหน การดูว่า เศรษฐกิจฝรั่งเศส จะมีส่วนได้แค่ไหนแล้วเทียบกับสหรัฐฯ หรือจีนจะถูกต้องกว่า ขนาดมันไม่พอ แต่ควรดูว่าพวกเขาทำอะไรได้บ้างจากขนาดที่เล็กกว่านั้น และ ผลิตภัณฑ์เฉพาะทาง อย่าง Leanstral, Voxtral ก็คือผลลัพธ์แบบนั้น
ฝรั่งเศสและเยอรมนีเป็นเศรษฐกิจที่ใหญ่ที่สุดใน EU ฝรั่งเศสมี Mistral ส่วนเยอรมนีมีหน่วยงานลักษณะเวนเจอร์แคปิตอลที่ได้รับการสนับสนุนจากรัฐ หน่วยงานนั้นภูมิใจมากที่ประกาศเงินถึง 125 ล้านยูโร (<150 ล้านดอลลาร์) เพื่อช่วยให้นักวิจัยยุโรปสร้าง frontier ใหม่ในโมเดลอธิปไตย[1]
เงินนั้นก็ไม่ได้ให้ผู้ชนะรายเดียว แต่แบ่งให้ผู้รับหลายราย เป็นก้าวแรกที่ดี แต่ถ้าพูดให้ตรง น่าจะเป็นก้าวแรกที่เหมาะเมื่อ 3–4 ปีก่อน น่าเสียดายจริง ๆ
[1] (ภาษาเยอรมัน) https://www.sprind.org/worte/magazin/verkuendung-next-fronti...
เราอยู่ใน เศรษฐกิจอาณานิคม ที่ใช้ทุนมนุษย์เป็นวัตถุดิบ และทุกอย่างไหลไปสหรัฐฯ ถ้าจะหลีกเลี่ยง ก็ต้องเลิกเล่นเกมแบบปัจจุบัน แล้วสร้างอุตสาหกรรมที่แข่งขันได้ด้วยนโยบายอุตสาหกรรมจริงจังแบบจีน ตลอดหลายทศวรรษที่ผ่านมาไม่มีเจตจำนงแบบนั้น แต่ Trump ได้แสดงให้เห็นอย่างชัดเจนถึงการกลับมาของรัฐ และยุโรปก็ค่อย ๆ ยอมรับเรื่องนี้อยู่
ส่วนที่ยากคือการอธิบายความคุ้มค่าทางการเงินของการพัฒนา LLM ล้วน ๆ โมเดลต่าง ๆ คล้ายกันมาก OpenAI ตอนแรกอธิบายตัวเองว่าเป็น “องค์กรการกุศล” เพื่อการวิจัยล้วน ๆ ส่วน Anthropic แยกออกมาโดยบอกว่า OpenAI ไม่ใส่ใจเรื่องความปลอดภัยมากพอ Elon บอกว่าถ้าเขาไม่สร้าง Grok ขึ้นมา AI ก็จะแกล้งตื่นรู้และไม่ซื่อสัตย์ต่อความจริง ส่วน Google สร้าง Gemini เพราะเดิมทีพวกเขาเป็นจุดเริ่มต้น และงานวิจัย AI เป็นภารกิจหลักที่ Larry กับ Sergey มอบไว้ตั้งแต่ก่อตั้งบริษัท เพียงแต่ถูกพักไว้ช่วงหนึ่งด้วยเหตุผลทางการเงิน
แรงจูงใจของโมเดลจีนพูดตรง ๆ คือไม่ชัดเจน ผมยังไม่เคยเห็นคำอธิบายที่ดี มีแต่สมมติฐาน แต่ดูจากการปล่อยฟรีหรือขายถูกเกินไป แรงจูงใจก็คงไม่ใช่เรื่องการเงิน
ในทางกลับกัน Mistral เป็นบริษัททั่วไป ไม่มีผู้สนับสนุนมหาเศรษฐีที่เชื่อในเรื่องเล่าระดับชะตากรรมจักรวาลแล้วเทเงินให้ ดังนั้นสิ่งที่ทำต้องอธิบายได้ด้วย ผลตอบแทนจากการลงทุน และนั่นแทบจะตัดการฝึก LLM ขนาดใหญ่ออกไป
ต้องพิจารณากฎระเบียบของ EU ด้วย เมื่อก่อนผมเคยลองค้นดู มีข้อบังคับแปลก ๆ มากมายที่ทำลายความเป็นไปได้ของอุตสาหกรรมเทคโนโลยียุโรป ในสหราชอาณาจักรมีกฎว่าการ crawl อินเทอร์เน็ตทำได้เฉพาะเพื่อการวิจัยเท่านั้นด้วย
https://knowledgerights21.org/news-story/the-uks-copyright-l...
และถ้าไม่มี First Amendment ความเสี่ยงที่จะถูกดำเนินคดีเพราะสิ่งที่โมเดลพูดก็สูงกว่ามาก ดูกรณีที่เยอรมนีพา Google ขึ้นศาลเพราะเนื้อหาที่โมเดลใส่ไว้ในหน้าผลการค้นหาก็ได้
ดังนั้นผลประโยชน์ไม่ชัดเจน แต่ความเสี่ยงทางกฎหมายสูงมาก
ในยุโรปจะระดมทุน 100 พันล้านดอลลาร์ ให้แล็บวิจัยใหม่แห่งเดียวได้ไหม? ถ้าไม่ได้ ก็จบแล้ว และยอมแพ้ได้เลย
บังเอิญจัง เช้านี้เพิ่งปล่อย OpenATP พอดี OpenATP เป็นแพ็กเกจ Python แบบโอเพนซอร์สและ CLI สำหรับ automated theorem prover แบบเอเจนต์
รวมถึงรองรับ Leanstral ผ่าน Vibe harness ของ Mistral ด้วย โมเดล Leanstral สำหรับโปรดักชันตัวก่อนถูกเลิกใช้ไปเมื่อวันที่ 22 พฤษภาคม และจะอัปเดตแพ็กเกจให้ชี้ไปที่ Leanstral 1.5 ให้เร็วที่สุด
GitHub: https://github.com/henryrobbins/open-atp
Docs: https://open-atp.henryrobbins.com
404 หรือเปล่า?
https://web.archive.org/web/20260630223430/https://docs.mist...
ยังไม่ค่อยเข้าใจ นโยบายเรื่อง weights เท่าไร เว็บไซต์นี้บอกว่า weights ใช้ไลเซนส์ Apache เลยดูเหมือนเป็น weights แบบเปิด แต่หาลิงก์ดาวน์โหลดไม่เจอ
โปรไฟล์ Hugging Face ดูเหมือนจะมีแค่สแนปช็อตก่อนหน้าเท่านั้น[0] มีใครรู้ไหมว่า weights ดาวน์โหลดได้หรือไม่ และถ้าได้ ดาวน์โหลดจากที่ไหน?
[0] https://huggingface.co/mistralai/Leanstral-2603
ผมก็ขึ้น “Page not found” เหมือนกัน เข้าถึงได้แล้วเหรอ? เนื้อหาเกี่ยวกับอะไร?
เป็น โมเดลวิศวกรรมพิสูจน์เชิงรูปแบบ Lean 4 ที่อัปเดตแล้ว และปรับแต่งมาเพื่อ automated theorem proving กับ autoformalization รวมพารามิเตอร์ทั้งหมด 119B ใช้งานจริง 6.5B
https://web.archive.org/web/20260630223430/https://docs.mist...
การสนทนาเกี่ยวกับ Leanstral 1: https://news.ycombinator.com/item?id=47404796
Lean 4 และ Idris 2 ถูกประเมินค่าต่ำเกินไป และเพราะให้การรับประกันเพิ่มเติม จึงน่าจะเหมาะมากให้ LLM ใช้เขียนโค้ด
ตอนนี้ขึ้น 404
สมัครมาเพราะข่าวนี้เลย แต่ถ้าจะใช้ “Code” ต้อง เชื่อมต่อ GitHub ด้วยเหรอ? ดูจำกัดเกินไปมาก