- โมเดลการให้เหตุผลแบบใหม่สำหรับแก้ปัญหาที่ซับซ้อน
- โมเดลถูกฝึกให้ใช้เวลาคิดกับปัญหานานขึ้นก่อนตอบ
- ผ่านการฝึกเพื่อปรับปรุงกระบวนการคิด ลองใช้กลยุทธ์ที่หลากหลาย และเรียนรู้วิธีรับรู้ข้อผิดพลาด
- แสดงประสิทธิภาพใกล้เคียงนักศึกษาปริญญาเอกในงานเบนช์มาร์กที่ท้าทายในสาขาฟิสิกส์ เคมี และชีววิทยา
- ทำผลงานได้โดดเด่นในด้านคณิตศาสตร์และการเขียนโค้ดด้วย
- ในการสอบคัดเลือกโอลิมปิกคณิตศาสตร์นานาชาติ (IMO) GPT-4o ตอบถูกเพียง 13% ขณะที่โมเดลการให้เหตุผลตอบถูก 83%
- ความสามารถด้านการเขียนโค้ดบนการแข่งขัน Codeforces ไปถึงเปอร์เซ็นไทล์ที่ 89
ความปลอดภัย
- คิดค้นแนวทางการฝึกด้านความปลอดภัยแบบใหม่เพื่อให้โมเดลปฏิบัติตามแนวทางด้านความปลอดภัยและการจัดแนว
- ในหนึ่งในการทดสอบการเจลเบรกที่ยากที่สุด GPT-4o ได้ 22 คะแนน (จาก 100 คะแนน) ขณะที่โมเดล o1-preview ได้ 84 คะแนน
- เสริมความแข็งแกร่งให้กับงานด้านความปลอดภัย ธรรมาภิบาลภายใน และความร่วมมือกับรัฐบาลกลาง
- การทดสอบและประเมินอย่างเข้มงวดโดยใช้ Preparedness Framework
- การดำเนินงานเรดทีมระดับสูงสุด
- กระบวนการทบทวนในระดับคณะกรรมการบริษัท รวมถึง Safety & Security Committee
- ได้ลงนามข้อตกลงและเริ่มดำเนินงานร่วมกับสถาบันวิจัยความปลอดภัย AI ของสหรัฐฯ และสหราชอาณาจักร
โมเดลนี้เหมาะกับใคร
- อาจมีประโยชน์อย่างยิ่งเมื่อรับมือกับปัญหาที่ซับซ้อนในสาขาอย่างวิทยาศาสตร์ การเขียนโค้ด และคณิตศาสตร์
- ตัวอย่างเช่น
- นักวิจัยด้านเฮลธ์แคร์สามารถใช้ใส่คำอธิบายประกอบให้ข้อมูลการจัดลำดับเซลล์
- นักฟิสิกส์สามารถใช้สร้างสูตรคณิตศาสตร์ที่ซับซ้อนซึ่งจำเป็นต่อควอนตัมออปติกส์
- นักพัฒนาสามารถใช้สร้างและรันเวิร์กโฟลว์หลายขั้นตอนได้
OpenAI o1-mini
- ซีรีส์ o1 โดดเด่นในการสร้างและดีบักโค้ดที่ซับซ้อนได้อย่างแม่นยำ
- เพื่อมอบโซลูชันที่มีประสิทธิภาพมากขึ้นให้แก่นักพัฒนา จึงเปิดตัวโมเดลการให้เหตุผลที่เร็วและถูกกว่าชื่อ o1-mini ด้วย
- o1-mini มีราคาถูกกว่า o1-preview อยู่ 80%
- เป็นโมเดลที่ทรงพลังและคุ้มค่าต้นทุนสำหรับแอปพลิเคชันที่ต้องการการให้เหตุผล แต่ไม่จำเป็นต้องมีความรู้รอบโลกอย่างกว้างขวาง
วิธีใช้งาน OpenAI o1
- ผู้ใช้ ChatGPT Plus และ Team สามารถเข้าถึงโมเดล o1 บน ChatGPT ได้ตั้งแต่วันนี้
- สามารถเลือกทั้ง o1-preview และ o1-mini ได้ด้วยตนเอง
- ณ ช่วงเปิดตัว o1-preview มีข้อจำกัด 30 ข้อความต่อสัปดาห์ และ o1-mini มีข้อจำกัด 50 ข้อความต่อสัปดาห์
- ผู้ใช้ ChatGPT Enterprise และ Edu จะเข้าถึงทั้งสองโมเดลได้ตั้งแต่สัปดาห์หน้า
- นักพัฒนาที่อยู่ในระดับการใช้งาน API ระดับ 5 สามารถเริ่มทำต้นแบบด้วยทั้งสองโมเดลบน API ได้ตั้งแต่วันนี้ โดยมีข้อจำกัดอัตราที่ 20 RPM
- API ของโมเดลเหล่านี้ยังไม่รวมฟีเจอร์อย่าง function calling, สตรีมมิง และการรองรับ system message ในขณะนี้
- มีแผนจะเปิดให้ผู้ใช้ ChatGPT Free ทุกคนเข้าถึง o1-mini
แผนในอนาคต
- นี่คือพรีวิวระยะแรกของโมเดลการให้เหตุผลสำหรับ ChatGPT และ API
- นอกจากการอัปเดตโมเดลแล้ว ยังมีแผนเพิ่มฟีเจอร์อย่างการท่องเว็บ การอัปโหลดไฟล์ และการอัปโหลดภาพ เพื่อให้มีประโยชน์กับทุกคนมากขึ้น
- มีแผนจะพัฒนาและเปิดตัวโมเดลในซีรีส์ GPT ควบคู่ไปกับซีรีส์ OpenAI o1 ใหม่ต่อไป
4 ความคิดเห็น
น่าสงสัยว่าจะเกิดซินเนอร์จีกับ GitHub Copilot ยังไงบ้าง
นี่คือ Strawberry ที่ลือกันอยู่นั่นเองใช่ไหม?
ใช่แล้ว Altman ปลอบใจคนที่ปล่อยข่าวลือนั้น
น่าจะใช่ครับ เหมือนเขาจะเลือกใช้เลขเวอร์ชันใหม่เป็น 1 เพื่อจะได้โฟกัสไปที่การให้เหตุผลล้วน ๆ