OpenAI เปิดตัวพรีวิวโมเดล o1 ที่คิดนานขึ้นก่อนตอบ

xguru · 2024-09-13T08:50:46+09:00

โมเดลการให้เหตุผลแบบใหม่สำหรับแก้ปัญหาที่ซับซ้อน โมเดลถูกฝึกให้ใช้เวลาคิดกับปัญหานานขึ้นก่อนตอบ ผ่านการฝึกเพื่อปรับปรุงกระบวนการคิด ลองใช้กลยุทธ์ที่หลากหลาย และเรียนรู้วิธีรับรู้ข้อผิดพลาด แสดงประสิทธิภาพใกล้เคียงนักศึกษาปริญญาเอกในงานเบนช์มาร์กที่ท้าทายในสาขาฟิสิกส์ เคมี และชีววิทยา ทำผลงานได้โดดเด่นในด้านคณิตศาสตร์และการเขียนโค้ดด้วย ในการสอบคัดเลือกโอลิมปิกคณิตศาสตร์นานาชาติ (IMO) GPT-4o ตอบถูกเพียง 13% ขณะที่โมเดลการให้เหตุผลตอบถูก 83% ความสามารถด้านการเขียนโค้ดบนการแข่งขัน Codeforces ไปถึงเปอร์เซ็นไทล์ที่ 89 ความปลอดภัย คิดค้นแนวทางการฝึกด้านความปลอดภัยแบบใหม่เพื่อให้โมเดลปฏิบัติตามแนวทางด้านความปลอดภัยและการจัดแนว ในหนึ่งในการทดสอบการเจลเบรกที่ยากที่สุด GPT-4o ได้ 22 คะแนน (จาก 100 คะแนน) ขณะที่โมเดล o1-preview ได้ 84 คะแนน เสริมความแข็งแกร่งให้กับงานด้านความปลอดภัย ธรรมาภิบาลภายใน และความร่วมมือกับรัฐบาลกลาง การทดสอบและประเมินอย่างเข้มงวดโดยใช้ Preparedness Framework การดำเนินงานเรดทีมระดับสูงสุด กระบวนการทบทวนในระดับคณะกรรมการบริษัท รวมถึง Safety & Security Committee ได้ลงนามข้อตกลงและเริ่มดำเนินงานร่วมกับสถาบันวิจัยความปลอดภัย AI ของสหรัฐฯ และสหราชอาณาจักร โมเดลนี้เหมาะกับใคร อาจมีประโยชน์อย่างยิ่งเมื่อรับมือกับปัญหาที่ซับซ้อนในสาขาอย่างวิทยาศาสตร์ การเขียนโค้ด และคณิตศาสตร์ ตัวอย่างเช่น นักวิจัยด้านเฮลธ์แคร์สามารถใช้ใส่คำอธิบายประกอบให้ข้อมูลการจัดลำดับเซลล์ นักฟิสิกส์สามารถใช้สร้างสูตรคณิตศาสตร์ที่ซับซ้อนซึ่งจำเป็นต่อควอนตัมออปติกส์ นักพัฒนาสามารถใช้สร้างและรันเวิร์กโฟลว์หลายขั้นตอนได้ OpenAI o1-mini ซีรีส์ o1 โดดเด่นในการสร้างและดีบักโค้ดที่ซับซ้อนได้อย่างแม่นยำ เพื่อมอบโซลูชันที่มีประสิทธิภาพมากขึ้นให้แก่นักพัฒนา จึงเปิดตัวโมเดลการให้เหตุผลที่เร็วและถูกกว่าชื่อ o1-mini ด้วย o1-mini มีราคาถูกกว่า o1-preview อยู่ 80% เป็นโมเดลที่ทรงพลังและคุ้มค่าต้นทุนสำหรับแอปพลิเคชันที่ต้องการการให้เหตุผล แต่ไม่จำเป็นต้องมีความรู้รอบโลกอย่างกว้างขวาง วิธีใช้งาน OpenAI o1 ผู้ใช้ ChatGPT Plus และ Team สามารถเข้าถึงโมเดล o1 บน ChatGPT ได้ตั้งแต่วันนี้ สามารถเลือกทั้ง o1-preview และ o1-mini ได้ด้วยตนเอง ณ ช่วงเปิดตัว o1-preview มีข้อจำกัด 30 ข้อความต่อสัปดาห์ และ o1-mini มีข้อจำกัด 50 ข้อความต่อสัปดาห์ ผู้ใช้ ChatGPT Enterprise และ Edu จะเข้าถึงทั้งสองโมเดลได้ตั้งแต่สัปดาห์หน้า นักพัฒนาที่อยู่ในระดับการใช้งาน API ระดับ 5 สามารถเริ่มทำต้นแบบด้วยทั้งสองโมเดลบน API ได้ตั้งแต่วันนี้ โดยมีข้อจำกัดอัตราที่ 20 RPM API ของโมเดลเหล่านี้ยังไม่รวมฟีเจอร์อย่าง function calling, สตรีมมิง และการรองรับ system message ในขณะนี้ มีแผนจะเปิดให้ผู้ใช้ ChatGPT Free ทุกคนเข้าถึง o1-mini แผนในอนาคต นี่คือพรีวิวระยะแรกของโมเดลการให้เหตุผลสำหรับ ChatGPT และ API นอกจากการอัปเดตโมเดลแล้ว ยังมีแผนเพิ่มฟีเจอร์อย่างการท่องเว็บ การอัปโหลดไฟล์ และการอัปโหลดภาพ เพื่อให้มีประโยชน์กับทุกคนมากขึ้น มีแผนจะพัฒนาและเปิดตัวโมเดลในซีรีส์ GPT ควบคู่ไปกับซีรีส์ OpenAI o1 ใหม่ต่อไป

(openai.com)

8 คะแนน โดย xguru 2024-09-13 | 4 ความคิดเห็น | แชร์ทาง WhatsApp

โมเดลการให้เหตุผลแบบใหม่สำหรับแก้ปัญหาที่ซับซ้อน
โมเดลถูกฝึกให้ใช้เวลาคิดกับปัญหานานขึ้นก่อนตอบ
ผ่านการฝึกเพื่อปรับปรุงกระบวนการคิด ลองใช้กลยุทธ์ที่หลากหลาย และเรียนรู้วิธีรับรู้ข้อผิดพลาด
แสดงประสิทธิภาพใกล้เคียงนักศึกษาปริญญาเอกในงานเบนช์มาร์กที่ท้าทายในสาขาฟิสิกส์ เคมี และชีววิทยา
ทำผลงานได้โดดเด่นในด้านคณิตศาสตร์และการเขียนโค้ดด้วย
- ในการสอบคัดเลือกโอลิมปิกคณิตศาสตร์นานาชาติ (IMO) GPT-4o ตอบถูกเพียง 13% ขณะที่โมเดลการให้เหตุผลตอบถูก 83%
- ความสามารถด้านการเขียนโค้ดบนการแข่งขัน Codeforces ไปถึงเปอร์เซ็นไทล์ที่ 89

ความปลอดภัย

คิดค้นแนวทางการฝึกด้านความปลอดภัยแบบใหม่เพื่อให้โมเดลปฏิบัติตามแนวทางด้านความปลอดภัยและการจัดแนว
ในหนึ่งในการทดสอบการเจลเบรกที่ยากที่สุด GPT-4o ได้ 22 คะแนน (จาก 100 คะแนน) ขณะที่โมเดล o1-preview ได้ 84 คะแนน
เสริมความแข็งแกร่งให้กับงานด้านความปลอดภัย ธรรมาภิบาลภายใน และความร่วมมือกับรัฐบาลกลาง
- การทดสอบและประเมินอย่างเข้มงวดโดยใช้ Preparedness Framework
- การดำเนินงานเรดทีมระดับสูงสุด
- กระบวนการทบทวนในระดับคณะกรรมการบริษัท รวมถึง Safety & Security Committee
ได้ลงนามข้อตกลงและเริ่มดำเนินงานร่วมกับสถาบันวิจัยความปลอดภัย AI ของสหรัฐฯ และสหราชอาณาจักร

โมเดลนี้เหมาะกับใคร

อาจมีประโยชน์อย่างยิ่งเมื่อรับมือกับปัญหาที่ซับซ้อนในสาขาอย่างวิทยาศาสตร์ การเขียนโค้ด และคณิตศาสตร์
ตัวอย่างเช่น
- นักวิจัยด้านเฮลธ์แคร์สามารถใช้ใส่คำอธิบายประกอบให้ข้อมูลการจัดลำดับเซลล์
- นักฟิสิกส์สามารถใช้สร้างสูตรคณิตศาสตร์ที่ซับซ้อนซึ่งจำเป็นต่อควอนตัมออปติกส์
- นักพัฒนาสามารถใช้สร้างและรันเวิร์กโฟลว์หลายขั้นตอนได้

OpenAI o1-mini

ซีรีส์ o1 โดดเด่นในการสร้างและดีบักโค้ดที่ซับซ้อนได้อย่างแม่นยำ
เพื่อมอบโซลูชันที่มีประสิทธิภาพมากขึ้นให้แก่นักพัฒนา จึงเปิดตัวโมเดลการให้เหตุผลที่เร็วและถูกกว่าชื่อ o1-mini ด้วย
o1-mini มีราคาถูกกว่า o1-preview อยู่ 80%
- เป็นโมเดลที่ทรงพลังและคุ้มค่าต้นทุนสำหรับแอปพลิเคชันที่ต้องการการให้เหตุผล แต่ไม่จำเป็นต้องมีความรู้รอบโลกอย่างกว้างขวาง

วิธีใช้งาน OpenAI o1

ผู้ใช้ ChatGPT Plus และ Team สามารถเข้าถึงโมเดล o1 บน ChatGPT ได้ตั้งแต่วันนี้
สามารถเลือกทั้ง o1-preview และ o1-mini ได้ด้วยตนเอง
ณ ช่วงเปิดตัว o1-preview มีข้อจำกัด 30 ข้อความต่อสัปดาห์ และ o1-mini มีข้อจำกัด 50 ข้อความต่อสัปดาห์
ผู้ใช้ ChatGPT Enterprise และ Edu จะเข้าถึงทั้งสองโมเดลได้ตั้งแต่สัปดาห์หน้า
นักพัฒนาที่อยู่ในระดับการใช้งาน API ระดับ 5 สามารถเริ่มทำต้นแบบด้วยทั้งสองโมเดลบน API ได้ตั้งแต่วันนี้ โดยมีข้อจำกัดอัตราที่ 20 RPM
API ของโมเดลเหล่านี้ยังไม่รวมฟีเจอร์อย่าง function calling, สตรีมมิง และการรองรับ system message ในขณะนี้
มีแผนจะเปิดให้ผู้ใช้ ChatGPT Free ทุกคนเข้าถึง o1-mini

แผนในอนาคต

นี่คือพรีวิวระยะแรกของโมเดลการให้เหตุผลสำหรับ ChatGPT และ API
นอกจากการอัปเดตโมเดลแล้ว ยังมีแผนเพิ่มฟีเจอร์อย่างการท่องเว็บ การอัปโหลดไฟล์ และการอัปโหลดภาพ เพื่อให้มีประโยชน์กับทุกคนมากขึ้น
มีแผนจะพัฒนาและเปิดตัวโมเดลในซีรีส์ GPT ควบคู่ไปกับซีรีส์ OpenAI o1 ใหม่ต่อไป

4 ความคิดเห็น

dbs0829 2024-09-13

น่าสงสัยว่าจะเกิดซินเนอร์จีกับ GitHub Copilot ยังไงบ้าง

wedding 2024-09-13

นี่คือ Strawberry ที่ลือกันอยู่นั่นเองใช่ไหม?

brainer 2024-09-13

ใช่แล้ว Altman ปลอบใจคนที่ปล่อยข่าวลือนั้น

xguru 2024-09-13

น่าจะใช่ครับ เหมือนเขาจะเลือกใช้เลขเวอร์ชันใหม่เป็น 1 เพื่อจะได้โฟกัสไปที่การให้เหตุผลล้วน ๆ