8 คะแนน โดย xguru 2024-09-13 | 4 ความคิดเห็น | แชร์ทาง WhatsApp
  • โมเดลการให้เหตุผลแบบใหม่สำหรับแก้ปัญหาที่ซับซ้อน
  • โมเดลถูกฝึกให้ใช้เวลาคิดกับปัญหานานขึ้นก่อนตอบ
  • ผ่านการฝึกเพื่อปรับปรุงกระบวนการคิด ลองใช้กลยุทธ์ที่หลากหลาย และเรียนรู้วิธีรับรู้ข้อผิดพลาด
  • แสดงประสิทธิภาพใกล้เคียงนักศึกษาปริญญาเอกในงานเบนช์มาร์กที่ท้าทายในสาขาฟิสิกส์ เคมี และชีววิทยา
  • ทำผลงานได้โดดเด่นในด้านคณิตศาสตร์และการเขียนโค้ดด้วย
    • ในการสอบคัดเลือกโอลิมปิกคณิตศาสตร์นานาชาติ (IMO) GPT-4o ตอบถูกเพียง 13% ขณะที่โมเดลการให้เหตุผลตอบถูก 83%
    • ความสามารถด้านการเขียนโค้ดบนการแข่งขัน Codeforces ไปถึงเปอร์เซ็นไทล์ที่ 89

ความปลอดภัย

  • คิดค้นแนวทางการฝึกด้านความปลอดภัยแบบใหม่เพื่อให้โมเดลปฏิบัติตามแนวทางด้านความปลอดภัยและการจัดแนว
  • ในหนึ่งในการทดสอบการเจลเบรกที่ยากที่สุด GPT-4o ได้ 22 คะแนน (จาก 100 คะแนน) ขณะที่โมเดล o1-preview ได้ 84 คะแนน
  • เสริมความแข็งแกร่งให้กับงานด้านความปลอดภัย ธรรมาภิบาลภายใน และความร่วมมือกับรัฐบาลกลาง
    • การทดสอบและประเมินอย่างเข้มงวดโดยใช้ Preparedness Framework
    • การดำเนินงานเรดทีมระดับสูงสุด
    • กระบวนการทบทวนในระดับคณะกรรมการบริษัท รวมถึง Safety & Security Committee
  • ได้ลงนามข้อตกลงและเริ่มดำเนินงานร่วมกับสถาบันวิจัยความปลอดภัย AI ของสหรัฐฯ และสหราชอาณาจักร

โมเดลนี้เหมาะกับใคร

  • อาจมีประโยชน์อย่างยิ่งเมื่อรับมือกับปัญหาที่ซับซ้อนในสาขาอย่างวิทยาศาสตร์ การเขียนโค้ด และคณิตศาสตร์
  • ตัวอย่างเช่น
    • นักวิจัยด้านเฮลธ์แคร์สามารถใช้ใส่คำอธิบายประกอบให้ข้อมูลการจัดลำดับเซลล์
    • นักฟิสิกส์สามารถใช้สร้างสูตรคณิตศาสตร์ที่ซับซ้อนซึ่งจำเป็นต่อควอนตัมออปติกส์
    • นักพัฒนาสามารถใช้สร้างและรันเวิร์กโฟลว์หลายขั้นตอนได้

OpenAI o1-mini

  • ซีรีส์ o1 โดดเด่นในการสร้างและดีบักโค้ดที่ซับซ้อนได้อย่างแม่นยำ
  • เพื่อมอบโซลูชันที่มีประสิทธิภาพมากขึ้นให้แก่นักพัฒนา จึงเปิดตัวโมเดลการให้เหตุผลที่เร็วและถูกกว่าชื่อ o1-mini ด้วย
  • o1-mini มีราคาถูกกว่า o1-preview อยู่ 80%
    • เป็นโมเดลที่ทรงพลังและคุ้มค่าต้นทุนสำหรับแอปพลิเคชันที่ต้องการการให้เหตุผล แต่ไม่จำเป็นต้องมีความรู้รอบโลกอย่างกว้างขวาง

วิธีใช้งาน OpenAI o1

  • ผู้ใช้ ChatGPT Plus และ Team สามารถเข้าถึงโมเดล o1 บน ChatGPT ได้ตั้งแต่วันนี้
  • สามารถเลือกทั้ง o1-preview และ o1-mini ได้ด้วยตนเอง
  • ณ ช่วงเปิดตัว o1-preview มีข้อจำกัด 30 ข้อความต่อสัปดาห์ และ o1-mini มีข้อจำกัด 50 ข้อความต่อสัปดาห์
  • ผู้ใช้ ChatGPT Enterprise และ Edu จะเข้าถึงทั้งสองโมเดลได้ตั้งแต่สัปดาห์หน้า
  • นักพัฒนาที่อยู่ในระดับการใช้งาน API ระดับ 5 สามารถเริ่มทำต้นแบบด้วยทั้งสองโมเดลบน API ได้ตั้งแต่วันนี้ โดยมีข้อจำกัดอัตราที่ 20 RPM
  • API ของโมเดลเหล่านี้ยังไม่รวมฟีเจอร์อย่าง function calling, สตรีมมิง และการรองรับ system message ในขณะนี้
  • มีแผนจะเปิดให้ผู้ใช้ ChatGPT Free ทุกคนเข้าถึง o1-mini

แผนในอนาคต

  • นี่คือพรีวิวระยะแรกของโมเดลการให้เหตุผลสำหรับ ChatGPT และ API
  • นอกจากการอัปเดตโมเดลแล้ว ยังมีแผนเพิ่มฟีเจอร์อย่างการท่องเว็บ การอัปโหลดไฟล์ และการอัปโหลดภาพ เพื่อให้มีประโยชน์กับทุกคนมากขึ้น
  • มีแผนจะพัฒนาและเปิดตัวโมเดลในซีรีส์ GPT ควบคู่ไปกับซีรีส์ OpenAI o1 ใหม่ต่อไป

4 ความคิดเห็น

 
dbs0829 2024-09-13

น่าสงสัยว่าจะเกิดซินเนอร์จีกับ GitHub Copilot ยังไงบ้าง

 
wedding 2024-09-13

นี่คือ Strawberry ที่ลือกันอยู่นั่นเองใช่ไหม?

 
brainer 2024-09-13

ใช่แล้ว Altman ปลอบใจคนที่ปล่อยข่าวลือนั้น

 
xguru 2024-09-13

น่าจะใช่ครับ เหมือนเขาจะเลือกใช้เลขเวอร์ชันใหม่เป็น 1 เพื่อจะได้โฟกัสไปที่การให้เหตุผลล้วน ๆ