4 คะแนน โดย GN⁺ 2025-03-21 | 1 ความคิดเห็น | แชร์ทาง WhatsApp
  • โทเค็นอินพุต $150, โทเค็นเอาต์พุต $600 (ต่อ 1 ล้านโทเค็น)
    • แพงกว่า o1-mini 150 เท่า
  • โมเดลตระกูล o1 ได้รับการฝึกด้วยการเรียนรู้แบบเสริมกำลัง (Reinforcement Learning) เพื่อให้คิดก่อนตอบและทำการให้เหตุผลที่ซับซ้อนได้
    • โมเดล o1-pro ใช้ทรัพยากรการประมวลผลมากขึ้นเพื่อคิดได้ลึกกว่าเดิมและให้คำตอบคุณภาพสูงอย่างสม่ำเสมอ
  • ใช้งานได้เฉพาะใน Responses API และรองรับความสามารถต่อไปนี้
    • รองรับการเรียกใช้หลายเครื่องมือ
    • รองรับการโต้ตอบของโมเดลหลายเทิร์นก่อนตอบกลับคำขอ API
  • หน้าต่างคอนเท็กซ์ 200,000 และจำนวนโทเค็นเอาต์พุตสูงสุด 100,000
  • วันตัดข้อมูลคือ 1 ตุลาคม 2023

1 ความคิดเห็น

 
GN⁺ 2025-03-21
ความคิดเห็นบน Hacker News
  • โมเดลนี้ใช้งานได้ผ่าน Responses API ใหม่เท่านั้น หากคุณมีโค้ดที่ใช้ Chat Completions อยู่ ก็ต้องอัปเกรดเป็น Responses เพื่อรองรับมัน
    • อาจต้องใช้เวลาสักหน่อยในการเพิ่มการรองรับในเครื่องมือ LLM ของฉัน
  • ราคา: โทเคนอินพุต 1 ล้านโทเคน ราคา $150, โทเคนเอาต์พุต 1 ล้านโทเคน ราคา $600
    • แพงมาก แต่จากการลองใช้ร่วมกับการสมัคร ChatGPT Pro แล้ว มันมีความสามารถอย่างน่าทึ่ง
    • ถ้าให้โค้ดเบสขนาด 100,000 โทเคน มันสามารถหาบั๊กเล็กๆ ที่ฉันมองข้ามไปโดยสิ้นเชิงได้
    • เมื่อเทียบราคาระดับ API กับค่าสมัครสมาชิกที่ฉันจ่ายอยู่ ก็รู้สึกเกรงใจนิดหน่อย
  • การเรนเดอร์ SVG รูปนกกระทุงปั่นจักรยานมีค่าใช้จ่าย 94 เซนต์
  • ถ้าสมมติว่าพนักงานออฟฟิศที่มีแรงจูงใจและเงินเดือน $160k ใช้เวลาวันละ 6 ชั่วโมงไปกับการฟังหรือพูด ต้นทุนต่อ 1 ล้านโทเคนจะอยู่ที่ประมาณ $10k
    • ตอนนี้ OpenAI ไปถึงระดับราคาที่ใกล้เคียงกับมนุษย์ผู้เชี่ยวชาญทักษะสูงสำหรับโมเดลแนวหน้าของพวกเขาแล้ว
    • o3 pro อาจเปลี่ยนสถานการณ์นี้ได้ แต่ฉันคิดว่าถ้า o3 ใกล้ออกมากจริงๆ พวกเขาคงไม่ปล่อยโมเดลนี้
  • มี knowledge cutoff อยู่ที่ปี 2023 และมี context window 200k
    • ค่อนข้างน่าผิดหวัง
  • o1-pro ยังยอดเยี่ยมอยู่แม้เทียบกับรีลีสอื่นทั้งหมด รวมถึง Grok 3 think และ Claude 3.7 think
    • ฉันกำลังจะยกเลิกการสมัครแบบ Pro แต่ 4.5 ดีเกินไปสำหรับงานที่ไม่ใช่โค้ด/คณิตศาสตร์
    • รอ o3 pro ไม่ไหวแล้ว
  • มีคนที่ลองทดสอบแล้วชอบมัน
    • ฉันมั่นใจใน Sonnet 3.7 มาก
    • อยากให้เร็วกว่านี้
    • ปัญหาส่วนใหญ่คือปัญหาเรื่องการลงมือทำ และฉันอยากให้ AI ทำได้เร็วกว่าที่ฉันเขียนโค้ดเอง
  • o1-pro น่าจะถูกใช้เป็นเครื่องมือสำหรับตรวจทานซ้ำหรือเช็กโค้ดเบสอีกชั้น
    • ต่อให้ราคาถูกลง ก็เดาว่าการจะได้ความเร็วมากกว่า Sonnet 10 เท่ายังคงต้องใช้ทั้งงานจำนวนมากและความรู้เฉพาะทาง
  • o1-pro ไม่รองรับการสตรีม
    • คาดว่าน่าจะใช้เทคนิคแบบ best-of-n เพื่อค้นหาหลายคำตอบ
    • คิดว่าน่าจะได้ผลลัพธ์คล้ายกันในราคาที่ถูกกว่ามากถ้าใช้ llm-consortium
    • สามารถพรอมป์ต์หลายโมเดล แล้วเลือกหรือสังเคราะห์คำตอบที่ดีที่สุดจากพวกมันได้
    • ทำซ้ำได้จนกว่าจะถึงเกณฑ์ความเชื่อมั่นที่ต้องการ
  • ตอนแรกคิดว่าน่าจะเพิ่มมันเข้าแพลตฟอร์มได้ แต่พอเห็นราคาแล้วก็ลังเลที่จะเปิดให้ผู้ใช้ส่วนใหญ่ใช้โมเดลนี้
    • ผู้ใช้ส่วนใหญ่น่าจะทำร้ายตัวเองมากกว่าจะได้ประโยชน์ ยกเว้นองค์กรที่มีเงินมาก
  • ฉันสงสัยมาตลอดว่า o1-Pro อาจเป็นเวิร์กโฟลว์ของโมเดล o1
    • อาจเป็นการกระจายไปยัง o1 จำนวน 8 อินสแตนซ์แล้วรวบรวมผลลัพธ์