12 คะแนน โดย GN⁺ 2024-12-06 | 7 ความคิดเห็น | แชร์ทาง WhatsApp
  • เมื่อเทคโนโลยี AI พัฒนามากขึ้น ก็สามารถแก้ปัญหาที่ซับซ้อนและสำคัญยิ่งขึ้นได้ และการทำให้สิ่งนี้เกิดขึ้นต้องใช้ทรัพยากรการประมวลผลจำนวนมาก
  • ChatGPT Pro เป็น แพ็กเกจค่าบริการ $200 ต่อเดือน ที่ให้ใช้งานโมเดลและเครื่องมือล่าสุดของ OpenAI ได้อย่างขยายขอบเขต
    • o1: โมเดลที่ฉลาดที่สุด
    • รวมถึง o1-mini, GPT-4o และ Advanced Voice
    • o1 pro mode: ใช้ทรัพยากรการประมวลผลมากขึ้นเพื่อคิดได้ลึกขึ้นและให้คำตอบที่ละเอียดมากขึ้นสำหรับปัญหาที่ซับซ้อน
    • มีแผนจะเพิ่มฟีเจอร์ด้านประสิทธิภาพการทำงานที่ทรงพลังยิ่งขึ้นในอนาคต
  • ออกแบบมาสำหรับนักวิจัย วิศวกร และบุคคลที่ทำงานเชิงวิจัย เพื่อช่วยเพิ่มประสิทธิภาพการทำงานและยืนอยู่แนวหน้าของความก้าวหน้า AI
  • o1 pro mode ของ ChatGPT Pro เป็นโมเดลขั้นสูงที่ให้คำตอบที่มีความน่าเชื่อถือสูง
    • โดยเฉพาะในด้านวิทยาการข้อมูล การเขียนโปรแกรม และการวิเคราะห์กฎหมาย ซึ่งให้คำตอบได้อย่างแม่นยำและครอบคลุม
    • เมื่อเทียบกับ o1 และ o1-preview แล้ว แสดงประสิทธิภาพที่ดีกว่าในเบนช์มาร์กแมชชีนเลิร์นนิงที่ยากในด้านคณิตศาสตร์ วิทยาศาสตร์ และการเขียนโค้ด

การเปรียบเทียบประสิทธิภาพหลัก (อิงตามความแม่นยำแบบ pass@1)

  • การแข่งขันคณิตศาสตร์ (AIME 2024)
    • o1-preview: 50
    • o1: 78
    • o1 pro mode: 86
  • การแข่งขันเขียนโค้ด (Codeforces)
    • o1-preview: 62
    • o1: 89
    • o1 pro mode: 90
  • คำถามวิทยาศาสตร์ระดับปริญญาเอก (GPQA Diamond)
    • o1-preview: 74
    • o1: 76
    • o1 pro mode: 79

ความน่าเชื่อถือที่ดีขึ้น: การประเมิน "4/4 reliability"

  • มีการนำเกณฑ์การประเมินที่เข้มงวดยิ่งขึ้นมาใช้: จะนับว่าแก้โจทย์ได้ก็ต่อเมื่อตอบถูกทั้ง 4 ครั้งจาก 4 ครั้งที่พยายาม

การเปรียบเทียบประสิทธิภาพหลัก (อิงตามความน่าเชื่อถือ 4/4)

  • การแข่งขันคณิตศาสตร์ (AIME 2024)
    • o1-preview: 37
    • o1: 67
    • o1 pro mode: 80
  • การแข่งขันเขียนโค้ด (Codeforces)
    • o1-preview: 26
    • o1: 64
    • o1 pro mode: 75
  • คำถามวิทยาศาสตร์ระดับปริญญาเอก (GPQA Diamond)
    • o1-preview: 58
    • o1: 67
    • o1 pro mode: 74

7 ความคิดเห็น

 
christallire 2024-12-11

ผมลองใช้ Pro แล้ว แต่จุดที่ร้ายแรงคือ context window สั้นเกินไป ถึงจะเขียนเนื้อหายาว ๆ ให้ได้ แต่พอผ่านไปสักระยะ เนื้อหาหรือฟอร์แมตเดิมที่กำลังเขียนอยู่ก็เริ่มเสียทรงไปเรื่อย ๆ

 
riki3 2024-12-06

OpenAI กำลังห่างไกลจากคำว่า open มากขึ้นเรื่อย ๆ
นี่คงเป็นความจริงของโลกสินะ

 
tsboard 2024-12-06

ตอนแรกคิดว่าเพราะแบกรับต้นทุนไม่ไหว เลยอาจจะขึ้นค่าสมาชิก Plus แต่ดูเหมือนว่าไม่ใช่ กลับเลือกออกไลน์อัประดับแพงกว่ามาเจาะตลาดแทน ปกติก็ใช้งานได้ดีมากอยู่แล้ว แต่สำหรับผมคงยังไม่จำเป็นต้องถึงขั้นเวอร์ชัน Pro ครับ 555

 
windrod 2024-12-06

ผมใช้ Plus อยู่ครับ ช่วงหลังมานี้รู้สึกว่าแม้จะใช้เอนจินประเภทเดียวกันและให้พรอมป์ต์ลักษณะเดียวกัน แต่ผลลัพธ์กลับเปลี่ยนไป รู้สึกว่ามันทำได้ไม่ดีเท่าเมื่อก่อน

เลยอดคิดไม่ได้ว่าอาจจะมีการลดความสามารถของโมเดลที่ใช้ได้ใน Plus เดิม แล้วตัดแยกไปขายหรือเปล่า

ยิ่งราคาสูงขึ้น คนก็ยิ่งคาดหวังความน่าเชื่อถือด้านประสิทธิภาพ แต่บริการ AI กลับไม่มีอะไรแบบนั้นเลย ดูมีแนวโน้มสูงว่า AI อาจจะเป็นแบบเดียวกับอินเทอร์เน็ต ที่วันดีคืนดีแอบถูกจำกัดความเร็วแบบเงียบ ๆ

 
vndk2234 2024-12-09

ผมก็ใช้ Plus อยู่เหมือนกันนะครับ แต่จะเรียกว่าโทนของคำตอบดีไหม? ถึงชื่อจะเป็น o1 เหมือนกัน แต่ความรู้สึกโดยรวมต่างจาก preview ไปเลย จนถึงขั้นคิดว่ามีใครกำลังกดการปล่อยโทเค็นออกมาอยู่หรือเปล่า

 
reagea0 2024-12-09

เห็นด้วยครับ/ค่ะ ผม/ฉันเองก็รู้สึกได้ว่าแม้จะใช้เวอร์ชันเดียวกันในช่วงเวลาเดียวกัน แต่ประสิทธิภาพก็ขึ้นๆ ลงๆ โดยไม่มีการบอกกล่าวอะไรเลย อีกเรื่องหนึ่งที่อาจจะนอกประเด็นนิดหน่อยคือ สำหรับบางบริการก็ไม่มีทางตรวจสอบได้จริงๆ ว่าไม่ได้เก็บรวบรวมข้อมูลหรือไม่ สุดท้ายเลยอาจเป็นเรื่องของความเชื่อล้วนๆ ครับ/ค่ะ

 
GN⁺ 2024-12-06
ความคิดเห็นบน Hacker News
  • OpenAI กำลังแข่งขันอยู่ระหว่างความเร็วในการพัฒนาทางเลือกโอเพนซอร์สกับความจำเป็นในการสร้างรายได้ ความสำเร็จจะขึ้นอยู่กับว่าบริษัทขนาดใหญ่จะเลือกโซลูชัน AI แบบครบวงจรและปลอดภัยของ OpenAI หรือไม่ ซึ่งคล้ายกับกลยุทธ์คอมพิวติ้งสำหรับองค์กรของ IBM

  • มีความไม่พอใจที่เวอร์ชัน Pro มี context window สั้น ในฐานะสมาชิก Plus คาดหวังว่าจะได้ context window ที่ยาวกว่านี้ แต่กลับไม่มีการพูดถึงเรื่องนี้เลย ขอแนะนำอย่างยิ่งให้คู่แข่งใช้ context window เป็นจุดสร้างความแตกต่าง

  • ความประทับใจแรกหลังซื้อสมาชิก Pro คือโมเดล o1-Pro ใหม่นั้นเป็นนักเขียนที่ยอดเยี่ยมมาก จัดการพรอมป์ต์ยาว ๆ และการวิเคราะห์ข้อมูลที่ซับซ้อนได้ดี

  • แผนสำหรับพลังประมวลผลที่มากขึ้นอาจอธิบายได้ด้วยกลยุทธ์การตั้งราคาแบบ decoy effect คือเพิ่มตัวเลือกที่ราคาแพงเพื่อทำให้แพลนอื่นดูสมเหตุสมผลมากขึ้น

  • จ่าย 166 ยูโรต่อเดือนให้กับ Claude Teams เพราะมีฟีเจอร์โปรเจ็กต์ที่ช่วยให้อัปโหลดไฟล์จำนวนมากและถามคำถามภายใต้บริบทเฉพาะได้ ความสามารถนี้ทรงพลังราวกับมีนักวิจัยอยู่แค่ปลายนิ้ว

  • ได้ประสิทธิภาพที่ดีกว่าจาก Anthropic ในราคาที่ถูกกว่ามาก จึงยังสงสัยกับคำกล่าวอ้างว่า GPT ตัวใหม่นั้นดีกว่า Claude ถึง 10 เท่า

  • สงสัยว่า OpenAI จะไปถึง AI แบบ "ทั่วไป" ได้หรือไม่ก่อนที่นักลงทุนจะเริ่มหมดความอดทน พวกเขาอาจสื่อเป็นนัยผ่านความสำเร็จของ ChatGPT ว่ามีเส้นทางไปถึงจุดนั้น

  • ความยากหลักของการตั้งราคารายเดือนสำหรับการใช้งานผลิตภัณฑ์แบบ "ไม่จำกัด" คือผู้ใช้ระดับ power user 1% ที่ใช้งานหนักมาก ราคา ChatGPT Pro ดูเหมือนจะตั้งมาเพื่อกลุ่ม power user/องค์กร

  • ใช้เวลา 4.5 ชั่วโมงในการเขียนสูตร Google Sheets ที่ซับซ้อน หากโหมด ChatGPT Pro ใหม่ทำได้เร็วกว่า ก็จะเป็นข้อได้เปรียบอย่างมากในแง่การประหยัดเวลา

  • มีกรณีที่ใช้โมเดล o1 ใน interview mill เพื่อดำเนินการสัมภาษณ์ การใช้งานลักษณะนี้อาจทำให้ค่าบริการรายเดือน $200 ดูไม่แพง