- เมื่อเทคโนโลยี AI พัฒนามากขึ้น ก็สามารถแก้ปัญหาที่ซับซ้อนและสำคัญยิ่งขึ้นได้ และการทำให้สิ่งนี้เกิดขึ้นต้องใช้ทรัพยากรการประมวลผลจำนวนมาก
- ChatGPT Pro เป็น แพ็กเกจค่าบริการ $200 ต่อเดือน ที่ให้ใช้งานโมเดลและเครื่องมือล่าสุดของ OpenAI ได้อย่างขยายขอบเขต
- o1: โมเดลที่ฉลาดที่สุด
- รวมถึง o1-mini, GPT-4o และ Advanced Voice
- o1 pro mode: ใช้ทรัพยากรการประมวลผลมากขึ้นเพื่อคิดได้ลึกขึ้นและให้คำตอบที่ละเอียดมากขึ้นสำหรับปัญหาที่ซับซ้อน
- มีแผนจะเพิ่มฟีเจอร์ด้านประสิทธิภาพการทำงานที่ทรงพลังยิ่งขึ้นในอนาคต
- ออกแบบมาสำหรับนักวิจัย วิศวกร และบุคคลที่ทำงานเชิงวิจัย เพื่อช่วยเพิ่มประสิทธิภาพการทำงานและยืนอยู่แนวหน้าของความก้าวหน้า AI
- o1 pro mode ของ ChatGPT Pro เป็นโมเดลขั้นสูงที่ให้คำตอบที่มีความน่าเชื่อถือสูง
- โดยเฉพาะในด้านวิทยาการข้อมูล การเขียนโปรแกรม และการวิเคราะห์กฎหมาย ซึ่งให้คำตอบได้อย่างแม่นยำและครอบคลุม
- เมื่อเทียบกับ o1 และ o1-preview แล้ว แสดงประสิทธิภาพที่ดีกว่าในเบนช์มาร์กแมชชีนเลิร์นนิงที่ยากในด้านคณิตศาสตร์ วิทยาศาสตร์ และการเขียนโค้ด
การเปรียบเทียบประสิทธิภาพหลัก (อิงตามความแม่นยำแบบ pass@1)
- การแข่งขันคณิตศาสตร์ (AIME 2024)
- o1-preview: 50
- o1: 78
- o1 pro mode: 86
- การแข่งขันเขียนโค้ด (Codeforces)
- o1-preview: 62
- o1: 89
- o1 pro mode: 90
- คำถามวิทยาศาสตร์ระดับปริญญาเอก (GPQA Diamond)
- o1-preview: 74
- o1: 76
- o1 pro mode: 79
ความน่าเชื่อถือที่ดีขึ้น: การประเมิน "4/4 reliability"
- มีการนำเกณฑ์การประเมินที่เข้มงวดยิ่งขึ้นมาใช้: จะนับว่าแก้โจทย์ได้ก็ต่อเมื่อตอบถูกทั้ง 4 ครั้งจาก 4 ครั้งที่พยายาม
การเปรียบเทียบประสิทธิภาพหลัก (อิงตามความน่าเชื่อถือ 4/4)
- การแข่งขันคณิตศาสตร์ (AIME 2024)
- o1-preview: 37
- o1: 67
- o1 pro mode: 80
- การแข่งขันเขียนโค้ด (Codeforces)
- o1-preview: 26
- o1: 64
- o1 pro mode: 75
- คำถามวิทยาศาสตร์ระดับปริญญาเอก (GPQA Diamond)
- o1-preview: 58
- o1: 67
- o1 pro mode: 74
7 ความคิดเห็น
ผมลองใช้ Pro แล้ว แต่จุดที่ร้ายแรงคือ context window สั้นเกินไป ถึงจะเขียนเนื้อหายาว ๆ ให้ได้ แต่พอผ่านไปสักระยะ เนื้อหาหรือฟอร์แมตเดิมที่กำลังเขียนอยู่ก็เริ่มเสียทรงไปเรื่อย ๆ
OpenAI กำลังห่างไกลจากคำว่า open มากขึ้นเรื่อย ๆ
นี่คงเป็นความจริงของโลกสินะ
ตอนแรกคิดว่าเพราะแบกรับต้นทุนไม่ไหว เลยอาจจะขึ้นค่าสมาชิก Plus แต่ดูเหมือนว่าไม่ใช่ กลับเลือกออกไลน์อัประดับแพงกว่ามาเจาะตลาดแทน ปกติก็ใช้งานได้ดีมากอยู่แล้ว แต่สำหรับผมคงยังไม่จำเป็นต้องถึงขั้นเวอร์ชัน Pro ครับ 555
ผมใช้ Plus อยู่ครับ ช่วงหลังมานี้รู้สึกว่าแม้จะใช้เอนจินประเภทเดียวกันและให้พรอมป์ต์ลักษณะเดียวกัน แต่ผลลัพธ์กลับเปลี่ยนไป รู้สึกว่ามันทำได้ไม่ดีเท่าเมื่อก่อน
เลยอดคิดไม่ได้ว่าอาจจะมีการลดความสามารถของโมเดลที่ใช้ได้ใน Plus เดิม แล้วตัดแยกไปขายหรือเปล่า
ยิ่งราคาสูงขึ้น คนก็ยิ่งคาดหวังความน่าเชื่อถือด้านประสิทธิภาพ แต่บริการ AI กลับไม่มีอะไรแบบนั้นเลย ดูมีแนวโน้มสูงว่า AI อาจจะเป็นแบบเดียวกับอินเทอร์เน็ต ที่วันดีคืนดีแอบถูกจำกัดความเร็วแบบเงียบ ๆ
ผมก็ใช้ Plus อยู่เหมือนกันนะครับ แต่จะเรียกว่าโทนของคำตอบดีไหม? ถึงชื่อจะเป็น o1 เหมือนกัน แต่ความรู้สึกโดยรวมต่างจาก preview ไปเลย จนถึงขั้นคิดว่ามีใครกำลังกดการปล่อยโทเค็นออกมาอยู่หรือเปล่า
เห็นด้วยครับ/ค่ะ ผม/ฉันเองก็รู้สึกได้ว่าแม้จะใช้เวอร์ชันเดียวกันในช่วงเวลาเดียวกัน แต่ประสิทธิภาพก็ขึ้นๆ ลงๆ โดยไม่มีการบอกกล่าวอะไรเลย อีกเรื่องหนึ่งที่อาจจะนอกประเด็นนิดหน่อยคือ สำหรับบางบริการก็ไม่มีทางตรวจสอบได้จริงๆ ว่าไม่ได้เก็บรวบรวมข้อมูลหรือไม่ สุดท้ายเลยอาจเป็นเรื่องของความเชื่อล้วนๆ ครับ/ค่ะ
ความคิดเห็นบน Hacker News
OpenAI กำลังแข่งขันอยู่ระหว่างความเร็วในการพัฒนาทางเลือกโอเพนซอร์สกับความจำเป็นในการสร้างรายได้ ความสำเร็จจะขึ้นอยู่กับว่าบริษัทขนาดใหญ่จะเลือกโซลูชัน AI แบบครบวงจรและปลอดภัยของ OpenAI หรือไม่ ซึ่งคล้ายกับกลยุทธ์คอมพิวติ้งสำหรับองค์กรของ IBM
มีความไม่พอใจที่เวอร์ชัน Pro มี context window สั้น ในฐานะสมาชิก Plus คาดหวังว่าจะได้ context window ที่ยาวกว่านี้ แต่กลับไม่มีการพูดถึงเรื่องนี้เลย ขอแนะนำอย่างยิ่งให้คู่แข่งใช้ context window เป็นจุดสร้างความแตกต่าง
ความประทับใจแรกหลังซื้อสมาชิก Pro คือโมเดล o1-Pro ใหม่นั้นเป็นนักเขียนที่ยอดเยี่ยมมาก จัดการพรอมป์ต์ยาว ๆ และการวิเคราะห์ข้อมูลที่ซับซ้อนได้ดี
แผนสำหรับพลังประมวลผลที่มากขึ้นอาจอธิบายได้ด้วยกลยุทธ์การตั้งราคาแบบ decoy effect คือเพิ่มตัวเลือกที่ราคาแพงเพื่อทำให้แพลนอื่นดูสมเหตุสมผลมากขึ้น
จ่าย 166 ยูโรต่อเดือนให้กับ Claude Teams เพราะมีฟีเจอร์โปรเจ็กต์ที่ช่วยให้อัปโหลดไฟล์จำนวนมากและถามคำถามภายใต้บริบทเฉพาะได้ ความสามารถนี้ทรงพลังราวกับมีนักวิจัยอยู่แค่ปลายนิ้ว
ได้ประสิทธิภาพที่ดีกว่าจาก Anthropic ในราคาที่ถูกกว่ามาก จึงยังสงสัยกับคำกล่าวอ้างว่า GPT ตัวใหม่นั้นดีกว่า Claude ถึง 10 เท่า
สงสัยว่า OpenAI จะไปถึง AI แบบ "ทั่วไป" ได้หรือไม่ก่อนที่นักลงทุนจะเริ่มหมดความอดทน พวกเขาอาจสื่อเป็นนัยผ่านความสำเร็จของ ChatGPT ว่ามีเส้นทางไปถึงจุดนั้น
ความยากหลักของการตั้งราคารายเดือนสำหรับการใช้งานผลิตภัณฑ์แบบ "ไม่จำกัด" คือผู้ใช้ระดับ power user 1% ที่ใช้งานหนักมาก ราคา ChatGPT Pro ดูเหมือนจะตั้งมาเพื่อกลุ่ม power user/องค์กร
ใช้เวลา 4.5 ชั่วโมงในการเขียนสูตร Google Sheets ที่ซับซ้อน หากโหมด ChatGPT Pro ใหม่ทำได้เร็วกว่า ก็จะเป็นข้อได้เปรียบอย่างมากในแง่การประหยัดเวลา
มีกรณีที่ใช้โมเดล o1 ใน interview mill เพื่อดำเนินการสัมภาษณ์ การใช้งานลักษณะนี้อาจทำให้ค่าบริการรายเดือน $200 ดูไม่แพง