- GPT-4.5 เป็นโมเดลล่าสุดของ OpenAI ที่ปรับปรุงความสามารถในการขยายขนาดทั้งในขั้น pre-training และ post-training
- ขยายขนาดของการเรียนรู้แบบไม่มีผู้สอน (unsupervised learning) เพื่อเสริมการจดจำรูปแบบและความเข้าใจเชิงสร้างสรรค์
- สนทนาได้อย่างเป็นธรรมชาติมากขึ้น เข้าใจเจตนาของผู้ใช้ได้ดีขึ้น และมีความฉลาดทางอารมณ์ (EQ) สูงขึ้น
- นำไปใช้ได้อย่างมีประโยชน์กับงานหลากหลาย เช่น การเขียน การเขียนโปรแกรม และการแก้ปัญหา
- คาดว่าจะลดอัตราการเกิดภาพหลอนของโมเดล (hallucination) ลงได้
- เปิดให้ใช้งานในรูปแบบ research preview โดยมีเป้าหมายเพื่อสำรวจทั้งจุดแข็งและข้อจำกัดของโมเดล และรวบรวมกรณีการใช้งานที่หลากหลาย
การขยายการเรียนรู้แบบไม่มีผู้สอน
- เพื่อพัฒนา AI ให้ก้าวหน้า มีการขยายสองแกนหลักคือ การเรียนรู้แบบไม่มีผู้สอน และ การให้เหตุผล (reasoning)
- เสริมความสามารถด้านการให้เหตุผล: ฝึกโมเดลให้คิดอย่างเป็นระบบเพื่อแก้ปัญหา STEM ที่ซับซ้อน
- โมเดลอย่าง OpenAI o1 และ OpenAI o3-mini เป็นผู้พัฒนาแนวทางนี้ต่อยอด
- ขยายการเรียนรู้แบบไม่มีผู้สอน: เพิ่มข้อมูลให้มากขึ้นเพื่อยกระดับสัญชาตญาณของโมเดลและความแม่นยำของความรู้เกี่ยวกับโลก
- GPT-4.5 ถูกฝึกบน Microsoft Azure AI supercomputer และมีทั้งขอบเขตความรู้ที่กว้างขึ้นและความเข้าใจที่ลึกขึ้น
- ส่งผลให้การเกิด hallucination ลดลง และให้ผลลัพธ์ที่น่าเชื่อถือยิ่งขึ้นในหัวข้อที่หลากหลาย
การขยายกระบวนทัศน์ GPT
- GPT-4.5 มีความรู้เหนือกว่าโมเดลก่อนหน้า
- ให้มุมมองเชิงลึกมากขึ้นกับคำถามทางประวัติศาสตร์ เช่น ต้นกำเนิดของภาษา
- สำหรับคำถามอย่าง "ภาษาแรกคืออะไร?":
- มีความเป็นไปได้สูงว่าไม่ได้มีภาษาแรกเพียงภาษาเดียว
- คาดว่าภาษาอาจถือกำเนิดขึ้นในแอฟริกามากกว่า 100,000 ปีก่อน
- ภาษาโบราณต้นแบบ (proto-languages) อาจพัฒนามาจากท่าทาง เสียง และสัญญาณต่าง ๆ
- ไม่อาจทราบต้นกำเนิดที่แน่ชัดของภาษาได้ เพราะไม่มีหลักฐานบันทึกไว้
- ในลักษณะนี้ GPT-4.5 สามารถให้คำตอบที่ลึกซึ้งได้แม้ในด้านภาษาศาสตร์และประวัติศาสตร์
ความรู้เกี่ยวกับโลกที่ลึกขึ้น
- ในผลการประเมิน SimpleQA นั้น GPT-4.5 ทำคะแนนความแม่นยำได้สูงกว่าโมเดลอื่น
- เปรียบเทียบความแม่นยำ (Accuracy):
- GPT-4.5: 62.5%
- GPT-4o: 38.2%
- OpenAI o1: 47%
- OpenAI o3-mini: 15%
- เปรียบเทียบอัตรา hallucination (Hallucination Rate) (ยิ่งต่ำยิ่งดี):
- GPT-4.5: 37.1%
- GPT-4o: 61.8%
- OpenAI o1: 44%
- OpenAI o3-mini: 80.3%
- GPT-4.5 รักษาความแม่นยำได้สูงกว่าในคำถามที่ต้องการการตรวจสอบข้อเท็จจริง และลดอัตรา hallucination ลง
การฝึกเพื่อการทำงานร่วมกับมนุษย์
- GPT-4.5 ถูก ฝึกให้เข้าใจความต้องการและเจตนาของมนุษย์ได้ดียิ่งขึ้น
- ตีความเจตนาของผู้ใช้ได้ละเอียดขึ้น และสนทนาได้อย่างเป็นธรรมชาติ
- มี ความฉลาดทางอารมณ์ (EQ) ดีขึ้น กว่าโมเดลเดิม จึงเข้าใจนัยและความละเอียดอ่อนได้ดีกว่า
- มี สัญชาตญาณเชิงสร้างสรรค์และรสนิยมด้านความงาม ที่โดดเด่นในงานเขียนและงานออกแบบ
- การประเมินเปรียบเทียบ (Win-rate vs GPT-4o)
- งานสร้างสรรค์: 56.8%
- คำถามเฉพาะทาง: 63.2%
- คำถามในชีวิตประจำวัน: 57.0%
- GPT-4.5 ทำงานร่วมกับมนุษย์ได้อย่างเป็นธรรมชาติ และจับเจตนาของผู้ใช้ในบทสนทนาได้แม่นยำยิ่งขึ้น
แนวโน้มในอนาคต: ความสามารถด้านการให้เหตุผลที่แข็งแกร่งขึ้น
- GPT-4.5 ไม่ใช่โมเดลที่คิดเชิงตรรกะก่อนตอบ
- เป็นแนวทางที่แตกต่างจาก โมเดลที่เน้นการให้เหตุผล อย่าง OpenAI o1 และ OpenAI o3-mini
- คาดว่าในโมเดลอนาคต การผสาน pre-training และ reasoning จะเป็นหัวใจสำคัญ
การเสริมความปลอดภัย
- GPT-4.5 ถูกฝึกด้วยวิธีการกำกับดูแลแบบใหม่ ซึ่งรวมถึง SFT (supervised fine-tuning) และ RLHF (reinforcement learning from human feedback) ที่ใช้อยู่เดิม
- มีการทำ การทดสอบความปลอดภัย ก่อนนำโมเดลออกใช้งาน เพื่อประเมินความเสี่ยงที่อาจเกิดขึ้น
- มีการเปิดเผย system card ที่บรรจุผลการประเมิน เพื่อกระตุ้นงานวิจัยและรับข้อเสนอแนะ
วิธีใช้ GPT-4.5 ใน ChatGPT
- ตั้งแต่วันนี้ ผู้ใช้ ChatGPT Pro สามารถเลือก GPT-4.5 ได้บนเว็บ มือถือ และเดสก์ท็อป
- สัปดาห์หน้า จะเปิดให้ผู้ใช้ Plus และ Team
- สัปดาห์ถัดไป จะเปิดให้ผู้ใช้ Enterprise และ Edu
- ความสามารถหลัก:
- ค้นหาข้อมูลล่าสุดได้
- รองรับการอัปโหลดไฟล์และรูปภาพ
- ใช้ canvas สำหรับงานเขียนและงานโค้ดได้
- อย่างไรก็ตาม ยังไม่รองรับโหมดเสียง วิดีโอ และการแชร์หน้าจอ
วิธีใช้ GPT-4.5 ใน API
- เปิดให้ใช้งานสำหรับนักพัฒนาผ่าน Chat Completions API, Assistants API และ Batch API
- ความสามารถหลัก:
- Function Calling
- Structured Outputs
- Streaming
- System Messages
- รองรับความสามารถด้านการมองเห็นผ่านอินพุตรูปภาพ
- กรณีการใช้งานของนักพัฒนา:
- แอปพลิเคชันที่ความฉลาดทางอารมณ์และความคิดสร้างสรรค์มีความสำคัญ (เช่น ผู้ช่วยเขียน โค้ชการเรียนรู้ การระดมความคิด)
- งานโค้ดที่ซับซ้อน (เช่น เวิร์กโฟลว์การเขียนโค้ดหลายขั้นตอน ระบบอัตโนมัติ)
- ข้อพิจารณาเกี่ยวกับการให้บริการผ่าน API:
- GPT-4.5 เป็นโมเดลที่ใช้ทรัพยากรประมวลผลสูงและมีต้นทุนสูง จึงไม่ได้มาแทน GPT-4o
- กำลังพิจารณาอยู่ว่าจะให้บริการผ่าน API ต่อไปในระยะยาวหรือไม่ และเสียงตอบรับจากผู้ใช้มีความสำคัญ
สรุป
- GPT-4.5 เป็นโมเดลที่ขยายขีดจำกัดของการเรียนรู้แบบไม่มีผู้สอน และสามารถสำรวจความสามารถใหม่ ๆ ที่สร้างสรรค์ได้
- เป็นการสำรวจความเป็นไปได้ใหม่ของเทคโนโลยี AI และคาดหวังการประยุกต์ใช้อย่างสร้างสรรค์จากผู้ใช้
4 ความคิดเห็น
ความคิดเห็นใน Hacker News
ราคา GPT 4.5 สูงมาก
ความเห็นหลังใช้งาน GPT-4.5
มุ่งเน้นที่ความฉลาดทางอารมณ์ (EQ)
ผิดหวังกับโพสต์บล็อกและเดโมไลฟ์สตรีม
แนวทางที่ต่างกันของ OpenAI และ Anthropic
ประสิทธิภาพของ GPT-4.5 ใน Kagi LLM benchmark
วิธีใช้ GPT-4.5 ผ่าน API
เปรียบเทียบประสิทธิภาพด้านการเขียนโค้ด
ความเข้าใจต่อความพยายามของ OpenAI
ราคา GPT-4.5 (ต่อ 1M โทเค็น)
ถ้าเทียบราคากับ 4o อินพุตแพงกว่า 30 เท่า และเอาต์พุตแพงกว่า 15 เท่าเลยนะ
แต่ดูเหมือนว่าประสิทธิภาพจะไม่ได้ดีขึ้นถึงขนาดนั้น เลยมีคนไม่พอใจอยู่มาก
มีคนบอกว่าถ้าลองใช้ GPT-4.5 ใน Cursor มันทำงานได้อย่างมีประสิทธิภาพแม้ในเคสที่โมเดลอื่นล้มเหลว
แน่นอนว่ามันแพงมากจนต้องจ่ายตามการใช้งานจริง มีคนตอบกันประมาณว่า "ให้มันเขียนโค้ดซับซ้อนแบบนี้ มีหวังล้มละลายแน่"
https://x.com/cursor_ai/status/1895210110714290302
พอเห็นราคา Claude Code แล้วก็เหมือนจะคิดคล้าย ๆ กันนะครับ ถ้าเป็นมนุษย์เงินเดือนแล้วค่าใช้จ่ายต่อชั่วโมงเกินค่าแรงรายชั่วโมง แบบนั้นคงเรียกว่าล้มละลายแล้วมั้ง 😵💫
ก็ดูเหมือนจะเป็นเรื่องที่น่ายินดีนะ ราคาของโมเดลขึ้นอยู่กับมูลค่าตัวเราด้วย...;;;