OpenAI เปิดตัว GPT-4.5

xguru · 2025-02-28T09:19:15+09:00

GPT-4.5 เป็นโมเดลล่าสุดของ OpenAI ที่ปรับปรุงความสามารถในการขยายขนาดทั้งในขั้น pre-training และ post-training ขยายขนาดของการเรียนรู้แบบไม่มีผู้สอน (unsupervised learning) เพื่อเสริมการจดจำรูปแบบและความเข้าใจเชิงสร้างสรรค์ สนทนาได้อย่างเป็นธรรมชาติมากขึ้น เข้าใจเจตนาของผู้ใช้ได้ดีขึ้น และมีความฉลาดทางอารมณ์ (EQ) สูงขึ้น นำไปใช้ได้อย่างมีประโยชน์กับงานหลากหลาย เช่น การเขียน การเขียนโปรแกรม และการแก้ปัญหา คาดว่าจะลดอัตราการเกิดภาพหลอนของโมเดล (hallucination) ลงได้ เปิดให้ใช้งานในรูปแบบ research preview โดยมีเป้าหมายเพื่อสำรวจทั้งจุดแข็งและข้อจำกัดของโมเดล และรวบรวมกรณีการใช้งานที่หลากหลาย การขยายการเรียนรู้แบบไม่มีผู้สอน เพื่อพัฒนา AI ให้ก้าวหน้า มีการขยายสองแกนหลักคือ การเรียนรู้แบบไม่มีผู้สอน และ การให้เหตุผล (reasoning) เสริมความสามารถด้านการให้เหตุผล: ฝึกโมเดลให้คิดอย่างเป็นระบบเพื่อแก้ปัญหา STEM ที่ซับซ้อน โมเดลอย่าง OpenAI o1 และ OpenAI o3-mini เป็นผู้พัฒนาแนวทางนี้ต่อยอด ขยายการเรียนรู้แบบไม่มีผู้สอน: เพิ่มข้อมูลให้มากขึ้นเพื่อยกระดับสัญชาตญาณของโมเดลและความแม่นยำของความรู้เกี่ยวกับโลก GPT-4.5 ถูกฝึกบน Microsoft Azure AI supercomputer และมีทั้งขอบเขตความรู้ที่กว้างขึ้นและความเข้าใจที่ลึกขึ้น ส่งผลให้การเกิด hallucination ลดลง และให้ผลลัพธ์ที่น่าเชื่อถือยิ่งขึ้นในหัวข้อที่หลากหลาย การขยายกระบวนทัศน์ GPT GPT-4.5 มีความรู้เหนือกว่าโมเดลก่อนหน้า ให้มุมมองเชิงลึกมากขึ้นกับคำถามทางประวัติศาสตร์ เช่น ต้นกำเนิดของภาษา สำหรับคำถามอย่าง "ภาษาแรกคืออะไร?": มีความเป็นไปได้สูงว่าไม่ได้มีภาษาแรกเพียงภาษาเดียว คาดว่าภาษาอาจถือกำเนิดขึ้นในแอฟริกามากกว่า 100,000 ปีก่อน ภาษาโบราณต้นแบบ (proto-languages) อาจพัฒนามาจากท่าทาง เสียง และสัญญาณต่าง ๆ ไม่อาจทราบต้นกำเนิดที่แน่ชัดของภาษาได้ เพราะไม่มีหลักฐานบันทึกไว้ ในลักษณะนี้ GPT-4.5 สามารถให้คำตอบที่ลึกซึ้งได้แม้ในด้านภาษาศาสตร์และประวัติศาสตร์ ความรู้เกี่ยวกับโลกที่ลึกขึ้น ในผลการประเมิน SimpleQA นั้น GPT-4.5 ทำคะแนนความแม่นยำได้สูงกว่าโมเดลอื่น เปรียบเทียบความแม่นยำ (Accuracy): GPT-4.5: 62.5% GPT-4o: 38.2% OpenAI o1: 47% OpenAI o3-mini: 15% เปรียบเทียบอัตรา hallucination (Hallucination Rate) (ยิ่งต่ำยิ่งดี): GPT-4.5: 37.1% GPT-4o: 61.8% OpenAI o1: 44% OpenAI o3-mini: 80.3% GPT-4.5 รักษาความแม่นยำได้สูงกว่าในคำถามที่ต้องการการตรวจสอบข้อเท็จจริง และลดอัตรา hallucination ลง การฝึกเพื่อการทำงานร่วมกับมนุษย์ GPT-4.5 ถูก ฝึกให้เข้าใจความต้องการและเจตนาของมนุษย์ได้ดียิ่งขึ้น ตีความเจตนาของผู้ใช้ได้ละเอียดขึ้น และสนทนาได้อย่างเป็นธรรมชาติ มี ความฉลาดทางอารมณ์ (EQ) ดีขึ้น กว่าโมเดลเดิม จึงเข้าใจนัยและความละเอียดอ่อนได้ดีกว่า มี สัญชาตญาณเชิงสร้างสรรค์และรสนิยมด้านความงาม ที่โดดเด่นในงานเขียนและงานออกแบบ การประเมินเปรียบเทียบ (Win-rate vs GPT-4o) งานสร้างสรรค์: 56.8% คำถามเฉพาะทาง: 63.2% คำถามในชีวิตประจำวัน: 57.0% GPT-4.5 ทำงานร่วมกับมนุษย์ได้อย่างเป็นธรรมชาติ และจับเจตนาของผู้ใช้ในบทสนทนาได้แม่นยำยิ่งขึ้น แนวโน้มในอนาคต: ความสามารถด้านการให้เหตุผลที่แข็งแกร่งขึ้น GPT-4.5 ไม่ใช่โมเดลที่คิดเชิงตรรกะก่อนตอบ เป็นแนวทางที่แตกต่างจาก โมเดลที่เน้นการให้เหตุผล อย่าง OpenAI o1 และ OpenAI o3-mini คาดว่าในโมเดลอนาคต การผสาน pre-training และ reasoning จะเป็นหัวใจสำคัญ การเสริมความปลอดภัย GPT-4.5 ถูกฝึกด้วยวิธีการกำกับดูแลแบบใหม่ ซึ่งรวมถึง SFT (supervised fine-tuning) และ RLHF (reinforcement learning from human feedback) ที่ใช้อยู่เดิม มีการทำ การทดสอบความปลอดภัย ก่อนนำโมเดลออกใช้งาน เพื่อประเมินความเสี่ยงที่อาจเกิดขึ้น มีการเปิดเผย system card ที่บรรจุผลการประเมิน เพื่อกระตุ้นงานวิจัยและรับข้อเสนอแนะ วิธีใช้ GPT-4.5 ใน ChatGPT ตั้งแต่วันนี้ ผู้ใช้ ChatGPT Pro สามารถเลือก GPT-4.5 ได้บนเว็บ มือถือ และเดสก์ท็อป สัปดาห์หน้า จะเปิดให้ผู้ใช้ Plus และ Team สัปดาห์ถัดไป จะเปิดให้ผู้ใช้ Enterprise และ Edu ความสามารถหลัก: ค้นหาข้อมูลล่าสุดได้ รองรับการอัปโหลดไฟล์และรูปภาพ ใช้ canvas สำหรับงานเขียนและงานโค้ดได้ อย่างไรก็ตาม ยังไม่รองรับโหมดเสียง วิดีโอ และการแชร์หน้าจอ วิธีใช้ GPT-4.5 ใน API เปิดให้ใช้งานสำหรับนักพัฒนาผ่าน Chat Completions API, Assistants API และ Batch API ความสามารถหลัก: Function Calling Structured Outputs Streaming System Messages รองรับความสามารถด้านการมองเห็นผ่านอินพุตรูปภาพ กรณีการใช้งานของนักพัฒนา: แอปพลิเคชันที่ความฉลาดทางอารมณ์และความคิดสร้างสรรค์มีความสำคัญ (เช่น ผู้ช่วยเขียน โค้ชการเรียนรู้ การระดมความคิด) งานโค้ดที่ซับซ้อน (เช่น เวิร์กโฟลว์การเขียนโค้ดหลายขั้นตอน ระบบอัตโนมัติ) ข้อพิจารณาเกี่ยวกับการให้บริการผ่าน API: GPT-4.5 เป็นโมเดลที่ใช้ทรัพยากรประมวลผลสูงและมีต้นทุนสูง จึงไม่ได้มาแทน GPT-4o กำลังพิจารณาอยู่ว่าจะให้บริการผ่าน API ต่อไปในระยะยาวหรือไม่ และเสียงตอบรับจากผู้ใช้มีความสำคัญ สรุป GPT-4.5 เป็นโมเดลที่ขยายขีดจำกัดของการเรียนรู้แบบไม่มีผู้สอน และสามารถสำรวจความสามารถใหม่ ๆ ที่สร้างสรรค์ได้ เป็นการสำรวจความเป็นไปได้ใหม่ของเทคโนโลยี AI และคาดหวังการประยุกต์ใช้อย่างสร้างสรรค์จากผู้ใช้

(openai.com)

4 คะแนน โดย xguru 2025-02-28 | 4 ความคิดเห็น | แชร์ทาง WhatsApp

GPT-4.5 เป็นโมเดลล่าสุดของ OpenAI ที่ปรับปรุงความสามารถในการขยายขนาดทั้งในขั้น pre-training และ post-training
ขยายขนาดของการเรียนรู้แบบไม่มีผู้สอน (unsupervised learning) เพื่อเสริมการจดจำรูปแบบและความเข้าใจเชิงสร้างสรรค์
สนทนาได้อย่างเป็นธรรมชาติมากขึ้น เข้าใจเจตนาของผู้ใช้ได้ดีขึ้น และมีความฉลาดทางอารมณ์ (EQ) สูงขึ้น
นำไปใช้ได้อย่างมีประโยชน์กับงานหลากหลาย เช่น การเขียน การเขียนโปรแกรม และการแก้ปัญหา
คาดว่าจะลดอัตราการเกิดภาพหลอนของโมเดล (hallucination) ลงได้
เปิดให้ใช้งานในรูปแบบ research preview โดยมีเป้าหมายเพื่อสำรวจทั้งจุดแข็งและข้อจำกัดของโมเดล และรวบรวมกรณีการใช้งานที่หลากหลาย

การขยายการเรียนรู้แบบไม่มีผู้สอน

เพื่อพัฒนา AI ให้ก้าวหน้า มีการขยายสองแกนหลักคือ การเรียนรู้แบบไม่มีผู้สอน และ การให้เหตุผล (reasoning)
- เสริมความสามารถด้านการให้เหตุผล: ฝึกโมเดลให้คิดอย่างเป็นระบบเพื่อแก้ปัญหา STEM ที่ซับซ้อน
  - โมเดลอย่าง OpenAI o1 และ OpenAI o3-mini เป็นผู้พัฒนาแนวทางนี้ต่อยอด
- ขยายการเรียนรู้แบบไม่มีผู้สอน: เพิ่มข้อมูลให้มากขึ้นเพื่อยกระดับสัญชาตญาณของโมเดลและความแม่นยำของความรู้เกี่ยวกับโลก
GPT-4.5 ถูกฝึกบน Microsoft Azure AI supercomputer และมีทั้งขอบเขตความรู้ที่กว้างขึ้นและความเข้าใจที่ลึกขึ้น
- ส่งผลให้การเกิด hallucination ลดลง และให้ผลลัพธ์ที่น่าเชื่อถือยิ่งขึ้นในหัวข้อที่หลากหลาย

การขยายกระบวนทัศน์ GPT

GPT-4.5 มีความรู้เหนือกว่าโมเดลก่อนหน้า
- ให้มุมมองเชิงลึกมากขึ้นกับคำถามทางประวัติศาสตร์ เช่น ต้นกำเนิดของภาษา
- สำหรับคำถามอย่าง "ภาษาแรกคืออะไร?":
  - มีความเป็นไปได้สูงว่าไม่ได้มีภาษาแรกเพียงภาษาเดียว
  - คาดว่าภาษาอาจถือกำเนิดขึ้นในแอฟริกามากกว่า 100,000 ปีก่อน
  - ภาษาโบราณต้นแบบ (proto-languages) อาจพัฒนามาจากท่าทาง เสียง และสัญญาณต่าง ๆ
  - ไม่อาจทราบต้นกำเนิดที่แน่ชัดของภาษาได้ เพราะไม่มีหลักฐานบันทึกไว้
ในลักษณะนี้ GPT-4.5 สามารถให้คำตอบที่ลึกซึ้งได้แม้ในด้านภาษาศาสตร์และประวัติศาสตร์

ความรู้เกี่ยวกับโลกที่ลึกขึ้น

ในผลการประเมิน SimpleQA นั้น GPT-4.5 ทำคะแนนความแม่นยำได้สูงกว่าโมเดลอื่น
- เปรียบเทียบความแม่นยำ (Accuracy):
  - GPT-4.5: 62.5%
  - GPT-4o: 38.2%
  - OpenAI o1: 47%
  - OpenAI o3-mini: 15%
- เปรียบเทียบอัตรา hallucination (Hallucination Rate) (ยิ่งต่ำยิ่งดี):
  - GPT-4.5: 37.1%
  - GPT-4o: 61.8%
  - OpenAI o1: 44%
  - OpenAI o3-mini: 80.3%
GPT-4.5 รักษาความแม่นยำได้สูงกว่าในคำถามที่ต้องการการตรวจสอบข้อเท็จจริง และลดอัตรา hallucination ลง

การฝึกเพื่อการทำงานร่วมกับมนุษย์

GPT-4.5 ถูก ฝึกให้เข้าใจความต้องการและเจตนาของมนุษย์ได้ดียิ่งขึ้น
- ตีความเจตนาของผู้ใช้ได้ละเอียดขึ้น และสนทนาได้อย่างเป็นธรรมชาติ
- มี ความฉลาดทางอารมณ์ (EQ) ดีขึ้น กว่าโมเดลเดิม จึงเข้าใจนัยและความละเอียดอ่อนได้ดีกว่า
- มี สัญชาตญาณเชิงสร้างสรรค์และรสนิยมด้านความงาม ที่โดดเด่นในงานเขียนและงานออกแบบ
การประเมินเปรียบเทียบ (Win-rate vs GPT-4o)
- งานสร้างสรรค์: 56.8%
- คำถามเฉพาะทาง: 63.2%
- คำถามในชีวิตประจำวัน: 57.0%
GPT-4.5 ทำงานร่วมกับมนุษย์ได้อย่างเป็นธรรมชาติ และจับเจตนาของผู้ใช้ในบทสนทนาได้แม่นยำยิ่งขึ้น

แนวโน้มในอนาคต: ความสามารถด้านการให้เหตุผลที่แข็งแกร่งขึ้น

GPT-4.5 ไม่ใช่โมเดลที่คิดเชิงตรรกะก่อนตอบ
เป็นแนวทางที่แตกต่างจาก โมเดลที่เน้นการให้เหตุผล อย่าง OpenAI o1 และ OpenAI o3-mini
คาดว่าในโมเดลอนาคต การผสาน pre-training และ reasoning จะเป็นหัวใจสำคัญ

การเสริมความปลอดภัย

GPT-4.5 ถูกฝึกด้วยวิธีการกำกับดูแลแบบใหม่ ซึ่งรวมถึง SFT (supervised fine-tuning) และ RLHF (reinforcement learning from human feedback) ที่ใช้อยู่เดิม
มีการทำ การทดสอบความปลอดภัย ก่อนนำโมเดลออกใช้งาน เพื่อประเมินความเสี่ยงที่อาจเกิดขึ้น
มีการเปิดเผย system card ที่บรรจุผลการประเมิน เพื่อกระตุ้นงานวิจัยและรับข้อเสนอแนะ

วิธีใช้ GPT-4.5 ใน ChatGPT

ตั้งแต่วันนี้ ผู้ใช้ ChatGPT Pro สามารถเลือก GPT-4.5 ได้บนเว็บ มือถือ และเดสก์ท็อป
สัปดาห์หน้า จะเปิดให้ผู้ใช้ Plus และ Team
สัปดาห์ถัดไป จะเปิดให้ผู้ใช้ Enterprise และ Edu
ความสามารถหลัก:
- ค้นหาข้อมูลล่าสุดได้
- รองรับการอัปโหลดไฟล์และรูปภาพ
- ใช้ canvas สำหรับงานเขียนและงานโค้ดได้
- อย่างไรก็ตาม ยังไม่รองรับโหมดเสียง วิดีโอ และการแชร์หน้าจอ

วิธีใช้ GPT-4.5 ใน API

เปิดให้ใช้งานสำหรับนักพัฒนาผ่าน Chat Completions API, Assistants API และ Batch API
ความสามารถหลัก:
- Function Calling
- Structured Outputs
- Streaming
- System Messages
- รองรับความสามารถด้านการมองเห็นผ่านอินพุตรูปภาพ
กรณีการใช้งานของนักพัฒนา:
- แอปพลิเคชันที่ความฉลาดทางอารมณ์และความคิดสร้างสรรค์มีความสำคัญ (เช่น ผู้ช่วยเขียน โค้ชการเรียนรู้ การระดมความคิด)
- งานโค้ดที่ซับซ้อน (เช่น เวิร์กโฟลว์การเขียนโค้ดหลายขั้นตอน ระบบอัตโนมัติ)
ข้อพิจารณาเกี่ยวกับการให้บริการผ่าน API:
- GPT-4.5 เป็นโมเดลที่ใช้ทรัพยากรประมวลผลสูงและมีต้นทุนสูง จึงไม่ได้มาแทน GPT-4o
- กำลังพิจารณาอยู่ว่าจะให้บริการผ่าน API ต่อไปในระยะยาวหรือไม่ และเสียงตอบรับจากผู้ใช้มีความสำคัญ

สรุป

GPT-4.5 เป็นโมเดลที่ขยายขีดจำกัดของการเรียนรู้แบบไม่มีผู้สอน และสามารถสำรวจความสามารถใหม่ ๆ ที่สร้างสรรค์ได้
เป็นการสำรวจความเป็นไปได้ใหม่ของเทคโนโลยี AI และคาดหวังการประยุกต์ใช้อย่างสร้างสรรค์จากผู้ใช้

4 ความคิดเห็น

GN⁺ 2025-02-28

ความคิดเห็นใน Hacker News

ราคา GPT 4.5 สูงมาก
- อินพุต: $75.00 ต่อ 1 ล้านโทเคน
- อินพุตที่แคชไว้: $37.50 ต่อ 1 ล้านโทเคน
- เอาต์พุต: $150.00 ต่อ 1 ล้านโทเคน
- เมื่อเทียบกับ GPT 4o แล้ว ส่วนต่างราคาสูงมาก
- GPT-4.5 เป็นโมเดลที่มีขนาดใหญ่มากและใช้การประมวลผลเข้มข้น จึงกำลังประเมินอยู่ว่าจะให้บริการผ่าน API ในระยะยาวหรือไม่
- ฟีดแบ็กจากผู้ใช้มีความสำคัญ
ความเห็นหลังใช้งาน GPT-4.5
- ช้ามาก ไม่เหมาะกับการโต้ตอบแบบเรียลไทม์
- สไตล์การเขียนดีขึ้น ดูสบาย ๆ และเข้าถึงง่ายกว่า
- เมื่อนำร่างหนังสือมาเปรียบเทียบ ความต่างระหว่าง GPT4o กับ GPT4.5 สังเกตได้ชัด
มุ่งเน้นที่ความฉลาดทางอารมณ์ (EQ)
- มีแนวโน้มจะเปลี่ยนไปเป็น "เพื่อน AI ที่ใจดี"
- Anthropic และ Grok ก็กำลังขยับไปในทิศทางนี้เช่นกัน
- หวังว่าพฤติกรรมแบบนี้จะไม่ซึมเข้าไปในคำตอบของ API
ผิดหวังกับโพสต์บล็อกและเดโมไลฟ์สตรีม
- โมเดลใหม่ไม่น่าประทับใจ
- ดูเหมือนว่า OpenAI จะนำหน้าคู่แข่งได้ยาก
- ราคาสูงมากจนน่าตกใจ
แนวทางที่ต่างกันของ OpenAI และ Anthropic
- Anthropic เชื่อว่าพาราไดม์เดียว (การให้เหตุผล) อาจเหมาะกับทุกกรณีการใช้งาน
- OpenAI เชื่อว่าจำเป็นต้องมี ensemble ของโมเดลที่มีความสามารถหลากหลาย
- GPT 4.5 มีขนาดใหญ่ จึงสามารถเก็บข้อมูลข้อเท็จจริงได้มากกว่า
ประสิทธิภาพของ GPT-4.5 ใน Kagi LLM benchmark
- แม้ราคาสูงและช้า แต่ประสิทธิภาพยอดเยี่ยม
- ในบางงานก็ยังมีจุดที่ด้อยอยู่
วิธีใช้ GPT-4.5 ผ่าน API
- สามารถรันได้ด้วยเครื่องมือ uvx
- ต้องตั้งค่า API key
เปรียบเทียบประสิทธิภาพด้านการเขียนโค้ด
- ChatGPT 4.5 เขียนโค้ดได้ดีกว่า ChatGPT 4o เล็กน้อย
- Anthropic Claude 3.7 แสดงประสิทธิภาพที่ดีกว่า
ความเข้าใจต่อความพยายามของ OpenAI
- GPT 4.5 เป็นความพยายามสำคัญในการสำรวจกฎการขยายขนาดของการพรีเทรน
- เป็นของขวัญที่มีคุณูปการต่อวงการวิทยาศาสตร์

xguru 2025-02-28

ราคา GPT-4.5 (ต่อ 1M โทเค็น)

อินพุต $75
อินพุตที่แคชไว้ $37.50
เอาต์พุต $150
ถ้าเทียบราคากับ 4o อินพุตแพงกว่า 30 เท่า และเอาต์พุตแพงกว่า 15 เท่าเลยนะ

แต่ดูเหมือนว่าประสิทธิภาพจะไม่ได้ดีขึ้นถึงขนาดนั้น เลยมีคนไม่พอใจอยู่มาก

มีคนบอกว่าถ้าลองใช้ GPT-4.5 ใน Cursor มันทำงานได้อย่างมีประสิทธิภาพแม้ในเคสที่โมเดลอื่นล้มเหลว
แน่นอนว่ามันแพงมากจนต้องจ่ายตามการใช้งานจริง มีคนตอบกันประมาณว่า "ให้มันเขียนโค้ดซับซ้อนแบบนี้ มีหวังล้มละลายแน่"
https://x.com/cursor_ai/status/1895210110714290302

bearmett 2025-02-28

พอเห็นราคา Claude Code แล้วก็เหมือนจะคิดคล้าย ๆ กันนะครับ ถ้าเป็นมนุษย์เงินเดือนแล้วค่าใช้จ่ายต่อชั่วโมงเกินค่าแรงรายชั่วโมง แบบนั้นคงเรียกว่าล้มละลายแล้วมั้ง 😵‍💫

botplaysdice 2025-02-28

ก็ดูเหมือนจะเป็นเรื่องที่น่ายินดีนะ ราคาของโมเดลขึ้นอยู่กับมูลค่าตัวเราด้วย...;;;