4 คะแนน โดย xguru 2025-02-28 | 4 ความคิดเห็น | แชร์ทาง WhatsApp
  • GPT-4.5 เป็นโมเดลล่าสุดของ OpenAI ที่ปรับปรุงความสามารถในการขยายขนาดทั้งในขั้น pre-training และ post-training
  • ขยายขนาดของการเรียนรู้แบบไม่มีผู้สอน (unsupervised learning) เพื่อเสริมการจดจำรูปแบบและความเข้าใจเชิงสร้างสรรค์
  • สนทนาได้อย่างเป็นธรรมชาติมากขึ้น เข้าใจเจตนาของผู้ใช้ได้ดีขึ้น และมีความฉลาดทางอารมณ์ (EQ) สูงขึ้น
  • นำไปใช้ได้อย่างมีประโยชน์กับงานหลากหลาย เช่น การเขียน การเขียนโปรแกรม และการแก้ปัญหา
  • คาดว่าจะลดอัตราการเกิดภาพหลอนของโมเดล (hallucination) ลงได้
  • เปิดให้ใช้งานในรูปแบบ research preview โดยมีเป้าหมายเพื่อสำรวจทั้งจุดแข็งและข้อจำกัดของโมเดล และรวบรวมกรณีการใช้งานที่หลากหลาย

การขยายการเรียนรู้แบบไม่มีผู้สอน

  • เพื่อพัฒนา AI ให้ก้าวหน้า มีการขยายสองแกนหลักคือ การเรียนรู้แบบไม่มีผู้สอน และ การให้เหตุผล (reasoning)
    • เสริมความสามารถด้านการให้เหตุผล: ฝึกโมเดลให้คิดอย่างเป็นระบบเพื่อแก้ปัญหา STEM ที่ซับซ้อน
      • โมเดลอย่าง OpenAI o1 และ OpenAI o3-mini เป็นผู้พัฒนาแนวทางนี้ต่อยอด
    • ขยายการเรียนรู้แบบไม่มีผู้สอน: เพิ่มข้อมูลให้มากขึ้นเพื่อยกระดับสัญชาตญาณของโมเดลและความแม่นยำของความรู้เกี่ยวกับโลก
  • GPT-4.5 ถูกฝึกบน Microsoft Azure AI supercomputer และมีทั้งขอบเขตความรู้ที่กว้างขึ้นและความเข้าใจที่ลึกขึ้น
    • ส่งผลให้การเกิด hallucination ลดลง และให้ผลลัพธ์ที่น่าเชื่อถือยิ่งขึ้นในหัวข้อที่หลากหลาย

การขยายกระบวนทัศน์ GPT

  • GPT-4.5 มีความรู้เหนือกว่าโมเดลก่อนหน้า
    • ให้มุมมองเชิงลึกมากขึ้นกับคำถามทางประวัติศาสตร์ เช่น ต้นกำเนิดของภาษา
    • สำหรับคำถามอย่าง "ภาษาแรกคืออะไร?":
      • มีความเป็นไปได้สูงว่าไม่ได้มีภาษาแรกเพียงภาษาเดียว
      • คาดว่าภาษาอาจถือกำเนิดขึ้นในแอฟริกามากกว่า 100,000 ปีก่อน
      • ภาษาโบราณต้นแบบ (proto-languages) อาจพัฒนามาจากท่าทาง เสียง และสัญญาณต่าง ๆ
      • ไม่อาจทราบต้นกำเนิดที่แน่ชัดของภาษาได้ เพราะไม่มีหลักฐานบันทึกไว้
  • ในลักษณะนี้ GPT-4.5 สามารถให้คำตอบที่ลึกซึ้งได้แม้ในด้านภาษาศาสตร์และประวัติศาสตร์

ความรู้เกี่ยวกับโลกที่ลึกขึ้น

  • ในผลการประเมิน SimpleQA นั้น GPT-4.5 ทำคะแนนความแม่นยำได้สูงกว่าโมเดลอื่น
    • เปรียบเทียบความแม่นยำ (Accuracy):
      • GPT-4.5: 62.5%
      • GPT-4o: 38.2%
      • OpenAI o1: 47%
      • OpenAI o3-mini: 15%
    • เปรียบเทียบอัตรา hallucination (Hallucination Rate) (ยิ่งต่ำยิ่งดี):
      • GPT-4.5: 37.1%
      • GPT-4o: 61.8%
      • OpenAI o1: 44%
      • OpenAI o3-mini: 80.3%
  • GPT-4.5 รักษาความแม่นยำได้สูงกว่าในคำถามที่ต้องการการตรวจสอบข้อเท็จจริง และลดอัตรา hallucination ลง

การฝึกเพื่อการทำงานร่วมกับมนุษย์

  • GPT-4.5 ถูก ฝึกให้เข้าใจความต้องการและเจตนาของมนุษย์ได้ดียิ่งขึ้น
    • ตีความเจตนาของผู้ใช้ได้ละเอียดขึ้น และสนทนาได้อย่างเป็นธรรมชาติ
    • มี ความฉลาดทางอารมณ์ (EQ) ดีขึ้น กว่าโมเดลเดิม จึงเข้าใจนัยและความละเอียดอ่อนได้ดีกว่า
    • มี สัญชาตญาณเชิงสร้างสรรค์และรสนิยมด้านความงาม ที่โดดเด่นในงานเขียนและงานออกแบบ
  • การประเมินเปรียบเทียบ (Win-rate vs GPT-4o)
    • งานสร้างสรรค์: 56.8%
    • คำถามเฉพาะทาง: 63.2%
    • คำถามในชีวิตประจำวัน: 57.0%
  • GPT-4.5 ทำงานร่วมกับมนุษย์ได้อย่างเป็นธรรมชาติ และจับเจตนาของผู้ใช้ในบทสนทนาได้แม่นยำยิ่งขึ้น

แนวโน้มในอนาคต: ความสามารถด้านการให้เหตุผลที่แข็งแกร่งขึ้น

  • GPT-4.5 ไม่ใช่โมเดลที่คิดเชิงตรรกะก่อนตอบ
  • เป็นแนวทางที่แตกต่างจาก โมเดลที่เน้นการให้เหตุผล อย่าง OpenAI o1 และ OpenAI o3-mini
  • คาดว่าในโมเดลอนาคต การผสาน pre-training และ reasoning จะเป็นหัวใจสำคัญ

การเสริมความปลอดภัย

  • GPT-4.5 ถูกฝึกด้วยวิธีการกำกับดูแลแบบใหม่ ซึ่งรวมถึง SFT (supervised fine-tuning) และ RLHF (reinforcement learning from human feedback) ที่ใช้อยู่เดิม
  • มีการทำ การทดสอบความปลอดภัย ก่อนนำโมเดลออกใช้งาน เพื่อประเมินความเสี่ยงที่อาจเกิดขึ้น
  • มีการเปิดเผย system card ที่บรรจุผลการประเมิน เพื่อกระตุ้นงานวิจัยและรับข้อเสนอแนะ

วิธีใช้ GPT-4.5 ใน ChatGPT

  • ตั้งแต่วันนี้ ผู้ใช้ ChatGPT Pro สามารถเลือก GPT-4.5 ได้บนเว็บ มือถือ และเดสก์ท็อป
  • สัปดาห์หน้า จะเปิดให้ผู้ใช้ Plus และ Team
  • สัปดาห์ถัดไป จะเปิดให้ผู้ใช้ Enterprise และ Edu
  • ความสามารถหลัก:
    • ค้นหาข้อมูลล่าสุดได้
    • รองรับการอัปโหลดไฟล์และรูปภาพ
    • ใช้ canvas สำหรับงานเขียนและงานโค้ดได้
    • อย่างไรก็ตาม ยังไม่รองรับโหมดเสียง วิดีโอ และการแชร์หน้าจอ

วิธีใช้ GPT-4.5 ใน API

  • เปิดให้ใช้งานสำหรับนักพัฒนาผ่าน Chat Completions API, Assistants API และ Batch API
  • ความสามารถหลัก:
    • Function Calling
    • Structured Outputs
    • Streaming
    • System Messages
    • รองรับความสามารถด้านการมองเห็นผ่านอินพุตรูปภาพ
  • กรณีการใช้งานของนักพัฒนา:
    • แอปพลิเคชันที่ความฉลาดทางอารมณ์และความคิดสร้างสรรค์มีความสำคัญ (เช่น ผู้ช่วยเขียน โค้ชการเรียนรู้ การระดมความคิด)
    • งานโค้ดที่ซับซ้อน (เช่น เวิร์กโฟลว์การเขียนโค้ดหลายขั้นตอน ระบบอัตโนมัติ)
  • ข้อพิจารณาเกี่ยวกับการให้บริการผ่าน API:
    • GPT-4.5 เป็นโมเดลที่ใช้ทรัพยากรประมวลผลสูงและมีต้นทุนสูง จึงไม่ได้มาแทน GPT-4o
    • กำลังพิจารณาอยู่ว่าจะให้บริการผ่าน API ต่อไปในระยะยาวหรือไม่ และเสียงตอบรับจากผู้ใช้มีความสำคัญ

สรุป

  • GPT-4.5 เป็นโมเดลที่ขยายขีดจำกัดของการเรียนรู้แบบไม่มีผู้สอน และสามารถสำรวจความสามารถใหม่ ๆ ที่สร้างสรรค์ได้
  • เป็นการสำรวจความเป็นไปได้ใหม่ของเทคโนโลยี AI และคาดหวังการประยุกต์ใช้อย่างสร้างสรรค์จากผู้ใช้

4 ความคิดเห็น

 
GN⁺ 2025-02-28

ความคิดเห็นใน Hacker News

  • ราคา GPT 4.5 สูงมาก

    • อินพุต: $75.00 ต่อ 1 ล้านโทเคน
    • อินพุตที่แคชไว้: $37.50 ต่อ 1 ล้านโทเคน
    • เอาต์พุต: $150.00 ต่อ 1 ล้านโทเคน
    • เมื่อเทียบกับ GPT 4o แล้ว ส่วนต่างราคาสูงมาก
    • GPT-4.5 เป็นโมเดลที่มีขนาดใหญ่มากและใช้การประมวลผลเข้มข้น จึงกำลังประเมินอยู่ว่าจะให้บริการผ่าน API ในระยะยาวหรือไม่
    • ฟีดแบ็กจากผู้ใช้มีความสำคัญ
  • ความเห็นหลังใช้งาน GPT-4.5

    • ช้ามาก ไม่เหมาะกับการโต้ตอบแบบเรียลไทม์
    • สไตล์การเขียนดีขึ้น ดูสบาย ๆ และเข้าถึงง่ายกว่า
    • เมื่อนำร่างหนังสือมาเปรียบเทียบ ความต่างระหว่าง GPT4o กับ GPT4.5 สังเกตได้ชัด
  • มุ่งเน้นที่ความฉลาดทางอารมณ์ (EQ)

    • มีแนวโน้มจะเปลี่ยนไปเป็น "เพื่อน AI ที่ใจดี"
    • Anthropic และ Grok ก็กำลังขยับไปในทิศทางนี้เช่นกัน
    • หวังว่าพฤติกรรมแบบนี้จะไม่ซึมเข้าไปในคำตอบของ API
  • ผิดหวังกับโพสต์บล็อกและเดโมไลฟ์สตรีม

    • โมเดลใหม่ไม่น่าประทับใจ
    • ดูเหมือนว่า OpenAI จะนำหน้าคู่แข่งได้ยาก
    • ราคาสูงมากจนน่าตกใจ
  • แนวทางที่ต่างกันของ OpenAI และ Anthropic

    • Anthropic เชื่อว่าพาราไดม์เดียว (การให้เหตุผล) อาจเหมาะกับทุกกรณีการใช้งาน
    • OpenAI เชื่อว่าจำเป็นต้องมี ensemble ของโมเดลที่มีความสามารถหลากหลาย
    • GPT 4.5 มีขนาดใหญ่ จึงสามารถเก็บข้อมูลข้อเท็จจริงได้มากกว่า
  • ประสิทธิภาพของ GPT-4.5 ใน Kagi LLM benchmark

    • แม้ราคาสูงและช้า แต่ประสิทธิภาพยอดเยี่ยม
    • ในบางงานก็ยังมีจุดที่ด้อยอยู่
  • วิธีใช้ GPT-4.5 ผ่าน API

    • สามารถรันได้ด้วยเครื่องมือ uvx
    • ต้องตั้งค่า API key
  • เปรียบเทียบประสิทธิภาพด้านการเขียนโค้ด

    • ChatGPT 4.5 เขียนโค้ดได้ดีกว่า ChatGPT 4o เล็กน้อย
    • Anthropic Claude 3.7 แสดงประสิทธิภาพที่ดีกว่า
  • ความเข้าใจต่อความพยายามของ OpenAI

    • GPT 4.5 เป็นความพยายามสำคัญในการสำรวจกฎการขยายขนาดของการพรีเทรน
    • เป็นของขวัญที่มีคุณูปการต่อวงการวิทยาศาสตร์
 
xguru 2025-02-28

ราคา GPT-4.5 (ต่อ 1M โทเค็น)

  • อินพุต $75
  • อินพุตที่แคชไว้ $37.50
  • เอาต์พุต $150
    ถ้าเทียบราคากับ 4o อินพุตแพงกว่า 30 เท่า และเอาต์พุตแพงกว่า 15 เท่าเลยนะ

แต่ดูเหมือนว่าประสิทธิภาพจะไม่ได้ดีขึ้นถึงขนาดนั้น เลยมีคนไม่พอใจอยู่มาก

มีคนบอกว่าถ้าลองใช้ GPT-4.5 ใน Cursor มันทำงานได้อย่างมีประสิทธิภาพแม้ในเคสที่โมเดลอื่นล้มเหลว
แน่นอนว่ามันแพงมากจนต้องจ่ายตามการใช้งานจริง มีคนตอบกันประมาณว่า "ให้มันเขียนโค้ดซับซ้อนแบบนี้ มีหวังล้มละลายแน่"
https://x.com/cursor_ai/status/1895210110714290302

 
bearmett 2025-02-28

พอเห็นราคา Claude Code แล้วก็เหมือนจะคิดคล้าย ๆ กันนะครับ ถ้าเป็นมนุษย์เงินเดือนแล้วค่าใช้จ่ายต่อชั่วโมงเกินค่าแรงรายชั่วโมง แบบนั้นคงเรียกว่าล้มละลายแล้วมั้ง 😵‍💫

 
botplaysdice 2025-02-28

ก็ดูเหมือนจะเป็นเรื่องที่น่ายินดีนะ ราคาของโมเดลขึ้นอยู่กับมูลค่าตัวเราด้วย...;;;