OpenAI เปิดตัว GPT-5.5 และ GPT-5.5 Pro บน API
(developers.openai.com)- เปิดตัว GPT-5.5 บน Chat Completions API และ Responses API และเพิ่ม GPT-5.5 pro สำหรับคำขอผ่าน Responses API สำหรับโจทย์ยากที่ได้ประโยชน์จากการใช้การประมวลผลมากขึ้น
- GPT-5.5 รองรับ context window 1 ล้านโทเค็น, การรับภาพเป็นอินพุต, structured output, function calling, prompt caching, Batch, tool search, computer use ในตัว, hosted shell, apply patch, Skills, MCP และการค้นหาเว็บ
- ค่าเริ่มต้นของ reasoning effort ถูกตั้งเป็น
mediumและเมื่อimage_detailไม่ได้ตั้งค่าหรือเป็นautoจะคงพฤติกรรมเดิมไว้ - แคชของ GPT-5.5 ทำงานเฉพาะใน extended prompt caching เท่านั้น และไม่รองรับ in-memory prompt caching : behavioral changes
- รายการเปลี่ยนแปลงวันที่ 21 เมษายน
- เปิดตัว GPT Image 2 เป็นโมเดลสร้างภาพรุ่นล่าสุดสำหรับการสร้างและแก้ไขภาพ
- GPT Image 2 มีขนาดภาพที่ยืดหยุ่นได้, การรับภาพอินพุตความเที่ยงตรงสูง, การคิดค่าบริการภาพแบบอิงโทเค็น และรองรับ Batch API ที่ลดราคา 50%
2 ความคิดเห็น
ตอนนี้ตั้งแต่ 5.4 เป็นต้นไป เวอร์ชัน pro ก็จะไม่รองรับ Chat Completions API อีกต่อไปแล้ว
ความเห็นจาก Hacker News
ผมเพิ่งลองใช้ทันทีเพราะมีปัญหาในโปรดักชัน แล้วก็เจอว่า GPT-5.5 ทำแบบที่ Claude ไม่เคยทำ
มันให้ผมเขียนคำสั่ง update หลังจาก troubleshooting เสร็จ แล้วพอผมบอกว่า "โอเค งั้นครอบอันนี้ด้วย transaction แล้วใส่ rollback ด้วย" มันกลับตอบมาแบบโบราณว่า
BEGIN TRAN;-- put the query herecommit;แค่นี้เอง
พักหลังผมแทบไม่ต้องคอยผลักให้โมเดลทำงานที่สั่งจริง ๆ แล้ว แต่เจอแบบนี้ถือว่าช็อกพอสมควร
เข้าใจนะว่ามันพยายามใช้โทเค็นให้น้อยลง แต่ถ้าผมจ่ายเงินให้ โมเดลล้ำสมัย แล้วมันออกอาการขี้เกียจแบบนี้ก็หงุดหงิดเหมือนกัน
เห็นมันขึ้นในตัวเลือกโมเดลของ Cursor ก็เลยลองเฉย ๆ
ถ้าปัญหาคือมันตอบแค่
-- put the query hereแล้วไม่ได้พิมพ์ query ซ้ำอีกครั้ง ผมก็ไม่คิดว่านั่นจำเป็นต้องเป็นปัญหาถ้าเป้าหมายจริง ๆ คือให้ได้ query ที่จะรัน แล้วคุณบอกว่า "ทำอันนี้เป็น transaction" การบอกว่าแค่พิมพ์
beginไว้ข้างหน้าก็ถือว่าสมเหตุสมผลทีเดียวถ้า query ยาว ก็ประหยัดโทเค็นด้วย และมันก็คล้ายกับเวลาขึ้น
permission deniedแล้วแทนที่จะเขียนคำสั่งทั้งหมดซ้ำอีกครั้ง ก็บอกให้เติมsudoข้างหน้าแต่ถ้าคุณคาดหวังให้โมเดลรัน query ให้จริง ๆ แล้วมันตอบประมาณว่า "นี่ไง เอาไปจัดการรันเอง" แบบนั้นก็ขี้เกียจชัดเจน และงงได้ไม่แปลก
เหมือนจะเป็น emergent behavior ที่โผล่มาในรูปแบบนี้
พูดเล่นก็ส่วนพูดเล่น แต่การที่ OpenAI หมกมุ่นกับการเพิ่ม intelligence ต่อ token แบบสุดโต่ง ทำให้นึกถึงยุคก่อน M1 ที่ Apple พยายามทำ MacBook ให้บางลงแบบเกินพอดี
คือไล่ตามตัวชี้วัดเดียวจนสุด แล้วเสียอย่างอื่นไปหมด
GPT-5.3+ ชัดเจนว่าเป็นโมเดลที่ฉลาดมากกลุ่มหนึ่ง แต่บางทีก็ขี้เกียจจนร่วมงานด้วยแล้วทรมาน
เมื่อกี้ผมลองรันกับ Wordpress+GravityForms benchmark ของตัวเองแล้ว ผลคือทั้งตามเกณฑ์ประสิทธิภาพก็ติดท้ายลีดเดอร์บอร์ด และถ้าวัดความคุ้มค่าก็แย่ที่สุด: https://github.com/guilamu/llms-wordpress-plugin-benchmark
รู้ว่าเป็นแค่ benchmark เดียว แต่ก็ยังไม่เข้าใจว่าจะออกมาแย่ได้ขนาดนี้ยังไง
ทุกวันนี้ความหมายของคำต่าง ๆ พังง่ายเกินไป เลยเห็นอะไรแบบนี้บ่อย
ฟอรัมที่เมื่อก่อนมีคนทำงานสายเทคนิคจริง ๆ เยอะ เดี๋ยวนี้ก็ดูเหมือนจะเต็มไปด้วยมวลชนสาย vibe researcher และพออะไรดังเกินจุดหนึ่งก็มักลงเอยแบบนี้
HN ยังดูเหมือนเป็นฐานที่มั่นสุดท้ายที่เหลือการสำรวจค้นคว้าแบบจริงจังอยู่บ้าง แต่ดูจากคอมเมนต์ต้นทางแล้วก็ไม่ได้มีภูมิคุ้มกันเสียทีเดียว
benchmarking แบบนี้ผมชอบพอสมควร
ผมสงสัยว่า judge benchmark ประเมินกันยังไง และผมเองก็อยากจัด benchmark คล้าย ๆ กันขึ้นมาบ้าง
ตัวพรอมป์บางเฉียบ แต่เกณฑ์ให้คะแนนเยอะมาก
ราคาตามความยาวคอนเท็กซ์ เป็นแบบนี้
อินพุตไม่เกิน 272K ราคา $5/M, เกินนั้น $10/M
เอาต์พุตไม่เกิน 272K ราคา $30/M, เกินนั้น $45/M
การอ่านแคชไม่เกิน 272K ราคา $0.50/M, เกินนั้น $1/M
ถ้าเกิน 272K ก็แพงกว่า Opus 4.7 อย่างชัดเจน และอย่างน้อยสำหรับงานของผม มันก็ดูไม่ได้มีประสิทธิภาพต่อโทเค็นดีขึ้นพอจะคุ้ม
ยังไม่มากพอจะชดเชยส่วนต่างราคา
จุดแข็งของ GPT-5.4 คือคอนเท็กซ์ 400k และ compaction ที่ไว้ใจได้ แต่ทั้งสองอย่างดูถอยหลังลงเล็กน้อย
อย่างไรก็ตาม ยังเร็วเกินไปที่จะฟันธงว่า compaction เชื่อถือได้น้อยลงจริงหรือไม่
เอาต์พุตฝั่งฟรอนต์เอนด์ก็ยังมีแนวโน้มเอนไปทางเทมเพลตโทนสีน้ำเงินที่เต็มไปด้วยการ์ดสะดุดตาแบบเดิม
เป็นสไตล์ที่ดูน่าสงสัยมาตั้งแต่ช่วง Horizon Alpha/Beta ก่อนเปิดตัว GPT-5 แล้ว แต่ตอนนั้น task adherence ดีมากจนยอมทนจุดอ่อนใหญ่นั้นได้และยังถือว่าใช้งานได้
แต่พอ GPT-5.5 บอกว่าเป็น foundation ใหม่ทั้งหมดแล้ว ส่วนนี้ยังจำกัดอยู่แบบนี้ก็ค่อนข้างแปลก
ผล benchmark การให้เหตุผลด้านโค้ดแบบภาพรวมของ GPT 5.5 ขึ้นแล้วที่ https://gertlabs.com/
ทั้ง live decision และ agentic eval ที่หนักกว่านี้จะทยอยเพิ่มต่ออีกเรื่อย ๆ ตลอด 24 ชั่วโมง แต่ตอนนี้ก็ดูไม่น่าจะมีอะไรเปลี่ยนอันดับบนลีดเดอร์บอร์ดแล้ว
GPT 5.5 เป็นโมเดลที่ฉลาดที่สุดในบรรดาโมเดลสาธารณะ และเร็วขึ้นจากรุ่นก่อนอย่างชัดเจน
เมื่อวานยังพูดแบบนี้อยู่เลย
https://simonwillison.net/2026/Apr/23/gpt-5-5/#the-openclaw-backdoor
เลยคิดว่าเรื่องนั้นอาจเป็นปัจจัยที่ทำให้การเปิดตัวครั้งนี้เร็วขึ้นก็ได้
มีตัวอย่างเก่าด้วย
ไม่แน่ใจว่าผมคิดไปเองไหม แต่ผมเริ่มรู้สึกว่า OpenAI ปล่อย นักคอมเมนต์รับเงิน หรือบอตมาคอยกด Claude แล้วดัน Codex ว่าดีกว่ามากทุกครั้งที่มีข่าวแบบนี้
มันเยอะเกินไป และหลายข้ออ้างก็ฟังไม่ขึ้นถ้าคุณใช้ Claude ทุกวัน
มันคล้ายกับบรรยากาศที่เหมือนทุกคนลืมไปแล้วว่า OpenAI ทรยศต่อประชาธิปไตยด้วยการไปช่วยเรื่อง อาวุธอัตโนมัติไร้การกำกับดูแล และการสอดส่องภายในประเทศขนาดใหญ่
อย่างน้อยสิ่งที่เริ่มโผล่ให้เห็นชัด ๆ ก็คือช่วงหลัง Opus 4.6 hype นี่เอง
ทุกวันนี้บริษัทที่พยายามดันสินค้าตัวเองก็คล้าย ๆ กันหมด
ผมเป็นผู้ใช้ Enterprise แต่ก็ยังเห็นแค่ 5.4
เมื่อวานประกาศว่าต้องใช้เวลาอีกไม่กี่ชั่วโมงกว่าจะ rollout ครบทุกคน ซึ่ง OpenAI ควรทำ GTM ให้ดีกว่านี้หน่อยถ้าจะบริหารความคาดหวัง
ปล่อยได้เร็วแบบนี้ก็ดี
คราวหน้าคงต้องรีบบ่นให้เร็วกว่านี้
เป็นโมเดลที่สองที่ได้ 25/25 ใน benchmark ของผม
ตัวแรกคือ Opus 4.7 และผลอยู่ที่นี่: https://sql-benchmark.nicklothian.com/?highlight=openai_gpt-5.5
ถูกกว่า Opus แต่ช้ากว่า
ในหน้า API ระบุ knowledge cutoff เป็น 2025-12-01 แต่ถ้าถามโมเดลตรง ๆ มันกลับตอบว่า ตอบว่าเป็นเดือนมิถุนายน 2024
Knowledge cutoff: 2024-06Current date: 2026-04-24You are an AI assistant accessed via an API.การถามตัวโมเดลเองเพื่อเช็กวันที่ cutoff เป็นวิธีที่เชื่อถือน้อยที่สุดมาตั้งนานแล้ว
มันอาจเคยเรียนรู้แม้แต่คอมเมนต์แบบนี้ด้วยซ้ำ
แค่ถามถึงเหตุการณ์สักอย่างที่เกิดขึ้นก่อน 2025-12-01 ไม่นานก็พอ
ถ้าเป็นไปได้ การแข่งขันกีฬา จะเหมาะที่สุด
ในหน้า API ของโมเดลรุ่นก่อน ๆ ก็เคยระบุ cutoff เดือนมิถุนายน 2024 ไว้เยอะเหมือนกัน มันอาจแค่หยิบมาเล่าตามนั้น
วิธีที่ถูกต้องในการตรวจ cutoff จริงคือถามเรื่องที่ยังไม่มีอยู่หรือยังไม่เกิดขึ้นก่อนวันนั้น
จากที่ลองทดสอบคร่าว ๆ หลายครั้ง cutoff ของความรู้ทั่วไปของ 5.5 ก็ดูยังอยู่ราวต้นปี 2025
ชุด GPT 5.5 + Codex ดีมากจริง ๆ
ไม่ว่าจะถาม วางแผน หรือให้เขียนโค้ด ตอนนี้ผมแทบจะมอบให้ทำได้โดยไม่ต้องสงสัยแล้ว
ส่วน Opus 4.7 ยังทำให้ผมต้องคอยเช็กซ้ำ
มันไม่ค่อยทำตามคำสั่งใน
CLAUDE.md, มี hallucination เยอะ และถ้าหาคำตอบไม่ได้ก็มักแต่งขึ้นมาเองเป็นค่าเริ่มต้น ซึ่งเป็นปัญหาใหญ่พอควรตอนปีที่แล้วคนพูดกันว่า OpenAI ตามหลังแล้ว เป็น code red กันอย่างรวดเร็วมาก แต่พอมาตอนนี้สถานการณ์ก็ดูเปลี่ยนไปหมดแล้ว