5 คะแนน โดย GN⁺ 2026-04-26 | 2 ความคิดเห็น | แชร์ทาง WhatsApp
  • เปิดตัว GPT-5.5 บน Chat Completions API และ Responses API และเพิ่ม GPT-5.5 pro สำหรับคำขอผ่าน Responses API สำหรับโจทย์ยากที่ได้ประโยชน์จากการใช้การประมวลผลมากขึ้น
  • GPT-5.5 รองรับ context window 1 ล้านโทเค็น, การรับภาพเป็นอินพุต, structured output, function calling, prompt caching, Batch, tool search, computer use ในตัว, hosted shell, apply patch, Skills, MCP และการค้นหาเว็บ
  • ค่าเริ่มต้นของ reasoning effort ถูกตั้งเป็น medium และเมื่อ image_detail ไม่ได้ตั้งค่าหรือเป็น auto จะคงพฤติกรรมเดิมไว้
  • แคชของ GPT-5.5 ทำงานเฉพาะใน extended prompt caching เท่านั้น และไม่รองรับ in-memory prompt caching : behavioral changes
  • รายการเปลี่ยนแปลงวันที่ 21 เมษายน
    • เปิดตัว GPT Image 2 เป็นโมเดลสร้างภาพรุ่นล่าสุดสำหรับการสร้างและแก้ไขภาพ
    • GPT Image 2 มีขนาดภาพที่ยืดหยุ่นได้, การรับภาพอินพุตความเที่ยงตรงสูง, การคิดค่าบริการภาพแบบอิงโทเค็น และรองรับ Batch API ที่ลดราคา 50%

2 ความคิดเห็น

 
ragingwind 2026-04-26

ตอนนี้ตั้งแต่ 5.4 เป็นต้นไป เวอร์ชัน pro ก็จะไม่รองรับ Chat Completions API อีกต่อไปแล้ว

 
GN⁺ 2026-04-26
ความเห็นจาก Hacker News
  • ผมเพิ่งลองใช้ทันทีเพราะมีปัญหาในโปรดักชัน แล้วก็เจอว่า GPT-5.5 ทำแบบที่ Claude ไม่เคยทำ
    มันให้ผมเขียนคำสั่ง update หลังจาก troubleshooting เสร็จ แล้วพอผมบอกว่า "โอเค งั้นครอบอันนี้ด้วย transaction แล้วใส่ rollback ด้วย" มันกลับตอบมาแบบโบราณว่า
    BEGIN TRAN;
    -- put the query here
    commit;
    แค่นี้เอง
    พักหลังผมแทบไม่ต้องคอยผลักให้โมเดลทำงานที่สั่งจริง ๆ แล้ว แต่เจอแบบนี้ถือว่าช็อกพอสมควร
    เข้าใจนะว่ามันพยายามใช้โทเค็นให้น้อยลง แต่ถ้าผมจ่ายเงินให้ โมเดลล้ำสมัย แล้วมันออกอาการขี้เกียจแบบนี้ก็หงุดหงิดเหมือนกัน
    เห็นมันขึ้นในตัวเลือกโมเดลของ Cursor ก็เลยลองเฉย ๆ

    • หลัง gpt-5.3-codex มา 2-3 รุ่นหลังสุด ผมรู้สึกว่าไม่ได้ดีขึ้นแบบชัดเจน แต่เหมือนเปลี่ยนนั่นเปลี่ยนนี่แล้วได้ tradeoff คนละแบบมากกว่า
    • ผมอาจเข้าใจผิดก็ได้ แต่อยากรู้จริง ๆ ว่าปัญหาคืออะไร
      ถ้าปัญหาคือมันตอบแค่ -- put the query here แล้วไม่ได้พิมพ์ query ซ้ำอีกครั้ง ผมก็ไม่คิดว่านั่นจำเป็นต้องเป็นปัญหา
      ถ้าเป้าหมายจริง ๆ คือให้ได้ query ที่จะรัน แล้วคุณบอกว่า "ทำอันนี้เป็น transaction" การบอกว่าแค่พิมพ์ begin ไว้ข้างหน้าก็ถือว่าสมเหตุสมผลทีเดียว
      ถ้า query ยาว ก็ประหยัดโทเค็นด้วย และมันก็คล้ายกับเวลาขึ้น permission denied แล้วแทนที่จะเขียนคำสั่งทั้งหมดซ้ำอีกครั้ง ก็บอกให้เติม sudo ข้างหน้า
      แต่ถ้าคุณคาดหวังให้โมเดลรัน query ให้จริง ๆ แล้วมันตอบประมาณว่า "นี่ไง เอาไปจัดการรันเอง" แบบนั้นก็ขี้เกียจชัดเจน และงงได้ไม่แปลก
    • ดูเหมือน OpenAI จะเป็นบริษัทแรกที่ไปถึงระดับ ความฉลาดที่เอางานไปให้ผู้ใช้ทำแทน ได้สำเร็จ
      เหมือนจะเป็น emergent behavior ที่โผล่มาในรูปแบบนี้
      พูดเล่นก็ส่วนพูดเล่น แต่การที่ OpenAI หมกมุ่นกับการเพิ่ม intelligence ต่อ token แบบสุดโต่ง ทำให้นึกถึงยุคก่อน M1 ที่ Apple พยายามทำ MacBook ให้บางลงแบบเกินพอดี
      คือไล่ตามตัวชี้วัดเดียวจนสุด แล้วเสียอย่างอื่นไปหมด
      GPT-5.3+ ชัดเจนว่าเป็นโมเดลที่ฉลาดมากกลุ่มหนึ่ง แต่บางทีก็ขี้เกียจจนร่วมงานด้วยแล้วทรมาน
    • ผมยังจับความรู้สึกไม่ได้เลยว่าตัวอย่างข้างบนถือว่าดีหรือแย่กันแน่
    • เรื่องเดียวที่ GPT-5.5 ดูจะทุบ benchmark กระจุย คือความไว้ใจผู้ใช้นี่แหละ
  • เมื่อกี้ผมลองรันกับ Wordpress+GravityForms benchmark ของตัวเองแล้ว ผลคือทั้งตามเกณฑ์ประสิทธิภาพก็ติดท้ายลีดเดอร์บอร์ด และถ้าวัดความคุ้มค่าก็แย่ที่สุด: https://github.com/guilamu/llms-wordpress-plugin-benchmark
    รู้ว่าเป็นแค่ benchmark เดียว แต่ก็ยังไม่เข้าใจว่าจะออกมาแย่ได้ขนาดนี้ยังไง

    • มันให้อารมณ์เหมือนจูเนียร์ที่ประสบการณ์น้อย กำลังง่วนอยู่กับโดเมนที่ตัวเองไม่คุ้นในโรงรถ แล้วทำการทดสอบหละหลวมก่อนเรียกมันว่า benchmark
      ทุกวันนี้ความหมายของคำต่าง ๆ พังง่ายเกินไป เลยเห็นอะไรแบบนี้บ่อย
      ฟอรัมที่เมื่อก่อนมีคนทำงานสายเทคนิคจริง ๆ เยอะ เดี๋ยวนี้ก็ดูเหมือนจะเต็มไปด้วยมวลชนสาย vibe researcher และพออะไรดังเกินจุดหนึ่งก็มักลงเอยแบบนี้
      HN ยังดูเหมือนเป็นฐานที่มั่นสุดท้ายที่เหลือการสำรวจค้นคว้าแบบจริงจังอยู่บ้าง แต่ดูจากคอมเมนต์ต้นทางแล้วก็ไม่ได้มีภูมิคุ้มกันเสียทีเดียว
    • ใน benchmark ของคุณ gemma4-e4b ทำได้ดีกว่า gemma4-26b อยู่ 50% อันนี้น่าจะมีอะไรผิดพลาดนะ
    • ใน benchmark ของคุณ Opus 4.7 แย่กว่า Sonnet 4.6 มาก ซึ่งต่อให้มันจริงสำหรับ benchmark นั้น ก็ไม่ได้แปลว่ามันเป็นตัวแทนสมรรถนะโดยรวมของโมเดล
    • เหมือนคุณนั่งไทม์แมชชีนไปหยิบ benchmark นี้มาจากอนาคตเลย
      benchmarking แบบนี้ผมชอบพอสมควร
      ผมสงสัยว่า judge benchmark ประเมินกันยังไง และผมเองก็อยากจัด benchmark คล้าย ๆ กันขึ้นมาบ้าง
    • อันนี้ดูใกล้เคียงกับ benchmark ที่วัดว่าโมเดลเก่ง vibe coding แค่ไหนมากกว่า
      ตัวพรอมป์บางเฉียบ แต่เกณฑ์ให้คะแนนเยอะมาก
  • ราคาตามความยาวคอนเท็กซ์ เป็นแบบนี้
    อินพุตไม่เกิน 272K ราคา $5/M, เกินนั้น $10/M
    เอาต์พุตไม่เกิน 272K ราคา $30/M, เกินนั้น $45/M
    การอ่านแคชไม่เกิน 272K ราคา $0.50/M, เกินนั้น $1/M
    ถ้าเกิน 272K ก็แพงกว่า Opus 4.7 อย่างชัดเจน และอย่างน้อยสำหรับงานของผม มันก็ดูไม่ได้มีประสิทธิภาพต่อโทเค็นดีขึ้นพอจะคุ้ม
    ยังไม่มากพอจะชดเชยส่วนต่างราคา
    จุดแข็งของ GPT-5.4 คือคอนเท็กซ์ 400k และ compaction ที่ไว้ใจได้ แต่ทั้งสองอย่างดูถอยหลังลงเล็กน้อย
    อย่างไรก็ตาม ยังเร็วเกินไปที่จะฟันธงว่า compaction เชื่อถือได้น้อยลงจริงหรือไม่
    เอาต์พุตฝั่งฟรอนต์เอนด์ก็ยังมีแนวโน้มเอนไปทางเทมเพลตโทนสีน้ำเงินที่เต็มไปด้วยการ์ดสะดุดตาแบบเดิม
    เป็นสไตล์ที่ดูน่าสงสัยมาตั้งแต่ช่วง Horizon Alpha/Beta ก่อนเปิดตัว GPT-5 แล้ว แต่ตอนนั้น task adherence ดีมากจนยอมทนจุดอ่อนใหญ่นั้นได้และยังถือว่าใช้งานได้
    แต่พอ GPT-5.5 บอกว่าเป็น foundation ใหม่ทั้งหมดแล้ว ส่วนนี้ยังจำกัดอยู่แบบนี้ก็ค่อนข้างแปลก

  • ผล benchmark การให้เหตุผลด้านโค้ดแบบภาพรวมของ GPT 5.5 ขึ้นแล้วที่ https://gertlabs.com/
    ทั้ง live decision และ agentic eval ที่หนักกว่านี้จะทยอยเพิ่มต่ออีกเรื่อย ๆ ตลอด 24 ชั่วโมง แต่ตอนนี้ก็ดูไม่น่าจะมีอะไรเปลี่ยนอันดับบนลีดเดอร์บอร์ดแล้ว
    GPT 5.5 เป็นโมเดลที่ฉลาดที่สุดในบรรดาโมเดลสาธารณะ และเร็วขึ้นจากรุ่นก่อนอย่างชัดเจน

  • เมื่อวานยังพูดแบบนี้อยู่เลย

    API deployments require different safeguards and we are working closely with partners and customers on the safety and security requirements for serving it at scale.
    แต่วันนี้กลับเป็นแบบนี้ทันที
    วันเดียวก็นับว่าเป็น "very soon" อยู่หรอก แต่ก็สงสัยว่าจริง ๆ แล้ว safeguards กับ security requirements นั้นหมายถึงอะไรแน่

    • เวลามีคนบอกว่าอะไรบางอย่างช้าเพราะ safeguards ปกติแล้วก็มักจะแปลว่า ตอนนี้ยังไม่มีทรัพยากรคอมพิวต์เต็มรูปแบบพอจะปล่อย
    • GPT-5.5 มีอยู่ใน API สำหรับ Codex โดยเฉพาะมาก่อนแล้ว และเขาก็บอกชัดว่าหยิบไปใช้วัตถุประสงค์อื่นได้ด้วย
      https://simonwillison.net/2026/Apr/23/gpt-5-5/#the-openclaw-backdoor
      เลยคิดว่าเรื่องนั้นอาจเป็นปัจจัยที่ทำให้การเปิดตัวครั้งนี้เร็วขึ้นก็ได้
    • คนที่โกหกแบบโจ่งแจ้งเรื่อง ความปลอดภัย มาตลอดขนาดนั้นยังคงเป็นคนบริหารบริษัทอยู่ ผมเลยไม่ค่อยเข้าใจว่าทำไมถึงยังคาดหวังว่าครั้งต่อไปจะต่างออกไป
      มีตัวอย่างเก่าด้วย

      In 2023, the company was preparing to release its GPT-4 Turbo model. As Sutskever details in the memos, Altman apparently told Murati that the model didn’t need safety approval, citing the company’s general counsel, Jason Kwon. But when she asked Kwon, over Slack, he replied, “ugh . . . confused where sam got that impression.”
      Altman ไม่ได้ซื่อสัตย์อย่างเต็มที่หลายครั้งเกี่ยวกับความสำคัญของ safety ใน OpenAI
      https://www.newyorker.com/magazine/2026/04/13/sam-altman-may-control-our-future-can-he-be-trusted (https://archive.is/a2vqW)

  • ไม่แน่ใจว่าผมคิดไปเองไหม แต่ผมเริ่มรู้สึกว่า OpenAI ปล่อย นักคอมเมนต์รับเงิน หรือบอตมาคอยกด Claude แล้วดัน Codex ว่าดีกว่ามากทุกครั้งที่มีข่าวแบบนี้
    มันเยอะเกินไป และหลายข้ออ้างก็ฟังไม่ขึ้นถ้าคุณใช้ Claude ทุกวัน

    • ใช่ แปลกแบบผิดสังเกตจริง ๆ
      มันคล้ายกับบรรยากาศที่เหมือนทุกคนลืมไปแล้วว่า OpenAI ทรยศต่อประชาธิปไตยด้วยการไปช่วยเรื่อง อาวุธอัตโนมัติไร้การกำกับดูแล และการสอดส่องภายในประเทศขนาดใหญ่
    • ผมก็รู้สึกว่ามันโจ่งแจ้งพอสมควรเหมือนกัน
      อย่างน้อยสิ่งที่เริ่มโผล่ให้เห็นชัด ๆ ก็คือช่วงหลัง Opus 4.6 hype นี่เอง
    • แน่นอนว่ามีทำกัน
      ทุกวันนี้บริษัทที่พยายามดันสินค้าตัวเองก็คล้าย ๆ กันหมด
  • ผมเป็นผู้ใช้ Enterprise แต่ก็ยังเห็นแค่ 5.4
    เมื่อวานประกาศว่าต้องใช้เวลาอีกไม่กี่ชั่วโมงกว่าจะ rollout ครบทุกคน ซึ่ง OpenAI ควรทำ GTM ให้ดีกว่านี้หน่อยถ้าจะบริหารความคาดหวัง

    • เมื่อกี้รีเฟรชแล้วเห็น 5.5 โผล่มาแล้ว
      ปล่อยได้เร็วแบบนี้ก็ดี
      คราวหน้าคงต้องรีบบ่นให้เร็วกว่านี้
  • เป็นโมเดลที่สองที่ได้ 25/25 ใน benchmark ของผม
    ตัวแรกคือ Opus 4.7 และผลอยู่ที่นี่: https://sql-benchmark.nicklothian.com/?highlight=openai_gpt-5.5
    ถูกกว่า Opus แต่ช้ากว่า

  • ในหน้า API ระบุ knowledge cutoff เป็น 2025-12-01 แต่ถ้าถามโมเดลตรง ๆ มันกลับตอบว่า ตอบว่าเป็นเดือนมิถุนายน 2024
    Knowledge cutoff: 2024-06
    Current date: 2026-04-24
    You are an AI assistant accessed via an API.

    • ไม่เข้าใจว่าทำไมประเด็นนี้ถึงวนกลับมาบ่อยนัก
      การถามตัวโมเดลเองเพื่อเช็กวันที่ cutoff เป็นวิธีที่เชื่อถือน้อยที่สุดมาตั้งนานแล้ว
      มันอาจเคยเรียนรู้แม้แต่คอมเมนต์แบบนี้ด้วยซ้ำ
      แค่ถามถึงเหตุการณ์สักอย่างที่เกิดขึ้นก่อน 2025-12-01 ไม่นานก็พอ
      ถ้าเป็นไปได้ การแข่งขันกีฬา จะเหมาะที่สุด
    • ผมไม่แน่ใจว่าจะเชื่อที่โมเดลพูดได้จริงหรือเปล่า
      ในหน้า API ของโมเดลรุ่นก่อน ๆ ก็เคยระบุ cutoff เดือนมิถุนายน 2024 ไว้เยอะเหมือนกัน มันอาจแค่หยิบมาเล่าตามนั้น
    • โมเดลไม่รู้ cutoff date ของตัวเองหรอก ถ้าไม่ได้ถูกบอกผ่าน system prompt
      วิธีที่ถูกต้องในการตรวจ cutoff จริงคือถามเรื่องที่ยังไม่มีอยู่หรือยังไม่เกิดขึ้นก่อนวันนั้น
      จากที่ลองทดสอบคร่าว ๆ หลายครั้ง cutoff ของความรู้ทั่วไปของ 5.5 ก็ดูยังอยู่ราวต้นปี 2025
    • งั้นลองทดสอบด้วยว่าใครชนะ การเลือกตั้งประธานาธิบดีสหรัฐปี 2024 ได้ไหม
  • ชุด GPT 5.5 + Codex ดีมากจริง ๆ
    ไม่ว่าจะถาม วางแผน หรือให้เขียนโค้ด ตอนนี้ผมแทบจะมอบให้ทำได้โดยไม่ต้องสงสัยแล้ว
    ส่วน Opus 4.7 ยังทำให้ผมต้องคอยเช็กซ้ำ
    มันไม่ค่อยทำตามคำสั่งใน CLAUDE.md, มี hallucination เยอะ และถ้าหาคำตอบไม่ได้ก็มักแต่งขึ้นมาเองเป็นค่าเริ่มต้น ซึ่งเป็นปัญหาใหญ่พอควร
    ตอนปีที่แล้วคนพูดกันว่า OpenAI ตามหลังแล้ว เป็น code red กันอย่างรวดเร็วมาก แต่พอมาตอนนี้สถานการณ์ก็ดูเปลี่ยนไปหมดแล้ว