2 คะแนน โดย GN⁺ 2026-03-04 | 1 ความคิดเห็น | แชร์ทาง WhatsApp
  • โมเดลที่ถูกใช้งานมากที่สุดของ ChatGPT ได้รับการอัปเดต ทำให้ ความแม่นยำ·ความลื่นไหล·ความเข้าใจบริบท ในบทสนทนาประจำวันดีขึ้น
  • เวอร์ชันใหม่นี้ลด การปฏิเสธที่ไม่จำเป็นและข้อความเตือน และให้ คำตอบที่ตรงไปตรงมาและใช้งานได้จริง ต่อคำถาม
  • เมื่อค้นหาบนเว็บ ความสามารถในการ ผสานรวมข้อมูล ได้รับการปรับปรุง จึงสร้าง คำตอบที่มีบริบท แทนการสรุปแบบเรียบ ๆ
  • โทนและสไตล์การสนทนา เป็นธรรมชาติและกระชับมากขึ้น พร้อมทั้งเสริม ความถูกต้องของข้อเท็จจริง และ คุณภาพการเขียนเชิงสร้างสรรค์
  • GPT‑5.3 Instant พร้อมใช้งานทันทีใน ChatGPT และ API ส่วน GPT‑5.2 Instant เดิมมีกำหนดสิ้นสุดการสนับสนุนในวันที่ 3 มิถุนายน 2026

ภาพรวมของ GPT‑5.3 Instant

  • เป็นการอัปเดตที่ ยกระดับคุณภาพบทสนทนาในชีวิตประจำวันของ ChatGPT โดยรวม โดยเน้นที่ คำตอบที่แม่นยำ·ความเข้าใจบริบท·การรักษาความต่อเนื่องของบทสนทนา
    • ลดการสะดุดที่ไม่จำเป็น ข้อความเกริ่นนำที่มากเกินไป และถ้อยคำแบบประกาศ ทำให้ ความเป็นธรรมชาติของบทสนทนา สูงขึ้น
  • ปรับปรุง โทน ความเกี่ยวข้อง และการไหลของบทสนทนา โดยสะท้อนความคิดเห็นของผู้ใช้
  • การอัปเดตนี้ออกแบบโดยยึด ประสบการณ์การใช้งานในชีวิตประจำวัน เป็นศูนย์กลาง และให้ความสำคัญกับ คุณภาพที่ผู้ใช้รู้สึกได้จริง มากกว่าตัวเลข benchmark

ลดการปฏิเสธที่ไม่จำเป็นและตอบให้กระชับขึ้น

  • เวอร์ชันก่อนหน้า (GPT‑5.2 Instant) มีปัญหา ปฏิเสธคำถามมากเกินไปแม้เป็นคำถามที่ตอบได้อย่างปลอดภัย หรือทำให้คำตอบล่าช้าด้วย การเกริ่นเชิงศีลธรรม
  • GPT‑5.3 Instant ลดการปฏิเสธที่ไม่จำเป็น และให้ คำตอบตรงประเด็นที่ยึดคำถามเป็นศูนย์กลาง
    • ตัวอย่าง: เมื่อมีคำขอคำนวณการยิงธนูระยะไกล GPT‑5.2 จะใส่คำนำยาวเกี่ยวกับความปลอดภัย
      แต่ GPT‑5.3 จะขอ ตัวแปรทางฟิสิกส์ที่จำเป็น (แรงของคันธนู มวลลูกธนู ความเร็ว ฯลฯ) ทันทีแล้วดำเนินการคำนวณ
  • ผลลัพธ์คือ การสะดุดของบทสนทนาลดลง และสามารถให้ คำตอบที่รวดเร็วและใช้ได้จริง มากขึ้น

คุณภาพคำตอบจากการค้นหาบนเว็บที่ดีขึ้น

  • GPT‑5.3 Instant ผสานข้อมูลที่ได้จากเว็บเข้ากับ ความรู้ภายในและความสามารถในการให้เหตุผล เพื่อสร้าง คำตอบที่มีบริบท
    • แทนที่จะเพียงลิสต์ลิงก์หรือข้อมูลซ้ำซ้อน จะให้ สรุปประเด็นสำคัญและเชื่อมโยงความหมาย เป็นหลัก
  • ตัวอย่าง: สำหรับคำถาม “สัญญาที่ใหญ่ที่สุดในช่วง offseason ของ MLB ปี 2025–26”
    • GPT‑5.2 อธิบายกรณีย้อนหลังของฤดูกาลก่อน
    • ขณะที่ GPT‑5.3 ระบุได้อย่างถูกต้องว่าเป็น สัญญา 4 ปี มูลค่า 240 ล้านดอลลาร์ของ Kyle Tucker กับ LA Dodgers และ
      อธิบายเชื่อมโยงไปถึง การเปลี่ยนแปลงโครงสร้างลีก·ผลกระทบจากการเจรจาระหว่างแรงงานกับฝ่ายบริหาร
  • ส่งผลให้ ความทันสมัย·ความเกี่ยวข้อง·ความแม่นยำด้านบริบท ดีขึ้น

ความเป็นธรรมชาติของสไตล์การสนทนา

  • คำตอบบางส่วนของ GPT‑5.2 Instant เคยได้รับคำติว่า “ไม่เป็นธรรมชาติ” เพราะมี ถ้อยคำปลอบใจมากเกินไปหรือการคาดเดาอารมณ์
  • GPT‑5.3 Instant ปรับปรุงโดย ลดการแสดงอารมณ์ที่ไม่จำเป็น และใช้ ภาษาสนทนาที่เป็นธรรมชาติและเน้นแก่นสำคัญ
    • ตัวอย่าง: สำหรับคำถาม “ทำไมการหาความรักในซานฟรานซิสโกถึงยาก”
      GPT‑5.3 อธิบายปัจจัยเชิงโครงสร้างอย่างเป็นระบบ เช่น วัฒนธรรมเมือง·การเคลื่อนย้าย·ระยะห่างทางอารมณ์
    • โดยไม่เปิดด้วยประโยคอย่าง “คุณไม่เป็นไรนะ” แต่ให้ คำตอบเชิงวิเคราะห์ที่ตรงไปตรงมาและเข้าถึงความรู้สึกได้

ความถูกต้องของข้อเท็จจริงที่ดีขึ้น

  • GPT‑5.3 Instant ลด อัตราการเกิดภาพหลอน (hallucination) ได้มากใน สาขาความเสี่ยงสูง เช่น การแพทย์ กฎหมาย และการเงิน
    • เมื่อใช้เว็บ อัตราภาพหลอนลดลง 26.8% และเมื่อใช้เพียงความรู้ภายในลดลง 19.7%
    • ในการประเมินตามความคิดเห็นผู้ใช้ ก็ลดลง 22.5% (เมื่อใช้เว็บ) และ 9.6% (ไม่ใช้เว็บ)
  • ทำให้ ความน่าเชื่อถือของคำตอบที่อิงข้อเท็จจริง สูงขึ้น และเพิ่มประโยชน์ในการใช้งานจริง

ความสามารถด้านการเขียนที่แข็งแกร่งขึ้น

  • GPT‑5.3 Instant มี ความลุ่มลึกเชิงเล่าเรื่องและพลังในการถ่ายทอดอารมณ์ ดีขึ้น จึงโดดเด่นด้าน การเขียนเชิงสร้างสรรค์·การพรรณนาเชิงวรรณศิลป์
    • ตัวอย่าง: เมื่อขอให้แต่งบทกวีเรื่อง “การส่งจดหมายครั้งสุดท้ายของบุรุษไปรษณีย์ฟิลาเดลเฟียที่กำลังเกษียณ”
      GPT‑5.3 ถ่ายทอดอารมณ์ได้อย่างเป็นธรรมชาติผ่าน ฉากที่เฉพาะเจาะจง·รายละเอียดเชิงประสาทสัมผัส
    • เมื่อเทียบกับการบรรยายเชิงซาบซึ้งของ GPT‑5.2 แล้ว มี ความสมบูรณ์ด้านโครงสร้างและความสมจริง สูงกว่า

ข้อจำกัดและการปรับปรุงในอนาคต

  • ใน ภาษาที่ไม่ใช่ภาษาอังกฤษ (เช่น ญี่ปุ่น·เกาหลี) ยังเกิด สำนวนที่ฟังแข็งหรือแปลตรงตัว อยู่
    • การปรับปรุง โทนที่เป็นธรรมชาติตามแต่ละภาษา ยังเป็นโจทย์ต่อไป
  • ฟังก์ชันปรับโทนคำตอบ อยู่ระหว่างการพัฒนา และยังคงเก็บความคิดเห็นผู้ใช้อย่างต่อเนื่อง

การให้บริการและแผนการย้ายไปใช้รุ่นใหม่

  • GPT‑5.3 Instant พร้อมใช้งานทันทีสำหรับผู้ใช้ ChatGPT ทุกคนและใน API (gpt‑5.3‑chat‑latest)
  • การอัปเดตโมเดล Thinking·Pro จะตามมาในเร็ว ๆ นี้
  • GPT‑5.2 Instant จะสิ้นสุดการสนับสนุนในวันที่ 3 มิถุนายน 2026 และจะให้ผู้ใช้แบบชำระเงินใช้งานต่อในหมวด ‘Legacy Models’ เป็นเวลา 3 เดือน

1 ความคิดเห็น

 
GN⁺ 2026-03-04
ความเห็นจาก Hacker News
  • ตอนนี้ปัญหาใหญ่ที่สุดของ ChatGPT คือ สำนวนการตอบที่ฟังแปลกๆ
    มีวลีอย่าง “Why it matters”, “the big picture” รวมถึงการเน้นเกินจริงและคำถามเชิงวาทศิลป์มากเกินไป
    GPT‑5 รุ่นแรกโอเคอยู่แล้ว แต่พอพยายามทำให้มี “บุคลิกที่อบอุ่นขึ้น” กลับพังเหมือน 4o
    ภาษาญี่ปุ่นเมื่อก่อนก็ทำได้ดี แต่ตอนนี้คุณภาพตกลงจนน่าผิดหวัง

    • เมื่อก่อนฉันเองก็เคยเขียนอะไรแนว “Why X works, but Y doesn’t” แบบนั้นเหมือนกัน แต่ตอนนี้มันชวนให้ดูเหมือน คนที่เลียนแบบ LLM ก็เลยยิ่งน่าเขิน
      เลยกำลังลองสไตล์การเขียนใหม่แบบใส่เอฟเฟ็กต์เสียงอย่าง <i>swoosh</i> เข้าไปแทน
    • ฉันก็รำคาญสำนวนซ้ำๆ แบบนั้นเหมือนกัน แต่ตอนนี้เลยข้ามมันไปแล้วอ่านเฉพาะเนื้อหา
      ฉันใช้งานผลลัพธ์จาก LLM เป็นข้อมูลอ้างอิง แต่ไม่คัดลอกตรงๆ และเขียนใหม่ด้วยเสียงของตัวเองเพื่อรักษา สไตล์ของตัวเอง ไว้
    • อีกไม่นานอาจมี “เวอร์ชันพรีเมียมที่ไม่หยิ่ง” ออกมาก็ได้ แล้วคนน่าจะย้ายไปใช้กันเยอะพอสมควร
  • แบรนด์ “5.2‑Instant” ชวนสับสน
    นึกว่าเป็นโมเดลความเร็วสูงมาก แต่ดูเหมือนจะเป็นแค่ 5.2 เวอร์ชันที่ไม่มี router
    ให้ความรู้สึกว่า OpenAI กำลังย้อนกลับไปสู่ยุคก่อน GPT‑5 ที่มีโมเดลมากเกินไปจนไม่รู้ว่าควรใช้อะไร

    • จริงๆ แล้ว ChatGPT Plus ใช้โมเดลอยู่สองตระกูล
      ตระกูลหนึ่งคือ Instant series ที่เร็วและปรับให้เหมาะกับ ChatGPT แต่ความแม่นยำต่ำกว่า
      อีกตระกูลคือ Thinking series ที่ช้ากว่าแต่เหมาะกับงานเฉพาะทางมากกว่า
      อยากลดให้เหลือตัวเลือกเดียวเพื่อความเรียบง่าย แต่เพราะผู้ใช้แต่ละคนชอบไม่เหมือนกัน เลยยังคงให้ทั้งสองโมเดลอยู่ (ผู้เขียนเป็นพนักงาน OpenAI)
    • คนชอบมีตัวเลือกอยู่แล้ว ดังนั้นการแยกเป็น “5.2 Instant / 5.2 Thinking” น่าจะชัดเจนกว่าใช้แค่ “5.2”
      คู่แข่งอย่าง Gemini 3 Fast / Gemini 3 Thinking ก็ใช้แนวทางเดียวกัน
    • ยังมีคนราว 800,000 คนต่อวันใช้ gpt‑4o อยู่ เลยมีเหตุผลที่จะรักษาฐานผู้ใช้นั้นไว้
      โมเดล “Thinking” มีต้นทุนแพงกว่า จึงเป็นกลยุทธ์ที่จะใช้ โมเดล Instant ราคาถูกกว่า เพื่อรั้งคนกลุ่มนั้นเอาไว้
    • ต้องรอดู benchmark จริง แต่จากคำอธิบายของ OpenAI นั้น Instant คือ โมเดลที่ปรับให้เหมาะกับ latency
      สำหรับอินเทอร์เฟซเสียง เวลากว่าจะได้โทเคนแรกสำคัญกว่าความเร็วโทเคนต่อวินาที
  • เห็นชื่อ “GPT‑5.3 Instant: Smoother, more …” แล้วหลุดขำเลย
    เดี๋ยวนี้คำโปรยโฆษณา LLM ฟังดูเหมือน โฆษณาบุหรี่

    • “GPT‑5.3 Instant: It’s toasted…”
    • “LLMenthols”
    • “GPT Super Mild”
    • “GPT Crush”
  • เห็นคำว่า “Better judgment around refusals” อยู่บนหน้าเพจ
    เลยสงสัยว่าบริษัท AI เคยจัดการปัญหาการใช้ กฎคนละชุดกับแต่ละกลุ่ม แบบเป็นทางการหรือเปล่า
    เช่น ปฏิเสธมุกตลกเกี่ยวกับบางกลุ่ม แต่อนุญาตกับอีกบางกลุ่ม
    อีกทั้งงานวิจัยนี้ก็อ้างว่าโมเดลประเมินค่าชีวิตมนุษย์ต่างกันไปตามประเทศ

    • มันอาจเป็นการสะท้อนบรรทัดฐานทางสังคมก็ได้ไม่ใช่หรือ?
    • สำหรับฉัน ปัญหาใหญ่ที่สุดคือ อคติแบบอเมริกาเป็นศูนย์กลาง
      ต่อให้สั่งว่า “ให้ตอบเป็นหน่วย metric” ก็มักไม่ทำตาม จนต้องถามเรื่องทำอาหารซ้ำหลายรอบ
      ตอนนี้ดีขึ้นหน่อยแล้ว แต่ก็ยังมีกลิ่นอายมุมมองแบบอเมริกันอยู่มาก
    • การตั้งคำถามเรื่องอคติของโมเดลนั้นสมเหตุสมผล แต่กระดาษงานวิจัยนั้นดูเหมือน วิธีวิจัยไม่แข็งแรง
      เขาคำนวณ “อัตราแลกเปลี่ยน” ของชีวิตมนุษย์จากราคาแพะ ซึ่งมันอาจสะท้อนแค่ความต่างของค่าครองชีพระหว่างประเทศก็ได้
      อีกทั้งมีตัวอย่างแค่ 11 ประเทศ จึงยากจะสรุปทั่วไป
    • บทความของ ACM ชี้ว่าการทดลอง “อัตราแลกเปลี่ยน” แบบนี้เป็นผลจากการออกแบบการประเมินเอง
      ไม่ได้แสดง ความชอบภายในจริงๆ ของโมเดล
      ถ้าให้ตัวเลือกแบบเป็นกลาง โมเดลส่วนใหญ่จะประเมินว่าชีวิตมนุษย์ทุกคนมีค่าเท่ากัน
      แถมงานวิจัยต้นฉบับยังเปิดเผยข้อมูลไม่พอ และเชื่อมโค้ดกับผลลัพธ์ได้ยาก ทำให้ความน่าเชื่อถือต่ำ
  • ตามลิงก์เปรียบเทียบ
    Gemini 3.1 Lite (no reasoning) ให้ประสิทธิภาพดีกว่า GPT‑5.3 (no reasoning)

    • แถมยังถูกกว่ามากด้วย: GPT‑5.3 อยู่ที่ $0.256 ส่วน Gemini อยู่แถว $0.011
  • รู้สึกไม่สบายใจกับการที่ตัวอย่างในการประกาศพูดถึง การคำนวณวิถีกระสุนปืนใหญ่พิสัยไกล

    • แม้จะไม่สบายใจ แต่ก็ไม่ใช่เรื่องแปลก
      OpenAI กำลังร่วมมือกับกองทัพสหรัฐอยู่ จึงดูเหมือนกำลังพยายามทำให้ การใช้งานทางทหารกลายเป็นเรื่องปกติ
      เหมือนเป็นกลยุทธ์ที่ค่อยๆ ห่อหุ้มมันด้วยตัวอย่างในชีวิตประจำวัน เพื่อลดทอนเสียงคัดค้าน
    • ฉันมองว่าตัวอย่างนั้นเป็น การคารวะ ยุคแรกๆ ที่คอมพิวเตอร์ถูกใช้คำนวณวิถีกระสุน
      แต่พอมองสถานการณ์ปัจจุบันแล้ว ก็ไม่แน่ใจว่าตีความแบบนั้นจะถูกไหม
    • มันอาจเป็นแค่ตัวอย่างธรรมดาที่พบได้ในหนังสือฟิสิกส์ระดับมัธยมปลาย
    • เมื่อคำนึงถึงเหตุการณ์ล่าสุด ตัวอย่างแบบนั้นดูเหมือน ความพลาดแบบไม่รู้กาลเทศะ
    • บางคนก็แซวว่า “ช่วงนี้มีอุบัติเหตุจากการยิงธนูหรือไง?”
  • ฉันเห็นด้วยกับคำอธิบายที่ว่า “GPT‑5.3 Instant ผสานข้อมูลที่ดึงมาจากเว็บได้ดีกว่า”
    ในการใช้งานจริง GPT ใช้ การค้นหา ได้เป็นธรรมชาติกว่า Claude มาก

    • กลับกัน ฉันรู้สึกว่า Claude ใช้การค้นหา บ่อยเกินไป
      แถมยังมีบั๊กที่แม้จะปิดการค้นเว็บไว้แล้ว มันก็ลืมการตั้งค่านั้น
  • ใน benchmark ของฉัน GPT‑5.3 ให้ผลเท่ากับหรือแย่กว่า 5.2‑chat เล็กน้อย
    เลยพอเข้าใจว่าทำไมในบล็อกถึง ไม่เปิดเผย benchmark
    ลิงก์เปรียบเทียบ

  • ที่น่าสนใจคือ ก่อนประกาศ “5.3 Instant” ไม่นาน ตัวเลือก “Instant” ในตัวเลือกโมเดลถูกถอดออกไปเลย
    แล้วเปลี่ยนเป็น “Auto(แต่ปิด Auto‑switch อยู่)”
    คำอธิบายว่า “อัตโนมัติ แต่ปิดอัตโนมัติอยู่” ดูเหมือนเป็นหลักฐานว่า ตัวเองก็ยังสับสนเหมือนกัน