- โมเดลที่ถูกใช้งานมากที่สุดของ ChatGPT ได้รับการอัปเดต ทำให้ ความแม่นยำ·ความลื่นไหล·ความเข้าใจบริบท ในบทสนทนาประจำวันดีขึ้น
- เวอร์ชันใหม่นี้ลด การปฏิเสธที่ไม่จำเป็นและข้อความเตือน และให้ คำตอบที่ตรงไปตรงมาและใช้งานได้จริง ต่อคำถาม
- เมื่อค้นหาบนเว็บ ความสามารถในการ ผสานรวมข้อมูล ได้รับการปรับปรุง จึงสร้าง คำตอบที่มีบริบท แทนการสรุปแบบเรียบ ๆ
- โทนและสไตล์การสนทนา เป็นธรรมชาติและกระชับมากขึ้น พร้อมทั้งเสริม ความถูกต้องของข้อเท็จจริง และ คุณภาพการเขียนเชิงสร้างสรรค์
- GPT‑5.3 Instant พร้อมใช้งานทันทีใน ChatGPT และ API ส่วน GPT‑5.2 Instant เดิมมีกำหนดสิ้นสุดการสนับสนุนในวันที่ 3 มิถุนายน 2026
ภาพรวมของ GPT‑5.3 Instant
- เป็นการอัปเดตที่ ยกระดับคุณภาพบทสนทนาในชีวิตประจำวันของ ChatGPT โดยรวม โดยเน้นที่ คำตอบที่แม่นยำ·ความเข้าใจบริบท·การรักษาความต่อเนื่องของบทสนทนา
- ลดการสะดุดที่ไม่จำเป็น ข้อความเกริ่นนำที่มากเกินไป และถ้อยคำแบบประกาศ ทำให้ ความเป็นธรรมชาติของบทสนทนา สูงขึ้น
- ปรับปรุง โทน ความเกี่ยวข้อง และการไหลของบทสนทนา โดยสะท้อนความคิดเห็นของผู้ใช้
- การอัปเดตนี้ออกแบบโดยยึด ประสบการณ์การใช้งานในชีวิตประจำวัน เป็นศูนย์กลาง และให้ความสำคัญกับ คุณภาพที่ผู้ใช้รู้สึกได้จริง มากกว่าตัวเลข benchmark
ลดการปฏิเสธที่ไม่จำเป็นและตอบให้กระชับขึ้น
- เวอร์ชันก่อนหน้า (GPT‑5.2 Instant) มีปัญหา ปฏิเสธคำถามมากเกินไปแม้เป็นคำถามที่ตอบได้อย่างปลอดภัย หรือทำให้คำตอบล่าช้าด้วย การเกริ่นเชิงศีลธรรม
- GPT‑5.3 Instant ลดการปฏิเสธที่ไม่จำเป็น และให้ คำตอบตรงประเด็นที่ยึดคำถามเป็นศูนย์กลาง
- ตัวอย่าง: เมื่อมีคำขอคำนวณการยิงธนูระยะไกล GPT‑5.2 จะใส่คำนำยาวเกี่ยวกับความปลอดภัย
แต่ GPT‑5.3 จะขอ ตัวแปรทางฟิสิกส์ที่จำเป็น (แรงของคันธนู มวลลูกธนู ความเร็ว ฯลฯ) ทันทีแล้วดำเนินการคำนวณ
- ผลลัพธ์คือ การสะดุดของบทสนทนาลดลง และสามารถให้ คำตอบที่รวดเร็วและใช้ได้จริง มากขึ้น
คุณภาพคำตอบจากการค้นหาบนเว็บที่ดีขึ้น
- GPT‑5.3 Instant ผสานข้อมูลที่ได้จากเว็บเข้ากับ ความรู้ภายในและความสามารถในการให้เหตุผล เพื่อสร้าง คำตอบที่มีบริบท
- แทนที่จะเพียงลิสต์ลิงก์หรือข้อมูลซ้ำซ้อน จะให้ สรุปประเด็นสำคัญและเชื่อมโยงความหมาย เป็นหลัก
- ตัวอย่าง: สำหรับคำถาม “สัญญาที่ใหญ่ที่สุดในช่วง offseason ของ MLB ปี 2025–26”
- GPT‑5.2 อธิบายกรณีย้อนหลังของฤดูกาลก่อน
- ขณะที่ GPT‑5.3 ระบุได้อย่างถูกต้องว่าเป็น สัญญา 4 ปี มูลค่า 240 ล้านดอลลาร์ของ Kyle Tucker กับ LA Dodgers และ
อธิบายเชื่อมโยงไปถึง การเปลี่ยนแปลงโครงสร้างลีก·ผลกระทบจากการเจรจาระหว่างแรงงานกับฝ่ายบริหาร
- ส่งผลให้ ความทันสมัย·ความเกี่ยวข้อง·ความแม่นยำด้านบริบท ดีขึ้น
ความเป็นธรรมชาติของสไตล์การสนทนา
- คำตอบบางส่วนของ GPT‑5.2 Instant เคยได้รับคำติว่า “ไม่เป็นธรรมชาติ” เพราะมี ถ้อยคำปลอบใจมากเกินไปหรือการคาดเดาอารมณ์
- GPT‑5.3 Instant ปรับปรุงโดย ลดการแสดงอารมณ์ที่ไม่จำเป็น และใช้ ภาษาสนทนาที่เป็นธรรมชาติและเน้นแก่นสำคัญ
- ตัวอย่าง: สำหรับคำถาม “ทำไมการหาความรักในซานฟรานซิสโกถึงยาก”
GPT‑5.3 อธิบายปัจจัยเชิงโครงสร้างอย่างเป็นระบบ เช่น วัฒนธรรมเมือง·การเคลื่อนย้าย·ระยะห่างทางอารมณ์
- โดยไม่เปิดด้วยประโยคอย่าง “คุณไม่เป็นไรนะ” แต่ให้ คำตอบเชิงวิเคราะห์ที่ตรงไปตรงมาและเข้าถึงความรู้สึกได้
ความถูกต้องของข้อเท็จจริงที่ดีขึ้น
- GPT‑5.3 Instant ลด อัตราการเกิดภาพหลอน (hallucination) ได้มากใน สาขาความเสี่ยงสูง เช่น การแพทย์ กฎหมาย และการเงิน
- เมื่อใช้เว็บ อัตราภาพหลอนลดลง 26.8% และเมื่อใช้เพียงความรู้ภายในลดลง 19.7%
- ในการประเมินตามความคิดเห็นผู้ใช้ ก็ลดลง 22.5% (เมื่อใช้เว็บ) และ 9.6% (ไม่ใช้เว็บ)
- ทำให้ ความน่าเชื่อถือของคำตอบที่อิงข้อเท็จจริง สูงขึ้น และเพิ่มประโยชน์ในการใช้งานจริง
ความสามารถด้านการเขียนที่แข็งแกร่งขึ้น
- GPT‑5.3 Instant มี ความลุ่มลึกเชิงเล่าเรื่องและพลังในการถ่ายทอดอารมณ์ ดีขึ้น จึงโดดเด่นด้าน การเขียนเชิงสร้างสรรค์·การพรรณนาเชิงวรรณศิลป์
- ตัวอย่าง: เมื่อขอให้แต่งบทกวีเรื่อง “การส่งจดหมายครั้งสุดท้ายของบุรุษไปรษณีย์ฟิลาเดลเฟียที่กำลังเกษียณ”
GPT‑5.3 ถ่ายทอดอารมณ์ได้อย่างเป็นธรรมชาติผ่าน ฉากที่เฉพาะเจาะจง·รายละเอียดเชิงประสาทสัมผัส
- เมื่อเทียบกับการบรรยายเชิงซาบซึ้งของ GPT‑5.2 แล้ว มี ความสมบูรณ์ด้านโครงสร้างและความสมจริง สูงกว่า
ข้อจำกัดและการปรับปรุงในอนาคต
- ใน ภาษาที่ไม่ใช่ภาษาอังกฤษ (เช่น ญี่ปุ่น·เกาหลี) ยังเกิด สำนวนที่ฟังแข็งหรือแปลตรงตัว อยู่
- การปรับปรุง โทนที่เป็นธรรมชาติตามแต่ละภาษา ยังเป็นโจทย์ต่อไป
- ฟังก์ชันปรับโทนคำตอบ อยู่ระหว่างการพัฒนา และยังคงเก็บความคิดเห็นผู้ใช้อย่างต่อเนื่อง
การให้บริการและแผนการย้ายไปใช้รุ่นใหม่
- GPT‑5.3 Instant พร้อมใช้งานทันทีสำหรับผู้ใช้ ChatGPT ทุกคนและใน API (
gpt‑5.3‑chat‑latest)
- การอัปเดตโมเดล Thinking·Pro จะตามมาในเร็ว ๆ นี้
- GPT‑5.2 Instant จะสิ้นสุดการสนับสนุนในวันที่ 3 มิถุนายน 2026 และจะให้ผู้ใช้แบบชำระเงินใช้งานต่อในหมวด ‘Legacy Models’ เป็นเวลา 3 เดือน
1 ความคิดเห็น
ความเห็นจาก Hacker News
ตอนนี้ปัญหาใหญ่ที่สุดของ ChatGPT คือ สำนวนการตอบที่ฟังแปลกๆ
มีวลีอย่าง “Why it matters”, “the big picture” รวมถึงการเน้นเกินจริงและคำถามเชิงวาทศิลป์มากเกินไป
GPT‑5 รุ่นแรกโอเคอยู่แล้ว แต่พอพยายามทำให้มี “บุคลิกที่อบอุ่นขึ้น” กลับพังเหมือน 4o
ภาษาญี่ปุ่นเมื่อก่อนก็ทำได้ดี แต่ตอนนี้คุณภาพตกลงจนน่าผิดหวัง
เลยกำลังลองสไตล์การเขียนใหม่แบบใส่เอฟเฟ็กต์เสียงอย่าง <i>swoosh</i> เข้าไปแทน
ฉันใช้งานผลลัพธ์จาก LLM เป็นข้อมูลอ้างอิง แต่ไม่คัดลอกตรงๆ และเขียนใหม่ด้วยเสียงของตัวเองเพื่อรักษา สไตล์ของตัวเอง ไว้
แบรนด์ “5.2‑Instant” ชวนสับสน
นึกว่าเป็นโมเดลความเร็วสูงมาก แต่ดูเหมือนจะเป็นแค่ 5.2 เวอร์ชันที่ไม่มี router
ให้ความรู้สึกว่า OpenAI กำลังย้อนกลับไปสู่ยุคก่อน GPT‑5 ที่มีโมเดลมากเกินไปจนไม่รู้ว่าควรใช้อะไร
ตระกูลหนึ่งคือ Instant series ที่เร็วและปรับให้เหมาะกับ ChatGPT แต่ความแม่นยำต่ำกว่า
อีกตระกูลคือ Thinking series ที่ช้ากว่าแต่เหมาะกับงานเฉพาะทางมากกว่า
อยากลดให้เหลือตัวเลือกเดียวเพื่อความเรียบง่าย แต่เพราะผู้ใช้แต่ละคนชอบไม่เหมือนกัน เลยยังคงให้ทั้งสองโมเดลอยู่ (ผู้เขียนเป็นพนักงาน OpenAI)
คู่แข่งอย่าง Gemini 3 Fast / Gemini 3 Thinking ก็ใช้แนวทางเดียวกัน
โมเดล “Thinking” มีต้นทุนแพงกว่า จึงเป็นกลยุทธ์ที่จะใช้ โมเดล Instant ราคาถูกกว่า เพื่อรั้งคนกลุ่มนั้นเอาไว้
สำหรับอินเทอร์เฟซเสียง เวลากว่าจะได้โทเคนแรกสำคัญกว่าความเร็วโทเคนต่อวินาที
เห็นชื่อ “GPT‑5.3 Instant: Smoother, more …” แล้วหลุดขำเลย
เดี๋ยวนี้คำโปรยโฆษณา LLM ฟังดูเหมือน โฆษณาบุหรี่
เห็นคำว่า “Better judgment around refusals” อยู่บนหน้าเพจ
เลยสงสัยว่าบริษัท AI เคยจัดการปัญหาการใช้ กฎคนละชุดกับแต่ละกลุ่ม แบบเป็นทางการหรือเปล่า
เช่น ปฏิเสธมุกตลกเกี่ยวกับบางกลุ่ม แต่อนุญาตกับอีกบางกลุ่ม
อีกทั้งงานวิจัยนี้ก็อ้างว่าโมเดลประเมินค่าชีวิตมนุษย์ต่างกันไปตามประเทศ
ต่อให้สั่งว่า “ให้ตอบเป็นหน่วย metric” ก็มักไม่ทำตาม จนต้องถามเรื่องทำอาหารซ้ำหลายรอบ
ตอนนี้ดีขึ้นหน่อยแล้ว แต่ก็ยังมีกลิ่นอายมุมมองแบบอเมริกันอยู่มาก
เขาคำนวณ “อัตราแลกเปลี่ยน” ของชีวิตมนุษย์จากราคาแพะ ซึ่งมันอาจสะท้อนแค่ความต่างของค่าครองชีพระหว่างประเทศก็ได้
อีกทั้งมีตัวอย่างแค่ 11 ประเทศ จึงยากจะสรุปทั่วไป
ไม่ได้แสดง ความชอบภายในจริงๆ ของโมเดล
ถ้าให้ตัวเลือกแบบเป็นกลาง โมเดลส่วนใหญ่จะประเมินว่าชีวิตมนุษย์ทุกคนมีค่าเท่ากัน
แถมงานวิจัยต้นฉบับยังเปิดเผยข้อมูลไม่พอ และเชื่อมโค้ดกับผลลัพธ์ได้ยาก ทำให้ความน่าเชื่อถือต่ำ
ตามลิงก์เปรียบเทียบ
Gemini 3.1 Lite (no reasoning) ให้ประสิทธิภาพดีกว่า GPT‑5.3 (no reasoning)
รู้สึกไม่สบายใจกับการที่ตัวอย่างในการประกาศพูดถึง การคำนวณวิถีกระสุนปืนใหญ่พิสัยไกล
OpenAI กำลังร่วมมือกับกองทัพสหรัฐอยู่ จึงดูเหมือนกำลังพยายามทำให้ การใช้งานทางทหารกลายเป็นเรื่องปกติ
เหมือนเป็นกลยุทธ์ที่ค่อยๆ ห่อหุ้มมันด้วยตัวอย่างในชีวิตประจำวัน เพื่อลดทอนเสียงคัดค้าน
แต่พอมองสถานการณ์ปัจจุบันแล้ว ก็ไม่แน่ใจว่าตีความแบบนั้นจะถูกไหม
ฉันเห็นด้วยกับคำอธิบายที่ว่า “GPT‑5.3 Instant ผสานข้อมูลที่ดึงมาจากเว็บได้ดีกว่า”
ในการใช้งานจริง GPT ใช้ การค้นหา ได้เป็นธรรมชาติกว่า Claude มาก
แถมยังมีบั๊กที่แม้จะปิดการค้นเว็บไว้แล้ว มันก็ลืมการตั้งค่านั้น
ใน benchmark ของฉัน GPT‑5.3 ให้ผลเท่ากับหรือแย่กว่า 5.2‑chat เล็กน้อย
เลยพอเข้าใจว่าทำไมในบล็อกถึง ไม่เปิดเผย benchmark
ลิงก์เปรียบเทียบ
ที่น่าสนใจคือ ก่อนประกาศ “5.3 Instant” ไม่นาน ตัวเลือก “Instant” ในตัวเลือกโมเดลถูกถอดออกไปเลย
แล้วเปลี่ยนเป็น “Auto(แต่ปิด Auto‑switch อยู่)”
คำอธิบายว่า “อัตโนมัติ แต่ปิดอัตโนมัติอยู่” ดูเหมือนเป็นหลักฐานว่า ตัวเองก็ยังสับสนเหมือนกัน