GPT‑5.5 Instant
(openai.com)- โมเดลเริ่มต้นของ ChatGPT อย่าง Instant ได้อัปเดตจาก GPT‑5.3 Instant เป็น GPT‑5.5 Instant และจะทยอยเปิดให้ผู้ใช้ทุกคน โดยมีเป้าหมายเพื่อให้คำตอบที่แม่นยำ กระชับ และปรับให้เหมาะกับผู้ใช้มากขึ้น
- ในการประเมินภายในของ OpenAI พบว่า GPT‑5.5 Instant ลด ข้ออ้างที่เป็นภาพหลอน ในพรอมป์ต์ความเสี่ยงสูง เช่น การแพทย์ กฎหมาย และการเงิน ได้ 52.5% เมื่อเทียบกับ GPT‑5.3 Instant และยังลดคำกล่าวที่ไม่ถูกต้องในการสนทนายาก ๆ ที่ผู้ใช้ระบุว่าเป็นข้อผิดพลาดด้านข้อเท็จจริงลง 37.3%
- มีการปรับปรุงด้านการวิเคราะห์ภาพถ่ายและการอัปโหลดรูปภาพ คำถามสาย STEM การตัดสินใจว่าจะใช้การค้นหาเว็บเมื่อใด รวมถึงการให้เหตุผลเชิงภาพ คณิตศาสตร์ และการประเมินด้านวิทยาศาสตร์ โดยในตัวอย่างคณิตศาสตร์ โมเดลสามารถตรวจพบข้อผิดพลาดในการย้ายข้าง และหาคำตอบได้ถึง
x = (3 + √33) / 2 - GPT‑5.5 Instant ถูกปรับให้ตอบแบบ สั้นและตรงประเด็น มากขึ้น โดยยังคงสาระสำคัญไว้ พร้อมลดความเยิ่นเย้อ การจัดรูปแบบที่มากเกินไป คำถามติดตามที่ไม่จำเป็น และการใช้อีโมจิที่ไม่จำเป็น
- โมเดลสามารถใช้บริบทจากแชตก่อนหน้า ไฟล์ และ Gmail ที่เชื่อมต่อไว้ได้ดีขึ้นเพื่อการปรับแต่งเฉพาะบุคคล และมีฟีเจอร์ใหม่ memory sources ที่ให้ผู้ใช้ตรวจสอบ ลบ หรือแก้ไขหน่วยความจำที่บันทึกไว้หรือบางส่วนของแชตก่อนหน้าที่ถูกใช้ในการตอบได้
ขอบเขตการอัปเดตและแนวทางการตอบ
- โมเดลเริ่มต้นของ ChatGPT อย่าง Instant เปลี่ยนจาก GPT‑5.3 Instant เป็น GPT‑5.5 Instant และเปิดให้ผู้ใช้ทุกคน
- Instant เป็นโมเดลที่ผู้คนนับร้อยล้านใช้งานทุกวัน ดังนั้นแม้การปรับปรุงเล็กน้อยก็ส่งผลอย่างมากต่อประโยชน์ใช้สอยและความพึงพอใจในการโต้ตอบประจำวัน
- การอัปเดตครั้งนี้มุ่งไปที่คำตอบที่แข็งแกร่งและกระชับยิ่งขึ้นในหลายหัวข้อ น้ำเสียงสนทนาที่เป็นธรรมชาติมากขึ้น และการใช้บริบทที่ผู้ใช้เคยแชร์ไว้แล้วได้ดีขึ้นเมื่อการปรับแต่งเฉพาะบุคคลช่วยให้คำตอบดีขึ้น
การปรับปรุงด้านความแม่นยำและการให้เหตุผล
- GPT‑5.5 Instant ปรับปรุงความถูกต้องตามข้อเท็จจริงโดยรวม และเห็นการพัฒนามากที่สุดในงานที่ความแม่นยำมีความสำคัญสูง
- ใน การประเมินภายในของ OpenAI GPT‑5.5 Instant สร้างข้ออ้างที่เป็นภาพหลอนน้อยกว่า GPT‑5.3 Instant ถึง 52.5% ในพรอมป์ต์ความเสี่ยงสูง เช่น การแพทย์ กฎหมาย และการเงิน
- ในบทสนทนาที่ยากเป็นพิเศษซึ่งผู้ใช้ระบุว่ามีข้อผิดพลาดด้านข้อเท็จจริง โมเดลลดคำกล่าวที่ไม่ถูกต้องลง 37.3%
- โมเดลยังเก่งขึ้นในงานประจำวันโดยรวม ทั้งการวิเคราะห์ภาพถ่ายและรูปภาพที่อัปโหลด การตอบคำถามเกี่ยวกับ STEM และความสามารถในการตัดสินใจว่าจะใช้การค้นหาเว็บเมื่อใดเพื่อให้ได้คำตอบที่มีประโยชน์มากขึ้น
- ยังมีการปรับปรุงในการประเมินด้านการให้เหตุผลเชิงภาพ คณิตศาสตร์ และวิทยาศาสตร์
ตัวอย่างคำตอบคณิตศาสตร์
-
คำตอบของ GPT‑5.3 Instant
- ในตัวอย่างสมการรากที่สองที่ผู้ใช้ถามว่าวิธีทำถูกต้องหรือไม่ GPT‑5.3 Instant ตอบในตอนแรกว่าการยกกำลังสอง การกระจายพจน์ การแยกตัวประกอบ และการตรวจสอบโดเมนนั้นถูกต้อง
- หลังจากนั้น โมเดลตรวจสอบโดยแทนค่า
x = 3ลงในสมการเดิมและพบว่า√10 ≠ 2จึงตัดสินว่าเป็นคำตอบแปลกปลอมที่เกิดจากกระบวนการยกกำลังสอง - แต่สุดท้ายกลับสรุปผิดว่า ไม่มีคำตอบจริง และไม่สามารถย้อนกลับไปติดตามข้อผิดพลาดทางพีชคณิตที่แท้จริงได้
-
คำตอบของ GPT‑5.5 Instant
- GPT‑5.5 Instant ก็ยอมรับในตอนแรกว่าวิธีทำของผู้ใช้ถูกต้อง แต่สามารถจับข้อผิดพลาด
√10 ≠ 2ได้เมื่อแทนx = 3ลงในสมการเดิม - จากนั้นยังพบต่อว่าปัญหาไม่ได้มีแค่คำตอบแปลกปลอม แต่ยังมีข้อผิดพลาดในการย้ายข้างด้วย และแก้เป็นว่า จาก
x + 7 = (x - 1)^2ควรได้0 = x^2 - 3x - 6 - เมื่อใช้สูตรกำลังสอง โมเดลได้
x = (3 ± √33) / 2และตามเงื่อนไขx ≥ 1จึงเสนอคำตอบที่ใช้ได้เป็น(3 + √33) / 2 - คำตอบของ GPT‑5.5 Instant แสดงให้เห็นว่าสามารถฟื้นจากความผิดพลาดช่วงแรก ค้นหาข้อผิดพลาดทางพีชคณิตที่แท้จริง และไปถึงคำตอบที่ถูกต้องได้
- GPT‑5.5 Instant ก็ยอมรับในตอนแรกว่าวิธีทำของผู้ใช้ถูกต้อง แต่สามารถจับข้อผิดพลาด
การสื่อสารที่กระชับขึ้น
- GPT‑5.5 Instant ถูกปรับให้ให้คำตอบที่ สั้นและตรงประเด็น มากขึ้น โดยไม่สูญเสียสาระสำคัญ
- ขณะเดียวกันก็ยังคงความอบอุ่นและบุคลิกที่ทำให้ ChatGPT ใช้งานได้ดีไว้ พร้อมถ่ายทอดข้อมูลเดียวกันได้มีประโยชน์กว่าเดิม และลดความเยิ่นเย้อกับการจัดรูปแบบที่มากเกินไป
- โมเดลจะถามคำถามติดตามที่ไม่จำเป็นน้อยลง และหลีกเลี่ยงองค์ประกอบที่ทำให้คำตอบรก เช่น อีโมจิที่ไม่จำเป็น
- ในตัวอย่างการถามวิธีบอกเพื่อนร่วมงานให้พูดสั้นลง GPT‑5.5 Instant ใช้จำนวนคำน้อยกว่า GPT‑5.3 Instant 30.2% และใช้จำนวนบรรทัดน้อยกว่า 29.2%
- GPT‑5.5 Instant ยังคงใช้น้ำเสียงไม่เป็นทางการแต่ใช้งานได้จริงและปลอดภัยสำหรับที่ทำงาน พร้อมให้ประโยคตามสถานการณ์ และมองปัญหาในมุมของการตั้งขอบเขต ไม่ใช่นิสัยของเพื่อนร่วมงาน
- ส่วน GPT‑5.3 Instant แม้จะดูครบถ้วนกว่าเพราะมีถึงส่วน “สิ่งที่ไม่ควรทำ” แต่สำหรับพรอมป์ต์ขอคำแนะนำแบบสบาย ๆ ก็ถือว่ามีโครงสร้างและการขัดเกลามากเกินไปเล็กน้อย
การปรับแต่งเฉพาะบุคคลและการควบคุม
- Instant ใช้บริบทจากแชตก่อนหน้า ไฟล์ และ Gmail ที่เชื่อมต่อไว้ได้อย่างมีประสิทธิภาพมากขึ้น เพื่อทำให้คำตอบเหมาะกับผู้ใช้มากขึ้น
- โมเดลสามารถตัดสินใจอย่างชาญฉลาดว่าช่วงใดการปรับแต่งเพิ่มเติมจะช่วยให้คำตอบดีขึ้น และค้นหาแชตก่อนหน้าได้เร็วขึ้นเพื่อหาบริบทที่เหมาะสม ช่วยให้ผู้ใช้ไม่ต้องพูดซ้ำ
- สิ่งนี้มีประโยชน์เป็นพิเศษเมื่อต้องการคำแนะนำหรือแผนที่ปรับให้เหมาะกับตนเอง หรือเมื่อต้องการทำงานที่ค้างอยู่ต่อ
- ในตัวอย่างการขอคำแนะนำร้านชา GPT‑5.3 Instant สะท้อนเพียงว่าผู้ใช้อยู่ใน San Francisco และให้คำแนะนำสถานที่แบบกว้าง ๆ
- ขณะที่ GPT‑5.5 Instant ใช้บริบทก่อนหน้าว่าผู้ใช้ไป Asha Tea House บ่อย และชอบชา Taiwanese/high-mountain tea แบบรสสะอาดมากกว่าชานมไข่มุกหวานจัด จึงแนะนำ Ceré Tea, Song Tea & Ceramics, Tea Rex Cafe & Specialty Teas และ Stonemill Matcha ได้แม่นยำขึ้น
memory sources
- มีการนำ memory sources มาใช้กับโมเดล ChatGPT ทุกตัว เป็นระบบควบคุมใหม่ที่ให้ผู้ใช้ดูได้ว่ามีการใช้บริบทใดในการปรับแต่งคำตอบ
- เมื่อคำตอบถูกปรับให้เหมาะกับผู้ใช้ ผู้ใช้สามารถตรวจสอบได้ว่ามีการใช้บริบทใดบ้าง เช่น หน่วยความจำที่บันทึกไว้หรือแชตก่อนหน้า และสามารถลบหรือแก้ไขข้อมูลที่เก่าหรือไม่เกี่ยวข้องแล้วได้
- ในแชตที่แชร์ร่วมกัน memory sources จะไม่แสดงให้ผู้อื่นเห็น
- ผู้ใช้สามารถลบแชตที่ไม่ต้องการให้อ้างอิงอีกต่อไป ลบหรือแก้ไขรายการหน่วยความจำที่บันทึกไว้ในการตั้งค่า หรือใช้แชตชั่วคราวที่ไม่ใช้และไม่อัปเดตหน่วยความจำ
- แม้ memory sources จะช่วยให้เข้าใจการปรับแต่งเฉพาะบุคคลได้ง่ายขึ้น แต่ก็อาจไม่ได้แสดงทุกปัจจัยที่ส่งผลต่อคำตอบเสมอไป
- ใน sources อาจแสดงเพียงบางส่วนของแชตก่อนหน้าที่เกี่ยวข้องที่สุด ไม่ใช่ทุกแชตที่ถูกค้นหาหรืออ้างอิง และมุมมองนี้จะได้รับการปรับปรุงให้ครอบคลุมมากขึ้นตามเวลา
กำหนดการเปิดให้ใช้งาน
- GPT‑5.5 Instant จะเริ่มทยอยเปิดให้ผู้ใช้ ChatGPT ทุกคนตั้งแต่วันนี้ และเข้ามาแทนที่ GPT‑5.3 Instant ในฐานะโมเดลเริ่มต้น
- ใน API จะให้ใช้งานผ่าน
chat-latest - ผู้ใช้แบบชำระเงินยังสามารถใช้ GPT‑5.3 Instant ต่อได้อีก 3 เดือนผ่านการตั้งค่าการกำหนดค่าโมเดล หลังจากนั้น GPT‑5.3 Instant จะยุติการให้บริการ
- การปรับแต่งเฉพาะบุคคลที่ดีขึ้นซึ่งอิงจากแชตก่อนหน้า ไฟล์ และ Gmail ที่เชื่อมต่อไว้ จะทยอยเปิดให้ผู้ใช้ Plus และ Pro บนเว็บ และจะตามมาบนมือถือในเร็ว ๆ นี้
- มีแผนขยายไปยัง Free, Go, Business และ Enterprise ภายในไม่กี่สัปดาห์ข้างหน้า
- memory sources กำลังทยอยเปิดให้กับทุกแพ็กเกจผู้ใช้ ChatGPT สำหรับผู้บริโภคบนเว็บ และจะตามมาบนมือถือในเร็ว ๆ นี้
- ความพร้อมใช้งานของแหล่งข้อมูลเพื่อการปรับแต่งบางประเภทอาจแตกต่างกันไปตามภูมิภาค
1 ความคิดเห็น
ความคิดเห็นจาก Hacker News
ถ้าอยากเห็นความฉับไว ลองดู chatjimmy.ai สักครั้ง ไม่ได้มีส่วนเกี่ยวข้องนะ แต่ความเป็นไปได้ที่มันเปิดให้กับผลิตภัณฑ์ที่ฉันกำลังทำอยู่นี่ค่อนข้างน่าตกใจ
ถ้าทำ การอนุมานระดับมิลลิวินาที ได้แม้บนโมเดลที่เก่ากว่ามาก เกมจะเปลี่ยนไปหมดเลย ถึงขั้นรันการอนุมานกับแทบทุก API call ได้โดยแทบไม่มีดีเลย์ให้สังเกต เหลือเชื่อจริงๆ
แก้ไข: เป็นบริษัทนี้ https://taalas.com/products/
GPT-5.3-instant ไม่ได้ฉับไวเลยสักนิด แม้ตั้งค่าความพยายามในการอนุมานต่ำสุด TTFT ในกรณีที่ดีที่สุดก็ยังช้ากว่า GPT-4.1 ราว 3–4 เท่า
แน่นอน ฉันพูดแบบนี้ได้ก็เพราะพวกเขาเองเป็นคนตั้งชื่อมันว่า “instant” นั่นแหละ มีความจำเป็นจริงๆ ที่จะต้องรีเฟรช GPT-4.1 ซึ่งเป็นเหมือนแรงงานหลักของดาต้าเซ็นเตอร์
แล้วการออกโมเดล “instant” มาโดยไม่พูดถึง ลักษณะด้านเวลาแฝง เลยนี่มันอะไรกันแน่
สงสัยว่านี่ต่างจากการตั้งค่าความพยายามในการอนุมานเป็น 0 ใน GPT 5.5 thinking ยังไง การตัดสินใจแยกเป็นคนละโมเดลก็น่าสนใจดี
ถ้าอย่างนั้นโมเดล instant ก็น่าจะเป็นโมเดลคนละตัวที่เล็กกว่าโดยสิ้นเชิง และน่าจะมีไว้รองรับ ChatGPT ฟรีเป็นหลัก
อันนี้ใช้ใน API ได้ไหม? ฉันไม่เห็น instant เห็นแต่ chat
คำตอบดูเหมือนจะอ่านง่ายขึ้น และหวังว่าในทางปฏิบัติก็จะเป็นแบบนั้นด้วย ตอนนี้ โมเดล ChatGPT ฟรีทั่วไปทรมานเกินไปจริงๆ
เท่ากับว่าที่ระดับราคาถูกที่สุด ความฉลาดเพิ่มขึ้นมาก
chat-latestใน https://developers.openai.com/api/docs/pricing ระบุราคาอินพุต/เอาต์พุตไว้ที่ $5/$30 ซึ่งเป็นราคาเดียวกับ gpt-5.5ทำไมถึงไม่ปล่อย Instant กับ Thinking model ของแต่ละหมายเลขเวอร์ชันพร้อมกันแบบสม่ำเสมอกว่านี้? ไม่เข้าใจว่าทำไมต้องสร้างความวุ่นวายซ้ำซ้อนแบบนี้
ดีเลย มีอะไรที่ใช้งานได้จริงและ ราคาเอื้อมถึงได้ ออกมาแล้ว