1 คะแนน โดย GN⁺ 1 시간 전 | 1 ความคิดเห็น | แชร์ทาง WhatsApp
  • โมเดลเริ่มต้นของ ChatGPT อย่าง Instant ได้อัปเดตจาก GPT‑5.3 Instant เป็น GPT‑5.5 Instant และจะทยอยเปิดให้ผู้ใช้ทุกคน โดยมีเป้าหมายเพื่อให้คำตอบที่แม่นยำ กระชับ และปรับให้เหมาะกับผู้ใช้มากขึ้น
  • ในการประเมินภายในของ OpenAI พบว่า GPT‑5.5 Instant ลด ข้ออ้างที่เป็นภาพหลอน ในพรอมป์ต์ความเสี่ยงสูง เช่น การแพทย์ กฎหมาย และการเงิน ได้ 52.5% เมื่อเทียบกับ GPT‑5.3 Instant และยังลดคำกล่าวที่ไม่ถูกต้องในการสนทนายาก ๆ ที่ผู้ใช้ระบุว่าเป็นข้อผิดพลาดด้านข้อเท็จจริงลง 37.3%
  • มีการปรับปรุงด้านการวิเคราะห์ภาพถ่ายและการอัปโหลดรูปภาพ คำถามสาย STEM การตัดสินใจว่าจะใช้การค้นหาเว็บเมื่อใด รวมถึงการให้เหตุผลเชิงภาพ คณิตศาสตร์ และการประเมินด้านวิทยาศาสตร์ โดยในตัวอย่างคณิตศาสตร์ โมเดลสามารถตรวจพบข้อผิดพลาดในการย้ายข้าง และหาคำตอบได้ถึง x = (3 + √33) / 2
  • GPT‑5.5 Instant ถูกปรับให้ตอบแบบ สั้นและตรงประเด็น มากขึ้น โดยยังคงสาระสำคัญไว้ พร้อมลดความเยิ่นเย้อ การจัดรูปแบบที่มากเกินไป คำถามติดตามที่ไม่จำเป็น และการใช้อีโมจิที่ไม่จำเป็น
  • โมเดลสามารถใช้บริบทจากแชตก่อนหน้า ไฟล์ และ Gmail ที่เชื่อมต่อไว้ได้ดีขึ้นเพื่อการปรับแต่งเฉพาะบุคคล และมีฟีเจอร์ใหม่ memory sources ที่ให้ผู้ใช้ตรวจสอบ ลบ หรือแก้ไขหน่วยความจำที่บันทึกไว้หรือบางส่วนของแชตก่อนหน้าที่ถูกใช้ในการตอบได้

ขอบเขตการอัปเดตและแนวทางการตอบ

  • โมเดลเริ่มต้นของ ChatGPT อย่าง Instant เปลี่ยนจาก GPT‑5.3 Instant เป็น GPT‑5.5 Instant และเปิดให้ผู้ใช้ทุกคน
  • Instant เป็นโมเดลที่ผู้คนนับร้อยล้านใช้งานทุกวัน ดังนั้นแม้การปรับปรุงเล็กน้อยก็ส่งผลอย่างมากต่อประโยชน์ใช้สอยและความพึงพอใจในการโต้ตอบประจำวัน
  • การอัปเดตครั้งนี้มุ่งไปที่คำตอบที่แข็งแกร่งและกระชับยิ่งขึ้นในหลายหัวข้อ น้ำเสียงสนทนาที่เป็นธรรมชาติมากขึ้น และการใช้บริบทที่ผู้ใช้เคยแชร์ไว้แล้วได้ดีขึ้นเมื่อการปรับแต่งเฉพาะบุคคลช่วยให้คำตอบดีขึ้น

การปรับปรุงด้านความแม่นยำและการให้เหตุผล

  • GPT‑5.5 Instant ปรับปรุงความถูกต้องตามข้อเท็จจริงโดยรวม และเห็นการพัฒนามากที่สุดในงานที่ความแม่นยำมีความสำคัญสูง
  • ใน การประเมินภายในของ OpenAI GPT‑5.5 Instant สร้างข้ออ้างที่เป็นภาพหลอนน้อยกว่า GPT‑5.3 Instant ถึง 52.5% ในพรอมป์ต์ความเสี่ยงสูง เช่น การแพทย์ กฎหมาย และการเงิน
  • ในบทสนทนาที่ยากเป็นพิเศษซึ่งผู้ใช้ระบุว่ามีข้อผิดพลาดด้านข้อเท็จจริง โมเดลลดคำกล่าวที่ไม่ถูกต้องลง 37.3%
  • โมเดลยังเก่งขึ้นในงานประจำวันโดยรวม ทั้งการวิเคราะห์ภาพถ่ายและรูปภาพที่อัปโหลด การตอบคำถามเกี่ยวกับ STEM และความสามารถในการตัดสินใจว่าจะใช้การค้นหาเว็บเมื่อใดเพื่อให้ได้คำตอบที่มีประโยชน์มากขึ้น
  • ยังมีการปรับปรุงในการประเมินด้านการให้เหตุผลเชิงภาพ คณิตศาสตร์ และวิทยาศาสตร์

ตัวอย่างคำตอบคณิตศาสตร์

  • คำตอบของ GPT‑5.3 Instant

    • ในตัวอย่างสมการรากที่สองที่ผู้ใช้ถามว่าวิธีทำถูกต้องหรือไม่ GPT‑5.3 Instant ตอบในตอนแรกว่าการยกกำลังสอง การกระจายพจน์ การแยกตัวประกอบ และการตรวจสอบโดเมนนั้นถูกต้อง
    • หลังจากนั้น โมเดลตรวจสอบโดยแทนค่า x = 3 ลงในสมการเดิมและพบว่า √10 ≠ 2 จึงตัดสินว่าเป็นคำตอบแปลกปลอมที่เกิดจากกระบวนการยกกำลังสอง
    • แต่สุดท้ายกลับสรุปผิดว่า ไม่มีคำตอบจริง และไม่สามารถย้อนกลับไปติดตามข้อผิดพลาดทางพีชคณิตที่แท้จริงได้
  • คำตอบของ GPT‑5.5 Instant

    • GPT‑5.5 Instant ก็ยอมรับในตอนแรกว่าวิธีทำของผู้ใช้ถูกต้อง แต่สามารถจับข้อผิดพลาด √10 ≠ 2 ได้เมื่อแทน x = 3 ลงในสมการเดิม
    • จากนั้นยังพบต่อว่าปัญหาไม่ได้มีแค่คำตอบแปลกปลอม แต่ยังมีข้อผิดพลาดในการย้ายข้างด้วย และแก้เป็นว่า จาก x + 7 = (x - 1)^2 ควรได้ 0 = x^2 - 3x - 6
    • เมื่อใช้สูตรกำลังสอง โมเดลได้ x = (3 ± √33) / 2 และตามเงื่อนไข x ≥ 1 จึงเสนอคำตอบที่ใช้ได้เป็น (3 + √33) / 2
    • คำตอบของ GPT‑5.5 Instant แสดงให้เห็นว่าสามารถฟื้นจากความผิดพลาดช่วงแรก ค้นหาข้อผิดพลาดทางพีชคณิตที่แท้จริง และไปถึงคำตอบที่ถูกต้องได้

การสื่อสารที่กระชับขึ้น

  • GPT‑5.5 Instant ถูกปรับให้ให้คำตอบที่ สั้นและตรงประเด็น มากขึ้น โดยไม่สูญเสียสาระสำคัญ
  • ขณะเดียวกันก็ยังคงความอบอุ่นและบุคลิกที่ทำให้ ChatGPT ใช้งานได้ดีไว้ พร้อมถ่ายทอดข้อมูลเดียวกันได้มีประโยชน์กว่าเดิม และลดความเยิ่นเย้อกับการจัดรูปแบบที่มากเกินไป
  • โมเดลจะถามคำถามติดตามที่ไม่จำเป็นน้อยลง และหลีกเลี่ยงองค์ประกอบที่ทำให้คำตอบรก เช่น อีโมจิที่ไม่จำเป็น
  • ในตัวอย่างการถามวิธีบอกเพื่อนร่วมงานให้พูดสั้นลง GPT‑5.5 Instant ใช้จำนวนคำน้อยกว่า GPT‑5.3 Instant 30.2% และใช้จำนวนบรรทัดน้อยกว่า 29.2%
  • GPT‑5.5 Instant ยังคงใช้น้ำเสียงไม่เป็นทางการแต่ใช้งานได้จริงและปลอดภัยสำหรับที่ทำงาน พร้อมให้ประโยคตามสถานการณ์ และมองปัญหาในมุมของการตั้งขอบเขต ไม่ใช่นิสัยของเพื่อนร่วมงาน
  • ส่วน GPT‑5.3 Instant แม้จะดูครบถ้วนกว่าเพราะมีถึงส่วน “สิ่งที่ไม่ควรทำ” แต่สำหรับพรอมป์ต์ขอคำแนะนำแบบสบาย ๆ ก็ถือว่ามีโครงสร้างและการขัดเกลามากเกินไปเล็กน้อย

การปรับแต่งเฉพาะบุคคลและการควบคุม

  • Instant ใช้บริบทจากแชตก่อนหน้า ไฟล์ และ Gmail ที่เชื่อมต่อไว้ได้อย่างมีประสิทธิภาพมากขึ้น เพื่อทำให้คำตอบเหมาะกับผู้ใช้มากขึ้น
  • โมเดลสามารถตัดสินใจอย่างชาญฉลาดว่าช่วงใดการปรับแต่งเพิ่มเติมจะช่วยให้คำตอบดีขึ้น และค้นหาแชตก่อนหน้าได้เร็วขึ้นเพื่อหาบริบทที่เหมาะสม ช่วยให้ผู้ใช้ไม่ต้องพูดซ้ำ
  • สิ่งนี้มีประโยชน์เป็นพิเศษเมื่อต้องการคำแนะนำหรือแผนที่ปรับให้เหมาะกับตนเอง หรือเมื่อต้องการทำงานที่ค้างอยู่ต่อ
  • ในตัวอย่างการขอคำแนะนำร้านชา GPT‑5.3 Instant สะท้อนเพียงว่าผู้ใช้อยู่ใน San Francisco และให้คำแนะนำสถานที่แบบกว้าง ๆ
  • ขณะที่ GPT‑5.5 Instant ใช้บริบทก่อนหน้าว่าผู้ใช้ไป Asha Tea House บ่อย และชอบชา Taiwanese/high-mountain tea แบบรสสะอาดมากกว่าชานมไข่มุกหวานจัด จึงแนะนำ Ceré Tea, Song Tea & Ceramics, Tea Rex Cafe & Specialty Teas และ Stonemill Matcha ได้แม่นยำขึ้น

memory sources

  • มีการนำ memory sources มาใช้กับโมเดล ChatGPT ทุกตัว เป็นระบบควบคุมใหม่ที่ให้ผู้ใช้ดูได้ว่ามีการใช้บริบทใดในการปรับแต่งคำตอบ
  • เมื่อคำตอบถูกปรับให้เหมาะกับผู้ใช้ ผู้ใช้สามารถตรวจสอบได้ว่ามีการใช้บริบทใดบ้าง เช่น หน่วยความจำที่บันทึกไว้หรือแชตก่อนหน้า และสามารถลบหรือแก้ไขข้อมูลที่เก่าหรือไม่เกี่ยวข้องแล้วได้
  • ในแชตที่แชร์ร่วมกัน memory sources จะไม่แสดงให้ผู้อื่นเห็น
  • ผู้ใช้สามารถลบแชตที่ไม่ต้องการให้อ้างอิงอีกต่อไป ลบหรือแก้ไขรายการหน่วยความจำที่บันทึกไว้ในการตั้งค่า หรือใช้แชตชั่วคราวที่ไม่ใช้และไม่อัปเดตหน่วยความจำ
  • แม้ memory sources จะช่วยให้เข้าใจการปรับแต่งเฉพาะบุคคลได้ง่ายขึ้น แต่ก็อาจไม่ได้แสดงทุกปัจจัยที่ส่งผลต่อคำตอบเสมอไป
  • ใน sources อาจแสดงเพียงบางส่วนของแชตก่อนหน้าที่เกี่ยวข้องที่สุด ไม่ใช่ทุกแชตที่ถูกค้นหาหรืออ้างอิง และมุมมองนี้จะได้รับการปรับปรุงให้ครอบคลุมมากขึ้นตามเวลา

กำหนดการเปิดให้ใช้งาน

  • GPT‑5.5 Instant จะเริ่มทยอยเปิดให้ผู้ใช้ ChatGPT ทุกคนตั้งแต่วันนี้ และเข้ามาแทนที่ GPT‑5.3 Instant ในฐานะโมเดลเริ่มต้น
  • ใน API จะให้ใช้งานผ่าน chat-latest
  • ผู้ใช้แบบชำระเงินยังสามารถใช้ GPT‑5.3 Instant ต่อได้อีก 3 เดือนผ่านการตั้งค่าการกำหนดค่าโมเดล หลังจากนั้น GPT‑5.3 Instant จะยุติการให้บริการ
  • การปรับแต่งเฉพาะบุคคลที่ดีขึ้นซึ่งอิงจากแชตก่อนหน้า ไฟล์ และ Gmail ที่เชื่อมต่อไว้ จะทยอยเปิดให้ผู้ใช้ Plus และ Pro บนเว็บ และจะตามมาบนมือถือในเร็ว ๆ นี้
  • มีแผนขยายไปยัง Free, Go, Business และ Enterprise ภายในไม่กี่สัปดาห์ข้างหน้า
  • memory sources กำลังทยอยเปิดให้กับทุกแพ็กเกจผู้ใช้ ChatGPT สำหรับผู้บริโภคบนเว็บ และจะตามมาบนมือถือในเร็ว ๆ นี้
  • ความพร้อมใช้งานของแหล่งข้อมูลเพื่อการปรับแต่งบางประเภทอาจแตกต่างกันไปตามภูมิภาค

1 ความคิดเห็น

 
GN⁺ 1 시간 전
ความคิดเห็นจาก Hacker News
  • ถ้าอยากเห็นความฉับไว ลองดู chatjimmy.ai สักครั้ง ไม่ได้มีส่วนเกี่ยวข้องนะ แต่ความเป็นไปได้ที่มันเปิดให้กับผลิตภัณฑ์ที่ฉันกำลังทำอยู่นี่ค่อนข้างน่าตกใจ
    ถ้าทำ การอนุมานระดับมิลลิวินาที ได้แม้บนโมเดลที่เก่ากว่ามาก เกมจะเปลี่ยนไปหมดเลย ถึงขั้นรันการอนุมานกับแทบทุก API call ได้โดยแทบไม่มีดีเลย์ให้สังเกต เหลือเชื่อจริงๆ

    • มีข้อมูลเกี่ยวกับเรื่องนี้มากกว่านี้ไหม? เดิมทีฉันก็คิดว่า Groq เร็วแล้ว แต่นี่เร็วแบบไม่น่าเป็นไปได้
      แก้ไข: เป็นบริษัทนี้ https://taalas.com/products/
    • ถ้า gpt-4.1 ทำเวลาแฝงระดับเลขสองหลักในหน่วยมิลลิวินาทีได้ นี่น่าจะเป็นตัวเปลี่ยนเกมจริงๆ
  • GPT-5.3-instant ไม่ได้ฉับไวเลยสักนิด แม้ตั้งค่าความพยายามในการอนุมานต่ำสุด TTFT ในกรณีที่ดีที่สุดก็ยังช้ากว่า GPT-4.1 ราว 3–4 เท่า
    แน่นอน ฉันพูดแบบนี้ได้ก็เพราะพวกเขาเองเป็นคนตั้งชื่อมันว่า “instant” นั่นแหละ มีความจำเป็นจริงๆ ที่จะต้องรีเฟรช GPT-4.1 ซึ่งเป็นเหมือนแรงงานหลักของดาต้าเซ็นเตอร์
    แล้วการออกโมเดล “instant” มาโดยไม่พูดถึง ลักษณะด้านเวลาแฝง เลยนี่มันอะไรกันแน่

  • สงสัยว่านี่ต่างจากการตั้งค่าความพยายามในการอนุมานเป็น 0 ใน GPT 5.5 thinking ยังไง การตัดสินใจแยกเป็นคนละโมเดลก็น่าสนใจดี

    • คำถามดีเลย GPT-5.5 thinking เก่งมากในการไม่เสียเวลาคิดกับคำถามง่ายๆ เลยไม่เคยรู้สึกจำเป็นต้องใช้โมเดล instant สำหรับงานถามตอบเร็วๆ
      ถ้าอย่างนั้นโมเดล instant ก็น่าจะเป็นโมเดลคนละตัวที่เล็กกว่าโดยสิ้นเชิง และน่าจะมีไว้รองรับ ChatGPT ฟรีเป็นหลัก
  • อันนี้ใช้ใน API ได้ไหม? ฉันไม่เห็น instant เห็นแต่ chat

    • GPT‑5.5 Instant is rolling out starting today to all ChatGPT users, replacing GPT‑5.3 Instant as the default model, and in the API as chat-latest.

  • คำตอบดูเหมือนจะอ่านง่ายขึ้น และหวังว่าในทางปฏิบัติก็จะเป็นแบบนั้นด้วย ตอนนี้ โมเดล ChatGPT ฟรีทั่วไปทรมานเกินไปจริงๆ

  • เท่ากับว่าที่ระดับราคาถูกที่สุด ความฉลาดเพิ่มขึ้นมาก

    • ถูกจริงเหรอ? chat-latest ใน https://developers.openai.com/api/docs/pricing ระบุราคาอินพุต/เอาต์พุตไว้ที่ $5/$30 ซึ่งเป็นราคาเดียวกับ gpt-5.5
    • ราคาบอกไว้ตรงไหน? เหมือนจะยังไม่ขึ้นแม้แต่ในหน้าของโมเดลเลย
  • ทำไมถึงไม่ปล่อย Instant กับ Thinking model ของแต่ละหมายเลขเวอร์ชันพร้อมกันแบบสม่ำเสมอกว่านี้? ไม่เข้าใจว่าทำไมต้องสร้างความวุ่นวายซ้ำซ้อนแบบนี้

    • น่าจะเป็นไปได้สูงว่าเป็นเวอร์ชันที่แก้ไขมาจากโมเดล thinking ถ้าเป็นแบบนั้น การจะออกพร้อมกันก็คงต้องเลื่อนการเปิดตัวโมเดล thinking ออกไป
  • ดีเลย มีอะไรที่ใช้งานได้จริงและ ราคาเอื้อมถึงได้ ออกมาแล้ว