6 คะแนน โดย GN⁺ 2025-09-08 | 1 ความคิดเห็น | แชร์ทาง WhatsApp
  • ChatGPT ที่ขับเคลื่อนด้วย GPT-5 (หรือที่เรียกว่า Research Goblin) แสดงให้เห็นถึง ความแม่นยำและความเป็นประโยชน์ในระดับสูงมาก สำหรับการค้นหาบนเว็บ
  • ตั้งแต่คำถามทั่วไปแบบ trivial ไปจนถึงการสืบค้นข้อมูลที่ซับซ้อน มันแสดงความสามารถด้านการค้นหาและการให้เหตุผลที่แข็งแกร่งใน หัวข้อที่หลากหลายอย่างกว้างขวาง
  • ในตัวอย่างจริง ระบบสามารถให้คำตอบและแหล่งข้อมูลที่เชื่อถือได้ผ่าน กระบวนการค้นหาขนาดใหญ่และการให้เหตุผลแบบต่อเนื่องเป็นลำดับ
  • แม้ใน สภาพแวดล้อมบนมือถือ ก็ยังมอบประสบการณ์การใช้งานที่ยอดเยี่ยมและเวิร์กโฟลว์การทำงานที่ต่อเนื่อง
  • ด้วย การผสานรวม Tool calling และ chain-of-thought ทำให้ในมุมมองของนักพัฒนา มันนำเสนอ มาตรฐานใหม่ ของการค้นหาที่ขับเคลื่อนด้วย LLM

GPT-5 Thinking (Research Goblin) และนวัตกรรมการค้นหา

กระบวนทัศน์การค้นหาที่กำลังเปลี่ยนไป

  • เดิมทีคำแนะนำกระแสหลักคือ “อย่าใช้แชตบอตเหมือนเสิร์ชเอนจิน” แต่กับ ChatGPT ที่ขับเคลื่อนด้วย GPT-5 รุ่นล่าสุด สูตรเดิมนี้เริ่มใช้ไม่ได้อีกต่อไป
  • โมเดลที่ขับเคลื่อนด้วย GPT-5 ก้าวข้ามการเชื่อมต่อกับเสิร์ชเอนจินอย่าง Bing ไปสู่ระดับที่ สามารถทดแทนหรือเหนือกว่าการค้นคว้าบนอินเทอร์เน็ตแบบทั่วไปได้จริง
  • เหตุผลที่มันได้ฉายา “Research Goblin” ก็เพราะไม่ว่าจะโยนคำถามหรือโจทย์ซับซ้อนแบบใดให้ มันจะ สืบค้นอย่างดื้อดึงผิดปกติเพื่อหาคำตอบที่ดีที่สุด

กรณีตัวอย่างการค้นหาจริงและผลลัพธ์

ทางเดินเลื่อนแบบน่าสนใจ (Travelators)

  • เมื่อถามว่าช่วงเวลาใดที่สายพานทางเดินเลื่อนยางในสนามบินฮีทโธรว์ถูกเปลี่ยนเป็นแบบโลหะ ระบบประเมินว่า น่าจะอยู่ระหว่างปี 2014~2018 และยังค้นพบบทความที่น่าสนใจจากปี 2024 ที่เกี่ยวข้องได้อีกด้วย

การระบุอาคาร

  • เมื่อถามถึงอาคารหน้าตาแปลกตาที่มองเห็นจากหน้าต่างรถไฟ ระบบยืนยันได้อย่างแม่นยำภายใน 1 นาที 4 วินาที ว่านั่นคือ ‘The Blade (Reading)’ พร้อมให้ลิงก์แหล่งที่มา
โฆษณา

การสืบค้นเค้กป๊อปของ Starbucks UK

  • ระบบทำการ สืบค้นเชิงลึกว่าทำไมร้าน Starbucks ในสหราชอาณาจักรจึงไม่มีเค้กป๊อป และพบว่ามีการนำเข้าในปี 2023 แต่ บางสาขาเท่านั้น โดยเฉพาะสาขาในจุดเดินทาง มักไม่มีจำหน่าย
  • ยังรวบรวมหลักฐานประกอบ เช่น PDF ข้อมูลโภชนาการและสารก่อภูมิแพ้ รวมถึงการสนทนาใน Reddit

ความสัมพันธ์ระหว่าง Wikipedia และ Britannica

  • ระบบวิเคราะห์เชิงลึกถึงความจริงและบริบทของคำกล่าวอ้างบนอินเทอร์เน็ตที่ว่า Wikipedia ใช้ บางส่วนของแหล่งข้อมูลจาก Britannica ฉบับปี 1911 ในช่วงแรกเริ่ม พร้อมติดตามเอกสารโครงการและคำอธิบายที่เกี่ยวข้องมาให้

ชื่อทางการของ University of Cambridge

  • ระบบระบุ ชื่อทางกฎหมายอย่างเป็นทางการของมหาวิทยาลัยเคมบริดจ์ (The Chancellor, Masters, and Scholars of the University of Cambridge) พร้อมหลักฐานอ้างอิง
  • กระบวนการให้เหตุผลถูกแสดงอย่างโปร่งใส ทำให้ตรวจสอบความน่าเชื่อถือของคำตอบได้ด้วย

ประวัติถ้ำและร้านอาหารที่ Exeter quay

  • ระบบค้นคว้าถึง โครงสร้างภายในของร้านอาหารที่เจาะเข้าไปในหน้าผาในย่าน Exeter Quay และประวัติความเป็นมา ผ่านการค้นหาหลายขั้นตอนและการวิเคราะห์ PDF จนระบุได้ว่ามีที่มาจากการก่อสร้างบนหน้าผาหินทรายสีแดงในช่วงทศวรรษ 1820~1830
  • ยังแสดงรูปแบบการค้นหาเชิงรุก โดย ค้นหารายงาน/แบบแปลนภาษาอังกฤษ และเมื่อเข้าถึงไม่ได้ก็ถึงขั้นร่างอีเมลสำหรับขอข้อมูลให้

การเปรียบเทียบ Aldi และ Lidl

  • ระบบวิเคราะห์อย่างยาวถึง ตำแหน่งทางการตลาด ภาพลักษณ์ อันดับในตลาดสหราชอาณาจักร ของ Aldi และ Lidl รวมถึงตัวเลขด้านส่วนแบ่งตลาดและการประเมินจากผู้บริโภค
  • ตามคำขอของผู้ใช้ ยังสามารถจัดอันดับใหม่ตามเกณฑ์ “fanciness(ความพรีเมียม)” ได้อีกด้วย
โฆษณา

การสแกนหนังสือของสถาบันวิจัย AI

  • นอกเหนือจากกรณีที่ Anthropic สแกนหนังสือจำนวนมากเพื่อสร้างข้อมูลฝึก ระบบ ยังไม่สามารถยืนยันได้ว่ามีสถาบันวิจัย AI อื่นทำในลักษณะเดียวกันหรือไม่ แต่ได้บันทึกรายละเอียดของการค้นหาความเป็นไปได้นั้นไว้อย่างครบถ้วน

จุดเด่นที่เหนือกว่าจริงของการค้นหาด้วย GPT-5

  • ในการค้นหาของ ChatGPT ที่ขับเคลื่อนด้วย GPT-5 นั้น สามารถ รวบรวมและประเมินข้อมูลได้รวดเร็ว เป็นระบบ และครอบคลุมกว่าการทำด้วยมือ
  • โดยเฉพาะใน สภาพแวดล้อมบนมือถือ การใช้งานดีขึ้นอย่างมาก ทำให้การตอบสนองความสงสัยทั่วไปหรือการค้นคว้าในชีวิตประจำวันทำได้ทุกที่ทุกเวลา
  • มันมีความสามารถในการ ให้ผลลัพธ์ที่รวดเร็วแต่เนื้อหาแน่น มากพอที่จะใช้แทนฟีเจอร์ Deep Research ของ OpenAI ได้

ความหมายในมุมมองการพัฒนา LLM

  • ด้วยการผสาน Tool calling และ chain-of-thought ทำให้การค้นหา การให้เหตุผลแบบเป็นลำดับ และการสำรวจเพิ่มเติมสามารถเชื่อมต่อกันอย่างเป็นธรรมชาติภายในขั้นตอน “การคิด” เพียงครั้งเดียว
  • เทคโนโลยี RAG (การผสานการค้นหากับการสร้างคำตอบ) ก็สามารถทำงานได้ ทรงพลังกว่าเดิมมาก ผ่านการเรียกใช้ tool หลายขั้นตอนอย่างยืดหยุ่นและการเชื่อมโยงกับการค้นหาที่ซับซ้อนขึ้น
  • ในคำศัพท์ของ Anthropic สิ่งนี้เรียกว่า interleaved thinking และใน OpenAI Responses API ก็รองรับลักษณะการทำงานคล้ายกัน

เคล็ดลับในการใช้เพื่อการค้นหาอย่างมีประสิทธิภาพ

  • สามารถยกระดับคุณภาพการค้นหาได้ผ่าน สัญชาตญาณจากประสบการณ์ (เช่น การใช้คำใบ้อย่าง “go deep” เพื่อกระตุ้นให้ค้นคว้าอย่างละเอียดมากขึ้น)
  • แม้ในกรณีของ คำถามเชิงตีความ ที่ไม่มีคำตอบชัดเจน ก็ยังสามารถให้ผลลัพธ์ที่เป็นประโยชน์และน่าสนใจได้
  • ดังเช่นอุปมา “ก็อบลิน” Research Goblin คือ AI สำหรับการค้นหาที่ขยันขันแข็ง แต่ไม่อาจเชื่อถือได้ทั้งหมด และแตกต่างจากมนุษย์ ทว่าใช้งานได้อย่างมีคุณค่าสูง

1 ความคิดเห็น

 
GN⁺ 2025-09-08
ความคิดเห็นจาก Hacker News
  • ฉันเห็นด้วยกับบทความของ Simon แต่คิดว่า “การวิจัย” หมายถึงการเปรียบเทียบหลักฐานหลายรูปแบบ เช่น ผลของ Obamacare, การคาดการณ์คำตัดสินทางกฎหมาย, การวิเคราะห์อิทธิพลของอนิเมชัน, หรือวิธีใช้งานไลบรารีโอเพนซอร์ส ซึ่งนำไปใช้ได้ในหลายสาขา ChatGPT และ LLM อื่น ๆ ดูจะมีปัญหาในการประเมินหลักฐานหรือเข้าใจอคติของแหล่งข้อมูล โดยเฉพาะเมื่อเกี่ยวข้องกับสถิติจำนวนมาก ยิ่งต้องใช้การให้เหตุผลที่ซับซ้อนมากขึ้น อาการหลอนก็ยิ่งเพิ่มขึ้น โมเดลยังมีแนวโน้มอยากสนับสนุนมุมมองของผู้ใช้ จึงมักตอบไปในทางบวกแม้เราไม่ได้ขอ ฉันมักขอให้ ChatGPT ประเมินแหล่งข้อมูลโดยตรง เปรียบเทียบเหตุผลทั้งฝ่ายเห็นด้วยและไม่เห็นด้วย และบางครั้งก็โต้แย้งกับโมเดลเพื่อดูปฏิกิริยา ประสบการณ์แบบละเอียดอ่านได้ในบล็อก

    • ฉันเคยใช้ Perplexity เพื่อหาการตั้งค่าที่เหมาะสมที่สุดสำหรับจอของตัวเอง มันให้รายการการตั้งค่าที่กระชับพร้อมเหตุผลมา แต่พอตรวจดูแหล่งที่มาแล้วกลับไม่มีข้อมูลทางการหรือหลักฐานรองรับ มีแค่โพสต์ในฟอรัม Samsung ที่ผู้ใช้คาดเดาหรือถกเถียงกันเอง ถ้ามี confidence rating ตามความน่าเชื่อถือของแหล่งข้อมูลก็น่าจะดี แต่คงทำได้ยากมาก

    • ChatGPT และ LLM มักพูดซ้ำแค่ “สามัญสำนึก” แบบผิวเผิน ฉันต้องถามต่อหลายรอบเพื่อเช็กว่ามีหลักฐานจริงไหม แหล่งข้อมูลคืออะไร ขอข้อความที่อ้างอิงมา และยืนยันอีกทีว่าไม่ได้หลอน บ่อยครั้งมากที่พบว่าคำตอบแรกผิดทั้งหมด คนส่วนใหญ่น่าจะรับคำตอบแรกไปเลย

    • เช่นเวลาจะตัดสินใจซื้อของอย่างมีข้อมูลจริง ๆ ฉันรู้สึกว่ามันยากมาก เพราะความเห็นเชิงการตลาดมีอยู่เต็มไปหมด และสัญญาณด้านลบที่สวนทางกัน เช่น คอมเมนต์เชิงลบใน Reddit หรือ YouTube ก็ไม่ได้ถูกชดเชยอย่างเพียงพอ

    • GPT-5 (รวมถึงโมเดล o3) เป็นหนึ่งใน LLM ที่มีมุมมองเชิงวิพากษ์มากที่สุด สำหรับคำขอเชิงวิชาการหรือเทคนิค มันสามารถอ้างอิงแหล่งข้อมูลและเปรียบเทียบผลลัพธ์ต่าง ๆ ได้โดยแทบไม่ต้องพรอมป์เพิ่มเลย ส่วน Grok 4 เวอร์ชันแรก ๆ แค่สรุปบทความโดยไม่วิเคราะห์ ขณะที่ Claude Opus 4 ก็ออกนอกประเด็น เช่น เวลาขอรายชื่อไลบรารี JS กลับคืนเอกสารที่เน้นอัตราการใช้งาน GPT-5 แน่นอนว่าไม่สมบูรณ์แบบ แต่โดยเฉลี่ยดีกว่ามนุษย์ทั่วไป

    • ฉันอยากถามว่าคิดอย่างไรกับการใช้คำว่า “research” ในฐานะคำเรียกชุดความสามารถของ LLM มันเป็นคำที่แทนงานวิจัยจริงได้มากพอไหม หรือใกล้เคียงกับสำนวน “do your research” ที่ชอบใช้กันช่วงฤดูเลือกตั้งในสหรัฐฯ มากกว่า

  • ฉันยังคิดว่าการค้นหาด้วย Google (โดยเฉพาะเมื่อปิด AI summary ด้วย udm=14) ยังให้ประสบการณ์ที่ดีอยู่มาก ตัวอย่างเช่นคำถามเกี่ยวกับ Britannica และ Wikipedia ฉันได้ผลลัพธ์จาก Google และ Wikipedia อย่างละภายใน 1-2 วินาที และใช้เวลาราว 60 วินาทีก็หาเนื้อหาที่ต้องการเองได้อย่างรวดเร็ว ตรงกันข้าม ChatGPT ใช้เวลาประมวลผลราว 3 นาทีแบบไม่ขึ้นกับกัน และฉันยังต้องตรวจผลเองกับเช็กว่าไม่ได้หลอน สรุปคือแม้การที่ LLM ทำงาน X ได้จะน่าประทับใจ แต่กระบวนการที่ฉันค้นหาเองแล้วสรุปเองมีประสิทธิภาพกว่ามาก

    • จากประสบการณ์ล่าสุดของฉัน ฉันเห็นต่างนิดหน่อย ถ้าไม่ปิด Google AI summary ประสบการณ์จะแย่ลงชัดเจน เช่น ตอนห่า Github repo Google หาเพจจริงไม่เจอและให้แต่ลิงก์มั่ว ๆ GPT แม้จะช้ากว่า แต่ก็มีข้อดีขึ้นอยู่กับขอบเขตการค้นคว้า ในหัวข้อเชิงลึกอย่างการเคลื่อนที่ของยูนิตใน StarCraft2 การที่ขอให้ GPT สรุป อธิบาย และตามด้วย source code ได้ในครั้งเดียวสะดวกมาก และฉันก็กรองข้อผิดพลาดเองได้ดีพอ อนาคตฉันคิดว่าการท่องอินเทอร์เน็ตทั้งหมดจะมีผู้ช่วยแบบ LLM เป็นฐาน

    • ฉันลองค้นหา "Rubber bouncy at Heathrow removal" ใน Google แล้วได้ผลลัพธ์ลิงก์ 3 รายการ ส่วน ChatGPT ดูเหมือนจะมีอาการหลอนบ้างในการแสดงหลักฐาน การค้นหาภาพย้อนกลับหรือเช็กราคาป๊อปของ Starbucks ก็ยังรู้สึกว่าหาเองได้ดีกว่า ถึงอย่างนั้นที่คนชอบ ChatGPT ก็คงเพราะมันสะดวก ตอบข้อมูลจากเว็บให้รวดเดียว แม้จะมีอาการหลอนบ้าง คนก็ยังยอมรับต้นทุนนั้น เมื่อก่อนคนก็เคยเชื่อห้องสมุดมากกว่า Wikipedia เช่นกัน ฉันคิดว่าวิวัฒนาการของ LLM อาจเป็นการเปลี่ยนพาราไดม์ครั้งใหม่

    • ข้อเสนอของฉันคือ เวลาลองเปรียบเทียบกับ Google ควรใช้ตัวอย่างที่ตอบยากที่สุด

    • ฉันลองถามคำถามง่าย ๆ ในโหมด GPT-5 Auto มันเริ่มตอบภายใน 2 วินาที และให้ลิงก์ที่ถูกต้อง 2 ลิงก์ในความเร็วที่อ่านง่าย ส่วนโหมด Think ใช้เวลาประมาณ 2 นาที แต่เปรียบเทียบหลายแหล่งข้อมูลและใส่หลักฐานกำกับทุกสรุป ฉันใช้งาน GPT ได้ดีมากกับข้อมูลของรัฐบาลท้องถิ่นที่หายาก หรือการวิเคราะห์ PR ของโอเพนซอร์สที่ซับซ้อน รู้สึกว่ามันมีประโยชน์มากเพราะช่วยแทนการต้องไปอ่านข้อเสนอจำนวนมากด้วยตัวเอง

    • ถ้าผู้คนไม่เข้าเว็บโดยตรงอีกต่อไป แต่มีปฏิสัมพันธ์แค่กับเอเจนต์ ฉันสงสัยว่าเว็บจะเปลี่ยนไปหน้าตาแบบไหน ช่วงเวลาต่อจากนี้คงน่าสนใจมาก

  • ฉันเคยใช้ซับ Reddit อย่าง "Tip of My Tongue" บ่อย ๆ เพื่อหาข้อมูลเก่าที่พอนึกออก แต่ก็ไม่เคยแก้ได้หมด ฟีเจอร์ Deep Research แก้ปัญหา 4 เรื่องที่ค้างอยู่ภายใน 1 ชั่วโมง และทำให้ฉันหาเบาะแสเรื่องที่ห้าได้เองด้วย แม้มันยังอ่อนด้านการให้เหตุผลเชิงตรรกะ แต่ความสามารถในการย่อยผลค้นหาหลายสิบรายการอย่างรวดเร็ว และดึงข้อมูลที่เกี่ยวข้องออกมาจากคำอธิบายแบบหลวม ๆ นั้นทรงพลังมาก ตอนนี้ฉันเข้าถึงพลังการค้นหาแบบนี้ได้ในไม่กี่นาทีโดยไม่ต้องปวดหัวกับสแปมบอตใน Reddit หรือผู้ใช้ที่ไม่ทำตามกฎ

    • ในการค้นหาข้อมูล มีความต่างระหว่างลิงก์เอกสารแบบเดิมกับคอนเทนต์ที่สร้างจากผลการค้นหา และคอนเทนต์ที่สร้างขึ้นนั้นทั้งมีประโยชน์และน่าทึ่งมาก แต่ฉันก็ไม่ลืมว่าผลลัพธ์แบบนี้มักผิดได้บ่อย ถ้าสามารถติดระดับ confidence ให้กับคำตอบได้ ก็น่าจะมีความหมายในเชิงโมเดลธุรกิจด้วย
  • ฉันก็คิดว่า ChatGPT เก่งเรื่องรีเสิร์ช แต่บางครั้งก็มีเคสประหลาดที่ให้คำตอบตื้น ๆ และอาจผิดได้ แม้จะมีแหล่งข้อมูลปฐมภูมิที่เป็นกลางอยู่บนออนไลน์ก็ตาม เลยขอแชร์บล็อกนี้

    • ฉันคิดว่าเคสที่คุณอธิบายไม่เหมือนกับกรณีจริง ความเห็นของคุณต่างจากงานวิจัยหลายชิ้น แล้วคุณก็สรุปลงบล็อกในลักษณะที่เหมือนอยากให้ ChatGPT รับมุมมองของคุณ จึงดูเหมือนมีข้อจำกัดด้านการประเมินอย่างเป็นกลาง

    • ช่วงนี้ฉันรู้สึกว่า ChatGPT ไม่นิ่ง คำตอบเกินครึ่งมักแต่งหลักฐานขึ้นมาเอง ลืมบริบท หรือผิดเฉย ๆ ใน Aistudio แม้จะใส่เกิน 300k tokens ไป Gemini/Aistudio ก็ยังรักษาบริบทได้ดี แต่ ChatGPT ดูอ่อนกับข้อมูลจำนวนมาก

    • ฉันก็มีประสบการณ์คล้ายกัน พอเปลี่ยนเป็น GPT5 Thinking ก็ดีขึ้นนิดหน่อย แต่ยังมีแนวโน้มพลาดบางอย่างเมื่อเทียบกับ o3 หรือ o1 ตัวอย่างเช่น ฉันถาม GPT5 เกี่ยวกับตอนออนเซ็นในนิยายของ Bocchan มันอธิบายผิดแบบละเอียดอ่อน ทั้งที่ในนิยายจริงตัวเอกว่ายน้ำในออนเซ็นแล้วโดนป้ายห้ามเล่นงานจนขายหน้า แต่ GPT5 กลับไปโฟกัสแค่คำอธิบายเรื่องกฎ

    • ฉันว่าบทความของคุณน่าสนใจและเหมาะกับการถกเถียง พูดตรง ๆ คือคิดว่า GPT น่าจะให้คำตอบที่ดีกว่านี้ได้ แต่การถกกันว่าจะหยุดการรีเสิร์ชตรงไหนก็มีความหมายเหมือนกัน ปกติถ้ารับทุกแหล่งที่น่าเชื่อถือน้อยกว่ามาด้วย การถกเถียงคงไม่จบ สุดท้ายการหยุดที่ข้อสรุปซึ่งสังคมยอมรับกันโดยทั่วไปก็น่าจะเป็น trade-off ที่สมเหตุสมผล

  • เมื่อก่อนโมเดลแบบ "heavy" ดูเหมือนมีความรู้ระดับสารานุกรมฝังอยู่ในตัว ขณะที่โมเดล "lighter" รุ่นหลัง ๆ พึ่งเว็บเสิร์ชแล้วให้ข้อมูลตื้น ๆ ฉันคิดถึงข้อดีของโมเดลที่จำเอกสารออฟไลน์จำนวนมหาศาลได้

    • ฉันกลับคิดตรงข้าม ความรู้ภายในของโมเดลอาจเป็นอาการหลอน จึงต้องมีการรีเสิร์ชเพื่อตรวจสอบแยกต่างหากเสมอ แต่ถ้า LLM ค้นหาและสรุปไว้ให้แล้ว เราก็แค่เช็กแหล่งข้อมูล สะดวกกว่ามาก Kagi Assistant ทำหน้าที่แบบนี้ได้ดี

    • ฉันปิดฟีเจอร์ค้นหามานาน แต่ช่วงนี้เพิ่มโหมดใช้เว็บค้นหา/ใช้ความรู้ภายในในคำสั่งแบบคัสตอมแล้ว พิมพ์ xz คือค้นเว็บ ส่วน xx คือใช้แต่ความรู้ภายใน เป็นการตั้งค่าที่สลับได้อิสระภายในเซสชัน

    • โมเดลที่ไม่มีการค้นหาจะหนัก ส่วนโมเดลที่อิงการค้นหาจะเบากว่าแต่พึ่งข้อมูลจริงล่าสุด ฉันสลับไปมาทั้งสองแบบ และช่วงหลังเริ่มชอบโมเดลเบาที่อิงแหล่งข้อมูลมากกว่า

    • ความรู้จริงถูกเก็บไว้นอกตัว ดังนั้นห้องสมุดจึงยังสำคัญในมหาวิทยาลัย เอเจนต์เองก็ไม่พอถ้าอาศัยแค่ความจำ

    • ฉันก็รู้สึกแบบนั้นอยู่บ้าง ถ้าโมเดลเว็บเสิร์ชแบบเบาสามารถแสดงมุมมองที่แยกข้อมูลที่เคยถูกกล่าวถึงไว้ก่อนแล้วกับข้อมูลใหม่ รวมถึงแยกหลักฐานที่แต่ละหน้าอ้างและจุดไม่สอดคล้องกันได้ ก็น่าจะน่าสนใจ

  • ผู้เขียนดูเหมือนจะยอมรับอย่างร่าเริงกับการให้เครื่องจัดการ “งานจำนวนมากอย่างไม่มีเหตุผล” เพื่อหาคำตอบบนอินเทอร์เน็ต ซึ่งทำให้ฉันสงสัยว่านั่นคือเป้าหมายจริงหรือเปล่า และการทุ่มทรัพยากรมหาศาลเพื่อไล่หาคำตอบให้ถูกต้องแบบ “wild goose chase” นั้นสมเหตุสมผลไหม

    • ในประวัติศาสตร์ก็มีคนจำนวนมากที่ใช้ชีวิตทั้งชีวิตไปกับการไล่ตามสิ่งที่ไร้ผลลัพธ์ Newton กับ Einstein ก็เป็นแบบนั้น แม้แต่อัจฉริยะก็ไม่ใช่ข้อยกเว้น
  • ChatGPT น่าทึ่งจริง แต่ครูมัธยมและอาจารย์มหาวิทยาลัยคงลำบากเพราะเครื่องมือแบบนี้ เช่น ถ้าตั้งงานว่า “จงค้นคว้าเชิงลึกให้มากที่สุดเพื่อหาหลักฐานว่า The Lord of the Rings ได้รับอิทธิพลจาก Gormenghast” นักเรียนก็คงใช้ deep research กันอัตโนมัติ ตัวอย่างที่แชร์

    • ฉันสงสัยว่าคุณได้ตรวจสอบข้อเท็จจริงเองไหม คลิกลิงก์ทั้งหมดและเช็กแหล่งข้อมูลหรือยัง ฉันเองเคยอวดว่า ChatGPT “แก้โจทย์” ให้ได้ แต่จริง ๆ แล้วมันคือข้อมูลจาก Wikipedia และยังผิดอีกด้วย

    • นักเรียนที่โกงในโรงเรียนส่วนใหญ่ขี้เกียจและไม่สนใจลำดับชั้น จึงไม่ได้แคร์งานคุณภาพสูงอยู่แล้ว ไม่มีเหตุผลจะต้องใช้โหมด Thinking ที่กินเวลานาน

    • ฉันขำคำใหม่อย่าง ‘steel-man’ ที่โผล่มาในคำตอบของ ChatGPT

    • ฉันนึกไอเดียได้ว่าในการเวิร์กช็อปสำหรับครู อาจสอนวิธีตั้งคำถามแบบโสเครตีส เพื่อช่วยให้เด็ก ๆ โต้แย้งข้อมูลที่ได้จาก Google/ChatGPT ด้วยตัวเอง เป็นแนวทางที่ให้พวกเขาพูดอธิบายความรู้ที่ถูกขยายด้วย LLM ออกมาด้วยตนเอง พร้อมจัดระเบียบระดับความรู้ปัจจุบันของตัวเอง

  • คำถามพวกนี้เป็นคำถามที่พิมพ์ใน Brave search แล้วได้คำตอบในไม่กี่วินาทีอยู่แล้ว แต่ LLM กลับใช้เวลานานอย่างน่าตกใจ

    • ฉันชอบ Brave แต่ไม่ค่อยชอบผลการค้นหา ฟีเจอร์ AI ก็โอเคอยู่ แต่แทบไม่ค่อยได้ผลลัพธ์จริงที่ต้องการ

    • ทุกวันนี้เว็บคุณภาพต่ำที่ทำ SEO มีกันเต็มไปหมดจนเหมือนกำแพง เลยทำให้ฉันไม่ค่อยเชื่ออะไรง่าย ๆ แบบนั้น

    • ข้อดีของ Chat+Search คือได้คำตอบทันทีโดยไม่ต้องกังวลเรื่องโฆษณา การคลิก ฟาร์มคอนเทนต์ หรือมัลแวร์

  • ฉันสับสนว่านี่เป็นฟีเจอร์ไหนของ ChatGPT ระหว่าง “Web Search”, “Deep Research”, หรือ “Agent Mode” ชุดฟีเจอร์นี่น่าสนใจดี

    • ไม่ใช่ Deep Search หรือ Agent Mode ฉันแค่เลือก “GPT-5 Thinking” แล้วเปิดใช้เครื่องมือค้นหาปกติ

    • จากประสบการณ์ของฉัน ผลลัพธ์มันใกล้เคียงกับ “ค้น Reddit แล้วเอาคอมเมนต์มาวางทับ” มากกว่า

    • อย่าลืม “ChatGPT 5 Pro” ด้วย มันต่างจาก Deep Research อยู่นิดหน่อย

    • ฉันคิดว่าเป็นโหมดพื้นฐานธรรมดา แทบไม่ต้องเปิดตัวเลือกเว็บค้นหาแยกเลย เพราะมันค้นหาอัตโนมัติอยู่แล้ว เลยสงสัยว่าทำไมต้องมีตัวเลือกแยก

    • ฉันเดาว่าอย่างน้อยก็คือโหมด ChatGPT 5 Thinking ที่เปิดเว็บค้นหาไว้ในระดับโปรไฟล์ ถ้ามีคำขอที่ต้องใช้ข้อมูลล่าสุดหรือการรีเสิร์ช ChatGPT มักจะคิดลึกและค้นคว้าเอง

  • ฉันอยากรู้ว่าพอดแคสต์ที่ฟังอยู่ทำรายได้เท่าไร เป็นรายการของคอเมเดียนสองคนจาก Phoenix ที่เริ่มจากไม่มีผู้ติดตาม แต่ตอนนี้ขึ้นไปอยู่ระดับบนของชาร์ต Apple แต่ก่อนฉันหาคำตอบชัด ๆ ไม่ได้ แต่ GPT-5 ไปทำรีเสิร์ชแบบ “ทุ่มสุดตัว” และตรวจสอบข้ามหลายแหล่ง จนให้ช่วงตัวเลขที่เชื่อถือได้ออกมา

    • แล้วช่วงตัวเลขนั้นอยู่ที่เท่าไร

    • ช่วงนี้ GPT ก็ดูจะตอบยืดยาวขึ้น Google Gemini บางทีก็ปล่อยเอกสารไร้สาระออกมา ส่วน ChatGPT ก็เริ่มโน้มไปทางรายงานยาว ๆ มากกว่าคำตอบเชิงข้อมูล อาจเป็นเพราะคนดูเชื่อรายงานยาวแบบนี้มากกว่า ยิ่งไปกว่านั้น ต่อให้มีเหตุผลหรือมีตัวเลขละเอียด คำตอบบางประเภทก็ตรวจสอบง่าย บางประเภทก็ยาก ฉันกังวลว่าถ้าใช้ LLM มาก ๆ ทักษะการรีเสิร์ชของตัวเองจะถดถอย อีกอย่างที่รู้สึกจากการลอง MCP คือมันใช้ทรัพยากรเยอะอย่างเหลือเชื่อ ดูเหมือน OpenAI จะยอมขาดทุนเพื่อให้ deep research ราคาถูกในตอนนี้ เลยคิดว่าถ้าภายหลังขึ้นราคาแรง ความพึ่งพาแบบนี้ก็อาจกลายเป็นความเสี่ยงได้