ความสามารถด้านการค้นหาของ ChatGPT รุ่น GPT-5 (Research Goblin) ทรงพลังมาก

(simonwillison.net)

6 คะแนน โดย GN⁺ 2025-09-08 | 1 ความคิดเห็น | แชร์ทาง WhatsApp

ChatGPT ที่ขับเคลื่อนด้วย GPT-5 (หรือที่เรียกว่า Research Goblin) แสดงให้เห็นถึง ความแม่นยำและความเป็นประโยชน์ในระดับสูงมาก สำหรับการค้นหาบนเว็บ
ตั้งแต่คำถามทั่วไปแบบ trivial ไปจนถึงการสืบค้นข้อมูลที่ซับซ้อน มันแสดงความสามารถด้านการค้นหาและการให้เหตุผลที่แข็งแกร่งใน หัวข้อที่หลากหลายอย่างกว้างขวาง
ในตัวอย่างจริง ระบบสามารถให้คำตอบและแหล่งข้อมูลที่เชื่อถือได้ผ่าน กระบวนการค้นหาขนาดใหญ่และการให้เหตุผลแบบต่อเนื่องเป็นลำดับ
แม้ใน สภาพแวดล้อมบนมือถือ ก็ยังมอบประสบการณ์การใช้งานที่ยอดเยี่ยมและเวิร์กโฟลว์การทำงานที่ต่อเนื่อง
ด้วย การผสานรวม Tool calling และ chain-of-thought ทำให้ในมุมมองของนักพัฒนา มันนำเสนอ มาตรฐานใหม่ ของการค้นหาที่ขับเคลื่อนด้วย LLM

GPT-5 Thinking (Research Goblin) และนวัตกรรมการค้นหา

กระบวนทัศน์การค้นหาที่กำลังเปลี่ยนไป

เดิมทีคำแนะนำกระแสหลักคือ “อย่าใช้แชตบอตเหมือนเสิร์ชเอนจิน” แต่กับ ChatGPT ที่ขับเคลื่อนด้วย GPT-5 รุ่นล่าสุด สูตรเดิมนี้เริ่มใช้ไม่ได้อีกต่อไป
โมเดลที่ขับเคลื่อนด้วย GPT-5 ก้าวข้ามการเชื่อมต่อกับเสิร์ชเอนจินอย่าง Bing ไปสู่ระดับที่ สามารถทดแทนหรือเหนือกว่าการค้นคว้าบนอินเทอร์เน็ตแบบทั่วไปได้จริง
เหตุผลที่มันได้ฉายา “Research Goblin” ก็เพราะไม่ว่าจะโยนคำถามหรือโจทย์ซับซ้อนแบบใดให้ มันจะ สืบค้นอย่างดื้อดึงผิดปกติเพื่อหาคำตอบที่ดีที่สุด

กรณีตัวอย่างการค้นหาจริงและผลลัพธ์

ทางเดินเลื่อนแบบน่าสนใจ (Travelators)

เมื่อถามว่าช่วงเวลาใดที่สายพานทางเดินเลื่อนยางในสนามบินฮีทโธรว์ถูกเปลี่ยนเป็นแบบโลหะ ระบบประเมินว่า น่าจะอยู่ระหว่างปี 2014~2018 และยังค้นพบบทความที่น่าสนใจจากปี 2024 ที่เกี่ยวข้องได้อีกด้วย

การระบุอาคาร

เมื่อถามถึงอาคารหน้าตาแปลกตาที่มองเห็นจากหน้าต่างรถไฟ ระบบยืนยันได้อย่างแม่นยำภายใน 1 นาที 4 วินาที ว่านั่นคือ ‘The Blade (Reading)’ พร้อมให้ลิงก์แหล่งที่มา

การสืบค้นเค้กป๊อปของ Starbucks UK

ระบบทำการ สืบค้นเชิงลึกว่าทำไมร้าน Starbucks ในสหราชอาณาจักรจึงไม่มีเค้กป๊อป และพบว่ามีการนำเข้าในปี 2023 แต่ บางสาขาเท่านั้น โดยเฉพาะสาขาในจุดเดินทาง มักไม่มีจำหน่าย
ยังรวบรวมหลักฐานประกอบ เช่น PDF ข้อมูลโภชนาการและสารก่อภูมิแพ้ รวมถึงการสนทนาใน Reddit

ความสัมพันธ์ระหว่าง Wikipedia และ Britannica

ระบบวิเคราะห์เชิงลึกถึงความจริงและบริบทของคำกล่าวอ้างบนอินเทอร์เน็ตที่ว่า Wikipedia ใช้ บางส่วนของแหล่งข้อมูลจาก Britannica ฉบับปี 1911 ในช่วงแรกเริ่ม พร้อมติดตามเอกสารโครงการและคำอธิบายที่เกี่ยวข้องมาให้

ชื่อทางการของ University of Cambridge

ระบบระบุ ชื่อทางกฎหมายอย่างเป็นทางการของมหาวิทยาลัยเคมบริดจ์ (The Chancellor, Masters, and Scholars of the University of Cambridge) พร้อมหลักฐานอ้างอิง
กระบวนการให้เหตุผลถูกแสดงอย่างโปร่งใส ทำให้ตรวจสอบความน่าเชื่อถือของคำตอบได้ด้วย

ประวัติถ้ำและร้านอาหารที่ Exeter quay

ระบบค้นคว้าถึง โครงสร้างภายในของร้านอาหารที่เจาะเข้าไปในหน้าผาในย่าน Exeter Quay และประวัติความเป็นมา ผ่านการค้นหาหลายขั้นตอนและการวิเคราะห์ PDF จนระบุได้ว่ามีที่มาจากการก่อสร้างบนหน้าผาหินทรายสีแดงในช่วงทศวรรษ 1820~1830
ยังแสดงรูปแบบการค้นหาเชิงรุก โดย ค้นหารายงาน/แบบแปลนภาษาอังกฤษ และเมื่อเข้าถึงไม่ได้ก็ถึงขั้นร่างอีเมลสำหรับขอข้อมูลให้

การเปรียบเทียบ Aldi และ Lidl

ระบบวิเคราะห์อย่างยาวถึง ตำแหน่งทางการตลาด ภาพลักษณ์ อันดับในตลาดสหราชอาณาจักร ของ Aldi และ Lidl รวมถึงตัวเลขด้านส่วนแบ่งตลาดและการประเมินจากผู้บริโภค
ตามคำขอของผู้ใช้ ยังสามารถจัดอันดับใหม่ตามเกณฑ์ “fanciness(ความพรีเมียม)” ได้อีกด้วย

การสแกนหนังสือของสถาบันวิจัย AI

นอกเหนือจากกรณีที่ Anthropic สแกนหนังสือจำนวนมากเพื่อสร้างข้อมูลฝึก ระบบ ยังไม่สามารถยืนยันได้ว่ามีสถาบันวิจัย AI อื่นทำในลักษณะเดียวกันหรือไม่ แต่ได้บันทึกรายละเอียดของการค้นหาความเป็นไปได้นั้นไว้อย่างครบถ้วน

จุดเด่นที่เหนือกว่าจริงของการค้นหาด้วย GPT-5

ในการค้นหาของ ChatGPT ที่ขับเคลื่อนด้วย GPT-5 นั้น สามารถ รวบรวมและประเมินข้อมูลได้รวดเร็ว เป็นระบบ และครอบคลุมกว่าการทำด้วยมือ
โดยเฉพาะใน สภาพแวดล้อมบนมือถือ การใช้งานดีขึ้นอย่างมาก ทำให้การตอบสนองความสงสัยทั่วไปหรือการค้นคว้าในชีวิตประจำวันทำได้ทุกที่ทุกเวลา
มันมีความสามารถในการ ให้ผลลัพธ์ที่รวดเร็วแต่เนื้อหาแน่น มากพอที่จะใช้แทนฟีเจอร์ Deep Research ของ OpenAI ได้

ความหมายในมุมมองการพัฒนา LLM

ด้วยการผสาน Tool calling และ chain-of-thought ทำให้การค้นหา การให้เหตุผลแบบเป็นลำดับ และการสำรวจเพิ่มเติมสามารถเชื่อมต่อกันอย่างเป็นธรรมชาติภายในขั้นตอน “การคิด” เพียงครั้งเดียว
เทคโนโลยี RAG (การผสานการค้นหากับการสร้างคำตอบ) ก็สามารถทำงานได้ ทรงพลังกว่าเดิมมาก ผ่านการเรียกใช้ tool หลายขั้นตอนอย่างยืดหยุ่นและการเชื่อมโยงกับการค้นหาที่ซับซ้อนขึ้น
ในคำศัพท์ของ Anthropic สิ่งนี้เรียกว่า interleaved thinking และใน OpenAI Responses API ก็รองรับลักษณะการทำงานคล้ายกัน

เคล็ดลับในการใช้เพื่อการค้นหาอย่างมีประสิทธิภาพ

สามารถยกระดับคุณภาพการค้นหาได้ผ่าน สัญชาตญาณจากประสบการณ์ (เช่น การใช้คำใบ้อย่าง “go deep” เพื่อกระตุ้นให้ค้นคว้าอย่างละเอียดมากขึ้น)
แม้ในกรณีของ คำถามเชิงตีความ ที่ไม่มีคำตอบชัดเจน ก็ยังสามารถให้ผลลัพธ์ที่เป็นประโยชน์และน่าสนใจได้
ดังเช่นอุปมา “ก็อบลิน” Research Goblin คือ AI สำหรับการค้นหาที่ขยันขันแข็ง แต่ไม่อาจเชื่อถือได้ทั้งหมด และแตกต่างจากมนุษย์ ทว่าใช้งานได้อย่างมีคุณค่าสูง

1 ความคิดเห็น

GN⁺ 2025-09-08

ความคิดเห็นจาก Hacker News

ฉันเห็นด้วยกับบทความของ Simon แต่คิดว่า “การวิจัย” หมายถึงการเปรียบเทียบหลักฐานหลายรูปแบบ เช่น ผลของ Obamacare, การคาดการณ์คำตัดสินทางกฎหมาย, การวิเคราะห์อิทธิพลของอนิเมชัน, หรือวิธีใช้งานไลบรารีโอเพนซอร์ส ซึ่งนำไปใช้ได้ในหลายสาขา ChatGPT และ LLM อื่น ๆ ดูจะมีปัญหาในการประเมินหลักฐานหรือเข้าใจอคติของแหล่งข้อมูล โดยเฉพาะเมื่อเกี่ยวข้องกับสถิติจำนวนมาก ยิ่งต้องใช้การให้เหตุผลที่ซับซ้อนมากขึ้น อาการหลอนก็ยิ่งเพิ่มขึ้น โมเดลยังมีแนวโน้มอยากสนับสนุนมุมมองของผู้ใช้ จึงมักตอบไปในทางบวกแม้เราไม่ได้ขอ ฉันมักขอให้ ChatGPT ประเมินแหล่งข้อมูลโดยตรง เปรียบเทียบเหตุผลทั้งฝ่ายเห็นด้วยและไม่เห็นด้วย และบางครั้งก็โต้แย้งกับโมเดลเพื่อดูปฏิกิริยา ประสบการณ์แบบละเอียดอ่านได้ในบล็อก
- ฉันเคยใช้ Perplexity เพื่อหาการตั้งค่าที่เหมาะสมที่สุดสำหรับจอของตัวเอง มันให้รายการการตั้งค่าที่กระชับพร้อมเหตุผลมา แต่พอตรวจดูแหล่งที่มาแล้วกลับไม่มีข้อมูลทางการหรือหลักฐานรองรับ มีแค่โพสต์ในฟอรัม Samsung ที่ผู้ใช้คาดเดาหรือถกเถียงกันเอง ถ้ามี confidence rating ตามความน่าเชื่อถือของแหล่งข้อมูลก็น่าจะดี แต่คงทำได้ยากมาก
- ChatGPT และ LLM มักพูดซ้ำแค่ “สามัญสำนึก” แบบผิวเผิน ฉันต้องถามต่อหลายรอบเพื่อเช็กว่ามีหลักฐานจริงไหม แหล่งข้อมูลคืออะไร ขอข้อความที่อ้างอิงมา และยืนยันอีกทีว่าไม่ได้หลอน บ่อยครั้งมากที่พบว่าคำตอบแรกผิดทั้งหมด คนส่วนใหญ่น่าจะรับคำตอบแรกไปเลย
- เช่นเวลาจะตัดสินใจซื้อของอย่างมีข้อมูลจริง ๆ ฉันรู้สึกว่ามันยากมาก เพราะความเห็นเชิงการตลาดมีอยู่เต็มไปหมด และสัญญาณด้านลบที่สวนทางกัน เช่น คอมเมนต์เชิงลบใน Reddit หรือ YouTube ก็ไม่ได้ถูกชดเชยอย่างเพียงพอ
- GPT-5 (รวมถึงโมเดล o3) เป็นหนึ่งใน LLM ที่มีมุมมองเชิงวิพากษ์มากที่สุด สำหรับคำขอเชิงวิชาการหรือเทคนิค มันสามารถอ้างอิงแหล่งข้อมูลและเปรียบเทียบผลลัพธ์ต่าง ๆ ได้โดยแทบไม่ต้องพรอมป์เพิ่มเลย ส่วน Grok 4 เวอร์ชันแรก ๆ แค่สรุปบทความโดยไม่วิเคราะห์ ขณะที่ Claude Opus 4 ก็ออกนอกประเด็น เช่น เวลาขอรายชื่อไลบรารี JS กลับคืนเอกสารที่เน้นอัตราการใช้งาน GPT-5 แน่นอนว่าไม่สมบูรณ์แบบ แต่โดยเฉลี่ยดีกว่ามนุษย์ทั่วไป
- ฉันอยากถามว่าคิดอย่างไรกับการใช้คำว่า “research” ในฐานะคำเรียกชุดความสามารถของ LLM มันเป็นคำที่แทนงานวิจัยจริงได้มากพอไหม หรือใกล้เคียงกับสำนวน “do your research” ที่ชอบใช้กันช่วงฤดูเลือกตั้งในสหรัฐฯ มากกว่า
ฉันยังคิดว่าการค้นหาด้วย Google (โดยเฉพาะเมื่อปิด AI summary ด้วย udm=14) ยังให้ประสบการณ์ที่ดีอยู่มาก ตัวอย่างเช่นคำถามเกี่ยวกับ Britannica และ Wikipedia ฉันได้ผลลัพธ์จาก Google และ Wikipedia อย่างละภายใน 1-2 วินาที และใช้เวลาราว 60 วินาทีก็หาเนื้อหาที่ต้องการเองได้อย่างรวดเร็ว ตรงกันข้าม ChatGPT ใช้เวลาประมวลผลราว 3 นาทีแบบไม่ขึ้นกับกัน และฉันยังต้องตรวจผลเองกับเช็กว่าไม่ได้หลอน สรุปคือแม้การที่ LLM ทำงาน X ได้จะน่าประทับใจ แต่กระบวนการที่ฉันค้นหาเองแล้วสรุปเองมีประสิทธิภาพกว่ามาก
- จากประสบการณ์ล่าสุดของฉัน ฉันเห็นต่างนิดหน่อย ถ้าไม่ปิด Google AI summary ประสบการณ์จะแย่ลงชัดเจน เช่น ตอนห่า Github repo Google หาเพจจริงไม่เจอและให้แต่ลิงก์มั่ว ๆ GPT แม้จะช้ากว่า แต่ก็มีข้อดีขึ้นอยู่กับขอบเขตการค้นคว้า ในหัวข้อเชิงลึกอย่างการเคลื่อนที่ของยูนิตใน StarCraft2 การที่ขอให้ GPT สรุป อธิบาย และตามด้วย source code ได้ในครั้งเดียวสะดวกมาก และฉันก็กรองข้อผิดพลาดเองได้ดีพอ อนาคตฉันคิดว่าการท่องอินเทอร์เน็ตทั้งหมดจะมีผู้ช่วยแบบ LLM เป็นฐาน
- ฉันลองค้นหา "Rubber bouncy at Heathrow removal" ใน Google แล้วได้ผลลัพธ์ลิงก์ 3 รายการ ส่วน ChatGPT ดูเหมือนจะมีอาการหลอนบ้างในการแสดงหลักฐาน การค้นหาภาพย้อนกลับหรือเช็กราคาป๊อปของ Starbucks ก็ยังรู้สึกว่าหาเองได้ดีกว่า ถึงอย่างนั้นที่คนชอบ ChatGPT ก็คงเพราะมันสะดวก ตอบข้อมูลจากเว็บให้รวดเดียว แม้จะมีอาการหลอนบ้าง คนก็ยังยอมรับต้นทุนนั้น เมื่อก่อนคนก็เคยเชื่อห้องสมุดมากกว่า Wikipedia เช่นกัน ฉันคิดว่าวิวัฒนาการของ LLM อาจเป็นการเปลี่ยนพาราไดม์ครั้งใหม่
- ข้อเสนอของฉันคือ เวลาลองเปรียบเทียบกับ Google ควรใช้ตัวอย่างที่ตอบยากที่สุด
- ฉันลองถามคำถามง่าย ๆ ในโหมด GPT-5 Auto มันเริ่มตอบภายใน 2 วินาที และให้ลิงก์ที่ถูกต้อง 2 ลิงก์ในความเร็วที่อ่านง่าย ส่วนโหมด Think ใช้เวลาประมาณ 2 นาที แต่เปรียบเทียบหลายแหล่งข้อมูลและใส่หลักฐานกำกับทุกสรุป ฉันใช้งาน GPT ได้ดีมากกับข้อมูลของรัฐบาลท้องถิ่นที่หายาก หรือการวิเคราะห์ PR ของโอเพนซอร์สที่ซับซ้อน รู้สึกว่ามันมีประโยชน์มากเพราะช่วยแทนการต้องไปอ่านข้อเสนอจำนวนมากด้วยตัวเอง
- ถ้าผู้คนไม่เข้าเว็บโดยตรงอีกต่อไป แต่มีปฏิสัมพันธ์แค่กับเอเจนต์ ฉันสงสัยว่าเว็บจะเปลี่ยนไปหน้าตาแบบไหน ช่วงเวลาต่อจากนี้คงน่าสนใจมาก
ฉันเคยใช้ซับ Reddit อย่าง "Tip of My Tongue" บ่อย ๆ เพื่อหาข้อมูลเก่าที่พอนึกออก แต่ก็ไม่เคยแก้ได้หมด ฟีเจอร์ Deep Research แก้ปัญหา 4 เรื่องที่ค้างอยู่ภายใน 1 ชั่วโมง และทำให้ฉันหาเบาะแสเรื่องที่ห้าได้เองด้วย แม้มันยังอ่อนด้านการให้เหตุผลเชิงตรรกะ แต่ความสามารถในการย่อยผลค้นหาหลายสิบรายการอย่างรวดเร็ว และดึงข้อมูลที่เกี่ยวข้องออกมาจากคำอธิบายแบบหลวม ๆ นั้นทรงพลังมาก ตอนนี้ฉันเข้าถึงพลังการค้นหาแบบนี้ได้ในไม่กี่นาทีโดยไม่ต้องปวดหัวกับสแปมบอตใน Reddit หรือผู้ใช้ที่ไม่ทำตามกฎ
- ในการค้นหาข้อมูล มีความต่างระหว่างลิงก์เอกสารแบบเดิมกับคอนเทนต์ที่สร้างจากผลการค้นหา และคอนเทนต์ที่สร้างขึ้นนั้นทั้งมีประโยชน์และน่าทึ่งมาก แต่ฉันก็ไม่ลืมว่าผลลัพธ์แบบนี้มักผิดได้บ่อย ถ้าสามารถติดระดับ confidence ให้กับคำตอบได้ ก็น่าจะมีความหมายในเชิงโมเดลธุรกิจด้วย
ฉันก็คิดว่า ChatGPT เก่งเรื่องรีเสิร์ช แต่บางครั้งก็มีเคสประหลาดที่ให้คำตอบตื้น ๆ และอาจผิดได้ แม้จะมีแหล่งข้อมูลปฐมภูมิที่เป็นกลางอยู่บนออนไลน์ก็ตาม เลยขอแชร์บล็อกนี้
- ฉันคิดว่าเคสที่คุณอธิบายไม่เหมือนกับกรณีจริง ความเห็นของคุณต่างจากงานวิจัยหลายชิ้น แล้วคุณก็สรุปลงบล็อกในลักษณะที่เหมือนอยากให้ ChatGPT รับมุมมองของคุณ จึงดูเหมือนมีข้อจำกัดด้านการประเมินอย่างเป็นกลาง
- ช่วงนี้ฉันรู้สึกว่า ChatGPT ไม่นิ่ง คำตอบเกินครึ่งมักแต่งหลักฐานขึ้นมาเอง ลืมบริบท หรือผิดเฉย ๆ ใน Aistudio แม้จะใส่เกิน 300k tokens ไป Gemini/Aistudio ก็ยังรักษาบริบทได้ดี แต่ ChatGPT ดูอ่อนกับข้อมูลจำนวนมาก
- ฉันก็มีประสบการณ์คล้ายกัน พอเปลี่ยนเป็น GPT5 Thinking ก็ดีขึ้นนิดหน่อย แต่ยังมีแนวโน้มพลาดบางอย่างเมื่อเทียบกับ o3 หรือ o1 ตัวอย่างเช่น ฉันถาม GPT5 เกี่ยวกับตอนออนเซ็นในนิยายของ Bocchan มันอธิบายผิดแบบละเอียดอ่อน ทั้งที่ในนิยายจริงตัวเอกว่ายน้ำในออนเซ็นแล้วโดนป้ายห้ามเล่นงานจนขายหน้า แต่ GPT5 กลับไปโฟกัสแค่คำอธิบายเรื่องกฎ
- ฉันว่าบทความของคุณน่าสนใจและเหมาะกับการถกเถียง พูดตรง ๆ คือคิดว่า GPT น่าจะให้คำตอบที่ดีกว่านี้ได้ แต่การถกกันว่าจะหยุดการรีเสิร์ชตรงไหนก็มีความหมายเหมือนกัน ปกติถ้ารับทุกแหล่งที่น่าเชื่อถือน้อยกว่ามาด้วย การถกเถียงคงไม่จบ สุดท้ายการหยุดที่ข้อสรุปซึ่งสังคมยอมรับกันโดยทั่วไปก็น่าจะเป็น trade-off ที่สมเหตุสมผล
เมื่อก่อนโมเดลแบบ "heavy" ดูเหมือนมีความรู้ระดับสารานุกรมฝังอยู่ในตัว ขณะที่โมเดล "lighter" รุ่นหลัง ๆ พึ่งเว็บเสิร์ชแล้วให้ข้อมูลตื้น ๆ ฉันคิดถึงข้อดีของโมเดลที่จำเอกสารออฟไลน์จำนวนมหาศาลได้
- ฉันกลับคิดตรงข้าม ความรู้ภายในของโมเดลอาจเป็นอาการหลอน จึงต้องมีการรีเสิร์ชเพื่อตรวจสอบแยกต่างหากเสมอ แต่ถ้า LLM ค้นหาและสรุปไว้ให้แล้ว เราก็แค่เช็กแหล่งข้อมูล สะดวกกว่ามาก Kagi Assistant ทำหน้าที่แบบนี้ได้ดี
- ฉันปิดฟีเจอร์ค้นหามานาน แต่ช่วงนี้เพิ่มโหมดใช้เว็บค้นหา/ใช้ความรู้ภายในในคำสั่งแบบคัสตอมแล้ว พิมพ์ xz คือค้นเว็บ ส่วน xx คือใช้แต่ความรู้ภายใน เป็นการตั้งค่าที่สลับได้อิสระภายในเซสชัน
- โมเดลที่ไม่มีการค้นหาจะหนัก ส่วนโมเดลที่อิงการค้นหาจะเบากว่าแต่พึ่งข้อมูลจริงล่าสุด ฉันสลับไปมาทั้งสองแบบ และช่วงหลังเริ่มชอบโมเดลเบาที่อิงแหล่งข้อมูลมากกว่า
- ความรู้จริงถูกเก็บไว้นอกตัว ดังนั้นห้องสมุดจึงยังสำคัญในมหาวิทยาลัย เอเจนต์เองก็ไม่พอถ้าอาศัยแค่ความจำ
- ฉันก็รู้สึกแบบนั้นอยู่บ้าง ถ้าโมเดลเว็บเสิร์ชแบบเบาสามารถแสดงมุมมองที่แยกข้อมูลที่เคยถูกกล่าวถึงไว้ก่อนแล้วกับข้อมูลใหม่ รวมถึงแยกหลักฐานที่แต่ละหน้าอ้างและจุดไม่สอดคล้องกันได้ ก็น่าจะน่าสนใจ
ผู้เขียนดูเหมือนจะยอมรับอย่างร่าเริงกับการให้เครื่องจัดการ “งานจำนวนมากอย่างไม่มีเหตุผล” เพื่อหาคำตอบบนอินเทอร์เน็ต ซึ่งทำให้ฉันสงสัยว่านั่นคือเป้าหมายจริงหรือเปล่า และการทุ่มทรัพยากรมหาศาลเพื่อไล่หาคำตอบให้ถูกต้องแบบ “wild goose chase” นั้นสมเหตุสมผลไหม
- ในประวัติศาสตร์ก็มีคนจำนวนมากที่ใช้ชีวิตทั้งชีวิตไปกับการไล่ตามสิ่งที่ไร้ผลลัพธ์ Newton กับ Einstein ก็เป็นแบบนั้น แม้แต่อัจฉริยะก็ไม่ใช่ข้อยกเว้น
ChatGPT น่าทึ่งจริง แต่ครูมัธยมและอาจารย์มหาวิทยาลัยคงลำบากเพราะเครื่องมือแบบนี้ เช่น ถ้าตั้งงานว่า “จงค้นคว้าเชิงลึกให้มากที่สุดเพื่อหาหลักฐานว่า The Lord of the Rings ได้รับอิทธิพลจาก Gormenghast” นักเรียนก็คงใช้ deep research กันอัตโนมัติ ตัวอย่างที่แชร์
- ฉันสงสัยว่าคุณได้ตรวจสอบข้อเท็จจริงเองไหม คลิกลิงก์ทั้งหมดและเช็กแหล่งข้อมูลหรือยัง ฉันเองเคยอวดว่า ChatGPT “แก้โจทย์” ให้ได้ แต่จริง ๆ แล้วมันคือข้อมูลจาก Wikipedia และยังผิดอีกด้วย
- นักเรียนที่โกงในโรงเรียนส่วนใหญ่ขี้เกียจและไม่สนใจลำดับชั้น จึงไม่ได้แคร์งานคุณภาพสูงอยู่แล้ว ไม่มีเหตุผลจะต้องใช้โหมด Thinking ที่กินเวลานาน
- ฉันขำคำใหม่อย่าง ‘steel-man’ ที่โผล่มาในคำตอบของ ChatGPT
- ฉันนึกไอเดียได้ว่าในการเวิร์กช็อปสำหรับครู อาจสอนวิธีตั้งคำถามแบบโสเครตีส เพื่อช่วยให้เด็ก ๆ โต้แย้งข้อมูลที่ได้จาก Google/ChatGPT ด้วยตัวเอง เป็นแนวทางที่ให้พวกเขาพูดอธิบายความรู้ที่ถูกขยายด้วย LLM ออกมาด้วยตนเอง พร้อมจัดระเบียบระดับความรู้ปัจจุบันของตัวเอง
คำถามพวกนี้เป็นคำถามที่พิมพ์ใน Brave search แล้วได้คำตอบในไม่กี่วินาทีอยู่แล้ว แต่ LLM กลับใช้เวลานานอย่างน่าตกใจ
- ฉันชอบ Brave แต่ไม่ค่อยชอบผลการค้นหา ฟีเจอร์ AI ก็โอเคอยู่ แต่แทบไม่ค่อยได้ผลลัพธ์จริงที่ต้องการ
- ทุกวันนี้เว็บคุณภาพต่ำที่ทำ SEO มีกันเต็มไปหมดจนเหมือนกำแพง เลยทำให้ฉันไม่ค่อยเชื่ออะไรง่าย ๆ แบบนั้น
- ข้อดีของ Chat+Search คือได้คำตอบทันทีโดยไม่ต้องกังวลเรื่องโฆษณา การคลิก ฟาร์มคอนเทนต์ หรือมัลแวร์
ฉันสับสนว่านี่เป็นฟีเจอร์ไหนของ ChatGPT ระหว่าง “Web Search”, “Deep Research”, หรือ “Agent Mode” ชุดฟีเจอร์นี่น่าสนใจดี
- ไม่ใช่ Deep Search หรือ Agent Mode ฉันแค่เลือก “GPT-5 Thinking” แล้วเปิดใช้เครื่องมือค้นหาปกติ
- จากประสบการณ์ของฉัน ผลลัพธ์มันใกล้เคียงกับ “ค้น Reddit แล้วเอาคอมเมนต์มาวางทับ” มากกว่า
- อย่าลืม “ChatGPT 5 Pro” ด้วย มันต่างจาก Deep Research อยู่นิดหน่อย
- ฉันคิดว่าเป็นโหมดพื้นฐานธรรมดา แทบไม่ต้องเปิดตัวเลือกเว็บค้นหาแยกเลย เพราะมันค้นหาอัตโนมัติอยู่แล้ว เลยสงสัยว่าทำไมต้องมีตัวเลือกแยก
- ฉันเดาว่าอย่างน้อยก็คือโหมด ChatGPT 5 Thinking ที่เปิดเว็บค้นหาไว้ในระดับโปรไฟล์ ถ้ามีคำขอที่ต้องใช้ข้อมูลล่าสุดหรือการรีเสิร์ช ChatGPT มักจะคิดลึกและค้นคว้าเอง
ฉันอยากรู้ว่าพอดแคสต์ที่ฟังอยู่ทำรายได้เท่าไร เป็นรายการของคอเมเดียนสองคนจาก Phoenix ที่เริ่มจากไม่มีผู้ติดตาม แต่ตอนนี้ขึ้นไปอยู่ระดับบนของชาร์ต Apple แต่ก่อนฉันหาคำตอบชัด ๆ ไม่ได้ แต่ GPT-5 ไปทำรีเสิร์ชแบบ “ทุ่มสุดตัว” และตรวจสอบข้ามหลายแหล่ง จนให้ช่วงตัวเลขที่เชื่อถือได้ออกมา
- แล้วช่วงตัวเลขนั้นอยู่ที่เท่าไร
- ช่วงนี้ GPT ก็ดูจะตอบยืดยาวขึ้น Google Gemini บางทีก็ปล่อยเอกสารไร้สาระออกมา ส่วน ChatGPT ก็เริ่มโน้มไปทางรายงานยาว ๆ มากกว่าคำตอบเชิงข้อมูล อาจเป็นเพราะคนดูเชื่อรายงานยาวแบบนี้มากกว่า ยิ่งไปกว่านั้น ต่อให้มีเหตุผลหรือมีตัวเลขละเอียด คำตอบบางประเภทก็ตรวจสอบง่าย บางประเภทก็ยาก ฉันกังวลว่าถ้าใช้ LLM มาก ๆ ทักษะการรีเสิร์ชของตัวเองจะถดถอย อีกอย่างที่รู้สึกจากการลอง MCP คือมันใช้ทรัพยากรเยอะอย่างเหลือเชื่อ ดูเหมือน OpenAI จะยอมขาดทุนเพื่อให้ deep research ราคาถูกในตอนนี้ เลยคิดว่าถ้าภายหลังขึ้นราคาแรง ความพึ่งพาแบบนี้ก็อาจกลายเป็นความเสี่ยงได้

ความสามารถด้านการค้นหาของ ChatGPT รุ่น GPT-5 (Research Goblin) ทรงพลังมาก

GPT-5 Thinking (Research Goblin) และนวัตกรรมการค้นหา

กระบวนทัศน์การค้นหาที่กำลังเปลี่ยนไป

กรณีตัวอย่างการค้นหาจริงและผลลัพธ์

ทางเดินเลื่อนแบบน่าสนใจ (Travelators)

การระบุอาคาร

การสืบค้นเค้กป๊อปของ Starbucks UK

ความสัมพันธ์ระหว่าง Wikipedia และ Britannica

ชื่อทางการของ University of Cambridge

ประวัติถ้ำและร้านอาหารที่ Exeter quay

การเปรียบเทียบ Aldi และ Lidl

การสแกนหนังสือของสถาบันวิจัย AI

จุดเด่นที่เหนือกว่าจริงของการค้นหาด้วย GPT-5

ความหมายในมุมมองการพัฒนา LLM

เคล็ดลับในการใช้เพื่อการค้นหาอย่างมีประสิทธิภาพ

บทความที่เกี่ยวข้อง

1 ความคิดเห็น

ความคิดเห็นจาก Hacker News