6 คะแนน โดย GN⁺ 2025-09-12 | 2 ความคิดเห็น | แชร์ทาง WhatsApp
  • ระบบหน่วยความจำของ Claude จะทำงานก็ต่อเมื่อผู้ใช้เรียกใช้โดยตรงเท่านั้น และจะค้นหา ประวัติการสนทนาจริง แบบเรียลไทม์เพื่อดึงข้อมูลกลับมา
  • ในทางกลับกัน ChatGPT จะโหลดโปรไฟล์ผู้ใช้และประวัติการใช้งานโดยอัตโนมัติในทุกบทสนทนา เพื่อมอบประสบการณ์ที่ปรับให้เหมาะกับผู้ใช้ได้ทันที
  • แนวทางทั้งสองนี้สะท้อนถึง ความแตกต่างของกลุ่มผู้ใช้เป้าหมายและปรัชญาการพัฒนาผลิตภัณฑ์
  • ผู้ใช้ Claude เน้นไปที่ นักพัฒนาและผู้เชี่ยวชาญ โดยให้ความสำคัญกับความโปร่งใส การควบคุมโดยตรง และ ความเป็นส่วนตัว
  • ช่วงหลัง Claude เองก็เริ่มเพิ่มฟีเจอร์หน่วยความจำอัตโนมัติคล้าย ChatGPT สำหรับบัญชีทีมและองค์กร แสดงให้เห็นว่า ขอบเขตการออกแบบหน่วยความจำ AI กำลังขยายตัวอย่างรวดเร็ว

ระบบหน่วยความจำของ Claude ทำงานอย่างไร

ระบบหน่วยความจำของ Claude มีคุณลักษณะหลักอยู่ 2 ประการ

  • เริ่มต้นจาก สถานะว่างเปล่า ในทุกครั้งที่เริ่มบทสนทนา และจะไม่โหลดโปรไฟล์ผู้ใช้หรือประวัติการสนทนาก่อนหน้าไว้ล่วงหน้า
  • ฟังก์ชันหน่วยความจำจะทำงานก็ต่อเมื่อผู้ใช้ใช้ ถ้อยคำเรียกใช้อย่างชัดเจน เช่น "ช่วยบอกสิ่งที่เราเคยคุยกันก่อนหน้านี้" หรือ "ช่วยทำต่อจากครั้งล่าสุด"

Claude ไม่ได้ใช้สรุปที่ AI สร้างขึ้นหรือโปรไฟล์ที่บีบอัดไว้ แต่จะ ค้นหาประวัติการสนทนาในอดีตจริงเท่านั้นแบบเรียลไทม์ แล้วนำข้อมูลนั้นมาใช้
เมื่อการค้นหาเสร็จสิ้น Claude จะรวมผลลัพธ์ที่พบเพื่อตอบคำขอของผู้ใช้หรือดำเนินการสนทนาต่อ

เครื่องมือ Conversation Search

  • เครื่องมือ conversation_search ใช้ค้นหาประวัติการสนทนาทั้งหมดตามคีย์เวิร์ดหรือหัวข้อ
  • ตัวอย่างเช่น หากผู้ใช้ถามว่า "จำสิ่งที่เราเคยคุยเกี่ยวกับ Chandni Chowk ได้ไหม" Claude จะค้นหาหลายบทสนทนาที่เกี่ยวข้องกับหัวข้อนั้น แล้วสรุปรวมให้
  • หากถามหลายหัวข้อพร้อมกัน (เช่น Michelangelo, Chainflip, Solana) ระบบจะค้นหาแต่ละหัวข้อแยกกันตามลำดับ แล้วส่งคืนเนื้อหาพร้อมลิงก์
  • พารามิเตอร์ของ conversation_search มีทั้งจำนวนผลลัพธ์สูงสุดและคำค้นหา
    • เช่น max_results (1~10), query (คีย์เวิร์ดค้นหา)

เครื่องมือ Temporal Chat Retrieval

  • เครื่องมือ recent_chats ใช้เข้าถึงประวัติการสนทนาตามเวลา
  • หากขอว่า "ช่วยบอกเนื้อหาจาก 10 บทสนทนาล่าสุด" ระบบจะค้นหาบทสนทนาล่าสุดตามลำดับและสรุปให้
  • ยังสามารถค้นหาแบบอิงช่วงเวลาได้ เช่น "เราเคยคุยอะไรกันในสัปดาห์สุดท้ายของเดือนพฤศจิกายน 2024"
  • พารามิเตอร์ของ recent_chats ประกอบด้วย after/before (เวลาเริ่มต้น·สิ้นสุด), n (จำนวนบทสนทนา, 1~20), sort_order (เรียงจากเก่าไปใหม่/ใหม่ไปเก่า)

เปรียบเทียบ ChatGPT กับ Claude

จนถึงเมื่อปีที่แล้ว ฟีเจอร์หลักที่ ChatGPT และ Claude มอบให้นั้นยังคล้ายกันอยู่ แต่ตอนนี้ ทิศทางของผลิตภัณฑ์แตกต่างกันมากขึ้น

  • ChatGPT พัฒนาไปสู่ผลิตภัณฑ์สำหรับผู้บริโภคในตลาดมวลชน โดยมีผู้ใช้จากหลากหลายพื้นเพ เช่น นักเรียน ผู้ปกครอง และผู้ใช้งานสายงานอดิเรก
    • องค์ประกอบด้านหน่วยความจำจะถูกโหลดโดยอัตโนมัติในทุกบทสนทนา เพื่อมอบประสบการณ์ การปรับให้เหมาะกับผู้ใช้แบบทันทีและใช้งานง่าย
    • สามารถนำไปใช้ต่อยอดในการแนะนำฟีเจอร์ในอนาคต ฟังก์ชันเฉพาะบุคคล และการสร้างรายได้ โดยอิงจากโปรไฟล์ผู้ใช้ที่ละเอียด
  • Claude ถูกพัฒนาโดยมุ่งเป้าไปที่นักพัฒนา วิศวกร และผู้เชี่ยวชาญ
    • ผู้ใช้เข้าใจการทำงานของอัลกอริทึม และเลือกได้อย่างชัดเจนว่าจะเรียกใช้หน่วยความจำเมื่อใด
    • แทนที่จะเน้นการทำโปรไฟล์หรือระบบอัตโนมัติ ผู้ใช้ให้คุณค่ากับ ความเป็นเครื่องมือ ความคาดการณ์ได้ และความเป็นส่วนตัว มากกว่า

ดังนั้น ระบบหน่วยความจำของทั้งสองบริการจึงสะท้อนความแตกต่างของฐานผู้ใช้และปรัชญาการพัฒนา ได้โดยตรง

ความหลากหลายของการออกแบบหน่วยความจำ AI

ระบบหน่วยความจำที่สวนทางกันอย่างสิ้นเชิง ของ ChatGPT และ Claude แสดงให้เห็นว่าพื้นที่การออกแบบหน่วยความจำ AI นั้นมีความหลากหลายมาก

  • ไม่มีคำตอบตายตัวหรือแนวทางสากลสำหรับวิธีจัดการหน่วยความจำ และจำเป็นต้องออกแบบย้อนกลับจากความต้องการและเป้าหมายของผู้ใช้จริง
  • เนื่องจากประวัติการใช้งานเครื่องมือ AI ยังมีไม่ถึง 3 ปี จึงยัง ไม่มีแนวปฏิบัติที่เป็นมาตรฐานชัดเจน สำหรับการจัดการข้อมูลสะสมหรือความเป็นส่วนตัวเมื่อใช้งานผู้ช่วย AI ตัวเดิมในระยะยาว
  • ปัจจุบันแอป AI จำนวนมากกำลังทดลองแนวทางด้านหน่วยความจำที่เป็นเอกลักษณ์ของตัวเอง ขณะที่โมเดลพื้นฐานก็ทรงพลังขึ้นทุกสัปดาห์
  • ในกระบวนการนี้ไม่มีคำตอบเดียวที่ดีที่สุด และ การลองผิดลองถูกกับการทดลองหลากหลายรูปแบบยังคงดำเนินต่อไป

อัปเดตล่าสุด: Claude เพิ่มฟีเจอร์หน่วยความจำอัตโนมัติ

ในวันที่บทความนี้เผยแพร่ Anthropic ได้ประกาศ ฟีเจอร์หน่วยความจำอัตโนมัติสำหรับบัญชีทีม/องค์กรของ Claude

  • ฟีเจอร์นี้ ทำงานคล้ายแนวทางของ ChatGPT โดยสร้างสรุปหน่วยความจำอัตโนมัติจากบริบทการทำงาน รูปแบบงาน และข้อมูลแยกตามโปรเจกต์
  • จะมีการสร้างหน่วยความจำแยกอิสระสำหรับแต่ละโปรเจกต์ใน Claude และผู้ใช้สามารถ ดูและแก้ไขสิ่งที่ Claude จดจำได้ด้วยตนเอง
  • ในขณะนี้ฟีเจอร์ดังกล่าวยังไม่เปิดให้ใช้งานกับการสมัคร Pro Max ส่วนตัวของผู้เขียน จึงยังไม่ได้ประเมินความสามารถ
  • ภายหน้าจะมีรีวิวเพิ่มเติมเกี่ยวกับการเปรียบเทียบกับหน่วยความจำแบบค้นหาเดิม รวมถึงความแตกต่างจาก ChatGPT

2 ความคิดเห็น

 
GN⁺ 2025-09-12
ความคิดเห็นจาก Hacker News
  • ความแตกต่างของการนำไปใช้สุดท้ายแล้วมีที่มาจากเป้าหมายทางธุรกิจ
    เห็นได้ชัดว่า ChatGPT มุ่งสร้างรายได้ผ่านโฆษณาและลิงก์พาร์ตเนอร์ และการทำเมโมรีก็เน้นไปที่การสร้างโปรไฟล์ผู้ใช้
    ขณะที่การทำเมโมรีของ Claude ใกล้กับเป้าหมายระยะยาวเรื่องการเข้าถึงปฏิสัมพันธ์ในอดีตและการทำ abstraction มากกว่า
    มันถูกออกแบบมาให้ค้นหาบทสนทนาได้คล้ายกับวิธีที่มนุษย์เข้าถึงความทรงจำ และคิดว่าในอนาคตผ่าน reinforcement learning มันอาจจำข้อผิดพลาดที่ผู้ใช้เคยชี้ไว้ หรือดึง abstraction จากบทสนทนาเก่ามาจัดการงานเชิงรุกได้ด้วย
    สุดท้ายแล้ว ChatGPT พยายามจะจดจำตัวผู้ใช้เอง ขณะที่ Claude โฟกัสที่ประวัติปฏิสัมพันธ์แต่ละครั้ง

    • ถ้าเป็น AGI ก็น่าจะสร้างรายได้ได้โดยไม่ต้องพึ่งโฆษณา แต่บริษัทใหม่แบบ Google รายถัดไปจำเป็นต้องมีโฆษณา
      รู้สึกว่ามีส่วนที่คำพูดกับการกระทำจริงไม่สอดคล้องกัน
    • ไม่ได้เชื่อเหมือนกันว่า Anthropic จะไม่ทำโฆษณาแบบ personalized
    • ถ้าสมมติว่าผู้ใช้ใช้ LLM บ่อยกับหัวข้อ a, b, c และใช้น้อยกับ d, e, f
      OpenAI ก็อาจทำเงินจากบางหัวข้ออย่าง b, c, f ด้วยโฆษณาแบบคั่นจอ (เต็มจอ, มากกว่า 30 วินาที) ได้
      แค่วิเคราะห์หัวข้อก็ทำได้แล้ว
      ถ้า OpenAI วิเคราะห์แชตและเซสชันเขียนโค้ดสักประมาณ 1000 ครั้ง แล้วพบว่าสามารถเพิ่มรายได้สูงสุดได้โดยชักจูงให้ผู้ใช้ไปทำงานกับบริษัทหนึ่ง หรือไปซื้อรถจากอีกบริษัทหนึ่ง ก็อาจปรับทั้งโฆษณาแบบคั่นจอรวมถึงคุณภาพหรือเนื้อหาของคำตอบได้ระหว่างทาง
      นี่เป็นสถานการณ์ที่ทั้งสมจริงพอและเป็นดิสโทเปียมาก
      ในทางกลับกัน ถ้า DeepSeek ดำเนินการได้โดยไม่มีโฆษณา เกณฑ์ที่ LLM แบบปิดซอร์สจะต้องผ่านเพื่อแย่งส่วนแบ่งตลาดก็จะสูงขึ้นมาก
      สุดท้าย LLM ก็จะเหมือนสินค้าทุกอย่าง คือผู้ใช้จ่ายตามคุณภาพ และแต่ละคนก็ต้องการระดับคุณภาพต่างกัน
      เพราะโฆษณาอาจบั่นทอนความน่าเชื่อถือของคำตอบจาก AI จึงคิดว่าโฆษณาเต็มจอน่าจะเป็นบทสรุปที่สมจริงที่สุด
    • สงสัยว่าทำไมถึงมองว่าเส้นทางไปสู่โฆษณามันชัดเจนขนาดนั้น
      ChatGPT ไม่ใช่โซเชียลมีเดีย จึงไม่จำเป็นต้องหารายได้แบบเดียวกัน
      ตอนนี้ก็มีรายได้มากพออยู่แล้วจาก subscription, enterprise, business, API ฯลฯ
  • ชี้ว่าลิงก์บทวิเคราะห์เกี่ยวกับเมโมรีของ ChatGPT ใส่มาผิด และแชร์ลิงก์ที่ถูกต้อง
    ก่อนหน้านี้ก็สงสัยเหมือนกันว่า ChatGPT ทำเมโมรีอย่างไร และพอเห็นว่าแนวทางต่างจาก Claude แบบสิ้นเชิงก็น่าสนใจมาก
    วิธีของ Claude ดูเหมาะกับการแก้โจทย์เชิงเทคนิคมากกว่า ส่วน ChatGPT ดูเหมาะกับบทสนทนาในชีวิตประจำวันและการผสานโฆษณา
    สักวันหนึ่งแนวทางเมโมรีที่อิงภาษาแบบนี้ก็คงล้าสมัย และจะมีใครสักคนหาวิธีเก็บ/เรียกคืนความทรงจำแบบเข้ารหัสที่ก้าวข้ามการแสดงออกด้วยภาษาได้
    นี่อาจเป็นความก้าวหน้าครั้งสุดท้ายสู่ AGI ก็ได้

    • ไม่เห็นด้วยกับคำกล่าวที่ว่าเป็นความก้าวหน้าครั้งสุดท้ายสำหรับ AGI
      LLM ปัจจุบันไม่ได้เข้าใจแนวคิด และจริง ๆ ก็ไม่มีฟังก์ชันที่เรียกว่า “ความเข้าใจ” โดยเนื้อแท้แล้วมันคือ Markov chain ที่ซับซ้อนมาก
      คิดว่าความฉลาดที่แท้จริงเป็นเงื่อนไขตั้งต้นของ AGI
    • คิดว่ารายการบทสนทนาล่าสุดก็คล้าย Claude ตรงที่ไม่ได้เป็นเมโมรีจริง แต่เก็บเป็นรูปแบบบีบอัดของบทสนทนาและเข้าถึงเมื่อจำเป็นเท่านั้น
      ส่วนเมโมรีของ ChatGPT ดูเหมือนจะอนุญาตให้ใส่เฉพาะ Memory จริงที่เป็นสรุปแยกตามเอนทิตีเข้าไปในบริบทได้
    • ChatGPT พยายามครอบคลุมทุกอย่างทั้งบทสนทนาทั่วไป งานเชิงเทคนิค ฯลฯ เลยทำให้กลยุทธ์นี้ใช้ได้ผลดี
      และยังเสนอความเห็นว่าการสรุปบทสนทนาเก่าหรือวิธีแบบ Embedding ก็นับเป็นการเก็บเมโมรีแบบเข้ารหัสได้เหมือนกันไม่ใช่หรือ
    • ไม่ต้องการ AGI
      เพราะจะทำอย่างไรให้ AGI เชื่อฟังคำสั่งได้เป็นเรื่องที่ชวนกังวล
  • บอกว่าพอใจกับการทำเมโมรีของ Claude แต่ปิดเมโมรีของ ChatGPT ไว้
    เพราะใช้ ChatGPT ทำเรื่องที่หลากหลายเกินไป จึงรู้สึกแปลกที่มันพยายามเชื่อมโยงสิ่งที่ไม่เกี่ยวกันเข้าด้วยกันแบบไม่มีความหมาย

    • เมโมรีของ ChatGPT เป็นฟีเจอร์ที่สะดวกที่สุด และเป็นเหตุผลที่ทำให้ยังใช้งานต่อ
      ต้องการ personalization และการอ้างอิงข้อมูลที่จำเป็น
      เช่น ถ้าให้มันจำข้อมูลของโปรเจ็กต์หนึ่งไว้ หลังจากนั้นก็ไม่ต้องอธิบายบริบทใหม่ทุกครั้ง ทำให้คุณภาพชีวิตดีขึ้นมาก
      แต่ไม่ค่อยชอบวิธีสร้างเมโมรีจากบทสนทนาเบื้องหลังที่ตัวเองควบคุมไม่ได้
    • กลับกัน รู้สึกว่าฟีเจอร์ที่ ChatGPT ดึงข้อมูลจากเมโมรีขึ้นมาให้อัตโนมัตินั้นสะดวกกว่ามาก
    • เหตุผลที่ปิดฟีเจอร์เมโมรีคือก่อนหน้านี้มันเคยจำข้อมูลผิดไว้ แล้วก็เรียกสิ่งนั้นกลับมาซ้ำ ๆ
    • คิดว่าความสามารถในการควบคุมได้ว่าจะเรียกเนื้อหาจากบทสนทนาเก่ามาเมื่อไรเป็นสิ่งที่มีคุณค่า
      ChatGPT มักเอาเนื้อหาจากบทสนทนาเก่าที่ไม่ต้องการมาปนโดยไม่จำเป็น จึงไม่ค่อยมีประโยชน์
    • แปลกใจที่ ChatGPT จำแม้แต่เรื่องพื้นฐานไม่ได้
      เคยลองใช้ AI tutor หลายตัวเพื่อฝึกภาษา และ ChatGPT ดีที่สุด
      แต่ก็ต้องขอซ้ำ ๆ ว่า “พูดช้า ๆ หน่อย” และถึงจะบอกให้ใช้กฎนี้กับทั้งบทสนทนาก็ทำไม่ได้
      นอกจากนี้ยังมีส่วนอื่นที่เมโมรีทำงานได้ไม่ดีนัก
  • อีกไม่นานวิธีทำเมโมรีของ ChatGPT จะเปลี่ยน
    ลิงก์อ้างอิง: X.com - ข่าวการเปลี่ยนแปลงเมโมรี, ประกาศทางการของ Anthropic

    • ถ้าระบบเมโมรีเปลี่ยนก็น่าเสียดายอยู่เหมือนกัน
  • แชร์ประสบการณ์ว่าเคยเขียนบทความเกี่ยวกับเมโมรีและประวัติแชตของ ChatGPT โดยตรง
    รวมถึงมีพรอมป์ต์สำหรับเทข้อมูลเข้าไปโดยตรงด้วย
    ลิงก์ที่เกี่ยวข้อง

  • ปกติปิดเมโมรีทั้งหมดเพราะต้องการควบคุมอินพุตอย่างแม่นยำเสมอ
    อยากตัด system prompt, training และอย่างอื่นทั้งหมดออก แล้วใช้เฉพาะพรอมป์ต์ที่ตัวเองเขียนเท่านั้น

  • สงสัยว่าข้อมูลที่ค้นพบจากการถาม ChatGPT ตรง ๆ นั้นเชื่อถือได้หรือไม่ หรืออาจเป็น hallucination แบบ generative
    คิดว่าไม่มีเหตุผลที่ LLM จะรู้ว่าตัวเองทำงานอย่างไร และก็คงไม่ได้รับชุดข้อมูลฝึกสำหรับเรื่องนั้นด้วย

    • การถาม LLM ว่ามันทำงานอย่างไรไม่ค่อยช่วยนัก แต่การถามถึง signature ของฟังก์ชัน/เครื่องมือที่มันใช้ได้กลับแม่นยำดี
      เพราะข้อมูลเครื่องมือพวกนี้ถูกเขียนไว้อย่างละเอียดมากใน system prompt
  • บอกว่า Claude อ้างอิงเพื่อเรียกความทรงจำจากประวัติบทสนทนาต้นฉบับเท่านั้น
    ไม่มีทั้งสรุปที่ AI สร้างขึ้นหรือโปรไฟล์แบบบีบอัด แต่ค้นหาจากบทสนทนาจริงในอดีตแบบเรียลไทม์
    การที่ไม่มีสรุป โปรไฟล์ หรือ knowledge graph ไม่ได้หมายความว่าเป็นฟีเจอร์ระดับผู้เชี่ยวชาญ แต่หมายถึงมันยังทำงานได้ไม่ดี
    เช่น มันอาจจำเรื่องเฉพาะเจาะจงอย่าง "Chandni Chowk" ได้ แต่กับคำที่คลุมเครืออย่าง "เพื่อนร่วมงานของฉันที่เคยมีปัญหา" อาจค้นหาไม่เจออย่างเหมาะสม

  • ถามว่าอุปสรรคของการใช้ external memory store ผ่าน tool calling หรือ MCP คืออะไร
    และสงสัยว่ามีการใช้ RL เพื่อเสริมรูปแบบการใช้เมโมรีอยู่หรือไม่
    ในมุมมองด้านความเป็นส่วนตัวของข้อมูล แม้ LLM จะได้รู้ข้อมูลนั้นตอนอนุมานอยู่ดี แต่ก็ไม่อยากป้อนมันตรง ๆ
    ตัวอย่าง: "ความสนใจ: MacOS, bondage, discipline, Baseball"

    • เล่าว่าช่วงฤดูใบไม้ผลิเคยทำ MCP tool ที่เก็บเมโมรีด้วยฐานข้อมูล SQLite เล่น ๆ
      ตอนนั้น Claude ถึงจะพยายามชี้นำด้วยพรอมป์ต์ต่อเนื่องก็ยังไม่ค่อยยอมใช้เมโมรีด้วยตัวเอง
      ต้องสั่งทุกครั้งอย่างชัดเจนให้เช็กหรือบันทึกเมโมรี ทำให้ประโยชน์ใช้สอยลดลง
      เรโปที่เกี่ยวข้อง
  • อ่านบทความนี้แล้วรู้สึกสับสน
    ไม่ชัดเจนว่าผู้เขียนคิดว่ามีการแทรกพรอมป์ต์แม้ในตอนที่ปิดเมโมรีอยู่หรือไม่
    สำหรับตัวเอง เมื่อปิดเมโมรีแล้วก็ไม่มีเมตาดาต้าอย่างบทสนทนาล่าสุดหรือข้อมูลความชอบถูกแทรกเข้ามาเลย และทุกบทสนทนาก็ยังแยกจากกันอย่างสมบูรณ์
    ไม่แน่ใจว่าเป็นเพราะตอนทดลองมีการสลับเปิดปิดเมโมรีไปมาจนทำให้สับสน หรือเป็นเพราะตัวเองอ่านบทความไม่ละเอียดเอง

 
roxie 2025-09-13

จู่ๆ จุดทั้งหมดก็หายไป