- ระบบหน่วยความจำของ Claude จะทำงานก็ต่อเมื่อผู้ใช้เรียกใช้โดยตรงเท่านั้น และจะค้นหา ประวัติการสนทนาจริง แบบเรียลไทม์เพื่อดึงข้อมูลกลับมา
- ในทางกลับกัน ChatGPT จะโหลดโปรไฟล์ผู้ใช้และประวัติการใช้งานโดยอัตโนมัติในทุกบทสนทนา เพื่อมอบประสบการณ์ที่ปรับให้เหมาะกับผู้ใช้ได้ทันที
- แนวทางทั้งสองนี้สะท้อนถึง ความแตกต่างของกลุ่มผู้ใช้เป้าหมายและปรัชญาการพัฒนาผลิตภัณฑ์
- ผู้ใช้ Claude เน้นไปที่ นักพัฒนาและผู้เชี่ยวชาญ โดยให้ความสำคัญกับความโปร่งใส การควบคุมโดยตรง และ ความเป็นส่วนตัว
- ช่วงหลัง Claude เองก็เริ่มเพิ่มฟีเจอร์หน่วยความจำอัตโนมัติคล้าย ChatGPT สำหรับบัญชีทีมและองค์กร แสดงให้เห็นว่า ขอบเขตการออกแบบหน่วยความจำ AI กำลังขยายตัวอย่างรวดเร็ว
ระบบหน่วยความจำของ Claude ทำงานอย่างไร
ระบบหน่วยความจำของ Claude มีคุณลักษณะหลักอยู่ 2 ประการ
- เริ่มต้นจาก สถานะว่างเปล่า ในทุกครั้งที่เริ่มบทสนทนา และจะไม่โหลดโปรไฟล์ผู้ใช้หรือประวัติการสนทนาก่อนหน้าไว้ล่วงหน้า
- ฟังก์ชันหน่วยความจำจะทำงานก็ต่อเมื่อผู้ใช้ใช้ ถ้อยคำเรียกใช้อย่างชัดเจน เช่น "ช่วยบอกสิ่งที่เราเคยคุยกันก่อนหน้านี้" หรือ "ช่วยทำต่อจากครั้งล่าสุด"
Claude ไม่ได้ใช้สรุปที่ AI สร้างขึ้นหรือโปรไฟล์ที่บีบอัดไว้ แต่จะ ค้นหาประวัติการสนทนาในอดีตจริงเท่านั้นแบบเรียลไทม์ แล้วนำข้อมูลนั้นมาใช้
เมื่อการค้นหาเสร็จสิ้น Claude จะรวมผลลัพธ์ที่พบเพื่อตอบคำขอของผู้ใช้หรือดำเนินการสนทนาต่อ
เครื่องมือ Conversation Search
- เครื่องมือ conversation_search ใช้ค้นหาประวัติการสนทนาทั้งหมดตามคีย์เวิร์ดหรือหัวข้อ
- ตัวอย่างเช่น หากผู้ใช้ถามว่า "จำสิ่งที่เราเคยคุยเกี่ยวกับ Chandni Chowk ได้ไหม" Claude จะค้นหาหลายบทสนทนาที่เกี่ยวข้องกับหัวข้อนั้น แล้วสรุปรวมให้
- หากถามหลายหัวข้อพร้อมกัน (เช่น Michelangelo, Chainflip, Solana) ระบบจะค้นหาแต่ละหัวข้อแยกกันตามลำดับ แล้วส่งคืนเนื้อหาพร้อมลิงก์
- พารามิเตอร์ของ conversation_search มีทั้งจำนวนผลลัพธ์สูงสุดและคำค้นหา
- เช่น max_results (1~10), query (คีย์เวิร์ดค้นหา)
เครื่องมือ Temporal Chat Retrieval
- เครื่องมือ recent_chats ใช้เข้าถึงประวัติการสนทนาตามเวลา
- หากขอว่า "ช่วยบอกเนื้อหาจาก 10 บทสนทนาล่าสุด" ระบบจะค้นหาบทสนทนาล่าสุดตามลำดับและสรุปให้
- ยังสามารถค้นหาแบบอิงช่วงเวลาได้ เช่น "เราเคยคุยอะไรกันในสัปดาห์สุดท้ายของเดือนพฤศจิกายน 2024"
- พารามิเตอร์ของ recent_chats ประกอบด้วย after/before (เวลาเริ่มต้น·สิ้นสุด), n (จำนวนบทสนทนา, 1~20), sort_order (เรียงจากเก่าไปใหม่/ใหม่ไปเก่า)
เปรียบเทียบ ChatGPT กับ Claude
จนถึงเมื่อปีที่แล้ว ฟีเจอร์หลักที่ ChatGPT และ Claude มอบให้นั้นยังคล้ายกันอยู่ แต่ตอนนี้ ทิศทางของผลิตภัณฑ์แตกต่างกันมากขึ้น
- ChatGPT พัฒนาไปสู่ผลิตภัณฑ์สำหรับผู้บริโภคในตลาดมวลชน โดยมีผู้ใช้จากหลากหลายพื้นเพ เช่น นักเรียน ผู้ปกครอง และผู้ใช้งานสายงานอดิเรก
- องค์ประกอบด้านหน่วยความจำจะถูกโหลดโดยอัตโนมัติในทุกบทสนทนา เพื่อมอบประสบการณ์ การปรับให้เหมาะกับผู้ใช้แบบทันทีและใช้งานง่าย
- สามารถนำไปใช้ต่อยอดในการแนะนำฟีเจอร์ในอนาคต ฟังก์ชันเฉพาะบุคคล และการสร้างรายได้ โดยอิงจากโปรไฟล์ผู้ใช้ที่ละเอียด
- Claude ถูกพัฒนาโดยมุ่งเป้าไปที่นักพัฒนา วิศวกร และผู้เชี่ยวชาญ
- ผู้ใช้เข้าใจการทำงานของอัลกอริทึม และเลือกได้อย่างชัดเจนว่าจะเรียกใช้หน่วยความจำเมื่อใด
- แทนที่จะเน้นการทำโปรไฟล์หรือระบบอัตโนมัติ ผู้ใช้ให้คุณค่ากับ ความเป็นเครื่องมือ ความคาดการณ์ได้ และความเป็นส่วนตัว มากกว่า
ดังนั้น ระบบหน่วยความจำของทั้งสองบริการจึงสะท้อนความแตกต่างของฐานผู้ใช้และปรัชญาการพัฒนา ได้โดยตรง
ความหลากหลายของการออกแบบหน่วยความจำ AI
ระบบหน่วยความจำที่สวนทางกันอย่างสิ้นเชิง ของ ChatGPT และ Claude แสดงให้เห็นว่าพื้นที่การออกแบบหน่วยความจำ AI นั้นมีความหลากหลายมาก
- ไม่มีคำตอบตายตัวหรือแนวทางสากลสำหรับวิธีจัดการหน่วยความจำ และจำเป็นต้องออกแบบย้อนกลับจากความต้องการและเป้าหมายของผู้ใช้จริง
- เนื่องจากประวัติการใช้งานเครื่องมือ AI ยังมีไม่ถึง 3 ปี จึงยัง ไม่มีแนวปฏิบัติที่เป็นมาตรฐานชัดเจน สำหรับการจัดการข้อมูลสะสมหรือความเป็นส่วนตัวเมื่อใช้งานผู้ช่วย AI ตัวเดิมในระยะยาว
- ปัจจุบันแอป AI จำนวนมากกำลังทดลองแนวทางด้านหน่วยความจำที่เป็นเอกลักษณ์ของตัวเอง ขณะที่โมเดลพื้นฐานก็ทรงพลังขึ้นทุกสัปดาห์
- ในกระบวนการนี้ไม่มีคำตอบเดียวที่ดีที่สุด และ การลองผิดลองถูกกับการทดลองหลากหลายรูปแบบยังคงดำเนินต่อไป
อัปเดตล่าสุด: Claude เพิ่มฟีเจอร์หน่วยความจำอัตโนมัติ
ในวันที่บทความนี้เผยแพร่ Anthropic ได้ประกาศ ฟีเจอร์หน่วยความจำอัตโนมัติสำหรับบัญชีทีม/องค์กรของ Claude
- ฟีเจอร์นี้ ทำงานคล้ายแนวทางของ ChatGPT โดยสร้างสรุปหน่วยความจำอัตโนมัติจากบริบทการทำงาน รูปแบบงาน และข้อมูลแยกตามโปรเจกต์
- จะมีการสร้างหน่วยความจำแยกอิสระสำหรับแต่ละโปรเจกต์ใน Claude และผู้ใช้สามารถ ดูและแก้ไขสิ่งที่ Claude จดจำได้ด้วยตนเอง
- ในขณะนี้ฟีเจอร์ดังกล่าวยังไม่เปิดให้ใช้งานกับการสมัคร Pro Max ส่วนตัวของผู้เขียน จึงยังไม่ได้ประเมินความสามารถ
- ภายหน้าจะมีรีวิวเพิ่มเติมเกี่ยวกับการเปรียบเทียบกับหน่วยความจำแบบค้นหาเดิม รวมถึงความแตกต่างจาก ChatGPT
2 ความคิดเห็น
ความคิดเห็นจาก Hacker News
ความแตกต่างของการนำไปใช้สุดท้ายแล้วมีที่มาจากเป้าหมายทางธุรกิจ
เห็นได้ชัดว่า ChatGPT มุ่งสร้างรายได้ผ่านโฆษณาและลิงก์พาร์ตเนอร์ และการทำเมโมรีก็เน้นไปที่การสร้างโปรไฟล์ผู้ใช้
ขณะที่การทำเมโมรีของ Claude ใกล้กับเป้าหมายระยะยาวเรื่องการเข้าถึงปฏิสัมพันธ์ในอดีตและการทำ abstraction มากกว่า
มันถูกออกแบบมาให้ค้นหาบทสนทนาได้คล้ายกับวิธีที่มนุษย์เข้าถึงความทรงจำ และคิดว่าในอนาคตผ่าน reinforcement learning มันอาจจำข้อผิดพลาดที่ผู้ใช้เคยชี้ไว้ หรือดึง abstraction จากบทสนทนาเก่ามาจัดการงานเชิงรุกได้ด้วย
สุดท้ายแล้ว ChatGPT พยายามจะจดจำตัวผู้ใช้เอง ขณะที่ Claude โฟกัสที่ประวัติปฏิสัมพันธ์แต่ละครั้ง
รู้สึกว่ามีส่วนที่คำพูดกับการกระทำจริงไม่สอดคล้องกัน
OpenAI ก็อาจทำเงินจากบางหัวข้ออย่าง b, c, f ด้วยโฆษณาแบบคั่นจอ (เต็มจอ, มากกว่า 30 วินาที) ได้
แค่วิเคราะห์หัวข้อก็ทำได้แล้ว
ถ้า OpenAI วิเคราะห์แชตและเซสชันเขียนโค้ดสักประมาณ 1000 ครั้ง แล้วพบว่าสามารถเพิ่มรายได้สูงสุดได้โดยชักจูงให้ผู้ใช้ไปทำงานกับบริษัทหนึ่ง หรือไปซื้อรถจากอีกบริษัทหนึ่ง ก็อาจปรับทั้งโฆษณาแบบคั่นจอรวมถึงคุณภาพหรือเนื้อหาของคำตอบได้ระหว่างทาง
นี่เป็นสถานการณ์ที่ทั้งสมจริงพอและเป็นดิสโทเปียมาก
ในทางกลับกัน ถ้า DeepSeek ดำเนินการได้โดยไม่มีโฆษณา เกณฑ์ที่ LLM แบบปิดซอร์สจะต้องผ่านเพื่อแย่งส่วนแบ่งตลาดก็จะสูงขึ้นมาก
สุดท้าย LLM ก็จะเหมือนสินค้าทุกอย่าง คือผู้ใช้จ่ายตามคุณภาพ และแต่ละคนก็ต้องการระดับคุณภาพต่างกัน
เพราะโฆษณาอาจบั่นทอนความน่าเชื่อถือของคำตอบจาก AI จึงคิดว่าโฆษณาเต็มจอน่าจะเป็นบทสรุปที่สมจริงที่สุด
ChatGPT ไม่ใช่โซเชียลมีเดีย จึงไม่จำเป็นต้องหารายได้แบบเดียวกัน
ตอนนี้ก็มีรายได้มากพออยู่แล้วจาก subscription, enterprise, business, API ฯลฯ
ชี้ว่าลิงก์บทวิเคราะห์เกี่ยวกับเมโมรีของ ChatGPT ใส่มาผิด และแชร์ลิงก์ที่ถูกต้อง
ก่อนหน้านี้ก็สงสัยเหมือนกันว่า ChatGPT ทำเมโมรีอย่างไร และพอเห็นว่าแนวทางต่างจาก Claude แบบสิ้นเชิงก็น่าสนใจมาก
วิธีของ Claude ดูเหมาะกับการแก้โจทย์เชิงเทคนิคมากกว่า ส่วน ChatGPT ดูเหมาะกับบทสนทนาในชีวิตประจำวันและการผสานโฆษณา
สักวันหนึ่งแนวทางเมโมรีที่อิงภาษาแบบนี้ก็คงล้าสมัย และจะมีใครสักคนหาวิธีเก็บ/เรียกคืนความทรงจำแบบเข้ารหัสที่ก้าวข้ามการแสดงออกด้วยภาษาได้
นี่อาจเป็นความก้าวหน้าครั้งสุดท้ายสู่ AGI ก็ได้
LLM ปัจจุบันไม่ได้เข้าใจแนวคิด และจริง ๆ ก็ไม่มีฟังก์ชันที่เรียกว่า “ความเข้าใจ” โดยเนื้อแท้แล้วมันคือ Markov chain ที่ซับซ้อนมาก
คิดว่าความฉลาดที่แท้จริงเป็นเงื่อนไขตั้งต้นของ AGI
ส่วนเมโมรีของ ChatGPT ดูเหมือนจะอนุญาตให้ใส่เฉพาะ Memory จริงที่เป็นสรุปแยกตามเอนทิตีเข้าไปในบริบทได้
และยังเสนอความเห็นว่าการสรุปบทสนทนาเก่าหรือวิธีแบบ Embedding ก็นับเป็นการเก็บเมโมรีแบบเข้ารหัสได้เหมือนกันไม่ใช่หรือ
เพราะจะทำอย่างไรให้ AGI เชื่อฟังคำสั่งได้เป็นเรื่องที่ชวนกังวล
บอกว่าพอใจกับการทำเมโมรีของ Claude แต่ปิดเมโมรีของ ChatGPT ไว้
เพราะใช้ ChatGPT ทำเรื่องที่หลากหลายเกินไป จึงรู้สึกแปลกที่มันพยายามเชื่อมโยงสิ่งที่ไม่เกี่ยวกันเข้าด้วยกันแบบไม่มีความหมาย
ต้องการ personalization และการอ้างอิงข้อมูลที่จำเป็น
เช่น ถ้าให้มันจำข้อมูลของโปรเจ็กต์หนึ่งไว้ หลังจากนั้นก็ไม่ต้องอธิบายบริบทใหม่ทุกครั้ง ทำให้คุณภาพชีวิตดีขึ้นมาก
แต่ไม่ค่อยชอบวิธีสร้างเมโมรีจากบทสนทนาเบื้องหลังที่ตัวเองควบคุมไม่ได้
ChatGPT มักเอาเนื้อหาจากบทสนทนาเก่าที่ไม่ต้องการมาปนโดยไม่จำเป็น จึงไม่ค่อยมีประโยชน์
เคยลองใช้ AI tutor หลายตัวเพื่อฝึกภาษา และ ChatGPT ดีที่สุด
แต่ก็ต้องขอซ้ำ ๆ ว่า “พูดช้า ๆ หน่อย” และถึงจะบอกให้ใช้กฎนี้กับทั้งบทสนทนาก็ทำไม่ได้
นอกจากนี้ยังมีส่วนอื่นที่เมโมรีทำงานได้ไม่ดีนัก
อีกไม่นานวิธีทำเมโมรีของ ChatGPT จะเปลี่ยน
ลิงก์อ้างอิง: X.com - ข่าวการเปลี่ยนแปลงเมโมรี, ประกาศทางการของ Anthropic
แชร์ประสบการณ์ว่าเคยเขียนบทความเกี่ยวกับเมโมรีและประวัติแชตของ ChatGPT โดยตรง
รวมถึงมีพรอมป์ต์สำหรับเทข้อมูลเข้าไปโดยตรงด้วย
ลิงก์ที่เกี่ยวข้อง
ปกติปิดเมโมรีทั้งหมดเพราะต้องการควบคุมอินพุตอย่างแม่นยำเสมอ
อยากตัด system prompt, training และอย่างอื่นทั้งหมดออก แล้วใช้เฉพาะพรอมป์ต์ที่ตัวเองเขียนเท่านั้น
สงสัยว่าข้อมูลที่ค้นพบจากการถาม ChatGPT ตรง ๆ นั้นเชื่อถือได้หรือไม่ หรืออาจเป็น hallucination แบบ generative
คิดว่าไม่มีเหตุผลที่ LLM จะรู้ว่าตัวเองทำงานอย่างไร และก็คงไม่ได้รับชุดข้อมูลฝึกสำหรับเรื่องนั้นด้วย
เพราะข้อมูลเครื่องมือพวกนี้ถูกเขียนไว้อย่างละเอียดมากใน system prompt
บอกว่า Claude อ้างอิงเพื่อเรียกความทรงจำจากประวัติบทสนทนาต้นฉบับเท่านั้น
ไม่มีทั้งสรุปที่ AI สร้างขึ้นหรือโปรไฟล์แบบบีบอัด แต่ค้นหาจากบทสนทนาจริงในอดีตแบบเรียลไทม์
การที่ไม่มีสรุป โปรไฟล์ หรือ knowledge graph ไม่ได้หมายความว่าเป็นฟีเจอร์ระดับผู้เชี่ยวชาญ แต่หมายถึงมันยังทำงานได้ไม่ดี
เช่น มันอาจจำเรื่องเฉพาะเจาะจงอย่าง "Chandni Chowk" ได้ แต่กับคำที่คลุมเครืออย่าง "เพื่อนร่วมงานของฉันที่เคยมีปัญหา" อาจค้นหาไม่เจออย่างเหมาะสม
ถามว่าอุปสรรคของการใช้ external memory store ผ่าน tool calling หรือ MCP คืออะไร
และสงสัยว่ามีการใช้ RL เพื่อเสริมรูปแบบการใช้เมโมรีอยู่หรือไม่
ในมุมมองด้านความเป็นส่วนตัวของข้อมูล แม้ LLM จะได้รู้ข้อมูลนั้นตอนอนุมานอยู่ดี แต่ก็ไม่อยากป้อนมันตรง ๆ
ตัวอย่าง: "ความสนใจ: MacOS, bondage, discipline, Baseball"
ตอนนั้น Claude ถึงจะพยายามชี้นำด้วยพรอมป์ต์ต่อเนื่องก็ยังไม่ค่อยยอมใช้เมโมรีด้วยตัวเอง
ต้องสั่งทุกครั้งอย่างชัดเจนให้เช็กหรือบันทึกเมโมรี ทำให้ประโยชน์ใช้สอยลดลง
เรโปที่เกี่ยวข้อง
อ่านบทความนี้แล้วรู้สึกสับสน
ไม่ชัดเจนว่าผู้เขียนคิดว่ามีการแทรกพรอมป์ต์แม้ในตอนที่ปิดเมโมรีอยู่หรือไม่
สำหรับตัวเอง เมื่อปิดเมโมรีแล้วก็ไม่มีเมตาดาต้าอย่างบทสนทนาล่าสุดหรือข้อมูลความชอบถูกแทรกเข้ามาเลย และทุกบทสนทนาก็ยังแยกจากกันอย่างสมบูรณ์
ไม่แน่ใจว่าเป็นเพราะตอนทดลองมีการสลับเปิดปิดเมโมรีไปมาจนทำให้สับสน หรือเป็นเพราะตัวเองอ่านบทความไม่ละเอียดเอง
จู่ๆ จุดทั้งหมดก็หายไป