วิธีป้อนชุดเอกสารแบบปรับแต่งให้ LLM
- ถกกันถึงวิธีที่ดีที่สุดในการป้อนชุดเอกสารของผู้ใช้ให้กับ LLM (Large Language Models) เพื่อให้ได้คำตอบที่เหมาะสมโดยไม่เกิดผลลัพธ์ที่หลุดจากความเป็นจริง
- เน้นไปที่วิธี "สอน" ชุดเอกสารเฉพาะให้กับ LLM ซึ่งไม่ได้หมายความว่าจะต้องฝึกโมเดลเองเสมอไป และรวมถึงแนวทางอย่าง RAG (Retrieval-Augmented Generation) ด้วย
- แม้จะมีเธรดเมื่อ 5 เดือนก่อน แต่ต้องการข้อมูลที่สอดคล้องกับสถานการณ์ปัจจุบัน ณ เดือนธันวาคม 2023
ความเห็นของ GN⁺
- การใช้ LLM เพื่อดึงข้อมูลที่ถูกต้องจากชุดเอกสารเฉพาะกำลังมีความสำคัญมากขึ้นตามพัฒนาการของเทคโนโลยี
- เทคโนโลยีลักษณะนี้ช่วยให้ผู้ใช้ได้ผลลัพธ์แบบปรับแต่งตามต้องการ และสามารถประยุกต์ใช้ได้ในหลายด้าน เช่น business intelligence, งานวิจัย และการศึกษา
- การใช้แนวทางที่มีอยู่แล้วอย่าง RAG หรือการค้นหาวิธีใหม่ ๆ เป็นสิ่งสำคัญ ซึ่งจะช่วยเพิ่มการใช้งาน LLM และทำให้ได้ผลลัพธ์ที่แม่นยำและเชื่อถือได้มากขึ้น
1 ความคิดเห็น
ความคิดเห็นจาก Hacker News
การฝึกกับเอกสารไม่ได้เกิดขึ้นจริง และแม้สตาร์ตอัปจำนวนมากจะใช้คำนี้ แต่ในความเป็นจริงพวกเขาใช้ RAG (Retrieval-Augmented Generation)
LlamaIndexถูกมองว่าเป็นตัวเลือกที่ดีที่สุดควรพิจารณาแนวทางที่ต่างกันตามปริมาณเอกสาร
LlamaIndexก็ทำวิศวกรรมไว้มากในด้านนี้AWS Bedrock ใช้งานง่าย สามารถอัปโหลดเอกสารไปยัง S3 แล้วซิงก์กับฐานข้อมูลเวกเตอร์เพื่อใช้งานผ่าน API ได้
h2ogpt เป็น RAG implementation แบบครบเครื่องที่จัดการเอกสารได้หลายรูปแบบและรองรับการโฮสต์โมเดลหลายแบบ
สามารถซื้อบัญชี ChatGPT แล้วอัปโหลดเอกสารของตนเองได้ ซึ่งทำให้สร้าง AI สนทนาแบบปรับแต่งเองได้
ตอนนี้ GPT-4 Assistants สามารถจัดการ RAG ได้โดยตรงอยู่แล้ว และ
PrivateGPTก็เป็นหนึ่งในตัวเลือกที่เป็นที่รู้จักสำหรับเรื่องนี้Copilot Builder ของ Microsoft Office ช่วยให้ผู้ใช้สร้าง AI Copilot ได้ภายในไม่กี่วินาที โดยระบุ URL พื้นฐาน ไฟล์ที่อัปโหลด และอื่น ๆ
Cheshire Cat เป็นเฟรมเวิร์กผู้ช่วย AI ที่เก็บเอกสารเป็น "ความทรงจำ" เพื่อให้ค้นคืนได้ในภายหลัง
มีวิดีโอแนะนำวิธี fine-tune
Mistral 7Bด้วย QLoRA และกล่าวด้วยว่าเทคนิค RAG อาจเป็นทางเลือกที่เหมาะสมกว่า