เครื่องมือ File Search ที่เพิ่งเปิดตัวใหม่ใน Google Gemini API ช่วยทำให้การสร้างระบบ RAG (Retrieval-Augmented Generation) ง่ายขึ้นอย่างมาก:
- แทนการตั้งค่าการแบ่งชิ้นข้อมูล, การทำ embedding และ vector DB ที่ซับซ้อนแบบเดิม เพียงอัปโหลดไฟล์ครั้งเดียว (โค้ด 2 บรรทัด) ระบบจะประมวลผลให้อัตโนมัติ และเมื่อมีการ query ก็จะค้นหาเอกสารที่เกี่ยวข้องแล้วป้อนให้โมเดล
- สตอเรจและ query embedding ใช้งานฟรี ส่วนค่าทำดัชนีเริ่มต้นคิดเพียง $0.15 ต่อ 1 ล้านโทเค็น
- รองรับไฟล์: PDF, DOCX, TXT เป็นต้น
- ตัวอย่างการใช้งานจริงค้นหาในไฟล์ 3,000 ไฟล์ได้ภายใน 2 วินาที ช่วยลดเวลาในการพัฒนาโปรโตไทป์ได้มาก
- ยังมีฟีเจอร์เพิ่มเติม เช่น การอ้างอิงอัตโนมัติ และการกรองด้วยเมทาดาทา
- ข้อจำกัด: จำกัด 10 สโตร์ต่อโปรเจกต์, ฟรีเทียร์ 1GB
- ประเมินว่า: ช่วยลดกำแพงในการพัฒนา RAG ทำให้โฟกัสกับแอปพลิเคชันได้มากขึ้น
3 ความคิดเห็น
สมเป็น Google จริง ๆ
ขอบคุณสำหรับการแชร์ครับ คุณภาพนี่แหละ! สงสัยจริง ๆ เลย
เห็นว่า notebooklm ถูกนำมาให้บริการ ก็เลยเคยคิดว่า someday มันอาจจะออกมาในรูปแบบคล้าย notebooklm API บ้าง แล้วก็เปิดตัวออกมาเป็นบริการ API ชื่อ File Search จริง ๆ ซะด้วย lol
ก่อนหน้านี้ถ้าจะทำ RAG ให้ดี ๆ ต้องมานั่งวาง pipeline/workflow เปิด Ollama แล้วก็ลองสลับโมเดลนั้นโมเดลนี้ไปมา เลยรู้สึกว่ามีอุปสรรคอยู่พอสมควร (คงต้องลองใช้ดูก่อนถึงจะรู้) แต่ถ้ารับประกันคุณภาพได้ในระดับหนึ่งก็น่าจะใช้งานได้สบายมากจริง ๆ