10 คะแนน โดย GN⁺ 2023-10-27 | 1 ความคิดเห็น | แชร์ทาง WhatsApp
  • โมเดลฝังข้อความ jina-embeddings-v2 รองรับความยาว 8192 โทเค็น
  • แข่งขันกับ text-embedding-ada-002 ของ OpenAI และทำผลงานได้ดีกว่าในการทดสอบมาตรฐานด้านการจัดหมวดหมู่/การจัดอันดับใหม่/การค้นหา/การสรุป เป็นต้น
  • สร้างขึ้นใหม่ทั้งหมดตั้งแต่พื้นฐาน และใช้งานได้หลากหลายสาขาด้วยคอนเท็กซ์ 8k: การวิเคราะห์เอกสารกฎหมาย, งานวิจัยทางการแพทย์, การวิเคราะห์วรรณกรรม, การคาดการณ์ทางการเงิน, AI แบบโต้ตอบ เป็นต้น
  • ดาวน์โหลดได้ 2 โมเดลบน HuggingFace
    • Base Model (0.27G) : ออกแบบมาให้เหมาะกับงานหนักที่ต้องการความแม่นยำสูง เช่น งานวิจัยเชิงวิชาการหรือการวิเคราะห์ธุรกิจ
    • Small Model (0.07G) : สร้างมาสำหรับแอปพลิเคชันขนาดเบา เช่น แอปมือถือหรืออุปกรณ์ที่มีทรัพยากรประมวลผลจำกัด

1 ความคิดเห็น

 
GN⁺ 2023-10-27
ความคิดเห็นจาก Hacker News
  • Jina AI เปิดตัวโมเดล text embedding แบบโอเพนซอร์ส 8k
  • ผู้ใช้บางคนตั้งคำถามเกี่ยวกับประสิทธิภาพของโมเดลนี้ โดยชี้ว่ามันอยู่อันดับต่ำกว่า OpenAI embedding และผลงานอื่นอีก 14 รายการบนลีดเดอร์บอร์ด
  • หน้าต่างคอนเท็กซ์ 8k เป็นความสามารถใหม่ แต่ผู้ใช้บางคนตั้งคำถามถึงประโยชน์ของมัน โดยเฉพาะเมื่อพิจารณาถึงข้อจำกัด 512 โทเค็น
  • ในขณะที่เบนช์มาร์กส่วนใหญ่จัดการเอกสารขนาดเล็ก ก็มีข้อกังขาเกี่ยวกับประสิทธิภาพของโมเดลกับเอกสารขนาดใหญ่กว่า
  • ผู้ใช้บางคนแสดงความตื่นเต้นที่ชุมชนโอเพนซอร์สกำลังลดช่องว่างกับ "Open"AI
  • เวกเตอร์ embedding ของโมเดลใหม่นี้มีขนาดเพียงครึ่งหนึ่งของ text-embedding-ada-002 (768 เทียบกับ 1536) ซึ่งช่วยประหยัดพื้นที่ฐานข้อมูลและอาจทำให้การค้นคืนเร็วขึ้น
  • มีการตั้งคำถามถึงกรณีใช้งานของ embedding 8k โดยผู้ใช้บางคนเสนอว่าอาจไม่ได้มีประโยชน์กับ RAG มากนัก
  • ผู้ใช้รายหนึ่งทำ quantize โมเดลเพื่อใช้กับ onnx และลดขนาดไฟล์ลง 4 เท่าใน transformers.js
  • มีการนำไปเปรียบเทียบกับโมเดลของ OpenAI ซึ่งรองรับหลายภาษา และคำนวณพิกัดเดียวกันสำหรับความหมายเดียวกันในภาษาที่ต่างกัน
  • ปลั๊กอิน llm-embed-jina ตัวใหม่ถูกเผยแพร่ไปยังเครื่องมือ LLM แล้ว ทำให้เข้าถึงโมเดลใหม่ของ Jina ได้
  • ผู้ใช้บางคนประทับใจกับงานนี้ แต่ก็ยังสงสัยว่าควรใช้ embedding 8k อย่างไรให้ดีที่สุด และเสนอว่าอาจมีประโยชน์กับการจับคู่ความคล้ายแบบคร่าว ๆ หรือการตรวจจับการลอกเลียน
  • จากข้อจำกัดการส่งออกชิปและความตึงเครียดระหว่างสหรัฐฯ/จีน จึงมีความกังวลเกี่ยวกับการดำเนินงานของ Jina AI ซึ่งมีสำนักงานอยู่ทั้งในเบอร์ลินและจีน