DeepEval - การทดสอบยูนิตสำหรับ LLM

xguru · 2023-08-19T10:03:01+09:00

ปรัชญาพื้นฐานคือ "Pytest for LLM" เพื่อใช้งานจริงในโปรดักชัน มอบวิธีการแบบ Pythonic สำหรับรันการประเมินแบบออฟไลน์กับไปป์ไลน์ LLM สามารถเขียนการทดสอบสำหรับแอปพลิเคชัน LLM (เช่น RAG) ได้เหมือนกับการเขียน Python unit test ประเมินคำตอบด้วยเมตริกอย่าง entailment / exact / bertscore ผ่าน assert_llm_output สามารถกำหนดเมตริกแบบกำหนดเองและแก้ไขเมตริกที่มีอยู่ได้

(github.com/mr-gpt)

4 คะแนน โดย xguru 2023-08-19 | ยังไม่มีความคิดเห็น | แชร์ทาง WhatsApp

ปรัชญาพื้นฐานคือ "Pytest for LLM"
เพื่อใช้งานจริงในโปรดักชัน มอบวิธีการแบบ Pythonic สำหรับรันการประเมินแบบออฟไลน์กับไปป์ไลน์ LLM
สามารถเขียนการทดสอบสำหรับแอปพลิเคชัน LLM (เช่น RAG) ได้เหมือนกับการเขียน Python unit test
ประเมินคำตอบด้วยเมตริกอย่าง entailment / exact / bertscore ผ่าน assert_llm_output
สามารถกำหนดเมตริกแบบกำหนดเองและแก้ไขเมตริกที่มีอยู่ได้

DeepEval - การทดสอบยูนิตสำหรับ LLM

บทความที่เกี่ยวข้อง

ยังไม่มีความคิดเห็น