g1 - สร้าง chain of thought แบบคล้าย o1 โดยใช้ Llama-3.1 70B บน Groq
(github.com/bklieger-groq)- g1 เป็นต้นแบบระยะแรกที่ใช้กลยุทธ์พรอมป์ต์เพื่อเพิ่มความสามารถด้านการให้เหตุผลของ LLM
- ช่วยให้ LLM สามารถแก้ปัญหาเชิงตรรกะได้ และสามารถจัดการปัญหาที่โมเดลเดิม ๆ ทำได้ยาก
- g1 เปิดซอร์สเพื่อสร้างแรงบันดาลใจให้ชุมชนโอเพนซอร์สพัฒนากลยุทธ์ใหม่ ๆ
วิธีการทำงาน
- g1 ใช้ Llama3.1-70b เพื่อสร้าง Chain of Thought แบบไดนามิก
- ในแต่ละขั้นตอน LLM สามารถไปยังขั้นตอนการให้เหตุผลถัดไป หรือให้คำตอบสุดท้ายได้
- system prompt มีทิปสำหรับ LLM รวมอยู่ด้วย
- ตัวอย่างเช่น มีคำสั่งอย่าง "รวมการสำรวจคำตอบทางเลือก" และ "ใช้วิธีอย่างน้อย 3 แบบเพื่อหาคำตอบ"
- วิธีเหล่านี้ช่วยเพิ่มความสามารถด้านการให้เหตุผลของ LLM
ตัวอย่าง
- g1 สามารถแก้ปัญหาตรรกะอย่างง่ายได้ด้วยความแม่นยำ 60-80%
- ตัวอย่าง: สำหรับคำถาม "มีตัว R กี่ตัวใน strawberry?" g1 แสดงความแม่นยำ 70%
เริ่มต้นอย่างรวดเร็ว
-
วิธีใช้ Streamlit UI:
python3 -m venv venv source venv/bin/activate pip3 install -r requirements.txt export GROQ_API_KEY=gsk... streamlit run app.py -
วิธีใช้ Gradio UI:
cd gradio pip3 install -r requirements.txt python3 app.py
กลยุทธ์พรอมป์ต์
-
ตัวอย่างพรอมป์ต์:
{ "title": "Identifying Key Information", "content": "To begin solving this problem, we need to carefully examine the given information and identify the crucial elements that will guide our solution process. This involves...", "next_action": "continue" } -
องค์ประกอบของพรอมป์ต์:
- กำหนดบทบาทเป็นผู้ช่วย AI ผู้เชี่ยวชาญ
- ให้ชื่อเรื่องและเนื้อหาในแต่ละขั้นตอน
- ตอบกลับในรูปแบบ JSON
- ใช้ขั้นตอนการให้เหตุผลอย่างน้อย 3 ขั้นตอนขึ้นไป
- ตระหนักถึงข้อจำกัดของ LLM และรวมการสำรวจคำตอบทางเลือก
- เมื่อตรวจทานใหม่ ให้ใช้แนวทางที่แตกต่างออกไปจริง ๆ
ฟอร์กหลัก
- Mult1: สร้าง chain of thought แบบคล้าย o1 โดยใช้ผู้ให้บริการ AI หลายราย (GitHub Repository)
Credits
- แอปนี้พัฒนาโดย Benjamin Klieger
สรุปโดย GN⁺
- g1 เป็นตันแบบระยะแรกที่ใช้กลยุทธ์พรอมป์ต์เพื่อเพิ่มความสามารถด้านการให้เหตุผลของ LLM
- เปิดซอร์สเพื่อสร้างแรงบันดาลใจให้ชุมชนโอเพนซอร์สพัฒนากลยุทธ์ใหม่ ๆ
- g1 แสดงความแม่นยำสูงกว่าโมเดลเดิมในการแก้ปัญหาตรรกะอย่างง่าย
- บทความนี้มีประโยชน์สำหรับการสำรวจวิธีต่าง ๆ ในการเพิ่มความสามารถด้านการให้เหตุผลของ LLM
- โปรเจ็กต์อื่นที่มีความสามารถคล้ายกันคือ o1 ของ OpenAI
1 ความคิดเห็น
ความคิดเห็นบน Hacker News