2 คะแนน โดย GN⁺ 2024-09-17 | 1 ความคิดเห็น | แชร์ทาง WhatsApp
  • g1 เป็นต้นแบบระยะแรกที่ใช้กลยุทธ์พรอมป์ต์เพื่อเพิ่มความสามารถด้านการให้เหตุผลของ LLM
  • ช่วยให้ LLM สามารถแก้ปัญหาเชิงตรรกะได้ และสามารถจัดการปัญหาที่โมเดลเดิม ๆ ทำได้ยาก
  • g1 เปิดซอร์สเพื่อสร้างแรงบันดาลใจให้ชุมชนโอเพนซอร์สพัฒนากลยุทธ์ใหม่ ๆ

วิธีการทำงาน

  • g1 ใช้ Llama3.1-70b เพื่อสร้าง Chain of Thought แบบไดนามิก
  • ในแต่ละขั้นตอน LLM สามารถไปยังขั้นตอนการให้เหตุผลถัดไป หรือให้คำตอบสุดท้ายได้
  • system prompt มีทิปสำหรับ LLM รวมอยู่ด้วย
  • ตัวอย่างเช่น มีคำสั่งอย่าง "รวมการสำรวจคำตอบทางเลือก" และ "ใช้วิธีอย่างน้อย 3 แบบเพื่อหาคำตอบ"
  • วิธีเหล่านี้ช่วยเพิ่มความสามารถด้านการให้เหตุผลของ LLM

ตัวอย่าง

  • g1 สามารถแก้ปัญหาตรรกะอย่างง่ายได้ด้วยความแม่นยำ 60-80%
  • ตัวอย่าง: สำหรับคำถาม "มีตัว R กี่ตัวใน strawberry?" g1 แสดงความแม่นยำ 70%

เริ่มต้นอย่างรวดเร็ว

  • วิธีใช้ Streamlit UI:

    python3 -m venv venv  
    source venv/bin/activate  
    pip3 install -r requirements.txt  
    export GROQ_API_KEY=gsk...  
    streamlit run app.py  
    
  • วิธีใช้ Gradio UI:

    cd gradio  
    pip3 install -r requirements.txt  
    python3 app.py  
    

กลยุทธ์พรอมป์ต์

  • ตัวอย่างพรอมป์ต์:

    {  
      "title": "Identifying Key Information",  
      "content": "To begin solving this problem, we need to carefully examine the given information and identify the crucial elements that will guide our solution process. This involves...",  
      "next_action": "continue"  
    }  
    
  • องค์ประกอบของพรอมป์ต์:

    • กำหนดบทบาทเป็นผู้ช่วย AI ผู้เชี่ยวชาญ
    • ให้ชื่อเรื่องและเนื้อหาในแต่ละขั้นตอน
    • ตอบกลับในรูปแบบ JSON
    • ใช้ขั้นตอนการให้เหตุผลอย่างน้อย 3 ขั้นตอนขึ้นไป
    • ตระหนักถึงข้อจำกัดของ LLM และรวมการสำรวจคำตอบทางเลือก
    • เมื่อตรวจทานใหม่ ให้ใช้แนวทางที่แตกต่างออกไปจริง ๆ

ฟอร์กหลัก

  • Mult1: สร้าง chain of thought แบบคล้าย o1 โดยใช้ผู้ให้บริการ AI หลายราย (GitHub Repository)

Credits

  • แอปนี้พัฒนาโดย Benjamin Klieger

สรุปโดย GN⁺

  • g1 เป็นตันแบบระยะแรกที่ใช้กลยุทธ์พรอมป์ต์เพื่อเพิ่มความสามารถด้านการให้เหตุผลของ LLM
  • เปิดซอร์สเพื่อสร้างแรงบันดาลใจให้ชุมชนโอเพนซอร์สพัฒนากลยุทธ์ใหม่ ๆ
  • g1 แสดงความแม่นยำสูงกว่าโมเดลเดิมในการแก้ปัญหาตรรกะอย่างง่าย
  • บทความนี้มีประโยชน์สำหรับการสำรวจวิธีต่าง ๆ ในการเพิ่มความสามารถด้านการให้เหตุผลของ LLM
  • โปรเจ็กต์อื่นที่มีความสามารถคล้ายกันคือ o1 ของ OpenAI

1 ความคิดเห็น

 
GN⁺ 2024-09-17
ความคิดเห็นบน Hacker News
  • วิธี ChainOfThought นั้นเรียบง่าย และ TreeOfThoughts เป็นวิธีที่ซับซ้อนกว่ามาก
    • คำใบ้ที่เกี่ยวข้องกับ OpenAI เชื่อมโยงกับการค้นหาแบบต้นไม้
    • การสร้าง CoT เป็นโครงสร้างแบบต้นไม้และค้นหาคำตอบที่ดีที่สุดเป็นสิ่งสำคัญ
  • น่าสนใจที่มีการเน้นคำสั่งด้วยตัวพิมพ์ใหญ่
    • คนแรกที่ทำให้ AGI สำเร็จน่าจะเป็นคนที่หาวิธีเพิ่มความน่าเชื่อถือของ LLM ได้
  • นวัตกรรมของ o1 ไม่ใช่ Chain-of-Thought แต่เป็นการสอนให้โมเดลทำ CoT ได้อย่างมีประสิทธิภาพ
    • ไม่สามารถได้ประสิทธิภาพแบบ o1 จากแค่ prompt engineering อย่างเดียว
  • LLM สามารถแก้ปัญหาได้ด้วยการ “ขยาย” อินพุตในรูปแบบที่ต่างออกไป
    • สามารถป้อนข้อความทีละตัวอักษร หรือแปลงเป็นภาพเพื่อตรวจดูรายละเอียดได้
  • ทำงานคล้ายกับโปรเจกต์ optillm
    • สามารถปรับปรุง LLM ได้ด้วยเทคนิคการเพิ่มประสิทธิภาพหลายแบบ
  • ปรับให้รันแบบโลคัล 100% โดยใช้ ollama:8b
    • Readme ยังไม่ได้อัปเดต
  • การหาคำนิยามของ “การให้เหตุผล” เป็นเรื่องสำคัญ
    • สามารถแก้ปัญหาการให้เหตุผลของ LLM ได้ด้วยการผสานกับอัลกอริทึมแบบดั้งเดิม
    • ควรแยกกระบวนการคิดออกเป็นสองส่วนแล้วให้รันบนโมเดลที่เหมาะสม
  • ในพรอมป์ที่ถามว่า .9 กับ .11 อันไหนมากกว่า ระบบตอบว่า .9 มากกว่า
    • นี่เป็นเพียง system prompt แบบง่าย
  • มีการ fork โปรเจกต์เพื่อความสนุกและทำให้รันโมเดล Llama-3.1 7B แบบโลคัลได้
    • มันยังแก้ปัญหาสตรอว์เบอร์รีไม่ได้ แต่รู้ว่า 0.9 มากกว่า