Ask HN: มีใครกำลังทำอะไรเจ๋ง ๆ ด้วยโมเดลภาษาขนาดจิ๋วอยู่ไหม?

(news.ycombinator.com)

6 คะแนน โดย GN⁺ 2025-01-22 | 1 ความคิดเห็น | แชร์ทาง WhatsApp

กำลังมองหากรณีการใช้งานของโมเดลภาษา ขนาด 0.5B~3B ที่ใช้ได้กับ Ollama และเครื่องมืออื่น ๆ
ถามว่ามี เครื่องมือ ที่สร้างขึ้นโดยใช้โมเดลเหล่านี้เป็นส่วนหนึ่งของเวิร์กโฟลว์ หรือกรณีการใช้งานที่น่าสนใจหรือไม่

1 ความคิดเห็น

GN⁺ 2025-01-22

ความคิดเห็นจาก Hacker News

ตั้งค่า ollama ให้ตอบกลับข้อความสแปมทาง SMS โดยกำหนดบุคลิกให้แต่ละเบอร์ เช่น เพื่อนยิมสายมิลเลนเนียล หรือสุภาพบุรุษอังกฤษศตวรรษที่ 19
ใช้โมเดล Llama เพื่อระบุแบนเนอร์คุกกี้ของเว็บไซต์และเพิ่มกฎตัวกรองลงใน EasyList Cookie แบนเนอร์คุกกี้ส่วนใหญ่มี HTML/CSS คล้ายกัน จึงสามารถดึง innerText มาใช้กับ LLM ขนาดเล็กเพื่อคัดกรองผลบวกลวงได้ โมเดล 3B ให้ประสิทธิภาพใช้ได้ด้วยการทำ prompt engineering ที่ดีพอ ส่วน 7B แทบไม่มีผลบวกลวงโดยไม่เพิ่มต้นทุน สามารถดูโค้ดและพรอมป์ต์ได้บน GitHub
ใช้มินิพีซีที่มี CPU n100 เพื่อสร้างเรื่องราวหลากหลายแนวและสไตล์ พัดลม CPU ไม่ร้อนเกินไป ไม่ได้ก่อให้เกิดประสิทธิผลมากนักแต่สนุกดี
ใช้สคริปต์ fish ขนาดเล็กเพื่อสร้างข้อความ commit สามแบบจาก git diff ปัจจุบัน กำลังทดสอบหลายโมเดลอยู่ และมีประโยชน์เวลาต้องการไอเดีย สามารถดูสคริปต์และตัวอย่างได้บน GitHub
มีอุปกรณ์เล็ก ๆ ที่พยายามประกาศว่าใครเป็น "ผู้ชนะ" ระหว่างการสนทนา
แนะนำบรรยาย "Comedy Writing With Small Generative Models" ของ Jamie Brew ควรรอดูจนถึงตอนที่เขาหยิบกีตาร์ขึ้นมาเล่น
Microsoft เปิดตัวโมเดล FLAME (60M พารามิเตอร์) ซึ่งทำได้ดีกว่าโมเดลที่ใหญ่กว่ามาก (มากกว่า 100B พารามิเตอร์) ในงานซ่อม/เติมสูตร Excel
Micro Wake Word เป็นชุดไลบรารีและโมเดลสำหรับอุปกรณ์ที่ปลุกด้วยเสียงบน ESPs เพิ่งถูกนำไปใช้กับตัวแทน Alexa แบบโลคัลทั้งหมดของ Home Assistants
ปรับจูน Gemma 2B เพื่อระบุข้อความเร่งด่วนจากหญิงตั้งครรภ์รายใหม่ในสายด่วนให้คำปรึกษาสุขภาพมารดาที่ดำเนินการโดยรัฐบาล
สร้างโมเดลราว 1m พารามิเตอร์เพื่อสุ่มสร้างการ์ด Magic the Gathering โดยอิงจาก nanogpt ของ Karpathy และเพิ่มความสามารถบางอย่างเข้าไป หากมี Mac ที่ใช้ Apple Silicon ก็สามารถสร้างโมเดลจาก GitHub ได้โดยตรง

Ask HN: มีใครกำลังทำอะไรเจ๋ง ๆ ด้วยโมเดลภาษาขนาดจิ๋วอยู่ไหม?

บทความที่เกี่ยวข้อง

1 ความคิดเห็น

ความคิดเห็นจาก Hacker News