-
R1 1776 เป็นโมเดลโอเพนซอร์สที่ Perplexity AI ปรับจูนละเอียดโมเดลการให้เหตุผล DeepSeek-R1 เพื่อเอาการเซ็นเซอร์ของพรรคคอมมิวนิสต์จีนออก
-
จุดเด่นคือมุ่งให้ข้อมูลที่ถูกต้องแบบไร้อคติ ขณะเดียวกันยังคงความสามารถด้านคณิตศาสตร์/การให้เหตุผลไว้ได้
-
ปัจจุบันดาวน์โหลดโมเดลได้จาก huggingface
-
ใช้ชุดประเมินที่ประกอบด้วยตัวอย่างหลายภาษามากกว่า 1,000 รายการเพื่อวัดความสามารถในการหลีกเลี่ยงการเซ็นเซอร์ (ใช้ทั้งผู้ประเมินมนุษย์และ LLM judge)
-
สามารถตอบคำถามในหัวข้ออ่อนไหว เช่น การเมือง/สังคม/สิทธิมนุษยชนของจีน ได้โดยไม่หลีกเลี่ยง
-
หลังผ่านกระบวนการลบการเซ็นเซอร์แล้ว ยังรักษาประสิทธิภาพเทียบเท่าโมเดลพื้นฐานในเบนช์มาร์กอย่าง MATH/GPQA
7 ความคิดเห็น
แล้วในบริษัทเกาหลีก็คงไม่ได้จำกัดการใช้งานเหมือนกันใช่ไหม?
ดีมากเลย ^o^
เขาฝึกแบบเดียวกันทุกอย่างตามที่ระบุไว้ในเอกสารของ DeepSeek หรือเปล่า?
ดูเหมือนว่าโมเดลการให้เหตุผล DeepSeek-R1 เองก็เป็นโอเพนซอร์ซนะ
เขาเปิดเผยเพียงโมเดลที่ได้จากการฝึกแล้ว แต่ไม่ได้เปิดเผยข้อมูลต้นฉบับ จึงไม่ใช่ "โอเพนซอร์ส" และแม้จะมีข้อจำกัด แต่ก็ยังสามารถฝึกเพิ่มหรือดัดแปลงต่อบนโมเดลที่ฝึกไว้แล้วได้ ดังนั้นสิ่งที่ออกมาครั้งนี้จึงเป็นเวอร์ชันที่ถูกปรับแก้ในลักษณะนั้น
ดังนั้นผมจึงชอบใช้คำว่า open weight มากกว่า
ยังมีคนที่เหนือกว่าคนเก่งอีก.