ChatGPT เป็นโมเดลขนาด 20B

(arxiv.org)

9 คะแนน โดย jonghwanhyeon 2023-10-31 | 5 ความคิดเห็น | แชร์ทาง WhatsApp

ในงานวิจัยของ Microsoft Research ที่ส่งไปยัง EMNLP 2023 เรื่อง "CodeFusion: A Pre-trained Diffusion Model for Code Generation" ได้มีการเปิดเผยว่าจำนวนพารามิเตอร์ของ ChatGPT (gpt-3.5-turbo) อยู่ที่ 20B

T5 (t5-large): 770M
CodeT5 (codet5-large): 770M
GPT3 (text-davinci-003): 175B
ChatGPT (gpt-turbo-3.5): 20B

5 ความคิดเห็น

hyeonseokoh94 2023-11-02

ขนาดนี้มันสมเหตุสมผลไหม? ฟังคนที่ทำงานด้าน AI พูดกันแล้วถึงกับตกตะลึงกันเลย...
All you need is 4090

geekarxiv 2023-11-01

เดิมทีขนาดพารามิเตอร์ของ GPT-3.5 ก็ไม่ได้มีการเปิดเผยอยู่แล้วหรือครับ?
ผมนึกมาตลอดว่าเป็นแค่ GPT-3 175B ที่เอาไปทำ RLHF เท่านั้น ดูเหมือนว่าจะไม่ใช่สินะครับ..

spark 2023-11-01

https://arxiv.org/abs/2310.17680v1 ยังดูเวอร์ชัน v1 ได้อยู่

verilogeek 2023-11-01

"There are some errors in the paper and we need to retract it" เขาว่าแบบนั้น

verilogeek 2023-11-01

ไม่รู้ว่าจุดที่มีข้อผิดพลาดอยู่ตรงไหน แต่ถ้าตัวเลขที่ผิดมีแค่ไม่กี่จุด ก็น่าจะแค่แก้ revision แบบง่าย ๆ ไปแล้ว... งั้นมีความเป็นไปได้สูงว่า 20B จะถูกต้องใช่ไหม?

ChatGPT เป็นโมเดลขนาด 20B

บทความที่เกี่ยวข้อง

5 ความคิดเห็น