คำอธิบายและประสบการณ์ใช้งาน Copilot
(medium.com)-
Copilot เป็นบริการที่นำ Codex ซึ่งสร้างบนพื้นฐานของ GPT-3 มาทำเป็นผลิตภัณฑ์
-
ฝึกด้วยชุดข้อมูลขนาด 159GB ที่ดึงมาจาก Repo จำนวน 54 ล้านรายการบน GitHub
-
มีการสร้างชุดข้อมูล benchmark 164 ชุด และ Codex แก้ได้ 28.8% ในจำนวนนั้น
-
ทำโจทย์อัลกอริทึมได้ดี เช่น ปัญหาบน LeetCode
-> คาดว่าน่าจะเป็นเพราะบน GitHub มี Repo ที่อัปโหลดวิธีแก้โจทย์อัลกอริทึมจำนวนมาก และมันได้เรียนรู้จากสิ่งเหล่านั้น
ก่อนหน้านี้ก็มีบทความเกี่ยวกับ Copilot ขึ้นมาบน GeekNews อยู่หลายชิ้นครับ
-
GitHub CoPilot - AI pair programmer https://th.news.hada.io/topic?id=4526
-
GitHub Copilot : ความประทับใจแรก https://th.news.hada.io/topic?id=4639
ครั้งนี้มีคนในบริษัทกำลังเขียนบทความเกี่ยวกับ Copilot และมีแค่ผมคนเดียวที่มีบัญชี Copilot Preview เลยได้ช่วยทดสอบบนคอมของผมให้ครับ
พอลองทดสอบดู มีจุดที่ทำให้ตกใจคือผมใส่โจทย์เขียนโค้ดไป 3 ข้อ แล้วมันให้คำตอบที่ผ่านได้ทันทีเลยครับ
หนึ่งในโจทย์คือปัญหาจาก Baekjoon ที่ผมเอาไปแปลผ่านเครื่องมือแปลแล้วค่อยใส่เข้าไป แต่มันก็ยังตอบถูกครับ
เลยแอบคิดว่าอาจมีคนเอาไปใช้โกงในการสอบเขียนโค้ดออนไลน์ก็ได้...
สรุปจากที่ผมเอาไปใช้กับ VSCode มา 1 เดือนคือ
-
เหมาะเวลาใช้พัฒนาในภาษาหรือสภาพแวดล้อมที่พอรู้อยู่คร่าว ๆ
-> ตอนพัฒนา React มีจุดที่ต้องรับ
e.target.valueแล้วทำอะไรบางอย่างต่อ มันแนะนำโค้ดยาวประมาณ 20 ตัวอักษรขึ้นมา ผมก็กด Tab ให้เติมอัตโนมัติ แล้วผลลัพธ์ก็ออกมาตามที่ต้องการเลย-> แน่นอนว่าผมค่อนข้างขี้สงสัย ก็เลยไปเช็กใน StackOverFlow อีกที และสิ่งที่มันแนะนำมาก็ถูกต้องครับ
-
ถ้าเป็นภาษาหรือสภาพแวดล้อมที่คุ้นเคยดีอยู่แล้ว คำแนะนำอาจไม่ใช่แบบที่เหมาะที่สุด เลยอาจรู้สึกรำคาญได้
-
ก็มีความกังวลอยู่ว่าเพื่อทำ Inference โค้ดน่าจะถูกส่งออกไป แบบนี้จะโอเคไหมนะ? แต่ก็คิดอีกมุมว่าแค่โค้ดในแต่ละไฟล์มันจะเอาไปทำอะไรได้มากแค่ไหน เลยยังใช้อยู่ครับ
12 ความคิดเห็น
https://www.youtube.com/watch?v=a9349pRiCRk
เห็นว่าก็มีความเห็นแบบนี้อยู่เหมือนกันนะครับ
ผมดูอันนี้แล้วความสนใจก็ลดลงไปอย่างรวดเร็วเลยครับ
ผม/ฉันไม่ค่อยรู้เรื่องลิขสิทธิ์ของโค้ดเท่าไร เลยอยากถามว่า ถ้านำโค้ดที่ได้รับความคุ้มครองตามลิขสิทธิ์มาใช้โดยแค่เปลี่ยนชื่อตัวแปร หรือเปลี่ยนชื่อฟังก์ชัน แล้วแก้ไขเพียงเล็กน้อย แบบนี้ถือเป็นการละเมิดไลเซนส์ไหมครับ/คะ?
ใช่ นั่นเป็นการละเมิด
มากกว่าจะเป็นว่าโค้ดเหมือนกันทุกประการหรือไม่... ผมคิดว่าประเด็นสำคัญในลิขสิทธิ์โค้ดน่าจะเป็นว่าโค้ดนั้นมีที่มาจากไหนมากกว่านะครับ
ในกรณีของไลเซนส์ MIT หรือ Apache การนำมาแก้ไขแล้วใช้งานก็คงไม่ใช่ปัญหาใหญ่อะไร...
แต่ถ้าโค้ดที่ Copilot แนะนำ ดันเป็นโค้ดที่เหมือนกับโค้ดซึ่งใช้ไลเซนส์ GPL ทุกอย่าง..
และนักพัฒนาแก้ไขโค้ดบางส่วนแล้วนำไปรวมไว้ในโปรเจ็กต์ที่กำลังพัฒนา..
ถ้ามองตามไลเซนส์ GPL ผมก็สงสัยว่าแบบนั้นจะไม่เท่ากับว่าต้องเปิดเผยซอร์สโค้ดทั้งหมดของโปรเจ็กต์หรือเปล่า
เท่าที่ผมเข้าใจ ถ้าใช้โค้ดที่มีไลเซนส์ GPL แล้วไม่เปิดเผยโค้ดทั้งหมดที่ใช้โค้ดนั้น ก็จะถือว่าละเมิดไลเซนส์ GPL นะครับ
ถ้าจะยกตัวอย่างสุดโต่งแบบแต่งเป็นเรื่องสมมติก็...
สมมติว่าบริษัทกำลังพัฒนาโซลูชันอยู่ แล้วนักพัฒนาใช้ Copilot แต่โชคร้ายที่โค้ดที่ถูกแนะนำเป็นโค้ดจากที่ที่ใช้ไลเซนส์ GPL ซึ่ง AI เรียนรู้มาแล้วคายออกมาตรงๆ แบบนั้นก็อาจจะเกิดประเด็นว่าบริษัทต้องเปิดเผยโค้ดทั้งหมดของโซลูชันหรือเปล่านะครับ.
สิ่งที่สงสัยคือ ถ้าผู้ใช้นำโค้ดที่ copilot สร้างออกมาปรับแก้เล็กน้อยแล้วใช้งาน แบบนั้นจะมีวิธีตรวจพบได้ไหมครับ? แม้จะเป็น I/O เดียวกันและทำงานเหมือนกัน แต่โค้ดก็อาจออกมาได้หลากหลายสไตล์ เลยสงสัยว่าการตรวจจับการลอกโค้ดลักษณะนี้ทำกันอย่างไร (มีแนวทางเปรียบเทียบกับต้นฉบับกันแบบคดีฟ้องร้องเรื่องการลอกเพลงหรือเปล่า?)
ก็ไม่แน่ใจเหมือนกันครับ ว่าจะตรวจสอบความคล้ายกันอย่างไร และจะตัดสินว่าถือเป็นโค้ดเดียวกันได้ถึงระดับไหน ฮ่าๆ
บทความที่เกี่ยวข้องก็เคยถูกโพสต์ขึ้นบน GeekNews เช่นกัน
https://th.news.hada.io/topic?id=4659
ในวิดีโอ YouTube ดังกล่าวมีการพูดถึงเรื่องลิขสิทธิ์ แต่พอมาดูว่าไม่มีการระบุแหล่งที่มาหรือลิขสิทธิ์ของภาพประกอบในวิดีโอเองเลย (เช่น ข่าว การ์ตูนแอนิเมชัน เป็นต้น) ก็เลยรู้สึกว่าเป็นเรื่องที่ยากจริง ๆ ครับ T_T
ลิขสิทธิ์ของข่าว/การ์ตูนในวิดีโอที่คุณชี้ให้เห็น ... เป็นเรื่องที่ผู้เขียนคนนั้นเอง (คนที่ผลิต/เผยแพร่วิดีโอ) ต้องรับผิดชอบก็จริง แต่..
ประเด็นคือ ถ้าใช้ Copilot แล้วมีโค้ดที่ติดปัญหาลิขสิทธิ์รวมเข้ามาอยู่ในโค้ดของฉันล่ะ
ฉันแค่ใช้เครื่องมือเท่านั้น แต่กลับกลายเป็นว่าโปรแกรมที่ฉันพัฒนาต้องเข้าไปพัวพันกับคดีลิขสิทธิ์นั่นเอง
ฉันก็อยากลองใช้เหมือนกัน แต่ไม่รู้ว่าจะได้รับสิทธิ์เมื่อไหร่ ฮือ
+1 ยังรอต่อไปอยู่ครับ
เท่าที่ทราบคือ ยิ่งใช้ Github มาก ก็ยิ่งได้รับสิทธิ์เร็วขึ้นครับ
พอดีว่าเมื่อปีที่แล้วมีรีโปที่ผมทำขึ้นมาแบบเร่งด่วนเพราะโควิด แล้วดันได้ Star เกิน 100 ไปเสียอย่างนั้นครับ ไม่รู้ว่าเป็นเพราะเรื่องนั้นหรือเปล่า เวลาผมสมัครทั้ง Copilot และ GitHub Codespaces ก็มักจะได้รับการคัดเลือกค่อนข้างง่ายครับ