Devin วิศวกรซอฟต์แวร์ AI คนแรก

(cognition-labs.com)

15 คะแนน โดย GN⁺ 2024-03-13 | 2 ความคิดเห็น | แชร์ทาง WhatsApp

Devin คือวิศวกรซอฟต์แวร์ AI แบบอัตโนมัติเต็มรูปแบบคนแรกของโลก
Devin สามารถทำงานร่วมกับวิศวกรมนุษย์หรือทำงานอย่างอิสระได้ และช่วยให้วิศวกรโฟกัสกับปัญหาที่น่าสนใจกว่าเดิม
Devin สามารถวางแผนและดำเนินงานวิศวกรรมที่ซับซ้อนได้ และสามารถใช้เครื่องมือของนักพัฒนา เช่น shell, code editor และ browser ได้

ความสามารถของ Devin

Devin มีความก้าวหน้าในด้านการให้เหตุผลและการวางแผนระยะยาว และสามารถทำงานวิศวกรรมที่ซับซ้อนได้พร้อมตัดสินใจนับพันครั้ง
สามารถทำงานร่วมกับผู้ใช้ โดยรายงานความคืบหน้าแบบเรียลไทม์ รับฟีดแบ็ก และร่วมกันตัดสินใจด้านการออกแบบได้
Devin สามารถเรียนรู้เทคโนโลยีที่ไม่คุ้นเคย สร้างและ deploy แอป ค้นหาและแก้บั๊กใน codebase รวมถึงฝึกและ fine-tune โมเดล AI ของตนเองได้

ประสิทธิภาพของ Devin

ใน benchmark การเขียนโค้ด SWE-bench นั้น Devin ทำอัตราความสำเร็จได้ 13.86% ในการแก้ปัญหา GitHub issue จริง ซึ่งสูงกว่าสถิติก่อนหน้าที่ดีที่สุดที่ 1.96% อย่างมาก
Devin ถูกประเมินบนชุดย่อยแบบสุ่ม 25% ของ dataset และในขณะที่โมเดลอื่นได้รับความช่วยเหลือด้วยการบอกไฟล์ที่ต้องแก้ไขอย่างแม่นยำ แต่ Devin ทำงานได้โดยไม่มีความช่วยเหลือ

แนะนำ Cognition

Cognition คือห้องวิจัย applied AI ที่มุ่งเน้นด้านการให้เหตุผล
มีเป้าหมายในการพัฒนาเพื่อนร่วมงาน AI ที่มีความสามารถเหนือกว่าเครื่องมือ AI ในปัจจุบัน
Cognition ได้รับเงินลงทุน Series A มูลค่า 21 ล้านดอลลาร์ นำโดย Founders Fund และได้รับการสนับสนุนจากผู้นำในอุตสาหกรรม

จ้าง Devin

ขณะนี้ Devin ยังอยู่ในช่วง early access และหากต้องการใช้ Devin กับงานวิศวกรรม สามารถติดต่อ Cognition ได้

มาร่วมกับเรา

ทีมของ Cognition มีขนาดเล็ก โดยทีมผู้ก่อตั้งมีเหรียญทอง IOI รวมกัน 10 เหรียญ และประกอบด้วยผู้นำและผู้สร้างที่มีประสบการณ์จาก Cursor, Scale AI, Lunchclub, Modal, Google DeepMind, Waymo, Nuro และที่อื่น ๆ
การสร้าง Devin เป็นเพียงก้าวแรก และความท้าทายที่ยากที่สุดยังรออยู่ข้างหน้า

ความเห็นของ GN⁺

Devin ในฐานะวิศวกรซอฟต์แวร์ AI เป็นสัญลักษณ์ของอนาคตการพัฒนาซอฟต์แวร์ และมีศักยภาพในการยกระดับประสิทธิภาพงานวิศวกรรมอย่างมากผ่านการผสานระบบอัตโนมัติกับ AI
การที่ AI แสดงอัตราความสำเร็จสูงเช่นนี้ในการแก้ปัญหาทางวิศวกรรมจริงถือเป็นความสำเร็จที่น่าจับตา และแสดงให้เห็นว่าความก้าวหน้าของเทคโนโลยี AI สามารถผสานเข้ากับสภาพแวดล้อมการทำงานจริงได้ดีเพียงใด
อย่างไรก็ตาม ยังจำเป็นต้องพิจารณาผลกระทบด้านจริยธรรมและสังคมของการที่ AI เข้ามาแทนที่งานของมนุษย์ โดยต้องใช้แนวทางที่รอบคอบต่อผลกระทบด้านการจ้างงานและการเปลี่ยนแปลงบทบาทของมนุษย์
เครื่องมือพัฒนาที่ขับเคลื่อนด้วย AI อื่นที่มีความสามารถคล้ายกันคือ GitHub Copilot ซึ่งถูกใช้อย่างแพร่หลายในฐานะเครื่องมือช่วยนักพัฒนาเขียนโค้ด
เมื่อนำเทคโนโลยีอย่าง Devin มาใช้ ควรคำนึงถึงความปลอดภัยของข้อมูล ความเป็นส่วนตัว ตลอดจนประเด็นเรื่องความโปร่งใสและความรับผิดชอบต่อการตัดสินใจของ AI การทำความเข้าใจและบริหารผลกระทบของการตัดสินใจของ AI ที่มีต่อธุรกิจและผู้ใช้เป็นสิ่งสำคัญ

2 ความคิดเห็น

yangeok 2024-03-13

อยากลองใช้ Devin ฟรีจังเลย

GN⁺ 2024-03-13

ความคิดเห็นบน Hacker News

ในฐานะนักพัฒนาและผู้รับผิดชอบผลิตภัณฑ์ เคยพยายามใช้ AI เขียนโค้ด แต่ล้มเหลวเพราะข้อจำกัดด้านความยาวของบริบท ผลลัพธ์จากโมเดลที่ไม่ดี และการขาดสถาปัตยกรรม จึงยังไม่สามารถใช้ AI ทำงานที่มีประโยชน์เกินกว่าการช่วยทำ Leetcode ได้ แม้แต่งานง่าย ๆ อย่างดึงตัวเลือกจากหน้า HTML แบบเรียบง่ายก็ลองกับโมเดล AI หลายตัวแล้วแต่ไม่สำเร็จ เคยมีความคาดหวังกับความก้าวหน้าทางเทคโนโลยีมาก แต่ตอนนี้ต้องการผลิตภัณฑ์ที่ใช้งานได้จริงอย่างถูกต้อง
มนุษย์แสวงหางานที่มอบความหมายและความพึงพอใจ ความก้าวหน้าทางเทคโนโลยีทำให้ช่างฝีมือกลายเป็นคนกลุ่มแรกที่หมดความจำเป็น สังคมส่งสารว่าหากไม่สร้างคุณค่า ก็จะไม่ได้รับการยอมรับในศักดิ์ศรี การมอบงานศิลปะและวิศวกรรมให้ AI ทำ ทำให้แม้แต่คนที่ไม่เข้าใจก็สามารถใช้สิ่งเหล่านี้ได้ในราคาถูก จึงตั้งคำถามว่าความก้าวหน้าทางเทคโนโลยีเป็นประโยชน์กับใคร และในอนาคตมนุษย์จะอยู่ตรงไหน
Scott Wu เป็นหนึ่งในไม่กี่คนที่ได้คะแนนเต็มนับตั้งแต่ปี 1989 และเคยพบกันในโอลิมปิกการแข่งขันเขียนโปรแกรม รู้สึกยินดีที่เห็นว่าเขากำลังใช้พรสวรรค์อันน่าทึ่งของตน
ไม่ได้ประทับใจกับเว็บไซต์ที่ให้ใครก็ได้อัปโหลดไฟล์ขนาดเท่าใดก็ได้โดยไม่ต้องยืนยันตัวตน จึงอัปโหลดไฟล์ขนาด 500MB ไปยังเซิร์ฟเวอร์
ถ้า AI เก่งจริงก็ควรถูกนำไปใช้ในทางที่ดี ในฐานะวิศวกรซอฟต์แวร์ระดับสูง การเขียนโค้ดไม่ได้เป็น 90% ของงาน แต่คือการแยกข้อกำหนดที่ซับซ้อนออกเป็นงานที่ชัดเจน ค้นหาช่องโหว่ในข้อกำหนด เขียนโค้ดให้น้อยที่สุด และทำความเข้าใจโค้ดเบส สิ่งที่ต้องการไม่ใช่ “AI วิศวกรซอฟต์แวร์” แต่เป็น “AI ผู้ประสานงานกับมนุษย์” มากกว่า
เดโมน่าประทับใจ แต่ขอบเขตจำกัด จึงสงสัยว่าจะทำงานได้ดีแค่ไหนในสถานการณ์จริง สงสัยว่าจะทำสถาปัตยกรรมซอฟต์แวร์ได้หรือไม่ วิธีแก้ปัญหาเป็นเพียงการผลิตซ้ำหรือไม่ และกรณีที่คำตอบถูกต้องเพียง 90% แต่ยังไม่เพียงพอจะเกิดขึ้นบ่อยแค่ไหน
ในฐานะคนที่มีประสบการณ์พัฒนาแบ็กเอนด์ LLM มอบการเพิ่มผลิตภาพอย่างน่าทึ่งในการสร้างโค้ด เมื่อผู้ใช้รู้จักไลบรารี/เฟรมเวิร์ก/ภาษา พื้นฐานเป็นอย่างดี แต่ก็ยังจำเป็นต้องรู้ทุกอย่างอยู่ดี และ AI ยังไม่สามารถทำทุกอย่างได้โดยอัตโนมัติ
เดโมน่าประทับใจและขอแสดงความยินดีกับการเปิดตัว แต่ก็สงสัยว่าบั๊กที่ Devin เจอนั้นแก้ได้ด้วยการแก้ไขง่าย ๆ หรือไม่ ตัวอย่างเช่น การครอบโค้ดด้วย try-catch เพื่อแก้ KeyError อาจทำให้โค้ดรันได้ แต่ไม่ใช่ทางแก้ที่เหมาะสมที่สุดเสมอไป
LLM ยังอยู่ในขั้นของการ “แต่งสัมผัส” ว่าจะก้าวไปสู่ “การใช้เหตุผล” ได้หรือไม่นั้นยังไม่แน่ชัด แต่การเขียนโค้ดต้องอาศัยการใช้เหตุผลกับปัญหาที่ซับซ้อน อย่างไรก็ตาม เมื่อพิจารณาจากความเร็วของการเปลี่ยนแปลง ก็ไม่ตัดความเป็นไปได้ใด ๆ
ในฐานะคนที่ทำงานในสายนี้ การใช้ AI ในการเขียนโค้ดตอนนี้ยังอยู่ที่ระดับเครื่องมือช่วยและการเติมโค้ดอัตโนมัติขั้นสูง บริษัทอย่าง Pythagora มองว่าการแทรกแซงของมนุษย์ยังสำคัญ และ LLM อาจมองได้ว่าเป็นนักพัฒนาระดับจูเนียร์ที่กระตือรือร้นและลงมือทำตามคำสั่งได้รวดเร็ว ด้วยพรอมป์ต์ภายในและการชี้นำจากมนุษย์เพียงเล็กน้อย ก็สามารถให้ผลลัพธ์ที่น่าทึ่งได้

Devin วิศวกรซอฟต์แวร์ AI คนแรก

ความสามารถของ Devin

ประสิทธิภาพของ Devin

แนะนำ Cognition

จ้าง Devin

มาร่วมกับเรา

ความเห็นของ GN⁺

บทความที่เกี่ยวข้อง

2 ความคิดเห็น

ความคิดเห็นบน Hacker News