15 คะแนน โดย GN⁺ 2024-03-13 | 2 ความคิดเห็น | แชร์ทาง WhatsApp
  • Devin คือวิศวกรซอฟต์แวร์ AI แบบอัตโนมัติเต็มรูปแบบคนแรกของโลก
  • Devin สามารถทำงานร่วมกับวิศวกรมนุษย์หรือทำงานอย่างอิสระได้ และช่วยให้วิศวกรโฟกัสกับปัญหาที่น่าสนใจกว่าเดิม
  • Devin สามารถวางแผนและดำเนินงานวิศวกรรมที่ซับซ้อนได้ และสามารถใช้เครื่องมือของนักพัฒนา เช่น shell, code editor และ browser ได้

ความสามารถของ Devin

  • Devin มีความก้าวหน้าในด้านการให้เหตุผลและการวางแผนระยะยาว และสามารถทำงานวิศวกรรมที่ซับซ้อนได้พร้อมตัดสินใจนับพันครั้ง
  • สามารถทำงานร่วมกับผู้ใช้ โดยรายงานความคืบหน้าแบบเรียลไทม์ รับฟีดแบ็ก และร่วมกันตัดสินใจด้านการออกแบบได้
  • Devin สามารถเรียนรู้เทคโนโลยีที่ไม่คุ้นเคย สร้างและ deploy แอป ค้นหาและแก้บั๊กใน codebase รวมถึงฝึกและ fine-tune โมเดล AI ของตนเองได้

ประสิทธิภาพของ Devin

  • ใน benchmark การเขียนโค้ด SWE-bench นั้น Devin ทำอัตราความสำเร็จได้ 13.86% ในการแก้ปัญหา GitHub issue จริง ซึ่งสูงกว่าสถิติก่อนหน้าที่ดีที่สุดที่ 1.96% อย่างมาก
  • Devin ถูกประเมินบนชุดย่อยแบบสุ่ม 25% ของ dataset และในขณะที่โมเดลอื่นได้รับความช่วยเหลือด้วยการบอกไฟล์ที่ต้องแก้ไขอย่างแม่นยำ แต่ Devin ทำงานได้โดยไม่มีความช่วยเหลือ

แนะนำ Cognition

  • Cognition คือห้องวิจัย applied AI ที่มุ่งเน้นด้านการให้เหตุผล
  • มีเป้าหมายในการพัฒนาเพื่อนร่วมงาน AI ที่มีความสามารถเหนือกว่าเครื่องมือ AI ในปัจจุบัน
  • Cognition ได้รับเงินลงทุน Series A มูลค่า 21 ล้านดอลลาร์ นำโดย Founders Fund และได้รับการสนับสนุนจากผู้นำในอุตสาหกรรม

จ้าง Devin

  • ขณะนี้ Devin ยังอยู่ในช่วง early access และหากต้องการใช้ Devin กับงานวิศวกรรม สามารถติดต่อ Cognition ได้

มาร่วมกับเรา

  • ทีมของ Cognition มีขนาดเล็ก โดยทีมผู้ก่อตั้งมีเหรียญทอง IOI รวมกัน 10 เหรียญ และประกอบด้วยผู้นำและผู้สร้างที่มีประสบการณ์จาก Cursor, Scale AI, Lunchclub, Modal, Google DeepMind, Waymo, Nuro และที่อื่น ๆ
  • การสร้าง Devin เป็นเพียงก้าวแรก และความท้าทายที่ยากที่สุดยังรออยู่ข้างหน้า

ความเห็นของ GN⁺

  • Devin ในฐานะวิศวกรซอฟต์แวร์ AI เป็นสัญลักษณ์ของอนาคตการพัฒนาซอฟต์แวร์ และมีศักยภาพในการยกระดับประสิทธิภาพงานวิศวกรรมอย่างมากผ่านการผสานระบบอัตโนมัติกับ AI
  • การที่ AI แสดงอัตราความสำเร็จสูงเช่นนี้ในการแก้ปัญหาทางวิศวกรรมจริงถือเป็นความสำเร็จที่น่าจับตา และแสดงให้เห็นว่าความก้าวหน้าของเทคโนโลยี AI สามารถผสานเข้ากับสภาพแวดล้อมการทำงานจริงได้ดีเพียงใด
  • อย่างไรก็ตาม ยังจำเป็นต้องพิจารณาผลกระทบด้านจริยธรรมและสังคมของการที่ AI เข้ามาแทนที่งานของมนุษย์ โดยต้องใช้แนวทางที่รอบคอบต่อผลกระทบด้านการจ้างงานและการเปลี่ยนแปลงบทบาทของมนุษย์
  • เครื่องมือพัฒนาที่ขับเคลื่อนด้วย AI อื่นที่มีความสามารถคล้ายกันคือ GitHub Copilot ซึ่งถูกใช้อย่างแพร่หลายในฐานะเครื่องมือช่วยนักพัฒนาเขียนโค้ด
  • เมื่อนำเทคโนโลยีอย่าง Devin มาใช้ ควรคำนึงถึงความปลอดภัยของข้อมูล ความเป็นส่วนตัว ตลอดจนประเด็นเรื่องความโปร่งใสและความรับผิดชอบต่อการตัดสินใจของ AI การทำความเข้าใจและบริหารผลกระทบของการตัดสินใจของ AI ที่มีต่อธุรกิจและผู้ใช้เป็นสิ่งสำคัญ

2 ความคิดเห็น

 
yangeok 2024-03-13

อยากลองใช้ Devin ฟรีจังเลย

 
GN⁺ 2024-03-13
ความคิดเห็นบน Hacker News
  • ในฐานะนักพัฒนาและผู้รับผิดชอบผลิตภัณฑ์ เคยพยายามใช้ AI เขียนโค้ด แต่ล้มเหลวเพราะข้อจำกัดด้านความยาวของบริบท ผลลัพธ์จากโมเดลที่ไม่ดี และการขาดสถาปัตยกรรม จึงยังไม่สามารถใช้ AI ทำงานที่มีประโยชน์เกินกว่าการช่วยทำ Leetcode ได้ แม้แต่งานง่าย ๆ อย่างดึงตัวเลือกจากหน้า HTML แบบเรียบง่ายก็ลองกับโมเดล AI หลายตัวแล้วแต่ไม่สำเร็จ เคยมีความคาดหวังกับความก้าวหน้าทางเทคโนโลยีมาก แต่ตอนนี้ต้องการผลิตภัณฑ์ที่ใช้งานได้จริงอย่างถูกต้อง
  • มนุษย์แสวงหางานที่มอบความหมายและความพึงพอใจ ความก้าวหน้าทางเทคโนโลยีทำให้ช่างฝีมือกลายเป็นคนกลุ่มแรกที่หมดความจำเป็น สังคมส่งสารว่าหากไม่สร้างคุณค่า ก็จะไม่ได้รับการยอมรับในศักดิ์ศรี การมอบงานศิลปะและวิศวกรรมให้ AI ทำ ทำให้แม้แต่คนที่ไม่เข้าใจก็สามารถใช้สิ่งเหล่านี้ได้ในราคาถูก จึงตั้งคำถามว่าความก้าวหน้าทางเทคโนโลยีเป็นประโยชน์กับใคร และในอนาคตมนุษย์จะอยู่ตรงไหน
  • Scott Wu เป็นหนึ่งในไม่กี่คนที่ได้คะแนนเต็มนับตั้งแต่ปี 1989 และเคยพบกันในโอลิมปิกการแข่งขันเขียนโปรแกรม รู้สึกยินดีที่เห็นว่าเขากำลังใช้พรสวรรค์อันน่าทึ่งของตน
  • ไม่ได้ประทับใจกับเว็บไซต์ที่ให้ใครก็ได้อัปโหลดไฟล์ขนาดเท่าใดก็ได้โดยไม่ต้องยืนยันตัวตน จึงอัปโหลดไฟล์ขนาด 500MB ไปยังเซิร์ฟเวอร์
  • ถ้า AI เก่งจริงก็ควรถูกนำไปใช้ในทางที่ดี ในฐานะวิศวกรซอฟต์แวร์ระดับสูง การเขียนโค้ดไม่ได้เป็น 90% ของงาน แต่คือการแยกข้อกำหนดที่ซับซ้อนออกเป็นงานที่ชัดเจน ค้นหาช่องโหว่ในข้อกำหนด เขียนโค้ดให้น้อยที่สุด และทำความเข้าใจโค้ดเบส สิ่งที่ต้องการไม่ใช่ “AI วิศวกรซอฟต์แวร์” แต่เป็น “AI ผู้ประสานงานกับมนุษย์” มากกว่า
  • เดโมน่าประทับใจ แต่ขอบเขตจำกัด จึงสงสัยว่าจะทำงานได้ดีแค่ไหนในสถานการณ์จริง สงสัยว่าจะทำสถาปัตยกรรมซอฟต์แวร์ได้หรือไม่ วิธีแก้ปัญหาเป็นเพียงการผลิตซ้ำหรือไม่ และกรณีที่คำตอบถูกต้องเพียง 90% แต่ยังไม่เพียงพอจะเกิดขึ้นบ่อยแค่ไหน
  • ในฐานะคนที่มีประสบการณ์พัฒนาแบ็กเอนด์ LLM มอบการเพิ่มผลิตภาพอย่างน่าทึ่งในการสร้างโค้ด เมื่อผู้ใช้รู้จักไลบรารี/เฟรมเวิร์ก/ภาษา พื้นฐานเป็นอย่างดี แต่ก็ยังจำเป็นต้องรู้ทุกอย่างอยู่ดี และ AI ยังไม่สามารถทำทุกอย่างได้โดยอัตโนมัติ
  • เดโมน่าประทับใจและขอแสดงความยินดีกับการเปิดตัว แต่ก็สงสัยว่าบั๊กที่ Devin เจอนั้นแก้ได้ด้วยการแก้ไขง่าย ๆ หรือไม่ ตัวอย่างเช่น การครอบโค้ดด้วย try-catch เพื่อแก้ KeyError อาจทำให้โค้ดรันได้ แต่ไม่ใช่ทางแก้ที่เหมาะสมที่สุดเสมอไป
  • LLM ยังอยู่ในขั้นของการ “แต่งสัมผัส” ว่าจะก้าวไปสู่ “การใช้เหตุผล” ได้หรือไม่นั้นยังไม่แน่ชัด แต่การเขียนโค้ดต้องอาศัยการใช้เหตุผลกับปัญหาที่ซับซ้อน อย่างไรก็ตาม เมื่อพิจารณาจากความเร็วของการเปลี่ยนแปลง ก็ไม่ตัดความเป็นไปได้ใด ๆ
  • ในฐานะคนที่ทำงานในสายนี้ การใช้ AI ในการเขียนโค้ดตอนนี้ยังอยู่ที่ระดับเครื่องมือช่วยและการเติมโค้ดอัตโนมัติขั้นสูง บริษัทอย่าง Pythagora มองว่าการแทรกแซงของมนุษย์ยังสำคัญ และ LLM อาจมองได้ว่าเป็นนักพัฒนาระดับจูเนียร์ที่กระตือรือร้นและลงมือทำตามคำสั่งได้รวดเร็ว ด้วยพรอมป์ต์ภายในและการชี้นำจากมนุษย์เพียงเล็กน้อย ก็สามารถให้ผลลัพธ์ที่น่าทึ่งได้