"ซอฟต์แวร์ในยุค AI" - วิดีโอบรรยายของ Andrej Karpathy ที่ YC AI School

(youtube.com)

29 คะแนน โดย GN⁺ 2025-06-19 | 2 ความคิดเห็น | แชร์ทาง WhatsApp

"Software is Changing (Again)"
กระบวนทัศน์ของซอฟต์แวร์กำลังเปลี่ยนแปลงอย่างมีนัยสำคัญเป็นครั้งแรกในรอบ 70 ปี และในช่วงไม่กี่ปีที่ผ่านมาได้วิวัฒน์อย่างรวดเร็วเป็น Software 1.0 (โค้ดแบบดั้งเดิม), 2.0 (ค่าน้ำหนักของโครงข่ายประสาท), 3.0 (LLM และพรอมต์ภาษาธรรมชาติ)
LLM ไม่ใช่แค่เครื่องมือ แต่กำลังก้าวขึ้นเป็นระบบนิเวศซอฟต์แวร์แบบใหม่ที่คล้ายระบบปฏิบัติการ (Operating System) และเปิดยุคที่ใคร ๆ ก็สามารถโปรแกรมคอมพิวเตอร์ด้วยภาษาธรรมชาติอย่างภาษาอังกฤษได้
การทำงานร่วมกับเครื่องมือ AI·เอเจนต์ และ 'ความอัตโนมัติบางส่วน (Partial Autonomy)' จะกลายเป็นแกนหลักของผลิตภัณฑ์ซอฟต์แวร์ในอนาคต และต้องมีการตรวจสอบกับควบคุมโดยมนุษย์อย่างรวดเร็วควบคู่กันไปจึงจะเชื่อถือได้
AI และ LLM มีลักษณะคล้าย ‘วิญญาณแบบมนุษย์ (people spirits)’ มีทั้งความจำและความรู้มหาศาล พร้อมกับข้อจำกัดเฉพาะตัวอย่างอาการหลอนข้อมูล การสูญเสียบริบท และความเสี่ยงด้านความปลอดภัย
ต่อจากนี้ซอฟต์แวร์ เอกสาร และโครงสร้างพื้นฐานจะต้องถูกออกแบบใหม่ให้ ‘เป็นมิตรต่อเอเจนต์ (Llms-friendly)’ เพื่อให้ LLM เข้าใจและลงมือทำได้ง่ายขึ้นผ่านการเปลี่ยนแปลงด้านโครงสร้างและวิธีการนำเสนอ

ซอฟต์แวร์ 1.0 → 2.0 → 3.0 : วิวัฒนาการของกระบวนทัศน์

Software 1.0: ซอร์สโค้ดแบบดั้งเดิมที่มนุษย์เขียนขึ้นโดยตรง
Software 2.0: โมเดลที่สร้างขึ้นจากการปรับจูนค่าน้ำหนัก (พารามิเตอร์) ของโครงข่ายประสาทด้วยชุดข้อมูลและ optimizer
Software 3.0: อิงกับโมเดลภาษาขนาดใหญ่ (LLM) และสร้างโปรแกรม (คำสั่ง) ด้วยพรอมต์ภาษาธรรมชาติอย่างภาษาอังกฤษ

ช่วงหลังนี้บน GitHub โค้ดกำลังพัฒนาไปสู่รูปแบบที่ผสมกันระหว่างภาษาอังกฤษกับโค้ด และ ภาษาอังกฤษในฐานะภาษาสำหรับการเขียนโปรแกรม ก็กำลังแพร่หลายอย่างรวดเร็ว
Hugging Face และบริการลักษณะเดียวกันทำหน้าที่เป็น 'GitHub' ของ Software 2.0 และเป็นผู้นำระบบนิเวศโมเดลโอเพนซอร์ส

LLM คือระบบปฏิบัติการ (OS) แบบใหม่

LLM กำลังพัฒนาไปไกลกว่าการเป็นเพียง API หรือยูทิลิตี สู่การเป็น แพลตฟอร์มที่ซอฟต์แวร์หลากหลายสามารถทำงานอยู่บนมันได้เหมือนระบบปฏิบัติการ
ปัจจุบันการใช้งาน LLM ยังมีลักษณะคล้ายยุคเมนเฟรมในทศวรรษ 1960 โดยอยู่ใน โครงสร้างแบบรวมศูนย์ที่ยึดคลาวด์เป็นหลัก
ในระยะยาวก็มีการกล่าวถึงความเป็นไปได้ของ ยุค LLM ส่วนบุคคล (ใช้งานแบบกระจายตัว·โลคัล)
สภาพแวดล้อมการใช้งาน LLM คล้ายกับเทอร์มินัลและอินเทอร์เฟซบรรทัดคำสั่งแบบดั้งเดิม แต่ GUI แบบอเนกประสงค์ยังพัฒนาได้ไม่เต็มที่

ความสามารถและข้อจำกัดของ LLM

LLM มี ความสามารถด้านความจำขนาดใหญ่และการเรียนรู้ความรู้ แต่ก็มี ข้อบกพร่องเฉพาะตัวอย่างฮัลลูซิเนชัน (ข้อมูลเท็จ), การหลงลืมบริบท, ช่องโหว่ด้านความปลอดภัย
‘บริบทการทำงาน (working memory)’ ของ LLM ยังต้องให้มนุษย์จัดการอย่างชัดเจน และความสามารถในการเรียนรู้บริบทระยะยาวยังไม่ดีพอ
ยังมี ความเสี่ยงจริงจัง เช่น ความปลอดภัยและ prompt injection จึงต้องใช้งานด้วยความระมัดระวัง

ความอัตโนมัติบางส่วน (Partial Autonomy) และการทำงานร่วมกันระหว่างมนุษย์กับ LLM

แอปที่อิงกับ LLM อย่าง Cursor, Perplexity กำลังพัฒนาไปสู่แนวคิด ‘ตัวเลื่อนระดับความอัตโนมัติ’ ที่ผสานการควบคุมแบบแมนนวลเดิมเข้ากับระบบอัตโนมัติของ LLM เพื่อให้ผู้ใช้ปรับระดับการควบคุม/การมอบหมายให้ AI ได้
การ audit ผ่าน GUI และวงจรการตรวจสอบอย่างรวดเร็ว รวมถึง ‘วิธีการควบคุม AI ให้อยู่ในกรอบสั้น ๆ’ เป็นสิ่งจำเป็นในการทำงานจริง
มีการคาดการณ์ว่าซอฟต์แวร์ ผลิตภัณฑ์ และบริการทั้งหมดจะ ค่อย ๆ เสริมความเป็น ‘อัตโนมัติบางส่วน’ มากขึ้น

กรณีใช้งานจริงและวัฒนธรรม ‘Vibecoding’

วัฒนธรรม ‘Vibecoding’ ที่ใคร ๆ ก็สามารถสร้างแอปผ่าน LLM ได้เองด้วยภาษาอังกฤษกำลังแพร่หลาย
Karpathy ยังเล่าประสบการณ์ที่เขาสร้างแอป iOS ด้วยภาษา Swift ซึ่งตนไม่มีประสบการณ์ในการเขียนมาก่อน ภายในเวลาเพียงวันเดียว และต่อยอดไปสู่บริการจริง
แม้ LLM จะช่วยให้การสร้างต้นแบบจริงทำได้ง่าย แต่ การทำให้เป็นบริการจริง (ยืนยันตัวตน การชำระเงิน การดีพลอย ฯลฯ) ยังคงติดคอขวดที่งานแมนนวลและ DevOps
ต่อจากนี้โจทย์สำคัญคือการออกแบบ ‘ซอฟต์แวร์/เอกสารที่เป็นมิตรต่อเอเจนต์’ เพื่อให้ส่วนที่ก่อนหน้านี้มนุษย์ต้องคลิกหรือตั้งค่าด้วยตัวเองสามารถถูก ‘เอเจนต์’ ทำแทน ได้

การเปลี่ยนแปลงของเอกสาร·โครงสร้างพื้นฐาน และความเป็นมิตรต่อเอเจนต์

เอกสารแบบเดิมที่เน้นมนุษย์เป็นศูนย์กลาง (การคลิก ลำดับขั้นตอน ฯลฯ) ใช้งานโดยตรงกับ LLM·เอเจนต์ได้ยาก จึงจำเป็นต้องปรับโครงสร้างใหม่ให้อยู่ในรูปแบบ Markdown และคำสั่ง
Versell, Stripe และบริษัทอื่น ๆ ได้เริ่ม ปรับเอกสารให้เป็นมิตรต่อเอเจนต์ (เช่น คำสั่ง curl) แล้ว
เครื่องมือต่าง ๆ เช่น GitHub Ingest, DeepWiki ช่วย แปลงโค้ดรีโพซิทอรีและเอกสารให้อยู่ในรูปแบบที่ LLM นำไปใช้งานได้ทันที

บทสรุปและแนวโน้ม

ตอนนี้คือช่วงเวลาที่ดีที่สุดในการเขียนโค้ดใหม่จำนวนมหาศาลและเขียนของเดิมขึ้นมาใหม่
LLM จะทำงานร่วมกับนักพัฒนามนุษย์ในฐานะ ‘เครื่องมือเสริม (ชุดเกราะ Iron Man)’ และนวัตกรรมแบบค่อยเป็นค่อยไปสู่ความอัตโนมัติเต็มรูปแบบจะดำเนินต่อไป
มีแนวโน้มว่า กระบวนการค่อย ๆ เพิ่มระดับของ ‘ตัวเลื่อนความอัตโนมัติ’ ตลอด 10 ปีข้างหน้า จะเป็นเทรนด์สำคัญ
นักพัฒนาและองค์กรต้องเร่งออกแบบซอฟต์แวร์ เอกสาร และโครงสร้างพื้นฐานใหม่ให้เหมาะกับ LLM·เอเจนต์

2 ความคิดเห็น

laeyoung 2025-06-24

วิดีโอนี้ดีมาก! เขาพูดถึงประโยคที่ Andrew Ng เคยบอกว่า "AI Is the New Electricity" แล้วก็อธิบายว่าถ้า ChatGPT ที่มีคนใช้ 800 ล้านคนล่ม มันก็ไม่ต่างจากไฟฟ้าดับเลย ซึ่งฟังแล้วรู้สึกเห็นภาพมากจริง ๆ

GN⁺ 2025-06-19

ความคิดเห็นจาก Hacker News

มีความเห็นว่าชอบการเปรียบเทียบและมุมมองที่มองความเป็นจริงได้อย่างแม่นยำของ Karpathy มาก
มีการชี้ว่าการนำการเขียนโค้ดแบบดั้งเดิม, น้ำหนักของโครงข่ายประสาท, และพรอมป์ต์มาเปรียบเทียบแบบขนานนั้นน่าสนใจ เช่น ในโมดูลขับขี่อัตโนมัติ การปรับโครงข่ายประสาทให้เหมาะกับชุดข้อมูลที่เป็นตัวแทนของเป้าหมายได้ดี แทนการเขียนโค้ดขึ้นมาโดยตรง อาจมีประโยชน์จริงไม่น้อย แต่ก็เน้นด้วยว่าในหลายสภาพแวดล้อม ข้อจำกัดด้านฮาร์ดแวร์จะทำให้ขอบเขตการใช้งานที่ software 2.0 หรือ software 3.0 นำมาได้นั้นจำกัดมาก อีกทั้งยังมองว่าโค้ดแบบเดิมและพรอมป์ต์จะยังคงเป็นเครื่องมือที่ใช้เสริมกัน ไม่ใช่ว่าอย่างใดอย่างหนึ่งจะเป็นคำตอบที่สมบูรณ์แบบ
มีคำชมว่า Karpathy เป็นคนที่คิดได้ชัดเจนเสมอและการเปรียบเทียบของเขาก็น่าประทับใจ พร้อมทั้งแสดงความสงสัยว่าเมื่อเห็นว่า Waymo สามารถขับอัตโนมัติได้อย่างต่อเนื่องตั้งแต่ปี 2013 แล้ว เหตุใดจึงไม่สามารถขยายได้เร็วขนาดนี้ เป็นเพราะกฎระเบียบหรือเพราะความยากในการปรับให้การขับขี่เหมาะสมกันแน่ อีกทั้งยังกล่าวถึงว่ามีสไลด์หนึ่งระบุว่า ‘AGI 2027’ และเอ่ยถึง ai-2027.com
มีความเห็นสั้น ๆ ว่าแปลกใจที่วิดีโอการบรรยายออกมาเร็วกว่ากำหนดมาก
กล่าวขอบคุณที่ YC แชร์วิดีโอนี้ออกมาก่อนที่เนื้อหาจะล้าสมัย พร้อมแนบลิงก์ทวีตที่เกี่ยวข้อง(https://x.com/karpathy/status/1935077692258558443)