- "Software is Changing (Again)"
- กระบวนทัศน์ของซอฟต์แวร์กำลังเปลี่ยนแปลงอย่างมีนัยสำคัญเป็นครั้งแรกในรอบ 70 ปี และในช่วงไม่กี่ปีที่ผ่านมาได้วิวัฒน์อย่างรวดเร็วเป็น Software 1.0 (โค้ดแบบดั้งเดิม), 2.0 (ค่าน้ำหนักของโครงข่ายประสาท), 3.0 (LLM และพรอมต์ภาษาธรรมชาติ)
- LLM ไม่ใช่แค่เครื่องมือ แต่กำลังก้าวขึ้นเป็นระบบนิเวศซอฟต์แวร์แบบใหม่ที่คล้ายระบบปฏิบัติการ (Operating System) และเปิดยุคที่ใคร ๆ ก็สามารถโปรแกรมคอมพิวเตอร์ด้วยภาษาธรรมชาติอย่างภาษาอังกฤษได้
- การทำงานร่วมกับเครื่องมือ AI·เอเจนต์ และ 'ความอัตโนมัติบางส่วน (Partial Autonomy)' จะกลายเป็นแกนหลักของผลิตภัณฑ์ซอฟต์แวร์ในอนาคต และต้องมีการตรวจสอบกับควบคุมโดยมนุษย์อย่างรวดเร็วควบคู่กันไปจึงจะเชื่อถือได้
- AI และ LLM มีลักษณะคล้าย ‘วิญญาณแบบมนุษย์ (people spirits)’ มีทั้งความจำและความรู้มหาศาล พร้อมกับข้อจำกัดเฉพาะตัวอย่างอาการหลอนข้อมูล การสูญเสียบริบท และความเสี่ยงด้านความปลอดภัย
- ต่อจากนี้ซอฟต์แวร์ เอกสาร และโครงสร้างพื้นฐานจะต้องถูกออกแบบใหม่ให้ ‘เป็นมิตรต่อเอเจนต์ (Llms-friendly)’ เพื่อให้ LLM เข้าใจและลงมือทำได้ง่ายขึ้นผ่านการเปลี่ยนแปลงด้านโครงสร้างและวิธีการนำเสนอ
ซอฟต์แวร์ 1.0 → 2.0 → 3.0 : วิวัฒนาการของกระบวนทัศน์
- Software 1.0: ซอร์สโค้ดแบบดั้งเดิมที่มนุษย์เขียนขึ้นโดยตรง
- Software 2.0: โมเดลที่สร้างขึ้นจากการปรับจูนค่าน้ำหนัก (พารามิเตอร์) ของโครงข่ายประสาทด้วยชุดข้อมูลและ optimizer
- Software 3.0: อิงกับโมเดลภาษาขนาดใหญ่ (LLM) และสร้างโปรแกรม (คำสั่ง) ด้วยพรอมต์ภาษาธรรมชาติอย่างภาษาอังกฤษ
- ช่วงหลังนี้บน GitHub โค้ดกำลังพัฒนาไปสู่รูปแบบที่ผสมกันระหว่างภาษาอังกฤษกับโค้ด และ ภาษาอังกฤษในฐานะภาษาสำหรับการเขียนโปรแกรม ก็กำลังแพร่หลายอย่างรวดเร็ว
- Hugging Face และบริการลักษณะเดียวกันทำหน้าที่เป็น 'GitHub' ของ Software 2.0 และเป็นผู้นำระบบนิเวศโมเดลโอเพนซอร์ส
LLM คือระบบปฏิบัติการ (OS) แบบใหม่
- LLM กำลังพัฒนาไปไกลกว่าการเป็นเพียง API หรือยูทิลิตี สู่การเป็น แพลตฟอร์มที่ซอฟต์แวร์หลากหลายสามารถทำงานอยู่บนมันได้เหมือนระบบปฏิบัติการ
- ปัจจุบันการใช้งาน LLM ยังมีลักษณะคล้ายยุคเมนเฟรมในทศวรรษ 1960 โดยอยู่ใน โครงสร้างแบบรวมศูนย์ที่ยึดคลาวด์เป็นหลัก
- ในระยะยาวก็มีการกล่าวถึงความเป็นไปได้ของ ยุค LLM ส่วนบุคคล (ใช้งานแบบกระจายตัว·โลคัล)
- สภาพแวดล้อมการใช้งาน LLM คล้ายกับเทอร์มินัลและอินเทอร์เฟซบรรทัดคำสั่งแบบดั้งเดิม แต่ GUI แบบอเนกประสงค์ยังพัฒนาได้ไม่เต็มที่
ความสามารถและข้อจำกัดของ LLM
- LLM มี ความสามารถด้านความจำขนาดใหญ่และการเรียนรู้ความรู้ แต่ก็มี ข้อบกพร่องเฉพาะตัวอย่างฮัลลูซิเนชัน (ข้อมูลเท็จ), การหลงลืมบริบท, ช่องโหว่ด้านความปลอดภัย
- ‘บริบทการทำงาน (working memory)’ ของ LLM ยังต้องให้มนุษย์จัดการอย่างชัดเจน และความสามารถในการเรียนรู้บริบทระยะยาวยังไม่ดีพอ
- ยังมี ความเสี่ยงจริงจัง เช่น ความปลอดภัยและ prompt injection จึงต้องใช้งานด้วยความระมัดระวัง
ความอัตโนมัติบางส่วน (Partial Autonomy) และการทำงานร่วมกันระหว่างมนุษย์กับ LLM
- แอปที่อิงกับ LLM อย่าง Cursor, Perplexity กำลังพัฒนาไปสู่แนวคิด ‘ตัวเลื่อนระดับความอัตโนมัติ’ ที่ผสานการควบคุมแบบแมนนวลเดิมเข้ากับระบบอัตโนมัติของ LLM เพื่อให้ผู้ใช้ปรับระดับการควบคุม/การมอบหมายให้ AI ได้
- การ audit ผ่าน GUI และวงจรการตรวจสอบอย่างรวดเร็ว รวมถึง ‘วิธีการควบคุม AI ให้อยู่ในกรอบสั้น ๆ’ เป็นสิ่งจำเป็นในการทำงานจริง
- มีการคาดการณ์ว่าซอฟต์แวร์ ผลิตภัณฑ์ และบริการทั้งหมดจะ ค่อย ๆ เสริมความเป็น ‘อัตโนมัติบางส่วน’ มากขึ้น
กรณีใช้งานจริงและวัฒนธรรม ‘Vibecoding’
- วัฒนธรรม ‘Vibecoding’ ที่ใคร ๆ ก็สามารถสร้างแอปผ่าน LLM ได้เองด้วยภาษาอังกฤษกำลังแพร่หลาย
- Karpathy ยังเล่าประสบการณ์ที่เขาสร้างแอป iOS ด้วยภาษา Swift ซึ่งตนไม่มีประสบการณ์ในการเขียนมาก่อน ภายในเวลาเพียงวันเดียว และต่อยอดไปสู่บริการจริง
- แม้ LLM จะช่วยให้การสร้างต้นแบบจริงทำได้ง่าย แต่ การทำให้เป็นบริการจริง (ยืนยันตัวตน การชำระเงิน การดีพลอย ฯลฯ) ยังคงติดคอขวดที่งานแมนนวลและ DevOps
- ต่อจากนี้โจทย์สำคัญคือการออกแบบ ‘ซอฟต์แวร์/เอกสารที่เป็นมิตรต่อเอเจนต์’ เพื่อให้ส่วนที่ก่อนหน้านี้มนุษย์ต้องคลิกหรือตั้งค่าด้วยตัวเองสามารถถูก ‘เอเจนต์’ ทำแทน ได้
การเปลี่ยนแปลงของเอกสาร·โครงสร้างพื้นฐาน และความเป็นมิตรต่อเอเจนต์
- เอกสารแบบเดิมที่เน้นมนุษย์เป็นศูนย์กลาง (การคลิก ลำดับขั้นตอน ฯลฯ) ใช้งานโดยตรงกับ LLM·เอเจนต์ได้ยาก จึงจำเป็นต้องปรับโครงสร้างใหม่ให้อยู่ในรูปแบบ Markdown และคำสั่ง
- Versell, Stripe และบริษัทอื่น ๆ ได้เริ่ม ปรับเอกสารให้เป็นมิตรต่อเอเจนต์ (เช่น คำสั่ง
curl) แล้ว
- เครื่องมือต่าง ๆ เช่น GitHub Ingest, DeepWiki ช่วย แปลงโค้ดรีโพซิทอรีและเอกสารให้อยู่ในรูปแบบที่ LLM นำไปใช้งานได้ทันที
บทสรุปและแนวโน้ม
- ตอนนี้คือช่วงเวลาที่ดีที่สุดในการเขียนโค้ดใหม่จำนวนมหาศาลและเขียนของเดิมขึ้นมาใหม่
- LLM จะทำงานร่วมกับนักพัฒนามนุษย์ในฐานะ ‘เครื่องมือเสริม (ชุดเกราะ Iron Man)’ และนวัตกรรมแบบค่อยเป็นค่อยไปสู่ความอัตโนมัติเต็มรูปแบบจะดำเนินต่อไป
- มีแนวโน้มว่า กระบวนการค่อย ๆ เพิ่มระดับของ ‘ตัวเลื่อนความอัตโนมัติ’ ตลอด 10 ปีข้างหน้า จะเป็นเทรนด์สำคัญ
- นักพัฒนาและองค์กรต้องเร่งออกแบบซอฟต์แวร์ เอกสาร และโครงสร้างพื้นฐานใหม่ให้เหมาะกับ LLM·เอเจนต์
2 ความคิดเห็น
วิดีโอนี้ดีมาก! เขาพูดถึงประโยคที่ Andrew Ng เคยบอกว่า "AI Is the New Electricity" แล้วก็อธิบายว่าถ้า ChatGPT ที่มีคนใช้ 800 ล้านคนล่ม มันก็ไม่ต่างจากไฟฟ้าดับเลย ซึ่งฟังแล้วรู้สึกเห็นภาพมากจริง ๆ
ความคิดเห็นจาก Hacker News
software 2.0หรือsoftware 3.0นำมาได้นั้นจำกัดมาก อีกทั้งยังมองว่าโค้ดแบบเดิมและพรอมป์ต์จะยังคงเป็นเครื่องมือที่ใช้เสริมกัน ไม่ใช่ว่าอย่างใดอย่างหนึ่งจะเป็นคำตอบที่สมบูรณ์แบบ