4 คะแนน โดย kokogo 2026-02-19 | 5 ความคิดเห็น | แชร์ทาง WhatsApp

ปัจจุบันผมได้พัฒนาฟังก์ชันที่ให้บริการข่าว/ข้อมูลจาก 32 ประเทศ และสแนปช็อตรายวันของประเทศหลัก (สหรัฐฯ ญี่ปุ่น สหราชอาณาจักร เกาหลีใต้) รวมถึงตลาดคริปโต/ฟิวเจอร์ส ผ่าน MCP(Model Context Protocol) แล้ว ขณะนี้กำลังพัฒนาโปรแกรมการลงทุนที่สามารถทำงานได้อย่างอิสระ คล้ายกับ OpenClaw โดยต่อยอดจากสิ่งนี้

มีอยู่สองประเด็นที่ผมกำลังคิดหนักอยู่

  1. การอยู่ร่วมกันของ 'อิสระของ AI' และ UI ฝั่งฟรอนต์เอนด์
    ผมกำลังพัฒนาโดยยึดแนวทางว่า จะยังคงมี UI และฟังก์ชันที่กำหนดไว้ล่วงหน้าแบบซอฟต์แวร์ดั้งเดิมเป็นพื้นฐาน แต่ในขณะเดียวกันก็ทำให้แต่ละฟังก์ชันเป็น API เพื่อให้ IDE หรือ AI สามารถเข้าใจและควบคุมได้อย่างสมบูรณ์ สุดท้ายแล้วผมคิดว่า การพัฒนาซอฟต์แวร์ในอนาคตจะมุ่งไปที่ว่า AI สามารถขยายและรันความสามารถต่าง ๆ ได้อย่างอิสระแค่ไหน หรือก็คือจะโฟกัสที่ 'อิสระของ AI' มากขึ้น อยากทราบความเห็นของทุกคนครับ

  2. การเปลี่ยนแปลงของประสบการณ์ผู้ใช้: ยุคของ "ช่วยทำอันนี้ให้หน่อย"
    ต่อไปผู้ใช้น่าจะคาดหวังว่าจะได้ผลลัพธ์ที่ต้องการ เพียงแค่สั่งง่าย ๆ ว่า "ช่วยทำอันนี้ให้หน่อย" แม้แต่ฟังก์ชันที่นักพัฒนาไม่ได้กำหนดไว้ล่วงหน้า ผมก็มองว่า AI ก็ควรค้นหาข้อมูลบนอินเทอร์เน็ตหรือเขียนโค้ดเองเพื่อเติมเต็มความต้องการของผู้ใช้ด้วย (เช่น ต่อให้เป็นโปรแกรมด้านกฎหมาย หากผู้ใช้ต้องการ ก็ช่วยจองตั๋วเครื่องบินได้ในระดับนั้น)

หากเทคโนโลยีควรมอบความสะดวกสบายสูงสุดให้ผู้ใช้ พวกเรานักพัฒนาควรคิดเรื่อง 'ฟังก์ชันแบบปิด' ไปจนถึงระดับไหน และควรผลักดัน 'ความสามารถในการขยายแบบเปิด' ไปได้ไกลเพียงใดกันแน่? ช่วงนี้ยิ่งได้เห็นการมาของเอเจนต์อย่าง OpenClaw ก็ยิ่งทำให้คิดหนักมากขึ้นครับ

5 ความคิดเห็น

 
pjoonmo79 2026-04-05

กรณีข้อ 1 ผมกำลังทดสอบอยู่
ผลคือเมื่อประสบการณ์ความล้มเหลวสะสมมากขึ้น ก็เริ่มตั้งข้อจำกัดให้ตัวเอง

 
pjoonmo79 2026-04-05

ขอเสริมนิดหนึ่ง ตอนนี้ผมอยู่ในขั้นที่ใช้ Hallucination เป็นเอนจินสำรวจช่องทางการส่งผ่าน

 
runableapp 2026-03-27
  1. โดยส่วนใหญ่แล้วโครงสร้างที่แยก UI กับ API ออกจากกันมีอยู่แล้ว จึงดูว่าแม้ในอนาคตจะมุ่งไปสู่ AI เป็นศูนย์กลางก็ไม่น่าจะมีความยากลำบากมากนัก ผมคิดว่าการขยายความสามารถนั้นขึ้นอยู่กับว่าจะมองจากมุมไหน --
    (a) การขยายความสามารถของแอปเดิมให้มากขึ้น
    (b) การขยายความสามารถด้วยการนำ API ของบริการต่าง ๆ ที่เดิมเป็นงานที่ 'มนุษย์' ทำอยู่แล้วมาผสมกัน

สำหรับ (a) ตอนนี้ยังไม่ค่อยเชื่อมั่นพอที่จะปล่อยให้ AI ขยายความสามารถได้ตามใจชอบ
ส่วน (b) เพราะเป็นสิ่งที่ถูกควบคุมไว้ จึงยังพอดูดีกว่าอยู่บ้าง

  1. ตัวแนวคิดแบบ "ช่วยทำอันนี้ให้หน่อย" เอง ในมุมของผู้บริโภค สุดท้ายแล้วก็หวังว่าจะไปถึงจุดนั้นได้ (เหมือนในหนัง Her) แต่เมื่อดูจากหลายกรณี ตอนนี้ก็ยังน่ากังวลเกินกว่าจะปล่อยให้ทำอะไรได้ตามใจแบบนั้น

อย่างไรก็ตาม ผมไม่คิดว่า 'โปรแกรมกฎหมายไปจองตั๋วเครื่องบิน' จะเป็นเรื่องที่เกิดขึ้นแน่นอน เพราะถ้าเป็นแบบนั้นมันก็ไม่ใช่โปรแกรมกฎหมายอีกต่อไป แต่จะกลายเป็น Her OS แบบอเนกประสงค์แทน เช่นเดียวกับที่มนุษย์แบ่งองค์กรและความรับผิดชอบออกจากกันด้วยเหตุผลบางอย่าง ผมคิดว่าการเขียนโปรแกรม/สถาปัตยกรรมก็ถูกแบ่งออกมาแบบนั้นด้วยเหตุผลเดียวกัน แนวคิดที่จะทำให้ระบบรู้ความต้องการของผมอย่างแท้จริง แล้วจัดการทุกอย่างให้ตรงใจผมทั้งหมดนั้น ดูคล้ายกับแนวคิดเรื่องดิจิทัลโคลน

การสั่งว่า "ช่วยทำอันนี้ให้หน่อย" นั้นควรเป็นเหมือนเลขาส่วนตัวที่รู้จักผมมานาน จนไม่ต้องอธิบายอย่างเป็นรูปธรรมและละเอียดมากนัก (เหมือนแนว spec-driven ที่ถูกพูดถึงกันมากตอนนี้) แต่ถึงจะผ่านกระบวนการสแกนทุกอย่างของผมเพื่อสะสมความรู้และความทรงจำ สุดท้ายก็ยังเกิดความผิดพลาดได้อยู่ดี (ใน Her ก็มีฉากที่ตอนตั้งค่าเริ่มต้น ระบบตรวจอีเมลและข้อมูลทั้งหมดของผู้ใช้) -- และประเด็นคือมันต้องตรวจจับและคัดกรองความผิดพลาดนั้นได้ดีแค่ไหน หรืออย่างน้อยต้องรู้วิธีแก้ไขความผิดพลาดนั้น ซึ่งตอนนี้ดูเหมือนว่ายังอีกไกล คุณลองให้คนทำงานดูแล้วจะเข้าใจ แม้แต่คนที่ทำงานด้วยกันมา 10 ปี 20 ปี ก็ยังไม่เข้าใจเจตนาของผมได้อย่างแม่นยำเสมอไป หรือบางคนที่ไม่ค่อยมีไหวพริบก็ยังไม่เข้าใจและผิดพลาดซ้ำ ๆ ... ในเมื่อคนยังเป็นแบบนี้ ผมจึงคิดว่าควรยกระดับ AI ที่เหมือน momento และไม่มีความรับผิดชอบ ให้ขึ้นมาอยู่ในระดับใกล้เคียงกับมนุษย์ก่อน

ถ้าจะไปในทิศทางของการขยายตัวแบบเปิดที่คุณพูดถึงก็คงดี แต่แบบนั้นมันต้องเป็น AI ผู้ช่วยส่วนตัวอเนกประสงค์จริง ๆ (และอย่างที่ท่านอื่นเขียนไว้ข้างบน เครื่องปิ้งขนมปังก็ไม่ควรไปทำงานอย่างอื่น) และต้องเรียนรู้ผู้ใช้อย่างต่อเนื่องผ่านปฏิสัมพันธ์กับผู้ใช้ ผมไม่ได้หวังให้รถยนต์มาจัดทำรายงานภาษี เรื่องนี้กับคนก็เหมือนกัน ถ้าคุณมอบหมายงานอย่างหนึ่งให้พนักงาน แต่เขากลับไปทำอย่างอื่นเพิ่ม นายจ้างอาจดีใจก็ได้ แต่ส่วนใหญ่ผมคิดว่าน่าจะกังวลมากกว่า

 
mammal 2026-02-19
  1. เอกสารที่ชัดเจนและการเข้าถึงที่ออกแบบมาอย่างดีจะเป็นฝ่ายชนะในท้ายที่สุด ถึงไม่ต้องโฟกัสที่อิสระของ AI มากนัก การเข้าถึงที่ออกแบบมาอย่างดีก็เข้าใจได้ง่ายทั้งสำหรับมนุษย์และ AI

  2. ไม่ครับ ต้องยึดหลักสิทธิ์เท่าที่จำเป็นอย่างเคร่งครัด ผมอยากให้เครื่องปิ้งขนมปังของผมมีหน้าที่แค่ปิ้งขนมปัง ไม่ใช่เชื่อมต่ออินเทอร์เน็ตไปสรุปข่าวแล้วรัน Doom

 
jeeeyul 2026-02-19

ในเชิงปรัชญา ผมขอแนะนำทฤษฎี Extended Mind ของ Andy Clark น่าจะช่วยให้เข้าใจได้ลึกซึ้งว่าการที่ LLM ซึ่งมีแค่ความน่าเชื่อถือผิวเผิน ขยายออกไปเป็นการรับรู้ผ่านเครื่องมือนั้นเกิดขึ้นอย่างไร

ในทางปฏิบัติ OpenCode เปิดเผยทุกส่วนของการประกอบเอเจนต์ไว้แล้ว จึงน่าจะเป็นประโยชน์ครับ

ข้อ 2 เป็นความจริงไปแล้ว หนึ่งในเครื่องมือที่ถูกมอบให้ก่อนที่สุดก็คือ code interpreter ดังนั้นความเห็นของผมต่อเอเจนต์เฉพาะโดเมน สุดท้ายแล้วก็เป็นเกมเก็งกำไรระยะสั้นที่กำลังจะสลายไป

สำหรับโดเมนที่คุณกำลังทำอยู่ ผมคิดว่าการให้ traditional ML ผ่าน MCP น่าจะเหมาะกว่า เพราะ language model ไม่ได้มีความได้เปรียบเลยในการวิเคราะห์แพตเทิร์นหรือการพยากรณ์เชิงเส้น

ดูเหมือนไม่จำเป็นต้องฝืนออกแบบ tool symmetry โดยอิงกับ UI ของมนุษย์ เพราะอย่างไรเสีย webMCP หรือ MCP แบบอัตโนมัติที่อิง GDI ซึ่งตัวเอเจนต์ตีความและควบคุม UI ได้โดยตรง ก็กำลังจะมาถึงในเวลาอันสั้น เนื่องจากยังต้องใช้งานระบบ legacy จำนวนมากที่สร้างมาเพื่อมนุษย์ หากเป็นเอเจนต์ที่อิง LLM และมี native multimodal อยู่แล้ว นักพัฒนาก็คงไม่จำเป็นต้องลำบากแปล GUI ให้เป็น MCP อีกต่อไป แพลตฟอร์มอย่าง iOS ที่มีอำนาจควบคุม GUI ระดับ foundation สูง อาจเริ่มได้ทันทีตั้งแต่เวอร์ชันถัดไปเลยก็ได้

ถ้าเป็นแบบนั้น แค่ติดตั้งแอปหุ้นอะไรก็ได้ คุณก็น่าจะมอบหมายให้เอเจนต์ลงทุนแทนได้เลย