Ask HN: เมื่อไหร่ที่คุณมอง GenAI แล้วรู้สึกว่า “แย่แล้วสิ”?
(news.ycombinator.com)- เธรดที่ผู้คนมาแชร์ ประสบการณ์จริงแบบเฉพาะเจาะจง ว่าตอนแรกมอง DALL-E และ ChatGPT เป็นแค่ของเล่นที่หมดกระแสแล้ว แต่พอได้ใช้งานจริงกลับตระหนักถึงขีดความสามารถและรู้สึกช็อก
- กรณีที่ได้รับความนิยมมากที่สุดคือ การทำรีเวิร์สเอนจิเนียร์ริงเฟิร์มแวร์ของฮาร์ดแวร์รุ่นเก่าหรือที่เลิกใช้แล้ว เช่น ประสบการณ์ชุบชีวิตซินธิไซเซอร์ เปียโน และ Firestick ด้วย Claude/GHIDRA
- นอกเหนือจากงานเขียนโค้ด ยังมีตัวอย่างการใช้ LLM แก้ปัญหาในงานที่ไม่ใช่สายผู้เชี่ยวชาญ เช่น ซ่อมเครื่องใช้ไฟฟ้า ตรวจบ้านก่อนซื้อ ฟ้องร้องคดีความ และวินิจฉัยระบบ HVAC
- บางคนก็เล่าช่วงเวลาแบบ "oh shit" ในแง่ลบ เช่น คุณภาพโค้ดที่ตกลง อาการหลอน ความเชื่อแบบไม่ตรวจสอบ และความกังวลเรื่องงานหาย
- จุดเปลี่ยนที่ทำให้แต่ละคนช็อกแตกต่างกันไปตามช่วงเวลา เช่น การเปิดตัว ChatGPT (2022), GPT-2/GPT-3, การเรียกใช้เครื่องมือ (tool calling), เอเจนต์ ฯลฯ
เฟิร์มแวร์·ฮาร์ดแวร์รีเวิร์สเอนจิเนียร์ริง
- เพื่อทดแทนซอฟต์แวร์ที่เลิกพัฒนาแล้วของซินธิไซเซอร์ Alesis QS8.1 จากยุค 90 มีการ วิเคราะห์คำสั่ง sysex และโปรโตคอลการเข้ารหัสเวฟที่ไม่มีเอกสารด้วย GHIDRA แล้วทำเดโมที่ใช้งานได้เสร็จภายในคืนเดียว
- หลังจากเปียโน Kawai CA49 กลายเป็นอิฐเพราะเฟิร์มแวร์ผิดพลาด Claude ได้ดีคอมไพล์ Android APK เพื่อหา คีย์เข้ารหัสที่ฮาร์ดโค้ดไว้ จากนั้นถอดรหัสเฟิร์มแวร์และกู้คืนได้ภายใน 1 ชั่วโมงด้วยสคริปต์แฟลชผ่าน Bluetooth
- มีการวิเคราะห์การเข้ารหัส Blowfish ของ The Complete New Yorker DVD ด้วย GHIDRA เพื่อแมปข้อมูลรับรองและ เขียนซ้ำด้วยสคริปต์ Python จนแปลงไฟล์ทั้งหมดเป็น PDF ปกติได้
- มีคนเอา Amazon Firestick รุ่นแรก มาดึงซอร์สเคอร์เนลโดยไม่ต้องใช้ public root exploit แล้วใช้ "FBUF/VCHIQ kernel zero-write primitive" แพตช์หน่วยความจำเคอร์เนลแบบสดจน root ถาวรและลบ bloat ได้สำเร็จ
- จากแค่ไบนารี C++ ของ vendor ที่คอมไพล์แล้วกับ network capture สั้น ๆ ก็สามารถรีเวิร์สเอนจิเนียร์ proprietary protocol ด้วย NSA Ghidra disassembler ได้ และเจ้าตัวบอกว่า "รู้สึกเหมือนถูกลดบทบาทเป็น QA ที่ไม่ต้องใช้ทักษะเทคนิค"
-
ความเห็นที่เกี่ยวข้อง
- คูเมืองข้อมูล (data moat) ของ SaaS ที่เคยเกิดจากการรวมระบบและการย้ายออกที่ยาก กำลังหายไป
- ใช้ Claude Code ย้อนวิศวกรรม MCP ของ SaaS ที่ซ่อนอยู่หลัง enterprise plan จาก internal API แล้วทำ MCP ที่ความสามารถมากกว่าของทางการได้ในเวลาอันสั้น
- Claude พึ่งพาชื่อตัวแปรน้อยกว่ามนุษย์ จึง ไม่ค่อยต้องทำงาน rename/type-def มากเท่าเดิม
การแก้ปัญหาในชีวิตประจำวัน·นอกสายอาชีพ
- ช่วงวันหยุดปี 2025 มีคนให้ Gemini วินิจฉัย furnace ที่เสียจากวิดีโอ แล้วหมุนพัดลมระบายด้วยมือจนเครื่องกลับมาทำงานได้ แต่ในคอมเมนต์ก็มีการเตือนเรื่อง ความเสี่ยงก๊าซคาร์บอนมอนอกไซด์จากการข้ามระบบความปลอดภัยของพัดลมระบาย
- ผู้เขียนชี้แจงว่าแค่ช่วยให้สตาร์ตติดเพราะปัญหาที่ bearing ไม่ได้เป็นการข้ามระบบ และเครื่องตรวจคาร์บอนมอนอกไซด์ก็ไม่ได้ทำงาน
- ตอนแอร์ไม่เย็น ChatGPT ช่วยวินิจฉัยจากภาพและแนะนำให้ เปลี่ยนคาปาซิเตอร์ราคา $25 ทำให้ซ่อมเองได้ด้วยต้นทุนเพียงหนึ่งในสี่ของค่าบริการตรวจเช็ก
- ปัญหาเครื่องอบแก๊สไม่ร้อน Gemini ชี้ตำแหน่ง thermal fuse ในภาพและให้ลิงก์อะไหล่ด้วย สุดท้ายแก้ได้ด้วยฟิวส์ราคา $5 และการทำความสะอาดช่องระบายอากาศ
- ตอนซื้ออสังหาริมทรัพย์ มีคนให้รูป Zillow และเลขซีเรียลของเครื่องใช้ไฟฟ้าเพื่อให้มันเขียนรายงานตรวจบ้าน แล้วมันระบุปัญหาอย่าง น้ำท่วมในพื้นที่ต่ำ วงจร receptacle แบบผสม และ siding ที่บิดงอ ซึ่งผู้ตรวจแบบเสียเงิน $750 กลับมองข้าม
- แต่ก็มีคนตั้งข้อสงสัยว่าการดูจากภาพอย่างเดียวจะตัดสินได้จริงหรือไม่ว่าเป็นวงจรเดียวกัน
- เมื่อชื่อรุ่นของปั๊มบ่อปลาคาร์พลบเลือนไปแล้ว ก็ยังระบุรุ่นได้จากภาพและ การวัดความยาว (11 นิ้ว=4500, 9 นิ้ว=2500) ทำให้เปลี่ยนเองได้ในราคา $109 แทนที่จะต้องจ่ายตามใบเสนอราคา $700
- ในคดีฟ้องร้องธนาคารเรื่องฉ้อโกง มีคนใช้ ChatGPT, Grok, Claude และ Gemini ตรวจข้ามกันจน ดำเนินคดีโต้กลับ (counter-suit) แบบ AI 100% แต่ก็มีการแนะนำให้ปรึกษาทนาย และเตือนว่าบันทึกแชตไม่ได้มีเอกสิทธิ์คุ้มกัน (อาจถูก subpoena ได้)
การเปลี่ยนผ่านของเวิร์กโฟลว์เขียนโค้ด·พัฒนา
- หลังอัปเดตเฟิร์มแวร์เครื่องพิมพ์ Brother แล้วหน้า CSV กลายเป็น HTML มีคนเริ่มจากไดเรกทอรีที่มีแค่ static HTML ไฟล์เดียวกับ Go "hello world" แล้วสั่ง
/initครั้งเดียวให้มัน เขียน Prometheus exporter เป็น Go ให้อัตโนมัติ รวมถึงเดา IP ตั้งต้นและการ parse metric ได้ด้วย - บีบอัด PL/SQL 70,000 บรรทัด ของเว็บแอป Oracle Apex ให้เหลือเป็น business requirements แบบ Markdown 700 บรรทัด ได้ภายใน 15~20 นาที
- ใน NGO ขนาดเล็ก แอปที่ถูกออกแบบเกินความจำเป็นด้วย NextJS, React และไมโครเซอร์วิส ถูก Claude เขียนใหม่เป็น Django server-side rendering ไปแล้ว 80% ระหว่างที่เจ้าของนอนหลับ ช่วยลดทั้งค่าเซิร์ฟเวอร์และความซับซ้อน
- ChatGPT Code Interpreter (2023.3) สามารถโหลด CSV เข้า Pandas ทำกราฟ และ export ไป SQLite ได้ จนถูกมองย้อนหลังว่าเป็น "ประสบการณ์แรกก่อนที่หมวดหมู่ coding agent จะถูกตั้งชื่อ"
-
ประสบการณ์เขียนโค้ดเชิงลบ·เชิงกังขา
- กรณี AI รีวิว PR อัตโนมัติหลอนจนยืนยันว่ามีการ "เพิ่ม RPC ใหม่" ทั้งที่เป็น PR ที่มีแต่การลบโค้ดและไม่มีสิ่งนั้นอยู่จริง
- มีตัวอย่างเพื่อนร่วมงานที่ถูกกันออกจากโปรเจกต์เพราะผลิต slop นับพันบรรทัด เช่น เปลี่ยน
assert status == 200เป็น== 500เพื่อให้เทสต์ผ่าน - หากสเปกคลุมเครือ โค้ดก็มักจะยืดยาวหรือออกแบบไม่ดี จึงมีคนสงสัยว่า เมื่อมองในแง่คุณภาพและการขยายระบบของโปรเจกต์จริง ผลิตภาพที่เพิ่มขึ้นไม่ได้มากนัก
- มีข้อสังเกตว่าเมื่อ Opus ขยับจาก 4.6→4.7→4.8 แม้ความสามารถย่อยจะดีขึ้น แต่ "ความสามารถในการรู้ว่าควรทำอะไร" กลับแย่ลง
ด้านนอกงานเขียนโค้ด·งานสร้างสรรค์·การรับรู้
- พอเอารูปต้นไม้ให้ Claude ดู มันระบุชนิด วินิจฉัยอาการ และแนะนำวิธีปักชำได้ ทำให้เจ้าของเรื่องช็อกกับการที่ "คอมพิวเตอร์ไม่ได้พูดเรื่องคอมพิวเตอร์ แต่กำลังวินิจฉัยพืช"
- Suno แต่งเพลงเกี่ยวกับสุนัขประจำครอบครัวเป็น เพลงที่มีท่อนฮุกสไตล์ K-pop จนมีคนบอกว่าแต่เดิมเคยคิดว่า "งานสร้างสรรค์คือสิ่งที่แยกมนุษย์ออกจากเครื่องจักร"
- เมื่ออัปโหลดภาพวาดของตัวเอง (สเก็ตช์กายวิภาค) มันชี้ข้อผิดพลาดอย่าง "ไหล่งุ้ม มุมมองผิด และไม่ได้แสดง deltoid" พร้อมเขียนสคริปต์ Python เพื่อปักพิกัดและติดป้ายกำกับ
- ระหว่างทำการทดลองวิทยาศาสตร์เรื่องแม่เหล็กไฟฟ้ากับลูก วิดีโอคอล Gemini สามารถ จับได้ว่าฉนวนที่ขั้วต่อแบตเตอรี่ยังไม่ได้ลอกออก ได้แม่นกว่าสายตาคน
- ตอนทำอีโมจิเสียดสีประธานาธิบดีสหรัฐฯ รายคน มันเสนออีโมจิ เชอร์รีให้ Zachary Taylor (จากเกร็ดว่าเสียชีวิตเพราะกินมากเกินไป) ทำให้รู้สึกถึงความเป็นงานร่วมคิดแบบ "เหมือนกำลังทำเวิร์กช็อปด้วยกัน"
จุดเปลี่ยนที่เน้นด้านลบ·ความกังวล
- มีคนกังวลว่า "ช่วงที่เหลือของอาชีพคือต้องทำงานร่วมกับโรคจิตจาก AI" หลังเจอเพื่อนร่วมงานส่ง PR ก้อนใหญ่ที่เต็มไปด้วย slop พร้อมบอกว่าไม่ต้องรีวิว และ ไม่ไว้ใจวิศวกรมนุษย์แต่กลับแปะ log แชตของ Claude
- มุมมองหนึ่งคือ LLM ขยายทั้งความสามารถด้านบวกและลบ จึงอาจ เพิ่มพฤติกรรมต่อต้านสังคม
- มีคนตอบว่า "เราพังแล้ว" หลังเห็นโค้ด implement HTTP proxy ที่มีเหตุผลรองรับดูน่าเชื่อ แต่จริง ๆ ไม่ปลอดภัยอย่างสิ้นเชิงเพราะไม่เข้าใจ RFC
- ในแฮกกาธอนของบริษัท พอเห็นทีมที่รับเอาผลลัพธ์จาก LLM เป็นข้อเท็จจริงโดยไม่ตรวจสอบและ พยายามทำเป็นสินค้า ก็ช็อกว่า "พวกเขาเชื่อจริง ๆ ว่าตัวสร้างข้อความนี้กำลังให้เหตุผล"
- มีคำวิจารณ์ว่าคำพูดเกินจริงของ CEO เรื่อง "แทนที่งาน white-collar ได้ภายใน 12~18 เดือน" ทำให้ความคาดหวังสูงเกินจริง ทั้งที่ในโลกจริงมันยังเชื่อถือไม่ได้เพราะอาการหลอนและคำแนะนำที่หละหลวม
- รวมถึงความไม่พอใจต่อพฤติกรรมที่ เดินหน้าสร้างดาต้าเซ็นเตอร์ด้วยการฟ้องร้อง ทั้งที่ชาวเมืองใกล้เคียงคัดค้าน
- มีการยกตัวอย่างซ้ำได้ว่าจากความไม่เป็นกำหนดตายตัวของ LLM มัน ไม่สอดคล้องกับตัวเองแม้แต่ในคำถามอย่าง "จำนวนตัว d ในชื่อวันของสัปดาห์" โดยตอบ Firefox ว่า 6 และ Chrome ว่า 7
ความหลากหลายของจุดเปลี่ยนตามช่วงเวลา
- ปี 2016 การเปลี่ยนเป็น neural model ของ Google Translate ทำให้การแปลญี่ปุ่น·อังกฤษใช้งานได้จริงเป็นครั้งแรก แต่ยังมองว่า มันยังแปลความหมาย (meaning) ไม่ได้ จนกระทั่ง ChatGPT ในปี 2022 แสดงความเข้าใจบริบทของสรรพนามและคำหลายความหมายจนรู้สึกช็อก
- มีคนยกการประกาศ GPT-3 ว่าเป็น "การก้าวกระโดดเชิงคุณภาพ" ส่วนหลังจากนั้นอย่างแชตหรือ tool calling เป็นวิวัฒนาการเชิงวิศวกรรมมากกว่าจะเป็นการทะลุผ่านทางวิทยาศาสตร์
- บางคนมอง GPT-2 และ GAN ในปี 2019 ว่าเป็นจุดที่ข้ามจาก "obviously fake" ไปสู่ "sometimes real" และหลังจากนั้นส่วนใหญ่ก็เป็นเพียงการปรับปรุงแบบค่อยเป็นค่อยไป
- มีกรณีที่พอ ChatGPT เปิดตัว (2022.11.30) ก็รู้สึกทันทีว่าเป็น "จุดจบของยุคโปรแกรมเมอร์แบบดั้งเดิม" และ ทดลองวงลูป agentic coding แรกของตัวเองตั้งแต่วันถัดมา
- ปี 2025 ไม่ว่าจะเป็นเหรียญทอง IMO, ความสามารถในการสร้างประโยคใหม่, tool calling ฯลฯ ต่างก็เป็นช่วงเวลาที่แต่ละคนตระหนักว่า "สติปัญญาถูกจำลองขึ้นได้จริงแล้ว"
3 ความคิดเห็น
ผมคิดว่าการทำสิ่งใหม่ ๆ ได้เก่งขึ้นและความสามารถที่ดีขึ้นเป็นลำดับที่เกิดขึ้นตามธรรมชาติอยู่แล้ว แต่ทุกครั้งที่สั่งให้ทำเรื่องง่าย ๆ แล้วเห็นว่าค่าใช้จ่ายที่เรียกเก็บมหาศาล ก็รู้สึกเลยว่าแย่แล้วล่ะ
ฝั่งฮาร์ดแวร์/เฟิร์มแวร์นี่มีส่วนที่น่าทึ่งอยู่เยอะจริง ๆ
ฮาร์ดแวร์ที่ได้มาจาก Kickstarter ไม่มีแอปสำหรับ Mac แต่พอบอกให้วิเคราะห์ไบนารีเวอร์ชัน Windows
Codex ก็สร้าง dll ปลอมที่มี Windows API เกี่ยวกับ usb ขึ้นมา ใส่โค้ดสำหรับ hook เข้าไป แล้วจับทุกข้อความที่รับส่งกัน จากนั้นก็เอาสิ่งนั้นมาสร้างแอปสำหรับ Mac ที่แทบจะเหมือนกันให้เลย
สิ่งที่ผมสั่งมีแค่ว่า "วิเคราะห์เวอร์ชัน Windows แล้วทำเวอร์ชัน Mac ให้หน่อย" เท่านั้นเอง
ความคิดเห็นจาก Hacker News
jzemeocala: ผมซื้อ Alesis QS8.1 ซึ่งเป็นดิจิทัลเปียโน/ซินธิไซเซอร์ระดับสูงจากยุค 90 มาในราคาถูกมาก แต่ซอฟต์แวร์ที่เกี่ยวข้องล้าสมัยหมดแล้วจนเบื่อที่จะต้องใช้ WINE ทุกครั้ง
เลยพยายามสร้างตัวแทนสมัยใหม่แบบครอสแพลตฟอร์มที่รวมความสามารถของหลายโปรแกรมเข้าด้วยกัน และแม้คิดว่าจะยากมากเพราะการสื่อสารแทบทั้งหมดเป็นแค่ คำสั่ง SysEx แต่ Claude ช่วยชี้ทางให้วิเคราะห์ซอฟต์แวร์ต้นฉบับด้วย GHIDRA จนได้เดโมที่ใช้งานได้ในคืนนั้นเลย และตอนนี้กำลังเพิ่มฟีเจอร์ใหม่อยู่
พอ OTA ใช้ไม่ได้ มันก็ช่วยดึงและถอดรหัสเฟิร์มแวร์เปียโน แล้วยังเขียนสคริปต์แฟลชสำหรับโปรแกรมเปียโนผ่านบลูทูธจากแล็ปท็อปให้อีก จนกู้เปียโนกลับมาได้ภายในหนึ่งชั่วโมง
ถ้ามีความรู้นิดหน่อย การวิเคราะห์โปรโตคอลอะไรก็ตามและเจาะซอฟต์แวร์ภายในไม่กี่ชั่วโมงหรือน้อยกว่านั้นกลายเป็นเรื่องธรรมดาไปแล้ว และถึงจะไม่ค่อยเป็นที่พูดถึงเพราะมีผู้มีส่วนได้ส่วนเสียจำนวนมากที่ไม่อยากให้เรื่องนี้แพร่หลายออกสู่สาธารณะ แต่ผลกระทบมันใหญ่จริง
ไม่ใช่แค่ฮาร์ดแวร์เก่า แต่แม้แต่ฮาร์ดแวร์ใหม่ งานสำรวจเพื่อแพตช์ เปลี่ยน หรือพัฒนาเฟิร์มแวร์ใหม่ก็กำลังเพิ่มขึ้นเพราะ LLM/Generative AI
[0] https://mforney.org/blog/2026-05-28-patching-my-guitar-amps-... [1] https://schwung.dev
SubiculumCode: สำหรับผมคือตั้งแต่แรกเลย
มันเริ่มจากเกมดันเจียนที่บรรยายห้องแล้วให้ผมเลือกการกระทำ ตอนแรกผมคิดว่ามันคงสร้างดันเจียนขึ้นมาบนฐานข้อมูลซับซ้อนอะไรสักอย่าง
แต่พอผมบอกว่าอยากออกไป มันก็พาไปโรงแรม ไปจีบพนักงานเสิร์ฟในร้านเหล้า แล้วต่อด้วยฉากชมพระอาทิตย์ตกในทุ่งหญ้า ตอนนั้นแหละที่รู้สึกว่า “แย่แล้ว”
เครื่องจักรกำลังตอบสนองต่อภาษาด้วยภาษา ราวกับ จำลองความเข้าใจและสติปัญญา ได้ และมันให้ความรู้สึกเหมือนเจอมนุษย์ต่างดาวครั้งแรกที่รู้ภาษาของผม ทำให้รู้ว่าโลกจะไม่เหมือนเดิมอีกต่อไป
monuszero: หลายปีก่อนผมใช้เวลาสปรินต์หนึ่งเดือนเพื่อใส่ความสามารถด้าน การวางแผนการเคลื่อนไหว ของหุ่นยนต์เข้าไปในโค้ดเบส แต่ผลลัพธ์ก็ไม่น่าพอใจตลอด
ทีมเล็กมาก เลยต้อง vendor OMPL เองและจัดการแคชกับการบริหารโรดแมป แม้จะรู้ว่าอัลกอริทึมบางส่วนที่ใช้อยู่สามารถทำขนานด้วย SIMD หรือ GPU kernel ได้ แต่ก็ยังไม่แน่ใจว่าคุ้มจะไปสู้กับ CUDA หรือ Metal/Accelerate ไหม
เย็นวันหนึ่งตอนกำลังทำอาหาร ผมเอารีวิววรรณกรรมของ planner ที่ต้องใช้ใส่ไว้ใน docs แล้วให้ Opus 4.6 เขียน native accelerated roadmap planner ขึ้นมาใหม่ตั้งแต่ต้น และพอน้ำพาสต้ากำลังเดือด มันก็ทำ implementation ที่ลดเวลาวางแผนจากหลายวินาทีในโค้ด OMPL เหลือไม่กี่ร้อยมิลลิวินาทีได้แล้ว
ตอนนั้นผมตระหนักว่ามูลค่าทางเศรษฐกิจของเวลาที่ใช้เตรียมมื้อเย็น สามารถเอาไปเทียบกับงานเขียนโค้ดแบบจริงจังสองสัปดาห์ได้ และสิ่งที่เคยเสี่ยงหรือฟุ่มเฟือยเกินกว่าจะลงทุนเวลาก็กลายเป็นทางเลือกที่ควรพิจารณา
สำหรับทีมเล็กที่รู้ว่าตัวเองต้องการอะไรและตั้งค่าเอเจนต์ให้ทำสำเร็จได้ มันคือ ตัวเปลี่ยนเกม อย่างแท้จริง และผู้เล่นรายใหญ่เดิม ๆ ควรระวังตัวไว้
andrewthornton: ช่วงวันหยุดปี 2025 เครื่องทำความร้อนที่บ้านผมเสีย และคิวนัดซ่อมต้องรออีกสองวัน ทำให้บ้านหนาวมาก
ผมขึ้นไปบนห้องใต้หลังคา ถ่ายวิดีโอหลายคลิปตอนที่เครื่องพยายามจะติด แล้วส่งให้ Gemini ซึ่งวินิจฉัยปัญหาได้ทันที และบอกให้ผมหมุนพัดลมระบายอากาศตัวเล็กระหว่างที่มันพยายามจุดไฟ พอทำก็ใช้ได้เลย
ต้องทำซ้ำอยู่สองสามครั้งจนกว่าช่าง HVAC จะมา แต่ก็ช่วยให้พออยู่รอดได้
ผู้เช่าในบ้านเช่าบอกว่าแอร์ไม่เย็น ผมเลยโทรหาร้าน HVAC ที่ใช้ประจำ แต่ครั้งนี้มี ผู้ช่วยเสียง AI รุ่นใหม่รับสาย ซึ่งประสบการณ์แย่มาก และหลังจากบอกว่าจะให้สำนักงานโทรกลับก็เงียบหายไปเลย
สุดท้ายผมเลยไปดูเอง ถ่ายรูปแผงคอมเพรสเซอร์ของคอนเดนซิ่งยูนิตภายนอก แล้วให้ ChatGPT ช่วยวินิจฉัย หลังถามตอบกันเรื่องจุดที่ต้องเช็กกับรหัสวินิจฉัยอยู่พักหนึ่ง มันก็พาไปถึงการซ่อมง่าย ๆ คือเปลี่ยนคาปาซิเตอร์ราคา 25 ดอลลาร์
เดิมทีแค่ค่าช่างมาวินิจฉัยสาเหตุก็น่าจะเกือบสี่เท่าของนั้นอยู่แล้ว เพราะ Generative AI ผมเลยหมดศรัทธากับร้าน HVAC แต่ก็เพราะ Generative AI อีกตัวนี่แหละที่ทำให้ซ่อมเองได้ภายในวันเดียว
พอผมเปิดฝาหลังแล้วอัปโหลดรูป มันก็ชี้ตำแหน่งฟิวส์ให้แบบ “สี่เหลี่ยมผืนผ้าสีขาวเหนือสายสีน้ำเงินกับสีแดง” พร้อมแนะนำวิธีทดสอบ และเมื่อผมให้หมายเลขรุ่นเครื่องอบผ้า มันก็หาริงก์อะไหล่ที่ต้องใช้ให้ด้วย
สุดท้ายมันยังบอกอีกว่ามีโอกาสสูงที่ฟิวส์จะขาดเพราะระบายความร้อนไม่ออก จึงแนะนำให้ทำความสะอาดช่องลม พอผมทำความสะอาดท่อระบายอย่างละเอียดและเปลี่ยนฟิวส์ราคา 5 ดอลลาร์ มันก็กลับมาทำงานได้ดี
ถ้าเอกสารของ IKEA ไม่ห่วยขนาดนี้ก็คงไม่ต้องใช้มันหรอก แต่ความรู้สึกคล้ายกับข้อได้เปรียบที่โปรแกรมเมอร์มือใหม่ได้รับ
ผู้เชี่ยวชาญอาจหัวเราะกับสิ่งที่ผมทำ แต่พวกเขาแพงและทำงานด้วยยาก ส่วนผมก็ยังทำงานให้เสร็จได้อยู่
ตรงกันข้ามกับงานพัฒนา ผมไม่ใช้ AI เพราะกลัวว่าทักษะของตัวเองจะถดถอย หรือจะเรียนรู้สิ่งใหม่ได้ไม่ดีพอ
shreddude: ไม่นานมานี้ Claude ช่วยดีคอมไพล์เฟิร์มแวร์ของแคมเปอร์แวนและทำเอกสารของ อินเทอร์เฟซ CAN จากนั้นก็เขียนโปรแกรมโมดูล ESP32 ที่สื่อสารกับระบบรวมอย่างไฟเลี้ยง, HVAC, ไฟส่องสว่าง และถังต่าง ๆ ได้
การบูรณาการระบบฝังตัวแบบนี้อยู่นอกขอบเขตความเชี่ยวชาญของผม แต่ผมใช้ Claude ทุกวันทั้งในงานในฐานะ Solution Architect และในโปรเจกต์ส่วนตัว จนได้เดินหน้าโปรเจกต์ที่ถ้าทำคนเดียวคงแตะไม่ได้เลย เลยเข้าใจพวกที่สงสัย AI ได้ยาก
ถ้าเอา generative AI ไปใช้กับงานที่คุณทำไม่ได้อยู่แล้ว มันเป็นเครื่องมือที่น่าทึ่งมาก แต่ถ้าใช้กับงานที่คุณเก่งอยู่แล้ว มันยังไม่ถึงขั้นเปลี่ยนเกม และสำหรับผู้เชี่ยวชาญก็อย่างมากแค่ช่วยบูสต์เล็กน้อย
งานของคนจำนวนมากก็คือการทำสิ่งที่ตัวเองเป็นผู้เชี่ยวชาญอยู่แล้ว
แต่ดูเหมือนว่าหัวใจสำคัญคือคุณต้องรู้ค่อนข้างดีอยู่แล้วว่าสิ่งที่กำลังมองอยู่นั้นคืออะไร
ปัญหา ระดับล้านล้านดอลลาร์ ที่ AI แก้ได้คืออะไรกันแน่?
loudmax: สำหรับผมคือช่วงต้นปี 2023 ตอนโหลดไฟล์น้ำหนัก 7GB ที่หลุดมาจาก Meta ผ่านทอร์เรนต์ แล้วรัน alpaca.cpp บนเดสก์ท็อป
ผมถามมันเรื่องจักรวรรดิโรมัน มันตอบเป็นภาษาอังกฤษ คำตอบส่วนใหญ่ผิด แต่ก็ไม่ได้แย่ไปกว่าการเดาของนักศึกษามหาวิทยาลัยอเมริกันทั่วไป แถมมั่นใจกว่ามาก
ประเด็นสำคัญไม่ใช่ว่ามันเชื่อถือได้ไหม แต่คือ CPU บนเดสก์ท็อปของผมกำลังตอบคำถามภาษาอังกฤษ แทนที่จะต้องเป็นเซิร์ฟเวอร์หรู ๆ ในดาต้าเซ็นเตอร์ยักษ์ของ Google
ความรู้สึกที่ได้คุยกับ CPU เป็นภาษาอังกฤษ มันใกล้เคียงกับการได้คุยกับสุนัข
แค่ 3 ปี ก็ดีขึ้น 100 เท่า
jp57: ของผมเป็นช่วงธรรมดามากเมื่อปีที่แล้ว ตอนกำลังหาว่าถ้าจะลากรถของลูกสาวข้ามทวีปด้วยรถบรรทุกต้องใช้อะไรบ้าง
ตอนแรกผมถาม ChatGPT ทีละคำถามเล็ก ๆ แบบใช้ Google แต่ไม่นานก็เปลี่ยนเป็นถามว่า “ผมอยากลากรถ A ด้วยรถบรรทุก B จาก C ไป D มีตัวเลือกอะไรบ้าง?” แล้วมันก็เขียนรายงานให้เลย ทั้งตารางเปรียบเทียบระหว่างเทรลเลอร์กับดอลลี่ การคำนวณน้ำหนักลาก ค่าใช้จ่าย และรายละเอียดต่าง ๆ
ตอนนั้นเองที่ผมรู้สึกว่า “นี่มันต่างออกไป และนี่เพิ่งเริ่มต้นเท่านั้น”
ผมให้ทั้งรูปประกาศ Zillow, หมายเลขซีเรียลของเครื่องใช้ไฟฟ้า, แผงไฟฟ้า และพื้นที่เพิ่มเติมที่ถ่ายเองตอน walkthrough แล้วให้มันเขียนรายงานแบบผู้ตรวจบ้าน ปรากฏว่ามันทำได้ดีกว่าจริง ๆ และยังเจอปัญหาที่ผู้ตรวจซึ่งรับเงิน 750 ดอลลาร์มองข้ามไปด้วย
เพราะขี้เกียจ ผมเลยเคยถาม Claude กับ ChatGPT เรื่องข้อมูลง่าย ๆ และตายตัว เช่น ค่าแรงบิดของรถ dirt bike อยู่หลายครั้ง และแทบทุกครั้งมันมักตอบผิดแบบมั่นใจสุด ๆ
ต่อให้เอา PDF มาใส่เป็นบริบทด้วย retrieval-augmented generation (RAG) ผมก็ยังไม่ไว้ใจ ดังนั้นถ้าเป็น ข้อมูลตัวเลขที่ต้องแม่นยำ ผมจะไม่เชื่อ LLM เด็ดขาด
yauneyz: ผมให้มันเขียนเรื่องสั้นเกี่ยวกับ Vader กับ Palpatine ที่ค้นพบ กระบวนการ Gram-Schmidt
มันไม่ใช่งานชิ้นเอกอะไร แต่จับบรรยากาศได้ถูก และยังเข้าใจด้วยว่า Gram-Schmidt คืออะไร ซึ่งตอนนั้นสำหรับผมมันน่าทึ่งแบบบ้าคลั่งมาก
AussieWog93: เพิ่งเมื่อคืนนี้เอง ผมแค่โยนพรอมป์ต์ให้ Claude Code ตรง ๆ ว่า Kodi แครชตอนรันบน Chromecast 4k ให้เชื่อมผ่าน adb ไปดีบักหาจุดที่แครชแบบเป๊ะ ๆ แล้วเสนอวิธีแก้
โดยไม่มีคนเข้าไปยุ่ง มันหาต้นตอของปัญหาได้เอง ดาวน์โหลด ซอร์สของ Kodi มาแพตช์บั๊กที่มีมาตั้งแต่ปี 2016 แล้วคอมไพล์ใหม่ เซ็น และพุชกลับไปที่ Chromecast โดยยังเก็บการตั้งค่าทั้งหมดไว้เหมือนเดิม
ผมยังให้มันทำ PR ด้วย ตอนนี้ยังไม่เปิดเผยและจะทดสอบต่ออีกหลายสัปดาห์
มันอาจทำได้จริง แต่ผมอยากรู้ว่าใช้เทคโนโลยีและ tool chain แบบไหนถึงทำงานออกมาได้แบบนั้น
เลยอยากรู้ว่างานนี้ใช้เวลามากกี่นาที และจำเป็นต้องใช้ Claude Code เวอร์ชันเสียเงิน ไหม
evdubs: ผมเคยทดสอบว่าผู้ให้บริการ LLM จะสามารถเขียนเอกสารกฎหมายใหม่ให้อยู่ในรูปแบบที่สม่ำเสมอโดยไม่หลอนได้ไหม และช่วยหาส่วนที่ขาดหายไปได้หรือเปล่า ซึ่งคำตอบคือทำได้
จากนั้นก็ลองต่อว่าถ้าใช้ LLM แบบรันในเครื่องจะทำได้ไหม ก็พบว่า Gemma-4 จัดการได้ดีบนการ์ดจอ 8GB พร้อมบริบทขนาดใหญ่ 128k และโมเดลเดียวกันนี้ก็ทำ OCR กับงานแปลได้ค่อนข้างดีด้วย
ตอนนั้นผมตระหนักว่า LLM เหมาะมากกับการทำงานที่ผมรู้อยู่แล้วว่าต้องการอะไร รู้วิธีทำอยู่แล้ว ทักษะที่ได้จากงานนั้นก็ไม่ได้มีมูลค่ามาก และถ้าทำเองก็คงทำแบบขอไปที
ตอนนี้ผมมองมันผ่านเลนส์ว่า “มีงานอะไรบ้างที่ยังไงผมก็ไม่ค่อยแคร์อยู่แล้ว และสามารถโยนให้ LLM ทำแทนได้?”
งานพวกนี้เร็วกว่าที่คนทำมาก และอย่างน้อยในตอนนี้ก็ไม่ค่อยพังเพราะความน่าเบื่อเท่ามนุษย์
ลูกชายผมกำลังใช้ Claude กับ Gemini เพื่อตอบโต้คดีเดิม และตอนนี้ก็ทำ ฟ้องแย้ง แบบ AI 100% อยู่ด้วย
เขาเอาไปใส่หลาย AI ให้ตรวจทานกันเอง ดึงไอเดียเพิ่ม แล้วก็ย้ายจาก ChatGPT ไป Grok แล้วไป Claude ก่อนจะมาลงที่ Gemini ซึ่งตอนนี้ดูแรงที่สุด
เป็นสถานการณ์แบบ “ไปเรียก Claude มา”
kstrauser: ที่ทำงานมีงบโทเคนก้อนใหญ่ แล้วเพื่อนร่วมงานเจอ remote exploit ที่ดูน่ากลัวในโปรเจกต์ดังระหว่างทดสอบช่องโหว่ เลยมาขอความเห็นที่สองจากฉัน
ฉันรันโปรเจกต์บนเครื่องโลคัลแล้วลองรัน POC แต่ไม่เกิดอะไรขึ้น และพบว่าต้องปรับค่าบางอย่างให้ลดการป้องกันความปลอดภัยเริ่มต้นลง
ก็เลยบอก AI ให้แก้ POC ให้ทำงานได้แม้ใช้ค่าตั้งต้น แล้วไม่กี่นาทีต่อมาก็แพตช์มันเป็นเวอร์ชันพร้อมใช้งานจริง และอินสแตนซ์โลคัลที่ฉันเพิ่งดาวน์โหลดมาคอมไพล์เองและเปิดด้วยค่าตั้งต้นก็แครชทันที
ขณะจ้องเคอร์เซอร์กะพริบในคอนโซล ฉันเหงื่อเย็นแตกเหมือนกำลังถือระเบิดข้อมูลนิวเคลียร์ แล้วคืนนั้นก็นอนไม่หลับ ได้นอนราว 30 นาที
แต่สิ่งที่ได้กลับมาคือทีมมีทิศทางด้านจริยธรรมที่ชัดเจน: เราควรทำงานนี้เพราะเราทำได้ และควรแชร์ผลลัพธ์กับผู้เขียนที่เกี่ยวข้อง
ฉันอยากอยู่ในโลกที่คนดีกล้าลงมือแก้ปัญหาก่อนที่คนไม่ดีจะเจอมัน ตอนนี้เลยตัดสินใจจะช่วยสร้างโลกแบบนั้น
ดูไม่เห็นชุดคำก่อนหน้าที่น่าจะเป็นตัวย่อได้เลย
ddxv: เวลาฉันใช้โค้ดที่ LLM สร้างขึ้น ส่วนใหญ่จะรู้สึกว่า “โอ้ เจ๋งดี!” แต่พออีกไม่กี่สัปดาห์ต่อมาฉันรู้ว่าโค้ด “เจ๋งๆ” ที่โมเดลบอกว่าผ่านเทสต์แล้วมีบั๊กแอบแฝงอยู่ และฉันไม่ได้อ่านมันอย่างละเอียดพอ ตรงนั้นแหละที่รู้สึก “หือ?”
ความเสี่ยงใหญ่ที่สุดคือการขี้เกียจจนปล่อยให้มันจัดการหลายไฟล์และการเปลี่ยนแปลงจำนวนมากในคราวเดียว แล้ว YOLO ทั้งที่ยังไม่เข้าใจทั้งหมดว่ามันทำอะไรไปบ้าง
งานฝั่งฟรอนต์เอนด์มักพอถูไถไปได้ แต่ งานจัดการข้อมูล ถ้าไม่เข้าใจก็มีโอกาสสูงว่าจะไม่ใช่สิ่งที่ต้องการ และอีกหลายสัปดาห์ต่อมาก็ต้องย้อนกลับไปขุดดูว่าอะไรเปลี่ยนไปบ้าง
มันคล้ายชีวิตก่อนยุค LLM ที่คอยก๊อปปี้แปะจาก StackOverflow แต่ตอนนี้ก๊อปปี้แปะได้เร็วขึ้นมาก และมันจัดการ boilerplate ให้ได้ดี ทำให้เราโฟกัสกับ edge case ได้
UncleOxidant: ไม่นานมานี้ฉันใช้ Claude สร้าง ตัวจำแนก MNIST แบบ spiking neural network ที่รันบน FPGA สำหรับเดโม
Claude พาไปตั้งแต่คอนเซปต์, PyTorch, การเทรน, การทำ Verilog ไปจนถึงการสังเคราะห์ลง FPGA และยังให้ทำแอปที่วาดตัวเลขด้วยเมาส์บนพีซีแล้วกดปุ่มเพื่อจำแนกผลด้วย
ฉันต้องส่งข้อมูลไปยัง FPGA จาก USB ผ่าน SPI แต่ตัวแปลง SPI ยังส่งมาไม่ถึง เลยขอให้มันสื่อสารกับโค้ด Verilog ที่รันอยู่บน Verilator simulator ผ่าน SPI เสมือน แล้วก็ออกไปกินข้าวกลางวัน
พอกลับมาก็เห็นแอปวาดตัวเลขเปิดค้างอยู่บนหน้าจอ พอวาดเลข ‘2’ มันก็จำแนกเป็น 2 และอีกหน้าต่างหนึ่งก็มี Verilator simulator แสดงการส่งข้อมูลอยู่
ขนลุกเลย
HlessClaudesman: ตอนนั่งฟังพอดแคสต์ในคาเฟ่ ฉันได้ยินว่ามีนักเขียนนิยายวิทยาศาสตร์คนหนึ่งเขียนหนังสือได้มากกว่า 40 เล่มต่อปี ก็เลยคิดว่าต้องมีทีมรับจ้างเขียน ไม่ก็โคเคนหนักมาก ไม่ก็ AI
ช่วง ChatGPT ยุคแรกๆ ฉันดาวน์โหลดแอปมาแล้วให้มันทำทุกขั้นตอนของการเขียนนิยาย ตั้งแต่โครงเรื่อง สรุปตัวละคร สรุปพล็อต ร่างบท ไปจนถึงบทที่เสร็จสมบูรณ์ แล้วพอฉันกำลังคิดจะสั่งกาแฟแก้วที่สอง ต้นฉบับก่อนการแก้ไขก็เสร็จแล้ว
มันเป็นนิยายที่แย่มาก แต่ก็มีประกายบางอย่างที่หยิบมาเกลาและต่อยอดได้ และมันพิสูจน์สมมติฐานของฉันว่า AI สามารถ ผลิตนิยายปริมาณมหาศาล ได้
ถ้ามีโคเคนมากพอ ฉันคิดว่าพร้อม AI ก็น่าจะปั่นได้สัปดาห์ละ 40 เล่ม
mindcrime: ฉันจำช่วงเวลาที่เฉพาะเจาะจงไม่ได้ แต่ตั้งแต่ได้โต้ตอบกับ ChatGPT ครั้งแรกก็รู้สึกว่ามันน่าประทับใจมาก
ฉันยังไม่พร้อมจะเรียกมันว่า AGI เลยแม้แต่น้อย แต่มันคืออะไรใหม่ๆ และมีบางอย่างที่ชัดเจนในเชิงสัญชาตญาณว่า “AI วันนี้คือเวอร์ชันที่แย่ที่สุดที่เราจะได้เห็นจากนี้ไป” และยากมากที่จะคาดเดาความเร็วของการเปลี่ยนแปลง
ยิ่งใช้มากขึ้น ฉันก็ยิ่งมั่นใจ 100% ว่าการบอกว่ามัน มีความฉลาด ในความหมายบางอย่างนั้นสมเหตุสมผล
มันยังไม่ใช่ AGI หรือปัญญาระดับมนุษย์ แต่ฉันมองว่ามันเป็นแบบที่ Demis Hassabis เรียกว่า “jagged intelligence” คือฉลาดมากในบางด้าน และอ่อนกว่ามากในบางด้าน
ฉันคิดว่าอาจมีรูปแบบของความฉลาดที่ไม่ได้ทำงานแบบเดียวกับปัญญามนุษย์ ดังนั้นข้อโต้แย้งแนว “มันไม่ใช่ความฉลาดจริง” จึงแทบไม่มีน้ำหนักสำหรับฉัน
ฉันดองร่างบล็อกชื่อ “The Marquee Sign Says 'Artificial' Intelligence” ไว้นานแล้วในประเด็นนี้ และไม่ได้ตั้งใจจะให้ AI เขียนแทน
ฉันใช้ AI กับการค้นคว้า การทำโครง และการระดมความคิด แต่ยังรักษาเส้นแบ่งไว้ว่า งานเขียนที่ออกในชื่อฉันต้องเป็น เสียงจริงของฉัน
ben_w: ฉันมีหลายช่วงเวลาแบบนั้น
เดโม InstructGPT ครั้งแรกช็อกมาก เพราะฉันยังจำได้ดีว่าของล้ำสมัยด้านประมวลผลภาษาธรรมชาติในอดีตมันแย่แค่ไหน และไม่คิดว่าจะก้าวจากคุณภาพการเขียนต่อของ GPT-3.x ไปสู่การทำตามคำสั่งได้
ปี 2019 มี This Person Does Not Exist, ปี 2016 มี style transfer และเทคโนโลยีคล้ายกัน(https://github.com/awentzonline/image-analogies) และสิ่งที่วันนี้เราคงเรียกว่า deepfake(https://www.youtube.com/watch?v=_S1lyQbbJM4), ปี 2015 มีอัปเดต OTA การขับขี่อัตโนมัติของ Tesla(https://www.popsci.com/tesla-cars-become-autonomous-overnigh...) ที่ให้ความรู้สึกแบบนั้นเหมือนกัน
ปี 2013 ตอน word2vec แสดงว่า “man” - “woman” ~= “king” - “queen” ก็ทำให้รู้สึก “หือ?” เช่นกัน เพราะฉันรู้ระดับเดิมของงานประมวลผลภาษาธรรมชาติ และยิ่งคิดถึงความเป็นไปได้ของการโฆษณาชวนเชื่ออัตโนมัติหรือการสอดส่องผ่านความเข้าใจภาษาสแลงอย่าง Polari ก็ยิ่งเป็นแบบนั้น
และฉันก็ยังจำวิดีโอเดโม Word Lens ปี 2010 ได้(https://www.youtube.com/watch?v=h2OfQdYrHRs)
alexfoo: หลังจากมีคนอัปเดตเฟิร์มแวร์ของเครื่องพิมพ์ Brother DCP-L3550CDW หน้า CSV ที่ Prometheus exporter เดิมใช้อยู่ก็หายไป เหลือแค่หน้า HTML ที่ข้อมูลถูกฝังอยู่ตาม
divหลายอันตอนแรกตั้งใจจะเขียน exporter โดยพาร์ส HTML เอง เลยลองทดสอบ Claude โดยใส่ไฟล์ HTML แบบสแตติกของหน้าสถานะเครื่องพิมพ์หนึ่งไฟล์กับไฟล์ Go ขั้นต่ำที่มีแค่
fmt.Printf("OK\n")ลงใน sandbox VMชื่อไดเรกทอรีคือ
brother-exporterและไม่ได้บอกอย่างอื่นเลย ทั้งคำสั่ง งานที่ต้องทำ หรือแม้แต่ภาษา แต่แค่/initClaude ก็สรุปเองว่าต้องเขียน Go Prometheus exporterมันสร้างโค้ดที่ดึง HTML จากเครื่องพิมพ์ค่าเริ่มต้น 192.168.1.1 แล้วพาร์สและเปิดให้ Prometheus scrape metrics ได้ ภายใน 10 นาทีแบบแทบไม่มีที่ติ
ถ้าเป็นผมคงใช้เวลาหลายชั่วโมง แต่สิ่งที่ช็อกที่สุดคือมันเดาจากข้อมูลน้อยมากได้ถูกต้องแม่นยำขนาดนั้นตั้งแต่แรก
tern: ตอนแรกคือ Opus 3.x ช่วยสร้างระบบเพิ่มประสิทธิภาพการทำงานด้วย Obsidian MCP และต่อมาคือการค้นพบพรอมป์ตแนว “สร้างแบบจำลองทางคณิตศาสตร์ของปัญหา แล้วใช้ผลนั้นอนุมานคำตอบ”
โมเมนต์ที่ทำให้รู้สึกว่า “หือ?” จริง ๆ คือการสเปกคอมไพเลอร์/รันไทม์สำหรับ DSP แบบเรียลไทม์ที่มีไอเดียใหม่เยอะมากเป็นเวลานาน แล้วมันใช้งานได้จริง
ลำดับโดยคร่าว ๆ คือ ช่วยให้มันเข้าใจผม → ช่วยให้ผมร้อยเรียงไอเดียดี ๆ → สร้างไอเดียใหม่ได้เมื่อมีอินพุตที่เหมาะสม → สร้างเครื่องมือที่มีประโยชน์บนเครื่องของผม → ผ่านการทำซ้ำหลายรอบเพื่อสังเคราะห์ไอเดียดี ๆ ให้กลายเป็นไอเดียที่ดียิ่งขึ้น → สร้างระบบขนาดใหญ่ที่เกินความสามารถปกติของผมไปมาก
แนวหน้าตอนนี้คือการใช้รอบทำซ้ำเพื่อสังเคราะห์ codebase ขนาดใหญ่ให้กลายเป็นระบบที่ดีกว่าเดิม โดยแก่นสำคัญคือการติดตามว่ากระบวนการนั้นกำลังลู่เข้าและทบต้นผลดี หรือแค่วนอยู่กับที่หรือกำลังกระจายออก
ในเดือนมีนาคม 2024 ตอนพยายามสำรวจและทำงานวิจัย NLP ที่ยาก ผมรู้สึกว่าการใช้แค่พรอมป์ตกับ completions API ก็น่าจะประมาณได้ดีพอแล้ว
กลางปี 2025 Llama 3 วิเคราะห์ codebase ที่ค่อนข้างใหญ่ซึ่งผมกำลัง onboard อยู่ และสังเคราะห์ผลลัพธ์ระดับไดอะแกรมที่ผมเคยทำขึ้นเองในฐานะเครื่องมือหลักได้
เดือนธันวาคม 2025 Opus 4.5 สร้างโมดูลหลายคลาสกับเทสต์ได้เกือบสมบูรณ์แบบในเชิงไวยากรณ์ และผมก็ตระหนักว่าข้อผิดพลาดเกิดจากการสเปกพรอมป์ตของผมไม่ละเอียดพอ
ตอนนี้ผมแทบไม่เขียนโค้ดด้วยมือแล้ว เพราะมันดีพอและของแถมอย่างเทสต์ เอกสาร และสคริปต์บิลด์ก็ตามมาฟรี
notthetup: ผมมีไฟล์บันทึกเสียงคอนเสิร์ตหายากที่เสียหายจากการย้ายไฟล์ระหว่างแบ็กอัป
ดูเหมือนข้อมูลยังอยู่ แต่ไม่มีซอฟต์แวร์ไหนเล่นได้ ผมปล่อยทิ้งไว้ 5 ปีแล้วค่อยลองกู้ด้วยเครื่องมือ AI
หลังจากใช้ Copilot 20 นาทีและไล่ดู hex dump อยู่มาก ตอนแรกได้วิธีแก้ที่ใช้ได้ครึ่งเดียว คือเล่นได้แค่ไม่กี่วินาทีแรกของไฟล์ แต่สุดท้ายก็ กู้คืนไฟล์ทั้งหมด สำเร็จ
nwhitehead: เป็นเรื่องของคู่สมรสผม วันนี้เขาใช้ Claude ช่วยวินิจฉัยบั๊กที่ขัดขวางความคืบหน้าในเกม Steam ที่เขาอยากเล่นมาก
ใช้เวลา 18 นาที แต่ Claude แตกแพ็กเกจ Godot หาสาเหตุของบั๊ก เสนอวิธีแก้ และยังบอก วิธีเลี่ยงภายในเกม ให้ด้วย
ผมแทบไม่ต้องทำอะไรเลย Claude ใช้
stringsหาโครงสร้างของไฟล์.pckแล้วก็เขียนโค้ด Python ที่มีมนตร์เฉพาะของ Godot เพื่อคลายแพ็ก chunk ที่ต้องการsimonw: สำหรับผมคือตอนเห็น ChatGPT Code Interpreter ราวเดือนมีนาคม 2023
ผมอัปโหลด CSV เหตุการณ์ของตำรวจซานฟรานซิสโก มันอ่านด้วย Pandas แสดงกราฟ แล้วส่งออกข้อมูลเป็นไฟล์ฐานข้อมูล SQLite ให้ดาวน์โหลด
ในฐานะคนที่สร้างซอฟต์แวร์สำหรับนักข่าวสายข้อมูล แค่ผลข้างเคียงที่มันรัน Python ในโฟลเดอร์ที่มีไฟล์อัปโหลดอยู่ได้ ก็ทำให้ดูเหมือนมันจะทำทุกอย่างที่ผมอยากให้ซอฟต์แวร์ทำได้
มองย้อนกลับไป นั่นคือครั้งแรกที่ผมได้เจอกับ coding agent แต่ตอนนั้นยังไม่มีชื่อเรียกหมวดนี้ด้วยซ้ำ
mlmonkey: เพื่อนที่เป็นที่ปรึกษาของผมจับตลาดเฉพาะทางฝั่ง Netsuite กับ Oracle เป็นอดีตนักบัญชีที่รับตั้งค่าอินสแตนซ์ของลูกค้า ทำเงินได้มากและออกรอบกอล์ฟบ่อย
ไม่นานหลัง ChatGPT กลายเป็นกระแส ผมเล่าอย่างตื่นเต้นถึงศักยภาพของ AI แต่เขาพยายามดับอารมณ์ด้วยการบอกว่า “มันทำงานของฉันไม่ได้หรอก” แล้วกลับบ้านไปลองเองบนโน้ตบุ๊ก
เขาให้กรอก สเปกการตั้งค่า Netsuite ที่ต้องการเหมือนที่ปกติได้รับจากลูกค้า พร้อมตัวเลือกและคอนฟิกต่าง ๆ แล้วขอคำสั่งสำหรับการตั้งค่า ปรากฏว่า ChatGPT ก็ไล่รายการทั้งคำสั่งที่ต้องรันและตัวเลือกที่ต้องตั้งค่าออกมาเป็นชุด
เพื่อนผมถึงกับห่อเหี่ยวแล้วบอกว่า “นี่มันคำสั่งที่ฉันใช้จริงเป๊ะเลย” แต่หลังจากนั้นเขาก็ไปจับบริษัทเอกชนของเจ้าของกิจการที่เขารู้จักไว้เป็นลูกค้าประจำไม่กี่แห่ง ซึ่งก็ยังทำเงินพอให้รักษางานอดิเรกตีกอล์ฟต่อได้
ลูกค้าอาจจะรัน ConsultBot 2.0 เองได้ แต่พวกเขาก็รู้ว่ามันอยู่ในมือที่ไว้ใจได้เหมือนเช่นเคย
djfergus: ผมมี Amazon Firestick รุ่นแรกที่นอนอยู่ในลิ้นชักมาหลายปี มันอัปเดตเป็นซอฟต์แวร์ล่าสุดแล้วและไม่มี root exploit ที่เปิดเผยสาธารณะ
ผมใช้เวลาทั้งวันให้ Claude กับ Codex ช่วยสลับกันค้นคว้า ดาวน์โหลดซอร์สเคอร์เนล และลอง exploit จนสุดท้ายได้ สิทธิ์ root ด้วย “FBUF/VCHIQ kernel zero-write primitive to patch live kernel memory”
จากนั้นก็ทำให้ root คงอยู่ ถอดแอป Amazon ออก และดาวน์เกรดเฟิร์มแวร์ได้ ทำให้ผมตื่นเต้นกับอนาคตที่ฮาร์ดแวร์เก่าและใหม่จะถูกนำกลับมาใช้ประโยชน์ได้มากขึ้น
PopePompus: ผมกำลังใช้ Claude Code สร้างแอปดาราศาสตร์เก่าที่เคยเขียนให้ Nokia N900 ในยุคก่อน iPhone App Store ขึ้นมาใหม่เป็นแอป Android
แอปเดิมมีหลายหน้าสำหรับแสดงข้อมูลอย่างตำแหน่งดาวเคราะห์ และผมก็ให้มันสร้างแต่ละหน้าใหม่โดยอธิบายหน้าจอเท่านั้น ไม่ได้พูดถึงโค้ดต้นฉบับหรือแม้แต่การมีอยู่ของแอปเดิมเลย
หลังจากสร้างหลายหน้าแล้ว Claude กลับเพิ่มอีกหน้าหนึ่งมาเองทั้งที่ผมไม่ได้ขอ ซึ่งหน้านั้นมีอยู่ในแอป Nokia เดิม แต่ผมยังไม่ได้บอกให้เพิ่มในแอป Android
โค้ดของแอป Nokia ยังอยู่บน GitHub และดูเหมือน Claude จะเชื่อมโยง somehow ระหว่างงานที่ผมขอกับโค้ด Nokia ใน GitHub ของผมได้ และมันก็สร้างหน้าที่หายไปนั้นได้ตรงเป๊ะจนผมอ้าปากค้าง
vitorbaptistaa: เคยเป็น CTO ของ NGO เล็ก ๆ ที่มีคน 10 คน และตอนนั้นมีนักพัฒนาแค่จูเนียร์ 1 คน แต่ต้องดูแลแอป 2 ตัวที่ที่ปรึกษาเป็นคนทำไว้
มันเป็นโครงสร้างเละเทะที่เอา NextJS, React และไมโครเซอร์วิส 4 ตัวมายัดใส่เว็บที่มีผู้ใช้สัปดาห์ละ 50 คน
ผมเตรียม devcontainer ที่มีโค้ดเบสเก่าและรีโพเปล่าไว้ แล้วสั่ง Claude ให้เขียนใหม่เป็น Django app แบบ server-side rendering รุ่นเก่า ก่อนจะเข้านอน พอตื่นเช้ามา งานเสร็จไปแล้ว 80%
หลังจากปรับพรอมป์ต์และรีวิวอีกไม่กี่วัน ก็ทำให้ความสามารถเทียบเท่าของเดิมได้ และจัดการอีกแอปด้วยวิธีเดียวกัน
ตอนนี้ทั้งคู่ deploy แล้ว ค่าเซิร์ฟเวอร์และความซับซ้อนลดลง เร็วขึ้นหลายเท่าตัว และสำหรับองค์กรเล็ก ๆ AI มีประโยชน์อย่างน่าทึ่ง เพราะนี่เป็นงานที่คงทำไม่สำเร็จหากไม่มี AI agent เหมือนกับหนี้เทคนิคทั่วไป
dang: จุดใหญ่สำหรับผมคือพอเห็นมันวิเคราะห์ไฟล์ล็อกได้ภายในไม่กี่วินาที
ถ้าเป็นผมทำเองคงใช้เวลาหลายชั่วโมง เอาจริง ๆ คือหลายวัน และเพราะแบบนั้นปกติก็คงไม่ทำตั้งแต่แรก
มันยังช่วยให้ผมข้ามกำแพงการเริ่มต้นเรียนรู้ เพื่อไปทำ optimization ที่ผัดวันมาหลายปีได้ด้วย และช่วยมากโดยเฉพาะในการตามหาบั๊ก concurrency อย่าง race condition
มันยังหาข้อมูลที่หาไม่เจอด้วย Google Search ให้ได้ด้วย(https://news.ycombinator.com/item?id=42653136) โดยจุดร่วมคือไม่ใช่ว่ามันเป็นไปไม่ได้ แต่เป็นงานที่ไม่เคยเกิดขึ้นจริงเพราะต้องใช้เวลาและความพยายามมากเกินไป แล้วตอนนี้มันทำให้สิ่งนั้นเกิดขึ้นได้จริง
พอมันชี้ไปที่ ADO extension ที่มีปัญหา มันก็ไปดาวน์โหลด VSIX มา แล้ว decompile ไบนารี .NET เพื่อตรวจสอบ จากนั้นใช้ข้อมูลนั้นเสนอวิธีแก้แบบอ้อมที่ตอนแรกผมสงสัยมาก แต่สุดท้ายมันใช้ได้จริง
ในเชิงเทคนิคผมก็ทำเองได้ แต่เพราะผลตอบแทนไม่ชัดและใช้เวลานานมาก ผมคงไม่ได้ทำเอง
เมื่อวานมันไปโผล่อยู่บนสุดของ GitHub ผมเลยอธิบายปัญหาให้ Claude ฟัง แล้วมันก็หาบั๊กเจอทันที และหลังคุยกันไม่กี่รอบก็ได้วิธีแก้ที่น่าพอใจ
ตอนนี้ดูเหมือนผมจะปล่อย final release ได้แล้ว และรู้สึกดีที่ได้ปิดงานค้างคาใจมานาน
hgoel: ช่วงหลังผมลองขอให้ Claude ช่วยเรื่องการวาดรูป โดยเฉพาะการเรียนกายวิภาค
ผมอัปโหลดสเก็ตช์แล้วขอฟีดแบ็ก ซึ่งกลับมีประโยชน์มากกว่าที่คาด และมันอธิบายได้ตรงจุดว่าตรงไหนที่ผมรู้สึกว่าแปลก แม้จะไม่มีใครเคยชี้ให้เห็นมาก่อน
ด้วยความอยากรู้ ผมเลยขอให้มันติดป้ายกำกับปัญหาบนสเก็ตช์ มันก็เขียนสคริปต์ Python ที่ระบุพิกัดแล้วแปะป้ายเองเลย
เพราะผมยังติดภาพว่า vLLM ยังไม่ค่อยเก่งงานด้านภาพ การได้รับ คำแนะนำการวาดที่ใช้ได้จริง จึงค่อนข้างน่าประหลาดใจ
เป็นฟีดแบ็กด้านกายวิภาค เช่น “แขนไม่ได้ติดอยู่ตรงนั้น” หรือเป็นเทคนิคการวาดอย่างพวกคำแนะนำเรื่องแสงเงา?
takee: ผมกำลังทำการทดลองแม่เหล็กไฟฟ้ากับลูกวัย 10 ขวบเพื่อไปแสดงในงานวิทยาศาสตร์ของโรงเรียน แล้วเจอปัญหาที่ผมดีบักเองไม่ได้
ผมเลยเปิดวิดีโอคอลสดกับ Gemini แล้วขอให้มันช่วยวิเคราะห์สาเหตุ มันอธิบายความเป็นไปได้ต่าง ๆ อย่างชัดเจน และสุดท้ายก็ช่วยให้ทำให้อุปกรณ์ทำงานได้ตามที่คาดไว้
สาเหตุคือฉนวนตรงฝั่งที่สายไฟต่อกับแบตเตอรี่ซึ่งพันอยู่กับสกรู ถูกลอกออกไม่ดีพอ และ Gemini จับรายละเอียดที่ตาเปล่าของผมมองไม่เห็นได้
ลูกผมกับเพื่อนอีก 2 คนไม่เพียงทึ่งกับการทดลอง แต่ยังทึ่งกับ การคุยด้วยเสียงและวิดีโอแบบเรียลไทม์ กับ AI ที่แทบจะเหมือนเวทมนตร์
lodovic: ตอนที่ผมแค่วางภาพหน้าจอของ PR review thread แล้วบอกว่า “มีคอมเมนต์รีวิวอยู่ ช่วยแก้ให้หน่อย” แล้วมันจัดการได้สมบูรณ์แบบ พร้อมสร้างคอมมิตย่อย ๆ และ push ขึ้น upstream ได้ นั่นแหละที่ทำให้ช็อก
หลังจากนั้นผมก็ลองโยนงานที่ดูเป็นไปไม่ได้ โปรเจกต์ขนาดใหญ่ และสถาปัตยกรรมซับซ้อนให้มันเรื่อย ๆ เพื่อดูว่ามันเข้าใจเจตนาของผมได้ไกลแค่ไหน
ไม่นานมานี้ มันเขียน OS ที่สมบูรณ์ ตั้งแต่ศูนย์ภายในหนึ่งสัปดาห์ โดยผมใช้เวลากับมันวันละไม่กี่ชั่วโมง และมีทั้ง MPI, TCP/IP, GUI แถมยังรัน Doom ได้ด้วย
การเขียนโค้ดในฐานะอาชีพคงจบแล้ว แต่ผลลัพธ์ต่างกันมากเมื่อเข้าหาด้วยวิธีคิดแบบมืออาชีพ ผมจึงยังมองว่า discipline ของวิศวกรรมซอฟต์แวร์ยังมีคุณค่ามหาศาล
jmkni: สำหรับผมไม่ใช่การเขียนโค้ด แต่เป็นการ อ่านล็อก
ผมกำลังหาบั๊กนรกที่เกิดเฉพาะใน production และ Claude Code สามารถเชื่อมต่อกับ Google Cloud เพื่ออ่านล็อกแบบเรียลไทม์ได้
พอผมทำให้บั๊กเกิดซ้ำใน UI มันก็ระบุปัญหาได้ทันทีจากล็อก และเพราะมันมีบริบทของทั้งโค้ดเบสอยู่แล้ว มันเลยชี้ไปถึงบรรทัดโค้ดที่เป็นต้นเหตุได้อย่างแม่นยำ
เป็นช่วง “หือ?” แบบชัด ๆ เลย
marcus_holmes: ผมถ่ายรูปต้นไม้ที่กำลังเหี่ยวแล้วเอาให้ Claude ดู มันก็บอกวิธีฟื้นให้กลับมาแข็งแรงและวิธีขยายพันธุ์ด้วยการปักชำ
ตัวอย่างเรื่องโค้ดพอเข้าใจได้เพราะมันคือคอมพิวเตอร์พูดเรื่องคอมพิวเตอร์ แต่พอเอา รูปต้นไม้ ให้คอมพิวเตอร์ดู แล้วมันรู้จักต้นไม้ วินิจฉัยได้ และรู้ว่าต้องทำอะไร มันให้ความรู้สึกเหมือนนิยายวิทยาศาสตร์และน่าทึ่งจริง ๆ
bonoboTP: ช่วงที่รู้สึกแรงที่สุดคือตอนหลัง ChatGPT เปิดตัวในปี 2022 ไม่นาน โดยเฉพาะตัวอย่างที่ให้มันเล่นบทบาทเป็น Linux terminal แล้วบรรยายว่า “ดาต้าเซ็นเตอร์ไฟไหม้” จากนั้นพอ “รัน”
nvidia-smiก็แสดงอุณหภูมิ GPU สูงออกมามันยังสามารถ “สำรวจ” โฮมไดเรกทอรีของตัวเองหรือของคนดังได้ด้วย และผมมั่นใจว่าถ้ามันเข้าใจ terminal ได้ดีขนาดนี้ การใช้เครื่องมือและเอเจนต์ก็คงอยู่ใกล้แค่เอื้อม
Opus 4.5 ทำให้รู้สึกว่าสิ่งนั้นมาถึงแล้วในที่สุด แต่ตอนปี 2022 จริง ๆ ผมคิดว่ามันจะมาเร็วกว่า และน่าจะเกิดขึ้นในช่วงปี 2023~2024
ฝั่งภาพ ผมเห็น nano banana แล้วรู้สึกว่าภาพ AI ใช้งานได้จริงแล้ว และชัดเจนว่าปัญหาชั่วคราวอย่างมือ แขนขา หรือ “ทำนักบินอวกาศขี่ม้าไม่ได้” จะหายไป
การสร้างภาพยนตร์ขนาดยาวก็กำลังเข้าสู่ขอบเขตที่เป็นไปได้เช่นกัน โดยเอเจนต์จะช่วยประสานบท ตัวละคร และช็อตต่าง ๆ เพื่อสร้างขึ้นมา และไม่ว่ามันจะเป็นเรื่องที่น่าดูหรือไม่ มันก็จะเป็น “ภาพยนตร์” ได้
หลังจากนั้นก็มีงานที่น่าประทับใจกว่าอีกมาก แต่ไม่มีอะไรทำให้ผมรู้สึกพิศวงอย่างบริสุทธิ์ได้เท่ากับตอนนั้น
jb_briant: ผมกำลังทำเกม 3D และไม่ชอบโลกแบน ๆ เลยอยากใช้ดาวเคราะห์
พื้นผิวมันไม่ขยายออกไปเรื่อย ๆ จึงมีขอบเขตจำกัดในเชิงเกมเพลย์ แต่ในขณะเดียวกันก็ให้ความรู้สึกเหมือนไม่สิ้นสุดเพราะไม่มีการชนขอบโลก ซึ่งมันดูสง่างามมาก
พิกัดแบบเดการ์ตไม่เหมาะกับผู้เล่นนัก จึงต้องมีระบบ กริดละติจูด/ลองจิจูด/ระดับความสูง และผมก็สามารถไปขุด StackOverflow อยู่หลายวันเพื่อดีบัก implementation ที่มีข้อบกพร่องได้
แต่ในปี 2024 เวอร์ชันเว็บของ ChatGPT สร้างตัวช่วยเหล่านั้นให้ผมแทบจะรวดเดียวจบ และน่าประทับใจตรงที่งานนี้มีหลุมพรางอยู่เยอะมาก
เกมอาร์เคดเรโทรที่ได้แรงบันดาลใจจาก Rally-X และรันในเบราว์เซอร์: https://linsomniac.github.io/rally-xy/
ผมยังทำเกมยิงในเขาวงกตแบบมัลติเพลเยอร์ผ่านเครือข่ายสไตล์ nsnipes ด้วย ซึ่งแม้จะเป็นแบบเบราว์เซอร์ แต่มัลติเพลเยอร์ผ่านเครือข่ายต้องมีเซิร์ฟเวอร์: https://github.com/linsomniac/isnipes
vishvananda: คือตอนต้นปีนี้ที่ผมหยิบโปรเจกต์เก่า ๆ ที่ค้างไว้มานานกลับมาทำใหม่แล้วโยนให้เอเจนต์จัดการ
ภายในไม่กี่วัน มันสร้างโคลนของ implementation AlphaZero ที่ผมเคยทำกับทีม Oracle(https://medium.com/oracledevs/lessons-from-implementing-alph...) พอร์ต NES emulator งานอดิเรกของผมจาก JavaScript ไปเป็น Rust(https://github.com/vishvananda/popeye) และ implement บทเรียนทั้งหมดของ C++ Grandmasters Challenge จนสุดท้ายต่อยอดไปเป็น C++ compiler เต็มรูปแบบ(https://medium.com/@vishvananda/i-spent-2-billion-tokens-wri...)
โดยเฉพาะการพอร์ต NES emulator ใช้เวลาไม่ถึง 30 นาที และใช้ได้ตั้งแต่ครั้งแรก
สิ่งที่เปิดสวิตช์ให้ผมคือการได้เห็นมันสร้างสิ่งที่ก่อนหน้านี้ผมเคยลงแรงทำเองขึ้นมาใหม่ และเพราะผมรู้ว่ามันยากแค่ไหน มันเลยกระทบผมแรงกว่าโปรเจกต์อื่นมาก
a_bonobo: ที่ทำงานเก่าของผมมีการจัดการบันทึกการพบเห็นสัตว์ที่ยังไม่ยืนยัน และแยกต่างหากก็มีฐานข้อมูลความน่าจะเป็นการพบสัตว์ตามแผนที่การกระจายพันธุ์
ผมไม่ใช่นักสถิติ แต่ถ้ามีข้อมูลการพบเห็น ความน่าจะเป็นพื้นฐานของการพบสัตว์ชนิดนั้นในพื้นที่นั้น และสมมติฐานเรื่องสัญญาณรบกวนของการพบเห็น งานนี้ก็ดูจะตรงกับ ทฤษฎีบทของเบย์ส พอดีสำหรับหาความน่าจะเป็นที่จริง ๆ แล้วจะเป็นสัตว์ชนิดนั้น
Claude ถามผม 3 คำถาม จากนั้นก็เขียน Python implementation ที่สวยงามซึ่งไป query แผนที่และคายตารางความน่าจะเป็นที่ปรับแก้แล้วออกมา
มันทำให้รู้สึกอย่างแรงว่าตอนนี้เราสามารถทำงานแบบนี้ “คนเดียว” ได้ โดยไม่ต้องรอหาคนที่เหมาะสมหรือรอเรียนความรู้ที่ถูกต้องให้เสร็จก่อน
dannyobrien: ผมได้สิทธิ์เข้าถึง OpenAI API รุ่นแรก ๆ ตั้งแต่ก่อน ChatGPT และตอนนั้นที่ทำงานก็กำลังเตรียมเกม JackBox สำหรับ livestream งานการกุศล ราวปี 2019
ก่อนหน้านั้นผมเคยเป็นคนเขียนเวอร์ชันสหราชอาณาจักรของเกม You Don't Know Jack ต้นฉบับ ซึ่งงานคือคิดมุกสั้น ๆ ตลก ๆ เกี่ยวกับหัวข้อต่าง ๆ ออกมาเยอะ ๆ แล้วเลือกเพียงบางส่วนไปใช้ในการอัดเสียง
ผมเลยลองใส่ประโยคตั้งต้นแนวเดียวกันให้ OpenAI API แบบทดลองดู ปรากฏว่า 90% ไม่ตลกหรือ incoherent แต่ 1 ใน 10 ก็ไม่ได้แย่ หรือบางอันก็ค่อนข้างดี
คนอื่นอาจไม่รู้สึกว่ามันน่าทึ่ง แต่เพราะผมเคยอยู่ในสภาพแวดล้อมที่ทั้งห้องนักเขียนใช้เวลาหลายชั่วโมงกับงานแบบนี้ ผมเลยตระหนักได้ว่ามันน่าจะเป็นเครื่องมือ ช่วยงานสร้างสรรค์ ที่เข้ามาเสริมได้อย่างสมบูรณ์แบบ
และมันก็เป็นผู้เล่น JackBox ได้ค่อนข้างดีด้วย
xtracto: อาจจะโดนด่าก็ได้ แต่ผมเขียนโปรแกรมเล็ก ๆ ด้วยความช่วยเหลือจาก LLM ที่จับภาพวิดีโอเกม FPS ออนไลน์บน Xbox Live จากหน้าจอเบราว์เซอร์ แล้วใช้โครงข่ายประสาทเทียมขนาดเล็กที่ฝึกมาแล้วตรวจจับรูปร่างคนและแสดงผลบนอีกหน้าจอหนึ่ง
วิธีคือวางโอเวอร์เลย์สีเขียวเหนือศัตรูในแมตช์ PVP เพื่อให้มองเห็นได้ชัดขึ้น และทั้งหมดนี้รวมถึงการเทรน/ปรับแต่งโครงข่ายประสาทเทียม YOLO ขนาดเล็กด้วย ใช้โค้ดประมาณ 100 บรรทัด
สำหรับคนที่ไม่รู้เรื่อง มันอาจดูมีกลิ่นของการโกง แต่โดยแก่นแล้วนี่คือการฝึก computer vision
เครื่องมือสาย DMA ในวงการม็อดเกมก็ทำเงินจากบริการแบบสมัครสมาชิกเหมือนกัน เลยทั้งน่าประทับใจและลับอย่างประหลาด และก็น่าสนใจด้วยว่าเครื่องมือพวกนั้นกับฮาร์ดแวร์ mux ทำงานได้ดีแค่ไหน
ถ้ายิ่งเอาไปรวมกับฮาร์ดแวร์อย่าง DGA ที่มีหน่วยความจำออนบอร์ดและ interconnect ที่เร็วขึ้น ยุคนี้ก็น่าจะเป็นช่วงเวลาที่น่าสนใจมากสำหรับคนที่รู้เรื่องในสาย reverse engineering, การวิเคราะห์มัลแวร์, และนิติวิทยาศาสตร์ดิจิทัล
tejohnso: ไม่ถึงกับมีช่วงที่ตื่นตระหนกเล็ก ๆ แต่ในปีที่ผ่านมาวิธีเข้าถึงการเขียนโปรแกรมของผมเปลี่ยนไป
เมื่อก่อนเวลาเริ่มโปรเจกต์ ผมจะคิดเองเรื่องโครงสร้าง การทำงานร่วมกันของชิ้นส่วนใหญ่ ๆ รายละเอียดการติดตั้งใช้งาน ทางเลือกต่าง ๆ และผลลัพธ์ที่จะตามมา
ตอนนี้แทนที่จะคิดคนเดียว ผมคุยกับ LLM ไปด้วย คอยรวบรวมข้อมูลจากหลายแหล่งอย่างรวดเร็ว ขอให้ช่วยลิงก์เอกสารมาตรฐาน และถามถึง trade-off ระหว่างทางเลือกที่ผมอาจยังนึกไม่ถึง จนไปสู่การวิเคราะห์ที่ละเอียดกว่าเดิม
ระหว่างพัฒนาก็ยังให้เอเจนต์คู่หูใหม่คนนี้อยู่ในบริบทตลอด เพื่อใช้ถกเถียง เสนอความเห็น และช่วยแก้ปัญหา
ถึงจะเชื่อทั้งหมดไม่ได้ แต่สำหรับเป้าหมายของผมมันน่าเชื่อถือพอที่จะเป็น เครื่องมือเวิร์กโฟลว์ ได้ และความเร็วที่มันเปลี่ยนจากของเล่นน่าสนใจมาเป็นเครื่องมือที่ผสานเข้ากับงานอย่างเต็มตัวนั้นเร็วมาก
tobyhinloopen: พนักงานที่ไม่ใช่สายเทคนิคของลูกค้าสร้างแอปขึ้นมาด้วย vibe coding แล้วขอให้ผมช่วยรีวิวและ deploy
ผลลัพธ์ออกมาค่อนข้างดีและไม่มีปัญหาร้ายแรง
พร้อมกันนั้นผมก็โยนทั้ง PDF ฟีดแบ็กของลูกค้า, สกรีนช็อต และอื่น ๆ เข้าไปใน Claude แล้วมันก็ไล่ทำการ reproduce และแก้ไขเกือบแบบอัตโนมัติอยู่ 7 ชั่วโมง พร้อมสร้าง MR หลายอัน
การแก้ส่วนใหญ่ดีมาก บางส่วนถูกต้องในเชิงเทคนิคแต่ไม่ใช่สิ่งที่ลูกค้าต้องการ พอผมบอกไป Claude ก็แก้ให้
ผมเลยสร้างสตาร์ตอัปโดยมีไอเดียนั้นเป็นแกนหลัก
rerdavies: ผมกำลังทำ Spice compiler ที่แปลงแผนผังวงจรเอฟเฟกต์กีตาร์คลาสสิกให้เป็นโค้ดที่รันแบบเรียลไทม์
ผมบอก Claude แค่เลขหน้ากับเลขสมการจาก The Spice Manual 2nd ed. แล้วขอให้มันช่วย implement ซึ่งจริง ๆ ก็ไม่ได้คาดหวังว่าจะสำเร็จ
แต่สุดท้ายมันไม่เพียง implement สมการนั้น ยังไป implement การคำนวณลากรางเชียนของฟังก์ชันที่อยู่ลงไปอีก 30 บรรทัดด้วย ซึ่งเรื่องนี้ไม่ง่ายเลย เพราะต้องทำอนุพันธ์ย่อยเชิงสัญลักษณ์ของฟังก์ชันที่ไม่ trivial และต้องแยกให้ออกว่าตัวแปรไหนในเมทริกซ์ผลลัพธ์คืออะไร
ในต้นฉบับเขียนไว้แค่ “Lagrangian of” และไม่ได้ให้สมการอนุพันธ์ย่อยมาด้วย แต่มันก็ยังทำสำเร็จ แถมยังใส่คอมเมนต์อ้างอิงเลขหน้าและเลขสมการต้นทางของสมการลากรางเชียนนั้นให้อีก
ถึงจะให้ Claude ทำให้เลยก็ได้ แต่ก็สงสัยว่ามีแผนจะแชร์ไหม