Ask HN: หลัง AI ปรากฏขึ้น คุณได้สร้างเครื่องมืออะไรไว้ใช้เพื่อตัวเองบ้าง?
(news.ycombinator.com)- การแพร่หลายของเครื่องมือเขียนโค้ดด้วย AI ทำให้เกิดกระแสที่ นักพัฒนาสร้างเครื่องมือของตัวเองโดยตรง มากขึ้น ส่งผลให้ยูทิลิตีขนาดเล็กและปรับแต่งเฉพาะบุคคลจำนวนมากถือกำเนิดขึ้น ซึ่งในอดีตอาจถูกล้มเลิกไปเพราะไม่คุ้มกับเวลาที่ใช้
- เครื่องมือที่โดดเด่นที่สุดคือ เครื่องมือเฉพาะทางสำหรับงานอดิเรกและชีวิตประจำวัน เช่น การทดลองด้านดนตรี·เสียง การแปลงสื่อ ระบบอัตโนมัติภายในบ้าน การติดตามสุขภาพ และมีหลายกรณีที่แทนที่แอปเชิงพาณิชย์ด้วยสิ่งที่ทำเอง
- มีการพูดถึงซ้ำ ๆ ถึง เครื่องมือ sandbox และ orchestration สำหรับแยกสภาพแวดล้อมและรัน coding agent แบบขนาน รวมถึงเครื่องมือเวิร์กโฟลว์การพัฒนาที่อิงกับ tmux/worktree
- มีทั้งคำวิจารณ์ว่า "สิ่งที่คุณสร้างไม่ใช่สิ่งที่คุณสร้างเอง แต่เป็น AI สร้าง" และข้อโต้แย้งกลับว่า การเขียนโค้ดโดยใช้ AI ไม่ได้เป็น vibe coding ไปทั้งหมด ซึ่งสะท้อนการถกเถียงเรื่องความเป็นเจ้าของในการสร้าง
- ในหลายด้านที่แอปให้ดาวน์โหลดตอบโจทย์ได้เพียง 80~90% เพราะโฆษณา ค่าสมัครสมาชิก หรือข้อจำกัดด้านฟีเจอร์ ปัจจุบันกำลังเกิดการเปลี่ยนมุมมองว่า การสร้าง ซอฟต์แวร์เฉพาะบุคคลที่ตรงกับแต่ละคนอย่างแม่นยำ ขึ้นมาใหม่เองนั้นเร็วกว่า
- มีทั้งฝ่ายที่สนับสนุนว่า "นอกเหนือจากการพิมพ์แล้ว การดึงแอปที่ใช้งานได้ออกมาจาก AI ก็เป็นทักษะอย่างหนึ่ง" และฝ่ายที่โต้ว่า "การใช้ LLM ไม่ต้องมีทักษะอะไร ใช้ไม่กี่วันก็เรียนรู้ได้"
การเปลี่ยนแปลงที่นักพัฒนารับรู้
- มีความเห็นว่าต้อง เลิกยึดติดกับสำนึกเรื่องต้นทุนเดิม ๆ (unlearning) ที่สั่งสมมาทั้งอาชีพ กล่าวคือ งานที่เมื่อก่อนหลีกเลี่ยงเพราะใช้เวลานาน ตอนนี้ไม่จำเป็นต้องเป็นแบบนั้นอีก
- ขณะเดียวกันก็ยังมีมุมมองระมัดระวังว่า หากต้องการมาตรฐานสูงด้านคุณภาพ ประสิทธิภาพ และการดูแลรักษา ก็ยังต้องเขียนโค้ดด้วยมือ และ ข้อจำกัดของ LLM ให้ความรู้สึกเหมือนข้อจำกัดของฮาร์ดแวร์
- มีการคาดการณ์ถึงอนาคตที่ "ซอฟต์แวร์สำหรับผู้บริโภคถูกสร้างขึ้นได้ทันทีและตามสั่ง" และซอฟต์แวร์เฉพาะบุคคลจะกลายเป็นเรื่องปกติ
- อย่างไรก็ตาม ยังมีมุมมองแบบสมดุลว่า หลายกรณีอาจมีความหมายไม่ต่างจากคำถามว่า "พิมพ์อะไรออกมาจากเครื่องพิมพ์" และคุณค่าของเครื่องมือปรับแต่งเหล่านี้จะเกิดขึ้นได้จริงก็ต่อเมื่อมี เครื่องมือพื้นฐานที่เชื่อถือได้และมีความเป็น deterministic รองรับอยู่
1 ความคิดเห็น
ความคิดเห็นจาก Hacker News
ddahlen: กำลังศึกษาด้าน พลวัตวงโคจร ของดาวเคราะห์น้อย ดาวหาง และฝุ่นอวกาศ จึงสร้างเครื่องมือแสดงภาพความแม่นยำสูงที่แสดงการเคลื่อนที่ของดาวเคราะห์น้อยที่รู้จักทั้งหมดในระบบสุริยะ
เมื่อคลิกดาวเคราะห์น้อยดวงใดดวงหนึ่ง จะแสดงวงโคจรความละเอียดสูงพิเศษที่สอดคล้องกับการคำนวณวงโคจรของ JPL โดยคำนึงถึงฟิสิกส์ทั้งหมด ปัญหาหลายวัตถุ สัมพัทธภาพ และดาวเคราะห์ที่ไม่เป็นทรงกลม ไม่ค่อยเหมาะกับมือถือ https://dahlend.github.io/ketev/
yungbeto: ทำ การทดลองด้านเสียง เยอะมากเพื่อความสนุก อาจกิน CPU พอสมควร
https://www.noisetable.xyz/ เป็นชุดช่องเสียงแบบอิงความน่าจะเป็นพร้อมอินเทอร์เฟซสไตล์ VCR และ https://concrete95.net/ เป็นเว็บแอป musique concrète ที่หน้าตาเหมือน Windows 95 สามารถดึงเสียงแบบสุ่มจาก freesound.org มาวนซ้ำเป็นช่วงสั้น ๆ แล้วซ้อน synth pad หรือ melodic synth loop เพื่อสร้างบรรยากาศพื้นหลังได้ดี https://windso.me เป็น sample-based step sequencer ที่เลือกแซมเปิลเองไม่ได้ จึงสนุกดีแต่ยังต้องปรับอีกเยอะ
michaelbuckbee: อันที่ตลกที่สุดคือยูทิลิตีฟรี Moniker ที่ดูเนื้อหาไฟล์แล้วเปลี่ยนชื่อให้เข้ากับบริบท ใช้โมเดล AI แบบรันในเครื่อง และจดโดเมนได้ดีมาก https://finalfinalreallyfinaluntitleddocumentv3.com/
อันที่มีประโยชน์ที่สุดคือ HutchDB ซึ่งเป็นบริการ MCP สำหรับเรียกจาก AI chat หรือเอเจนต์เพื่อเก็บข้อมูล แค่พูดว่า “save that to Hutch” มันก็จะอนุมานสคีมาและฟิลด์ สร้างเว็บวิวแบบ Kanban, Timeline, Grid, Calendar ได้ และยังแชร์ผลลัพธ์ได้ด้วย เขาใช้กับการติดตามเวลา การส่งต่องานระหว่างเอเจนต์กับมนุษย์ และการเปรียบเทียบกิจกรรมการตลาดกับจำนวนผู้สมัคร https://hutchdb.com
อีกอย่างคือโฮสต์บน Vercel แล้วทำไมถึงฟรีก็สงสัยเหมือนกัน ถ้ามันไวรัลขึ้นมานิดเดียวก็อยากได้หลักประกันว่าจะไม่ปิดบริการเพราะค่าใช้จ่าย หรือเปลี่ยนไปคิดเงินเดือนละ 500 ดอลลาร์ หลังสมัครใช้งานแล้วก็ถูกรีไดเรกต์จาก https://hutchdb.com/ ไป https://hutchdb.com/dashboard จนดูหน้านโยบายความเป็นส่วนตัวกับข้อกำหนดการใช้งานไม่ได้
Jordan-117: Gemini ช่วยได้มากจริง ๆ ตอนย้ายจาก Windows ไป Linux
ถึงจะพอมีประสบการณ์อยู่บ้าง แต่พอย้ายระบบปฏิบัติการใหม่ก็มีคำถามจิปาถะกับเคสขอบแปลก ๆ เต็มไปหมด ถ้าต้องทำคนเดียวคงขาดทั้งความมั่นใจ ความอดทน และเวลา การได้คำตอบทันทีสำหรับปัญหาเฉพาะหน้าโดยไม่ต้องกลัวโดนตัดสินหรือรอคนตอบนั้นดีมาก ตอนย้ายกลับจาก Chrome ไป Firefox ก็ใช้บ่อยเพื่อหาทางเลือกแทนส่วนขยายที่เคยใช้ หรือถ้าไม่มี ก็ทำเองเสียเลย Gemini ก็ช่วยได้ กำลังทำปลั๊กอิน custom สำหรับ Quod Libet ด้วย Gemini และ Claude โดยมีฟังก์ชันอย่างดาวน์โหลด metadata และเนื้อเพลงแบบซิงก์ แถบด้านข้างไฮไลต์เนื้อเพลงขณะเล่น และปุ่มบุ๊กมาร์กช่วงโปรดของเพลง ต่อไปอยากทำระบบค้นหาเนื้อเพลงทั้งคลัง
ในสายงานที่ตัวเองเชี่ยวชาญ ก็ไม่ต้องเสียเวลาอ่านน้ำท่วมทุ่งสำหรับมือใหม่ ส่วนในเรื่องที่ไม่ถนัด ก็ถามคำถามมือใหม่ได้โดยไม่โดนไล่ไป RTFM หรือ LMGTFY
ดูเหมือนเป็นผลรวมจากทั้ง Google ที่แย่ลงเรื่อย ๆ และปัญหาในชีวิตประจำวันซับซ้อนขึ้นจนต้องใช้สคริปต์หรืออะไรทำนองนั้นถึงจะแก้ได้ ล่าสุดก็มีโจทย์อย่าง “หาที่ตั้งแคมป์ราคาถูกที่ยังเปิดอยู่ตอนนี้ใกล้ Pacific Crest Trail”
ingvay7: ตอนเย็นผมฝึกโซโลกีตาร์เร็ว ๆ แต่เพราะงานประจำยุ่งมากจนแทบไม่มีเวลาปรับโทนในแอมป์ซิมูเลเตอร์ เลยทำเครื่องมือที่แค่พิมพ์อย่าง “Brian May Solo Bohemian Rhapsody” แล้ว LLM จะเติม JSON contract จากนั้นสคริปต์จะสร้าง XML เพื่อโยนเข้า plugin ได้ทันที
ใช้แค่ 2 นาทีก็ได้อารมณ์เหมือนกำลังเล่นที่ Wembley ’85 แล้ว ถ้าทำแพตเทิร์นนี้ให้ทั่วไปขึ้น LLM ก็จะช่วยหา preset ให้ อัปโหลดไฟล์เข้าไปเพื่อจูนให้ตรงยิ่งขึ้นได้ และโค้ดจะตรวจสอบก่อนโหลดเข้า plugin เขากำลังใช้แนวทาง contract/adapter นี้กับ Terraform, preset ของ game engine และ CI pipeline ด้วย https://vishsubramanian.me/lm-guitar-tone-generator-polychro...
สำหรับมือใหม่กีตาร์มันทั้งน่ากลัวและน่าสนุก เป็นโพรงกระต่ายที่น่าสนใจ ถ้ามีพรอมป์ต์ “ผู้เชี่ยวชาญ” หลายแบบตามต้นแบบและแนวเพลงก็น่าจะสนุกดี
netcoyote: มีเครื่องมือที่ทำไว้ใช้ส่วนตัวอยู่หลายอย่าง
sandvault https://www.codeofhonor.com/projects/sandvault/ ใช้รันเอเจนต์ในบัญชีผู้ใช้ macOS แยกต่างหาก และเสริมความปลอดภัยด้วย sandbox-exec รองรับทั้งการท่องเว็บแบบ headless และ iOS Simulator ภายใน sandbox ด้วย clodpod https://www.codeofhonor.com/projects/clodpod/ รันเอเจนต์ภายใน macOS VM git-multi-hook https://www.codeofhonor.com/projects/git-multi-hook/ เป็น dispatcher ที่แก้ปัญหาซึ่ง git hook อนุญาตให้มีได้เพียงหนึ่งสคริปต์ต่อหนึ่งเหตุการณ์ และ TubeGate https://www.codeofhonor.com/projects/tubegate/ เป็นส่วนขยาย Chrome สำหรับบล็อกวิดีโอ YouTube ตามคีย์เวิร์ด ส่วน push10k https://www.codeofhonor.com/projects/push10k/ เป็นแอป iOS สำหรับติดตามความคืบหน้าของการวิดพื้น 10,000 ครั้ง บล็อกนี้เขียนโค้ดด้วย AI โดยใช้ Zola, Sveltia CMS, Cloudflare Pages/Workers และ GitHub Actions https://www.codeofhonor.com
Balgair: ทำ scraper งี่เง่าอันหนึ่งที่ไปดึงข่าวทั้งหมดมา หา ข่าวเกี่ยวกับสงคราม สรุปมัน แล้วแสดงผลพร้อมข้อความไตเติลเปิดแบบ Star Wars และดนตรี
Rantenki: ผมเขียน GUI สำหรับ pen plotter และตัวส่ง G-code ด้วย Rust แบบทำเองล้วนๆ ผู้ใช้ก็มีแค่ตัวเอง
บางครั้งตัวกระบวนการเองก็สำคัญ และการได้ใช้สมองก็สำคัญด้วย ผมเข้าใจความกังวลเชิงอัตถิภาวะว่า AI จะมาแย่งงานและกีดกันมนุษย์ออกจากกระบวนการสร้างสรรค์ แต่ถ้าทำเพื่อความพึงพอใจส่วนตัว ก็แค่เขียนโค้ดไปได้เลย https://github.com/armyofevilrobots/bap-egui
wizenheimer: ผมปล่อย QA harness สำหรับ Claude Code ออกมาแล้ว มันจะอ่านความต่างของโค้ดและหา UI flow ที่ได้รับผลกระทบ จากนั้นก็ทดสอบในเบราว์เซอร์จริง แทนที่จะต้องคลิกไล่ตาม flow บนหน้าจอด้วยตัวเอง
หลังจบแต่ละรัน จะมีการบันทึกวิดีอหน้าจอ, console log, network requests, HAR และ Playwright trace ให้ดูว่าเอเจนต์ทำอะไรไปอย่างแม่นยำ https://github.com/wizenheimer/canary
ลองโพสต์ Show HN แล้ว แต่ไม่รู้ด้วยเหตุผลอะไรถึงโดนปักธง
DonaldFisk: Dartmouth Summer Research Project on Artificial Intelligence คือปี 1956 และ AI เองก็สืบย้อนไปได้ถึงหุ่นยนต์อย่าง Elmer และ Elsie ของ William Grey Walter ในปี 1948 ซึ่งตอนนั้นเรียกว่า ไซเบอร์เนติกส์
ตั้งแต่ยุค 1980 ผมก็ทำ symbolic AI เป็นพักๆ แต่สิ่งที่พูดถึงกันที่นี่น่าจะหมายถึง LLM มากกว่า ผมยังไม่เคยใช้ LLM โดยตรง ช่วงนี้เลยลองทำโครงข่ายประสาทเทียมหลายชั้นในภาษา C เพื่อการเรียนรู้ ก่อนหน้านี้เคยทำ speech spectrogram ด้วย Lisp แล้วต่อกับ Unix pipe เพื่อพยายามรู้จำหน่วยเสียงด้วย hidden layer เดียว ตอนมีแค่สระผลค่อนข้างดี แต่พอเพิ่มเสียงอย่าง l, r, s, z เข้าไป ประสิทธิภาพก็แย่ลง โค้ด C ดูเหมือนจะไม่มีบั๊ก แต่ผมไม่รู้วิธีเทรน ANN ให้ได้ผลดีง่ายๆ ลองทั้งเพิ่มชุดฝึก เพิ่มชั้น และปรับจำนวนเซลล์ประสาทใน hidden layer แล้ว แต่เทคนิคดีบักทั่วไปไม่ค่อยช่วย
linsomniac: ประสบความสำเร็จอย่างมากในการออกแบบระบบปฏิบัติการเวิร์กสเตชันใหม่ด้วย NixOS และ Claude Code
ชอบที่ NixOS มีการตั้งค่าที่ทำซ้ำได้โดยอิงจาก git repository และสามารถบูตกลับไปใช้การตั้งค่าก่อนหน้าได้เมื่อทำพัง แต่การเรียนรู้และลงมือทำเองแบบแมนนวลนั้นเป็นงานใหญ่ ลองเล่นมาประมาณ 2 ปีแต่ก็ยังไปไม่ถึงการตั้งค่าเวิร์กสเตชันแบบสมบูรณ์ และเพราะต้องอัปเกรด Ubuntu 22.04 เลยตัดสินใจลอง NixOS อย่างจริงจังก่อนจะไป 26.04 รอบนี้ตั้งค่าทั้งหมดด้วย Claude Code และใช้มาหนึ่งสัปดาห์แล้วโดยไม่พบว่าขาดอะไร ติดตั้งบนแล็ปท็อปเก่าก่อนแล้วค่อย ๆ ย้ายมาลงใหม่บนเวิร์กสเตชันปัจจุบัน และการตั้งค่าเครื่องที่สองก็เป็นเรื่องเล็กน้อยเพราะ NixOS ตอนนี้ต่อให้ฮาร์ดแวร์พังก็แค่เอา /etc/nixos มาสร้างใหม่ก็พอ นอกจากนี้ยังใช้ Claude Code สร้าง
neovim.nixยาวราว 700 บรรทัดที่ใส่เฉพาะฟังก์ชันที่ต้องการแทน LunarVim/AstroVim และยังรวม LSP กับ TreeSitter ไว้ด้วยrockmeamedee: https://github.com/amedeedaboville/mish เป็น mosh โคลนที่ใช้ ชั้นทรานสปอร์ต QUIC
มันใช้ได้ทั้ง datagram แบบไม่เชื่อถือได้เหมือน UDP และ stream แบบเชื่อถือได้เหมือน TCP เลยมี scrollback buffer ด้วย ด้วยความที่ใช้ QUIC ก็ปล่อยให้ QUIC จัดการเรื่องการเข้ารหัสได้ จึงไม่ต้องเชื่อใจให้ LLM ไปเขียนระบบเข้ารหัสเอง เทอร์มินัลจัดการด้วย alacritty และ SSH ใช้ russh ซึ่งเป็น SSH ที่เขียนด้วย Rust จึงทำงานได้ในสภาพแวดล้อมที่ไม่ได้ติดตั้ง SSH เช่น Windows ซึ่ง mosh แบบเดิมไม่รองรับ Claude ช่วยรันทั้ง end-to-end test, การจำลองเครือข่ายแบบ FoundationDB, การทดสอบลำดับเธรดอะซิงก์ของ tokio, เป้าหมายสำหรับ fuzzing 12 จุด และการตรวจสอบแบบจำลองโปรโตคอลอย่างเบาทั้งไปและกลับ และในแต่ละรอบของ fuzzing ก็เจอบั๊กทุกครั้ง ถ้าไม่นับกรณีแนว “อาจมีบั๊กแต่พิสูจน์ความถูกต้องแล้ว” มันก็ดูน่าเชื่อถือได้พอ ๆ กับต้นฉบับ หรืออาจมากกว่าด้วยซ้ำ
stonlyb: Workhorse เป็นชุดสคริปต์/เครื่องมือ CLI ที่เปลี่ยนแล็ปท็อปเก่าให้กลายเป็นโหนดประมวลผลและสตอเรจแบบ headless ผ่าน SSH และให้เครื่องหลักโยนงานไปทำที่นั่นได้
องค์ประกอบหลักคือ onpro ซึ่งเป็นสคริปต์ตัวกลางที่ตรวจสอบเครื่อง ปล่อยให้คำสั่งไปรันจากระยะไกล และถ้าเครื่องหลับอยู่หรือถอดปลั๊กก็จะสลับกลับมารันในเครื่องเองโดยอัตโนมัติ ในการตั้งค่า AI coding นั้น hook
PreToolUseจะดักคำสั่งหนัก ๆ เช่น build, test, ffmpeg, OCR หรืองาน pandas ขนาดใหญ่ แล้วส่งไปรันบน workhorse แทน MacBook Air เอเจนต์เป็นคนตัดสินใจว่าจะรันอะไร ส่วนชั้นที่กำหนดแบบตายตัวจะคอยรับประกันว่างานหนักถูกส่งไปยังเครื่องที่ถูกต้อง ตั้งใจว่าจะแชร์หลังจากทดสอบเพิ่มอีกหน่อย https://motate.app/ เป็นความพยายามที่เริ่มจากอยากให้การเขียนคณิตศาสตร์ง่ายขึ้น เพราะตอนทบทวนพีชคณิตเชิงเส้นต้องอุ้มทารกแรกเกิดไปด้วย และตอนนี้กำลังคิดว่าจะทำให้มันเป็นประโยชน์ในวงกว้างขึ้นสำหรับการเขียนและการสอนด้านวิทยาศาสตร์กับคณิตศาสตร์ได้อย่างไรxlii: มีหลายอย่าง แต่มีบางชิ้นที่ภูมิใจเป็นพิเศษ
https://github.com/exlee/pikchr_pl คือ DiagramIDE ที่ให้สคริปต์ไดอะแกรม Pikchr ได้ใน workbench สไตล์ Amiga โดยใช้ TCL, Prolog, Pikchr และล่าสุดคือ mruby https://svg.axk.sh เป็นตัวแก้ไข SVG แบบกึ่งแมนนวลเพื่อช่วยแปลงภาพเวกเตอร์กึ่ง ๆ ที่ AI สร้างขึ้นให้เป็นเวกเตอร์จริงได้ง่ายขึ้น https://github.com/exlee/rik เป็น AI harness ที่ใช้ text editor เป็น UI ซึ่งทำให้ขำทุกครั้งที่ใช้ มันมีบุคลิกและชอบปล่อยคอมเมนต์เพี้ยน ๆ แต่ก็เป็นเอเจนต์ที่ถูกจำกัดความสามารถอย่างมาก ไม่ถึงขั้นเป็น vibe coding แต่ AI ช่วยให้ข้ามจุดฝืดใหญ่ ๆ ได้ง่ายขึ้นมาก เช่น ตอนที่ไม่อยากเขียนอัลกอริทึมการ fit SVG แบบคัสตอมขึ้นมาใหม่
melvinroest: สร้าง แอปบันทึกเสียง ที่คล้ายกับ Apple Voice Memos
ตอนนี้อัปโหลดบันทึกเสียงขึ้น iCloud แล้วให้ Claude Code เปลี่ยนมันเป็นโน้ตแบบมีโครงสร้าง และแอปก็แสดงโน้ตเหล่านั้น วิธีใช้คือเดินเล่นสักชั่วโมงแล้วพูดไปเรื่อย ๆ ตามกระแสความคิด จากนั้น Claude จะจัดระเบียบให้ ชอบที่แค่พูดความคิดออกมาก็ถูกจัดโครงสร้างให้แล้ว ทำแบบ vibe coding และตอนนี้เกือบแตะ 20,000 บรรทัดรวมเทสต์แล้ว มันทำงานได้ค่อนข้างดี แต่ยังมีบั๊กอยู่จึงต้องทำงานวิศวกรรมจริงจังเพิ่มอีกหน่อย ส่วน UX นั้นทำงานได้ดี
vtbassmatt: พอทำไปทำมาก็กลายเป็นว่าเกือบทั้งหมดเป็นเครื่องมือสำหรับงานอดิเรกรอบ ๆ เกม
มีทั้งสมุดสูตรอาหารสำหรับเก็บสูตรโปรดของครอบครัวไว้ เพื่อจะได้เลิกพึ่ง Pinterest ในสักวัน https://github.com/vtbassmatt/Cookbook, ไปป์ไลน์ดึงข้อมูลและเสิร์ชเอนจินสำหรับเกมการ์ด Mood Swings https://moodswingsdata.github.io และ https://moodswingsdata.github.io/feelings, แอปสำหรับช่วยกันสร้าง Magic: the Gathering cube แบบวนซ้ำกับเพื่อน ๆ https://github.com/vtbassmatt/popcorn-cube, เอนจินวิกิแบบคัสตอมสำหรับเครือข่ายพอดแคสต์ที่ชอบ https://github.com/vtbassmatt/totalus-wikium, และตัวดู log ของ systemd บนเว็บ https://github.com/vtbassmatt/djournal
aleqs: ผมทำ เครื่องมือ lint repository แบบทั่วไป ขึ้นมา https://alint.org/ https://github.com/asamarts/alint
เดิมทีตั้งใจจะใช้แทนสคริปต์ตรวจสอบความเป็นระเบียบและโครงสร้างของ repository หลายตัวที่ค่อย ๆ เพิ่มเข้ามาตอนเห็น AI แก้โค้ดแบบหลวม ๆ หลังจากนั้นก็ไปดู open source repository หลายแห่งว่าพวกเขาเขียนสคริปต์ตรวจอะไรบ้าง แล้วเอามาใส่ในเครื่องมือเป็นประเภทรูลที่ใช้ได้ทั่วไปและขยายต่อได้ สามารถนิยามโครงสร้าง repository, ความเป็นระเบียบ, และกฎอื่น ๆ แบบ declarative ได้ และมันเร็วมาก จึงเหมาะกับ workflow ของ pre-commit และ CI https://alint.org/benchmarks/
shibel: ใน Tailscale ถ้าชี้โดเมนไปที่ FQDN ของเครื่องที่แชร์อยู่ โดเมนนั้นจะใช้ได้เฉพาะกับคนที่ถูกแชร์ให้เท่านั้น https://www.youtube.com/watch?v=Vt4PDUXB_fg
แต่ถ้าอยากให้ผู้ใช้ไม่ต้องรู้พอร์ตของแอปแต่ละตัว ก็ต้องเปิดให้เข้าถึงพอร์ต 443/80 ของโฮสต์นั้นใน Tailscale ACL ซึ่งทำให้ immich.familydomain.com สะดวกสำหรับครอบครัวก็จริง แต่ในมุมมองของเครือข่าย serveradmin.familydomain.com บนโฮสต์เดียวกันก็เข้าถึงได้ด้วย ผมเลยใช้เวลาหลายชั่วโมงกับ Claude เมื่อราวเดือนมกราคม เขียน Go authentication gateway ตัวเล็ก ๆ ที่ไปเช็กทั้ง Tailscale public API และ
localapiแล้วตอบ Caddy ตามพอร์ตที่ผู้ใช้คนนั้นได้รับอนุญาตจริง ๆ ตอนนี้เลยแชร์แอปและซับโดเมนคนละชุดให้แต่ละคนได้ โดยไม่ต้องเสียการควบคุมสิทธิ์ที่นิยามไว้ในไฟล์ policy ของ Tailscale เหตุผลที่ไม่ใช้พวก Authentik ก็เพราะผู้ใช้ล็อกอิน Tailscale อยู่แล้ว จึงไม่เห็นความจำเป็นต้องติดตั้งและตั้งค่าแอปใหญ่แยกต่างหากที่ทำเรื่องเดิมซ้ำ แล้วบังคับให้ยืนยันตัวตนสองรอบSerenacula: ผมมีสคริปต์ที่รับ input prompt เพื่อสร้างสคริปต์ใหม่ แล้วต่อด้วยการรันสกิลเพื่อตรวจและไล่แก้บั๊กทีละน้อย
ผมยังใช้มันสร้างอีกสคริปต์หนึ่งไว้ลิสต์และติดตามสคริปต์คัสตอมทั้งหมดด้วย และก็มีเครื่องมือที่โหลด local script เพื่อกำหนดขอบเขตคำสั่ง CLI ให้เข้ากับสภาพแวดล้อมของโฟลเดอร์นั้น ๆ โดยรวมแล้วผมสร้างใช้กับทุกอย่างที่คิดว่าน่าจะทำให้เป็น automation ได้ สักวันหนึ่งกะว่าจะเขียนเป็นบล็อกโพสต์ และช่วงหลังมานี้เองที่เริ่มรู้สึกจริง ๆ ว่าโลกของ personalized software ได้เปลี่ยนไปแล้ว
neonglow: สร้างส่วนขยายเบราว์เซอร์ที่ หยุดการเล่นภาพเคลื่อนไหวอัตโนมัติ อย่าง GIF เป็นค่าเริ่มต้น
รำคาญมาตลอดที่เบราว์เซอร์เล่นภาพเคลื่อนไหวอัตโนมัติ และจนถึงตอนนี้ก็ยังไม่มีตัวควบคุมในตัว ส่วนขยายนี้จะแสดงเฟรมแรกและเพิ่มปุ่มเล่น/หยุดไว้บนภาพ เริ่มจากเป็นยูทิลิตีใช้ส่วนตัว แต่ก็เอาไปลงใน Firefox และ Chrome extension store แล้ว เป็นโปรเจ็กต์เล็ก ๆ ที่แก้ปัญหาที่เจอทุกวัน Firefox: https://addons.mozilla.org/en-US/firefox/addon/gif-control/ Chrome: https://chromewebstore.google.com/detail/gif-control/nhoihin... ยินดีรับ bug report และฟีดแบ็ก เคยโพสต์ใน Show HN มาก่อนแต่ไม่มีเสียงตอบรับ https://news.ycombinator.com/item?id=48208916
thatmf: ลอง vibe coding ทำ เว็บแอป เล็ก ๆ ที่ติดตั้งไว้บนหน้าโฮมได้ เพื่อบอกว่าประชุมแรกของวันถัดไปเริ่มเมื่อไร
มีประชุมเยอะและเปลี่ยนตลอด แต่ไม่อยากล็อกอินบัญชีงานบนมือถือหรือแม้แต่ต้องนึกถึงโลกใบนั้น แค่อยากรู้ว่าควรตื่นกี่โมง แอปจะแสดงแค่เวลา และแตะเพื่อดูชื่อเรื่องได้ ฟอนต์กับสีก็เปลี่ยนตามว่าประชุมเช้าแค่ไหน และถ้าก่อน 8 โมงเช้าจะใช้ Nosifer ถ้าจะทำเองก็คงทำได้ แต่ก็น่าจะไม่ทำ มองว่ายูทิลิตีง่าย ๆ ที่ปรับแต่งเฉพาะทางสุด ๆ แบบนี้เหมาะกับ vibe coding มาก
asciimoo: กำลังสร้างบริการค้นหาแบบโฮสต์เองชื่อ Hister เพื่อลดการพึ่งพาเสิร์ชเอนจินออนไลน์และคำตอบจาก AI https://hister.org/ https://github.com/asciimoo/hister
Hister เป็นตัวทำดัชนีข้อความเต็มสำหรับเว็บไซต์และไฟล์ในเครื่อง และจะบันทึกหน้าเว็บที่เบราว์เซอร์เรนเดอร์แล้วซึ่งเคยเข้าชมโดยอัตโนมัติ มีอินเทอร์เฟซค้นหาทั้งบนเว็บและเทอร์มินัล พร้อมพรีวิวผลลัพธ์แบบออฟไลน์และภาษาคิวรีแบบละเอียด และถ้าจำเป็นก็สลับไปเสิร์ชเอนจินแบบดั้งเดิมได้อย่างรวดเร็ว สำหรับการค้นหาแบบ “ระลึกความจำ” เพื่อหาคอนเทนต์ที่เคยเข้าชมมาก่อน มันมอบประสบการณ์ที่เป็นมิตรต่อความเป็นส่วนตัว แต่สำหรับการค้นหาแบบ “ค้นพบ” เพื่อหาเนื้อหาใหม่ ๆ ยังไม่ดีพอ
hakunin: สร้างตัวกวาดข้อมูลบน SQLite ที่ไล่อ่านไฟล์สแกน โน้ต PDF และรูปภาพในไฟล์ซิสเต็ม บันทึกพาธไว้ และเปิดให้ค้นหาคำอธิบายกับข้อความที่ได้จาก Mistral OCR
สามารถถามได้อย่าง “ฉันควรเอารถไปเข้าศูนย์เมื่อไร” หรือ “หารูปที่ลูกวาดให้แม่ในวันแม่ให้หน่อย” แล้วรัน document chat แบบนี้ผ่านไฟล์ปฏิบัติการ bash บน Raspberry Pi https://github.com/maxim/ringbinder
alphaBetaGamma: สร้างเครื่องมือสำหรับออกแบบ เครื่องประดับที่ได้แรงบันดาลใจจากวิทยาการคอมพิวเตอร์และวิทยาศาสตร์ ใน CAD
เขียน DSL สำหรับอธิบายเครื่องประดับ แล้วให้ LLM สร้างอินเทอร์พรีเตอร์ที่สร้างไฟล์ CAD ด้วย cadquery ได้ และก็ได้บทเรียนว่า LLM ไม่เก่งเรื่องการให้เหตุผลแบบ 3D ถ้าไม่มี AI ก็คงหาเวลาทำไม่ได้ เจ้าตัวยังใช้ AI ออกแบบร้านออนไลน์ด้วยเพราะไม่ใช่นักพัฒนาฝั่งฟรอนต์เอนด์ และก็น่าทึ่งที่ภรรยาซึ่งไม่มีพื้นฐานเทคนิคสามารถใช้ Claude Code แก้เว็บไซต์ได้ ผลลัพธ์สุดท้ายคือร้านที่ขายเครื่องประดับทรง lambda diagram (Tromp diagram) สำหรับคำนวณจำนวน Graham หรือทรง fixed-point operator ที่ใกล้เคียงกับ Y-combinator ส่วน Y-combinator จริง ๆ กลับสวยน้อยกว่าในมุมของเครื่องประดับ https://studio-galois.com
mybbor: ทำดีไซน์สติกเกอร์สำหรับคอนเสิร์ตและเทศกาลดนตรีมาตั้งแต่ก่อนที่การเขียนโค้ดแบบเอเจนต์จะเริ่มแพร่หลาย การทำสติกเกอร์ไปแจกช่วยให้ได้เจอคนใหม่ ๆ ง่ายขึ้น
ยังทำเอเจนต์โค้ชด้านสุขภาพและเวลเนสด้วย OpenClaw เพื่อติดตามแคลอรีและการดื่มแอลกอฮอล์แล้วบันทึกลงแดชบอร์ดส่วนตัวอีกด้วย ถ้าส่งรูปอาหารไป มันจะประเมินแคลอรีเพื่อบันทึก ช่วยตัดสินใจเรื่องมื้ออาหาร และยังให้กำลังใจด้วย ใช้รีโพซิทอรี HAM dashboard https://github.com/VA3HDL/hamdashboard ทำแดชบอร์ดแบบคัสตอมที่รวมฟีดวิดีโอและสภาพอากาศในท้องถิ่น และจากหลุมกระต่ายเดียวกันก็ทำคู่มืออ้างอิงวิทยุสมัครเล่นสำหรับพื้นที่ Sonoma County ด้วย https://mybbor.com/petaluma-sonoma-ham-radio.html ยังทำเว็บไซต์เล็ก ๆ แบบครั้งเดียวหรือขนาดย่อมอีกเกือบ 12 แห่งสำหรับความสนใจและโปรเจ็กต์ต่าง ๆ และชอบใช้ตัวอัปโหลดไฟล์บนโดเมนสั้น ๆ เพื่อโฮสต์ Markdown และ HTML อย่างรวดเร็วแล้วแชร์ให้ครอบครัว เพื่อน และเพื่อนร่วมงาน ใช้งานบน Caddy และ DigitalOcean VPS และเปิดซอร์สโค้ดไว้แล้ว https://github.com/RobbyMcCullough/honeydrop
yablak: ทำเครื่องมือสำหรับแบ็กอัป Google Photosที่ทำงานแบบ incremental มากกว่า Google Takeout https://github.com/ebrevdo/gphoto-pull
หลังออกจาก Google ก็ยังทำเวอร์ชันลินเตอร์ของ IFTTT ที่คิดถึงขึ้นมาด้วย https://github.com/ebrevdo/ifttt-lint
jfim: ทำเครื่องมือไว้เยอะมาก
ทำเครื่องมือ web archiving แบบ self-hosted ที่รองรับ processing pipeline แบบขยายได้ เช่น ดึงข้อความ→แปล→สรุป→สร้างแท็ก หรือดาวน์โหลดวิดีโอ→แยกเสียง→ถอดเสียง→สรุป ระหว่างทางนั้นก็ทำเบราว์เซอร์ Chromium แบบจัดการเองที่รองรับส่วนขยายและ WARC รวมถึงตัวสังเคราะห์ RSS ที่สร้างฟีดจากหน้ารายการบทความอะไรก็ได้ที่ไม่มี RSS ด้วย นอกจากนี้ยังมี active learning loop สำหรับโมเดลที่ใช้เก็บกวาดบทความโดยลบสิ่งรบกวนอย่าง native ads และ sponsor blocks ออกไปด้วย ยังทำแท็บเทอร์มินัลที่มีฟีเจอร์จัดการโปรเจ็กต์ เช่น เปิดฐานข้อมูล แอปเซิร์ฟเวอร์ และ Claude Code ทีเดียวตามแท็บ และถ้าเทอร์มินัลอ่าน
http://localhost:4000/ก็จะเปิดเบราว์เซอร์ไปยัง URL ที่ถูกต้องโดยอัตโนมัติด้วย มีทั้งโมดูลาร์ MCP server, MCP proxy และ OAuth2 DCR ที่สามารถเพิ่มไอเดีย MCP server ใหม่กับ Claude แล้วดีพลอยได้ภายในไม่กี่นาที อีกทั้งยังมีเครื่องมือเล็ก ๆ ที่เรนเดอร์บทสนทนา Claude แล้วลิงก์เข้า Obsidian vault ได้ด้วยลิงก์อย่างconvo://claude-code/-home-jfim-projects-foo/และโดยรวมก็ใช้กับการดีพลอย Docker container ในสภาพแวดล้อม self-hosted ของตัวเองเยอะมาก ส่วนใหญ่มีอยู่บน GitHub แต่ความพร้อมก็แตกต่างกันไปjoddystreet: ทำไว้หลายอย่าง
มีทางเลือกแทน POPSQL แบบ self-hosted https://github.com/p-raj/collab-sqlc, ทางเลือกแทน CleanMyMac ที่อิงเครื่องมือโอเพนซอร์ส https://github.com/p-raj/open-cleanmymac, เครื่องมือแปลงการประชุม standup ให้เป็นการ์ตูน https://github.com/p-raj/standup-to-comics, และ Pomodoro ที่ตั้งค่าได้ https://github.com/p-raj/open-tomato ยังมีเครื่องมือส่วนตัวอีกหลายตัวที่ยังห่างไกลจากคำว่าใช้งานได้อยู่มาก
SdtEE: เบื่อกับพฤติกรรมประหลาดสารพัดที่เกิดขึ้นเวลา Excel เปิด CSV ก็เลยเริ่มทำตัวดู CSVที่เร็วและเบา
ต่อมาถึงได้รู้ว่าเทคนิคการโหลดไฟล์ CSV ขนาดใดก็ได้แบบทันทีนั้นสามารถทำให้เป็นนามธรรมเป็น parser combinator แบบ incremental ที่ใช้ได้กับฟอร์แมตอะไรก็ได้ เลยทำให้อ่านได้ไม่ใช่แค่ไฟล์ แต่รวมถึงแหล่งข้อมูลแบบสตรีมอย่าง pipe ด้วย ใช้ AI ช่วยพัฒนา แต่เวลาส่วนใหญ่กลับหมดไปกับการออกแบบ UX ที่เข้าใจง่ายและสม่ำเสมอ เลยไม่ได้เร็วขึ้นมากนัก ยังไม่พร้อมสำหรับ production แต่ถ้าสนใจก็ดูได้ https://github.com/Verticalysis/Hitomi
AJRF: ช่วงที่รู้สึกว่า “ไม่คิดว่าจะทำได้จริง” คือการทำไดรเวอร์ user-space สำหรับ Nintendo Switch Pro 2 Controller บน Ubuntu ด้วย GLM 5
ตอนเสียบเข้าไป เครื่องถูกตรวจพบก็จริง แต่พอกดปุ่มกลับพยายามเริ่มกระบวนการจับคู่ และใน evtest ก็ไม่มีอะไรเข้ามาเลย คำอธิบายนั้นแทบจะถูกใช้เป็นพรอมป์ต์ตรง ๆ และอีก 10 นาทีต่อมาก็มีไดรเวอร์พร้อม systemd unit ที่ยังทำงานได้หลังรีสตาร์ตด้วย เหลือเชื่อมาก
josh_p: สร้าง บอต Telegram ที่ส่งรายการสิ่งที่ต้องทำให้ผมแทบทุกเช้าและบ่าย
มันเชื่อมกับ Google Calendar และฐานข้อมูลหน่วยความจำแบบบ้าน ๆ (SQLite) และผมให้มันพูดเหมือน Yarnaby จาก Silksong ตามที่ลูก ๆ ขอ
ผมยังทำระบบสำรองเซฟ Steam อัตโนมัติไว้เผื่อเวลาที่ลูก ๆ เล่นเกมเดียวกันในบัญชีผมแล้วเซฟบน Steam Cloud ตีกัน และทำสคริปต์รีรัน GitHub Actions ที่ล้มเหลวอัตโนมัติสำหรับรีโปที่มีเทสต์งอแงด้วย เป็นงานประเภทที่ก็ไม่แน่ใจนักว่าควรไปแก้ต้นตอจริงไหม นอกจากนี้ยังทำให้สาขาตาม
mainอัตโนมัติด้วย มีส่วนขยาย YNAB สำหรับ pi agent harness ที่ช่วยป้อนรายการซื้อซึ่งต้องแยกหมวดหมู่ และใส่เข้าไปในบอต Telegram เพื่อให้บรรยายรายการซื้อด้วยเสียงได้ด้วย เดิมทีผมมีสคริปต์ Python สำหรับสร้าง PDF เพื่อพิมพ์ proxy ของ Magic: The Gathering อยู่แล้ว เลยใช้ LLM ให้สร้างแผ่นคั่นที่มีชื่อเซ็ตกับสัญลักษณ์ ทำให้จัดกล่องการ์ดใบใหญ่ได้ง่ายขึ้นgeedy: กำลังทำ BRep CAD kernel ขึ้นใหม่ทั้งหมดตั้งแต่ศูนย์
ถ้าทำให้ fillet ทำงานได้ดีมาก ๆ เมื่อไร ก็มีแผนจะปล่อยเป็นโอเพนซอร์ส คงต้องใช้เวลาอีกพอสมควร แต่เริ่มมา 10 สัปดาห์แล้วและคืบหน้าไปมาก เป้าหมายระยะกลางคือทำแอป GUI ที่นำเข้าไฟล์ STEP แล้วจัดการเฉพาะ fillet คุณภาพสูงมากได้ คิดว่าน่าจะมีประโยชน์สำหรับสายงานอดิเรกหลายคน
smeej: ใช้ Logseq มานานแล้ว และโชคดีที่ทั้ง Logseq กับปลั๊กอินต่างก็เป็นโอเพนซอร์ส
ผมชอบโคลนปลั๊กอินที่ใช้บ่อย ๆ แล้วบอกว่า “Claude ทำให้มันทำ X ได้ด้วยตรงนี้หน่อย” เพื่อเพิ่มความสามารถที่อยากได้มาตลอด
mike-cardwell: https://gitlab.com/grepular/calendiff คอยเฝ้า URL ของไฟล์ .ics แล้วแจ้งการเปลี่ยนแปลงในปฏิทินทางอีเมล
https://gitlab.com/grepular/foxcage รัน Firefox ใน podman เพื่อแยกจากโฮสต์ และใส่เฉพาะฟีเจอร์บางอย่างที่ผมต้องการ https://gitlab.com/grepular/claude-sandbox เป็น Claude sandbox อีกตัวหนึ่ง ซึ่งรันใน podman เช่นกัน และมีระบบพร็อกซีที่แข็งแรงสำหรับปกป้องข้อมูลรับรอง ตอนนี้กำลังทำ เครื่องมือชำระล้างอีเมล อยู่ และถ้ามันพร้อมให้คนอื่นใช้ได้เมื่อไร ผมจะเขียนถึงมันที่ https://www.grepular.com/blog/ มันใช้ policy กับส่วน HTML/SVG/calendar/vcard เพื่ออนุญาตหรือบล็อกแท็ก แอตทริบิวต์ CSS และ URL schema จัดระเบียบ URL ดึง remote content ตอนส่งมอบแล้วแนบเข้าไปในอีเมลเพื่อกันการติดตาม รวมถึงมีฟีเจอร์อีกมาก เช่น การเข้ารหัสและถอดรหัส PGP กับ S/MIME อัตโนมัติ
eternityforest: เคยสร้าง แอปติดตามสินค้าคงคลัง ที่ทำงานในเบราว์เซอร์อย่างเดียวด้วย yjs และซิงก์ผ่าน peer.js แต่ช่วงนี้ไม่ค่อยได้ใช้แล้ว https://eternityforest.github.io/Stuffer/
ถึงจะไม่ใช่แอป แต่ผมก็มีระบบเพิ่มประสิทธิภาพการทำงานด้วย ทุกครั้งที่ผมลืมอะไรสักอย่าง ผมจะบอก AI แล้วค่อย ๆ ขัดเกลามันไปพร้อมกับขอเอกสารอ้างอิงงานวิจัยเรื่อง human error ที่เกี่ยวกับความผิดพลาดแบบนั้นโดยเฉพาะ https://github.com/EternityForest/THUNDERWARS
david_shi: ตลอด 3 เดือนที่ผ่านมา ผมทำให้การตั้งค่า OpenClaw agent ใหม่บนคลาวด์ทำได้เร็วมาก https://operator.io
การรันเอเจนต์แยกกันหลายตัวใน Telegram โดยแต่ละตัวมีหน่วยความจำและงานของตัวเอง ช่วยได้มากกับการทำระบบแจ้งเตือนอัตโนมัติ การติดตามบริบท และการเป็นเหมือน external cortex ส่วนตัว
flutas: ผมทำชุดตั้งค่า Home Agent และมีเอเจนต์เฉพาะทางแบบคัสตอมที่จัดการหลายแง่มุมของบ้านผ่าน Home Assistant
มันพยายามเรียนรู้จากฟีดแบ็กของคนในบ้านเพื่อปรับให้เหมาะกับช่วงเวลาที่ถูกต้อง ผมยังทำ MCP ที่เกี่ยวข้องไว้อีกหลายตัว มีเซิร์ฟเวอร์ Claude Code ระยะไกลด้วย ทำให้ดูภาพรวมระดับโปรเจกต์และรันหรือพัฒนาโปรเจกต์บนโฮมเซิร์ฟเวอร์แทนโน้ตบุ๊กโลคัลได้ รองรับทั้ง SSH และเว็บ UI โดยเว็บ UI มีรายการโปรเจกต์ เชลล์ที่เรนเดอร์ด้วย https://xtermjs.org/ และมุมมองแบบไทล์สำหรับดูการจบเทิร์นเวลา ทำหลายโปรเจกต์พร้อมกัน ในทำนองเดียวกัน เวอร์ชันโลคัลจะเปิดคอนเทนเนอร์ podman ระดับโปรเจกต์ให้อัตโนมัติ ส่งผ่าน working directory ติดตั้ง CC/Codex/Grok และส่งต่อการยืนยันตัวตนกับการตั้งค่าของแต่ละเอเจนต์ แล้วพาเข้าเชลล์ที่ใส่ environment flag กับ alias เพื่อปิด permission prompt เช่น
claude = claude --dangerously-bypass-permissionsผมยังมี MCP ขนาดใหญ่ที่เปิดให้เอเจนต์เข้าถึงฟีเจอร์ขั้นสูงของ Obsidian รวมถึงการแนะนำ ติดตั้ง และตั้งค่าปลั๊กอินด้วย มันช่วยเรื่องประสิทธิภาพการทำงานในชีวิตประจำวันได้ แต่ส่วนใหญ่ผมก็ยังชอบลงมือแก้โค้ดเองมากกว่าสั่งทุกอย่างด้วยพรอมป์ต์danielvaughn: กำลังทำ เบราว์เซอร์ สำหรับดีไซเนอร์ แม้จะทำเพื่อคนอื่นด้วย แต่หลัก ๆ คือทำไว้ให้ตัวเองใช้
ผมทำงานกับโค้ด แต่บ่อยครั้งก็ไม่อยากสร้างสาขาหรือทำให้โค้ดเบสเละด้วยเดโมคอมโพเนนต์และไฟล์ต่าง ๆ แค่เพราะอยากลองไอเดียหลายแบบ ถ้าเบราว์เซอร์ทั่วไปมี developer tools เบราว์เซอร์นี้ก็มีเครื่องมือออกแบบฝังมาในตัว คุณเข้าแอป เปิดแคนวาสรอบ ๆ ลากชิ้นส่วนต่าง ๆ มาวางบนแคนวาสเพื่อทำงานคล้ายการออกแบบ แล้วค่อยรวมกลับเข้าไปเป็นโค้ดได้ ทุกอย่างเกิดขึ้นใน UI เดียวกัน มันเจ๋งพอที่ผมจะปล่อยให้คนอื่นใช้ แต่ตอนนี้ก็มีประโยชน์กับผมมากอยู่แล้ว https://matry.design/
margarita_dev: ในลิสต์สิ่งที่อยากลองสร้างเองตั้งแต่ต้นมี ภาษาโปรแกรม อยู่เสมอ และก็ทำเสร็จได้ด้วยความช่วยเหลือจาก AI
ที่บริษัทได้เห็นปัญหาใหญ่สองอย่างคือเวิร์กโฟลว์ AI และไลบรารีสกิล อย่างแรกคือเมื่อเวิร์กโฟลว์ทั้งชุดเป็นไฟล์ Markdown 100 ขั้นตอน มันขาดความเป็น deterministic และอย่างที่สองคือไลบรารีสกิลแบบ Markdown มี composability ต่ำ ทำให้ละเมิดหลัก DRY ได้ง่าย Margarita ทำให้ Markdown และตัวดำเนินการเชิงตรรกะอยู่ร่วมกันได้ จึงดึงเอาความเป็น deterministic จากโครงสร้างแบบโค้ดมาใช้ได้เมื่อจำเป็น และถ้าต้องการก็ขยับไปใช้โค้ดแบบไดนามิกของ LLM ได้ นอกจากนี้ยังรองรับพรอมป์ต์ที่ประกอบต่อกันได้แบบ React เลยช่วยแก้ปัญหาไลบรารีสกิลที่ข้อความกระจัดกระจายไปทั่วด้วย กระแสตอบรับบน Reddit ค่อนข้างเฉย ๆ เลยน่าจะพักโปรเจ็กต์นี้ไว้ แต่ระหว่างทำสนุกมาก ยังได้ทำโค้ดเอเจนต์สำหรับผู้ให้บริการ LLM แทบทุกเจ้าและทำฮาร์เนสของตัวเองด้วย เป็นประสบการณ์การเรียนรู้ที่ดีมาก เลยอยากแนะนำ https://www.margarita.run https://github.com/Banyango/margarita
jtap: กำลังทำ เครื่องมือสแกนและจัดทำดัชนีการ์ด Pokemon ให้ลูกสาว เพื่อน ๆ และตัวเองอยู่เรื่อย ๆ https://MyBulkCards.com
มีทั้งแอปมือถือและเว็บไซต์ โดยแอปจะใช้กล้องสแกนการ์ด แล้วส่งภาพผ่านโมเดลหลายตัวก่อนจะบันทึกข้อมูลการ์ดและตำแหน่งจัดเก็บไว้ ระบบเรียบง่ายแต่เก็บตำแหน่งกล่องอย่าง “Box 1 AAA, Box 1 BBB …” ได้ ทำให้หาการ์ดได้ง่าย นอกจากนี้ยังมีฟีเจอร์เพื่อน ให้ดูได้ว่าเพื่อนแถวบ้านมีการ์ดอะไรบ้าง และพวกเขาก็ยืมการ์ดกันบ่อยมาก ระหว่างทำสนุกมาก และเพิ่งได้รับการอนุมัติจาก Android app store มาไม่นานนี้ หลังจากจัดระเบียบอีกนิดก็น่าจะเปิดให้ใช้งานเร็ว ๆ นี้