ถ้าผมจะสร้าง GitHub ในแบบของตัวเอง
(matduggan.com)- forge สมัยใหม่อย่าง GitHub, GitLab, Gitea แม้จะต่างกันในรายละเอียด แต่ล้วนใช้โมเดลแบบ GitHub ร่วมกัน ทว่าแกนหลักของงานจริงกลับเกิดขึ้นในฟีเจอร์ของ forge อย่าง PR, Actions, Issues, Releases มากกว่าใน
git - forge แบบใหม่ควรมี pre-commit hook แบบบังคับ ที่รันจากระยะไกลและให้ฟีดแบ็กก่อน push ไม่ใช่หลัง commit เพื่อช่วยลด commit วนซ้ำอย่าง
Feature,fix,actually fix,asdfasdf - การอนุมัติ PR ควรไปไกลกว่าทางเลือกแบบอนุมัติ/ปฏิเสธ และรองรับการอนุมัติแบบอ่อนหรือการทำเครื่องหมายว่าไว้กลับมาดูอีกครั้งแบบ Gerrit รวมถึงให้การเปลี่ยนแปลงเล็ก ๆ ที่ผู้เขียนเป็นผู้ดูแลและ LLM ประเมินว่ามีความเสี่ยงต่ำผ่านได้อย่างยืดหยุ่นขึ้น
- Stacked PR ควรเป็น ฟีเจอร์ระดับแกนหลัก ของทั้ง forge และ VCS และรีโพสิตอรีในเครื่องควรแทนสถานะทั้งหมดของรีโพสิตอรีได้ ไม่ใช่แค่โค้ดแต่รวมถึงการอนุมัติ PR และ issue ด้วย
- ชุดที่ต้องการคือ JJ เป็น VCS, forge ใหม่ที่โฮสต์ได้เป็นหน่วยเล็ก ๆ และ Actions ที่รองรับลายเซ็น, SHA, และการทำงานแบบออฟไลน์ แต่ในยุคที่ GitHub ยังเป็นค่าเริ่มต้น ก็ยังไม่มีตัวเลือกทดแทนที่ชัดเจน
ปัญหาของ forge สมัยใหม่
- GitHub, GitLab, Gitea แม้มีรายละเอียดต่างกัน แต่แทบทั้งหมดเดินตามโมเดลการออกแบบเดียวกัน และใกล้เคียงกับการที่เครื่องมืออื่นย้ายรูปแบบอุตสาหกรรมที่ GitHub วางไว้มาใช้
- ฟังก์ชันส่วนใหญ่ของ forge ปัจจุบันแทบไม่เกี่ยวข้องกับ
gitโดยตรง และตัวไคลเอนต์ก็ห่างไกลจากวิธีใช้งานจริง gitเป็นระบบควบคุมเวอร์ชันแบบกระจายที่เหมาะกับสภาพแวดล้อมอย่างการพัฒนาเคอร์เนล ซึ่งส่งแพตช์ทางอีเมลไปยังผู้ดูแล และผู้ดูแลจะจัดการพื้นที่ของตัวเองพร้อมตัดสินใจว่าจะรวมเข้าหรือไม่ เป็นเวิร์กโฟลว์ที่อาศัยความเชื่อถือสูง- แต่ในที่ทำงานส่วนใหญ่
gitใกล้เคียงกับการเป็นแค่วิธี pull/push โค้ดจากรีโพสิตอรีที่เก็บอยู่ใน forge กลาง และงานสำคัญเกิดขึ้นใน forge- Pull Request กลายเป็นเครื่องมือบังคับใช้ หลักการสี่ตา
- GitHub Actions ใช้รันทดสอบและ lint บน Pull Request เพื่อตรวจสอบทั้งการทำงานและการปฏิบัติตามข้อกำหนดขององค์กร
- ตัวตนผู้ใช้ภายใน forge กลายเป็นเกณฑ์สำหรับยืนยันตัวผู้ใช้
- Issues ใช้ติดตามปัญหาในโค้ด และ Releases ใช้สร้างรีลีสให้ผู้ใช้ดาวน์โหลด
- ในเวิร์กโฟลว์แบบนี้ ฟีเจอร์ของ forge ที่ครอบบน
gitมีมากกว่าgitเอง ดังนั้นถ้าจะสร้าง forge ใหม่ เหตุผลที่จะต้องผูกติดกับข้อจำกัดของgitก็ลดลง
ฟีเจอร์ที่อยากได้ใน forge ใหม่
-
ฟีดแบ็กควรมาก่อน commit ไม่ใช่หลัง commit
- PR ทั่วไปมักมี commit ต่อเนื่องอย่าง
Feature,fix,fix,actually fix,please,asdfasdf - ถ้าวงจรฟีดแบ็กเกิดหลัง commit ผู้ใช้ก็ต้องทนทุกข์กับการแก้ไปเรื่อย ๆ จนดึก
- forge ควรมี pre-commit hook แบบบังคับ ที่รันงานจากระยะไกล เพื่อให้ผู้ใช้ได้รับฟีดแบ็กก่อนจะ push
- PR ทั่วไปมักมี commit ต่อเนื่องอย่าง
-
การอนุมัติ PR เป็นแบบสองทางเกินไป
- ตอนนี้ PR มักถูกแบ่งเป็นแค่อนุมัติแล้วหรือยังไม่อนุมัติ แต่การรีวิวโค้ดจริงมีพื้นที่ตรงกลางมากกว่านั้น
- ปฏิกิริยาแบบมนุษย์อย่าง “ตอนนี้โอเคก่อน เดี๋ยวค่อยจัดการทีหลัง” ก็ควรสื่อผ่านปุ่มได้
- Gerrit มีโมเดลที่ดีกว่าในเรื่องนี้
- ถ้าผู้ดูแลอนุมัติแบบอ่อน ก็ควรทำเครื่องหมายไว้เพื่อกลับมาดูอีกครั้งภายหลังได้
-
นโยบาย PR ควรยืดหยุ่นกว่านี้
- ไม่ใช่ทุกการเปลี่ยนแปลงที่จะต้องผ่านการตรวจแบบสี่ตา โดยเฉพาะในโลกที่มี LLM
- การต้องรอให้วิศวกรอาวุโสมาแปะ
LGTMบน PR ที่มีแค่สี่บรรทัดมีต้นทุนสูงเกินไป - ถ้าผู้เขียนเป็นผู้ดูแล และ LLM ประเมินว่าความเสี่ยงต่ำหรือไม่มีความเสี่ยง ก็ควรควบคุมให้ผ่านไปได้ง่ายขึ้น
-
Stacked PR ควรเป็นฟีเจอร์ระดับแกนหลัก
- Stacked PR ทำให้การรีวิวและการทำความเข้าใจง่ายขึ้น
- มันไม่ควรเป็นแค่ความสามารถเสริมจากเครื่องมือภายนอก VCS แต่ควรถูกปฏิบัติเป็น พลเมืองชั้นหนึ่ง ทั้งใน forge และ VCS
-
forge ไม่ควรพยายามทำทุกอย่าง
- จำเป็นต้องมีการติดตาม issue แต่บอร์ด Kanban อาจไม่จำเป็น
- ความจำเป็นของ Wiki ก็ยังน่าสงสัย
- เครื่องมือที่ใส่ทุกอย่างลงไปสุดท้ายคุณภาพจะตก และแม้จะเพิ่มฟีเจอร์ได้ง่าย แต่ต้นทุนการบำรุงรักษาจะยังเกิดขึ้นต่อไปไม่ว่ามีคนใช้มากน้อยแค่ไหน
- ถ้ามีใครเริ่มใช้ฟีเจอร์นั้นที่ไหนสักแห่ง ก็จะผูกติดกับมัน
-
หน่วยการโฮสต์ใหญ่เกินไป
- การดูแล GitHub Enterprise เป็นงานใหญ่ และการดูแล GitLab ก็เป็นภาระที่มากพอสมควร
- ผลิตภัณฑ์เหล่านี้เป็นระบบซับซ้อนที่มีชิ้นส่วนเคลื่อนไหวจำนวนมาก
- ควรสร้างหน่วยโฮสต์ย่อยที่เล็กกว่า และเชื่อมมันเข้าด้วยกันเพื่อเป็นองค์กรเดียวได้
- ไม่จำเป็นต้องเป็น federation ระดับโลก และแม้ต้องสร้างบัญชีแยกตามองค์กรก็ยังได้ แต่ระบบควรยืดหยุ่นพอที่องค์กรจะพูดได้ว่า “Raspberry Pi 12 เครื่องนี้คือองค์กรของฉัน”
-
รีโพสิตอรีในเครื่องควรแทนทั้งรีโพสิตอรี ไม่ใช่แค่โค้ด
- สำเนาในเครื่องควรแทนทั้งรีโพสิตอรี ไม่ใช่แค่โค้ด แต่รวมถึงการอนุมัติ PR และ issue ด้วย
- ควรอนุมัติ PR ได้ใน VCS เดียวกับที่ใช้ checkin โค้ด
- ควรเปิดดู issue ได้เหมือนกับการไล่ดูไฟล์ในเครื่อง
-
ไม่จำเป็นต้องจ่ายต้นทุนการเก็บประวัติทั้งหมดตลอดเวลา
- ถ้าจะทำงานร่วมกับทีมอย่างเหมาะสมก็ต้องออนไลน์อยู่แล้ว ดังนั้นไม่จำเป็นต้องบังคับให้แบกรับต้นทุนการเก็บทุกอย่างเสมอไป
- VCS และ forge ควรทำงานร่วมกัน
- ตอน clone รีโพสิตอรี ควรรับมาแค่ประวัติที่จำกัด และเมื่อพยายามย้อนกลับไปในอดีตก็ค่อยปลุก worker ขึ้นมาเพื่อนำสิ่งที่ต้องใช้จาก VCS
- ไม่จำเป็นต้องส่งคำขอ clone ขนาดมหึมาไปยัง forge อยู่ตลอด เพียงเพราะสมมติว่าผู้ใช้อาจอยากสร้าง forge ขึ้นมาใหม่จากประวัติโครงการทั้งหมดในสักวันหนึ่ง
-
Actions ควรมีลายเซ็น มี SHA และใช้แบบออฟไลน์ได้
- Actions มีความสำคัญ จึงควรรองรับ ลายเซ็น, SHA และการใช้งานแบบออฟไลน์
- หากต้องการ ก็ควรดาวน์โหลด tarball ของทุก action มาเก็บไว้ในรีโพสิตอรีได้ และสั่งระบบไม่ให้ดึง checkout action จากภายนอก แต่ใช้ตัวที่อยู่ในรีโพสิตอรีแทน
- ถ้าระบุ
latestก็ควรทำงานแบบเปิด PR เพื่อนำ tarball ล่าสุดเข้ามาในรีโพสิตอรี เหมือนกับ Dependabot ในปัจจุบัน - หากต้องการ Actions ก็ควรรันบนเครื่องโลคัลผ่าน VCS เดียวกันได้เช่นกัน
มีเครื่องมือที่ทำได้บางส่วนแล้ว แต่ต้องการการผสานกัน
- มีเครื่องมือจำนวนมากที่ทำข้อกำหนดเหล่านี้ได้บางส่วนอยู่แล้ว
- สิ่งที่ต้องการคือการนำเครื่องมือเหล่านี้มาผูกเข้าด้วยกันและทำให้มันเข้ากันอย่างเหมาะสม
- ชุดที่ต้องการคือ JJ เป็น VCS, ระบบใหม่เป็น forge และความคาดหวังว่าผู้ใช้จะสามารถใช้ Raspberry Pi เครื่องเดียวเป็น forge ได้อย่างน่าพอใจไปอีกนาน
- forge ใหม่ควรถูกออกแบบโดยมีแนวคิดสมัยใหม่อย่าง object storage, shallow clone และคำขอต่อเนื่องจากบอต LLM เป็นศูนย์กลาง
รอยร้าวในยุคที่ GitHub เป็นค่าเริ่มต้น
- ถ้า GitHub ทำได้ดีอยู่แล้ว ก็คงไม่จำเป็นต้องเขียนภาพฝันแบบนี้
- GitHub คือค่าเริ่มต้น และการพยายามโน้มน้าวให้คนขยับออกจากค่าเริ่มต้นก็มักใกล้เคียงกับการเสียเวลา
- ถ้าจะใช้ forge ไปจนถึงปี 2026 ก็ต้องมีเหตุผลที่หนักแน่นมากที่จะไม่เลือกเครื่องมือที่ทุกคนใช้
- จนไม่นานมานี้ forge อื่น ๆ ก็ยังถูกมองว่าเป็นเพียงของทดแทน มากกว่าจะเป็นตัวเลือกที่อยากได้จริง
- แต่ forge ขนาดยักษ์เพียงตัวเดียวกำลังพังลง และยังไม่มีผู้ทดแทนถูกสร้างขึ้น
- คนที่มีเงินกำลังยุ่งกับจรวด คนที่มีรสนิยมกำลังยุ่งกับงานหลัก ส่วนที่เหลือก็เปิด PR ชื่อ
asdfasdfตอนเที่ยงคืน รอการตรวจจากบอต และตั้งคำถามว่าเมื่อไหร่กันที่เครื่องมือที่ใช้ทั้งวันถึงเลิกถูกสร้างมาเพื่อผู้ใช้
1 ความคิดเห็น
ความคิดเห็นจาก Hacker News
มีคนวิจารณ์ว่า การอนุมัติ PR เป็นอะไรที่แบ่งขาวดำเกินไป ซึ่งฟังดูขัดแย้งกันเอง เพราะการอนุมัติ PR คือการให้สิทธิ์ สุดท้ายจึงหนีไม่พ้นที่จะเป็นค่าแบบบูลีน จะรวมโค้ดได้หรือไม่ได้ก็มีแค่สองทาง
สิ่งที่พูดกันตรงนี้ดูจะเป็นกลไกช่วยให้รู้สึกสบายใจขึ้นเล็กน้อย เวลาต้องอนุมัติโค้ดที่ตัวเองไม่ชอบ พร้อมแนวคำพูดอย่าง “ไว้ค่อยกลับมาดูอีกที...” มากกว่า แค่เปิดตั๋วใหม่ขึ้นมาก็พอ
-2: เป็นไอเดียที่ไม่ดี อย่าทำ
-1: เป็นไอเดียที่ดี แต่ยังต้องปรับปรุง
+1: ดูดี แต่ยังไม่มีความรู้หรือสิทธิ์พอจะอนุมัติ
+2: อนุมัติ
ที่บอกว่า “Y ก็ทำได้บางส่วน” นั้นก็จริง แต่ tangled.org ทำได้เกือบทั้งหมดจริง ๆ
อย่างนิยาม YAML, secret, คำสั่งที่รันจริงเป๊ะ ๆ, การกู้คืนเครื่องมือและ cache ทำอย่างไร ระบบ build อาจช่วยได้บางส่วน แต่ primitive ที่ GHA ให้มานั้นอ่อนมาก สุดท้ายก็วนกลับไปเป็นปัญหาว่าต้องไปรันทั้งระบบที่อื่น ทำให้ระบบแบบนี้มักต้องอาศัยการลองผิดลองถูก
ปัญหาพื้นฐานที่กำลังพูดถึงคือการวนลูปที่มีทั้งการแก้ไข, commit, network call ปนกันไป แล้วคอยรันจนกว่า CI จะเขียว ซึ่งทรมานมาก วิธีที่ดีที่สุดในการเลี่ยงลูปนี้คืออย่าเขียนบั๊กเลย! ล้อเล่นนะ
พอคนเรียนรู้ GitHub แล้วก็มักเริ่มโปรเจกต์สาธารณะบน GitHub ด้วย ถ้ายังไม่เปิดให้สร้าง private repo สำหรับ side project ได้ ก็ยากจะถูกใช้อย่างแพร่หลาย สิ่งที่คนต้องการคือสร้าง private repo แล้วหายไปหลายเดือน กลับมาก็ยังมีมันรออยู่เหมือนเดิม
ถ้าอยาก clone มาแค่ประวัติที่จำกัดและค่อยดึงข้อมูลเก่าเพิ่มเมื่อจำเป็น ให้ใช้ blobless clone
git clone --filter=blob:noneมันจะดึง history มาก่อน แล้วค่อยดึง blob เมื่อจำเป็น GitHub มีบทความดี ๆ อยู่: https://github.blog/open-source/git/get-up-to-speed-with-par...
เมื่อวิธีแก้กลายเป็นตัวปัญหา ก็เป็นจังหวะของ disruptive innovation ช่วงนี้มีคนพูดเรื่องนี้เยอะพอสมควร และก็สงสัยว่าก่อนที่ GitHub จะปรับทิศทางใหม่ หนึ่งในทางเลือกใหม่ ๆ ที่โผล่มาจำนวนมากจะมีสักรายที่ได้แรงส่งหรือไม่
ฝั่งประชาสัมพันธ์ของ Microsoft คงบอกว่า AI คือคำตอบของทุกอย่าง แต่ในโลกจริงปัญหาเดิม ๆ จะยังวนกลับมา แม้ outage ของ GitHub จะไม่ได้เกี่ยวกับ AI โดยตรง แต่เพราะกลยุทธ์ของ Microsoft เปลี่ยนไปแล้ว การตัดสินใจส่วนใหญ่ก็จะถูกจัดให้สอดคล้องกับการควบคุมจากบนลงล่างที่มี AI เป็นศูนย์กลางอยู่ดี workflow ของคนใช้ GitHub จะพังไหม สำหรับ Microsoft น่าจะเป็นแค่เรื่องรอง ๆ และปัญหานั้นจะโผล่กลับมาเรื่อย ๆ อาจเงียบไปสัก 3 เดือนได้ แต่ไม่นานก็คงมีดราม่าใหม่ว่า GitHub กำลังเสื่อมอีกแน่นอน Ghostty คงไม่ใช่รายสุดท้าย จะมีทางเลือกใหม่เกิดขึ้นไหมก็น่าสนใจ แต่ทางเลือกเหล่านั้นก็ห้ามห่วย เพราะหลายเว็บไซต์ตอนนี้ก็แย่อยู่พอควร
อนาคตเราอาจไม่ได้รับซอฟต์แวร์แบบเสียเงินหรือโอเพนซอร์ส แต่จะได้ชุดเอกสารความต้องการสำหรับ code forge คล้ายสูตรอาหาร แต่ละคนก็เอาไปอบเอง แล้วปรับให้เข้ากับงานและรสนิยมของตัวเอง
คิดว่ายังมีช่องว่างตลาดสำหรับ บริการ git ที่เรียบง่ายกว่านี้ สิ่งที่ต้องการมีแค่ remote host สำหรับ push โปรเจกต์ให้คนอื่นเห็น ไม่ได้อยากได้ PR หรือ Actions อะไรพวกนั้น
ถ้ามีฟีเจอร์ “release” สำหรับอัปโหลด binary asset ที่ build จากเครื่องโลคัลได้ก็คงดี ส่วน fork ก็ให้คน clone repository แล้วอัปขึ้นเป็นโปรเจกต์ใหม่เองก็ได้
ข้อเสนอที่ว่าเอาข้อมูลรีวิวไปเก็บใน git repository เหมือนซอร์สด้วยนั้นฟังดูน่าเชื่อพอสมควร
ถ้าตั้ง branch แยกต่อรีวิวโดยใช้คำนำหน้าที่รู้กันอยู่แล้ว ก็ทำได้ง่ายมาก แต่ namespace ของ branch ปกติคงจะรกอย่างรวดเร็ว อาจใช้ git namespaces เพื่อแยกจาก namespace หลัก หรือมี branch พิเศษอย่าง
.reviewsที่เก็บแค่ commit ID ปลายทางของแต่ละ review branch ก็ได้ ถ้ามีใครสนใจมากพอจนทำสเปกกับ implementation ที่ใช้งานได้จริงออกมา คนก็อาจเริ่มรับไปใช้ เหตุผลที่ GitHub กับ forge หลายแห่งไม่เลือกแนวนี้น่าจะเป็นเพราะ metadata ของการรีวิวเป็นคุณค่าของแพลตฟอร์ม ถ้าใคร ๆ ก็ใช้เครื่องมือโลคัลที่อยากใช้มาทำ code review ของคนอื่นได้ ก็จะลด vendor lock-in ลง แต่อีกด้านหนึ่งก็อาจมีเหตุผลอื่น เช่น access control หรือกรณีรีวิวข้าม repository ที่อยากเก็บ metadata ของรีวิวไว้อีก repository หนึ่งถ้าดูเฉพาะการเข้าถึงแบบอ่านอย่างเดียว ข้อมูลรีวิวของ Gerrit ก็เข้าถึงผ่าน Git ได้จริงด้วย[7] ถ้าเป็นรีวิว ABCDE แทนที่จะดึง ref หมายเลขปกติใต้คำนำหน้านั้น ก็ให้ pull
refs/changes/DE/ABCDE/metaแทน และก็มีคนทำให้เข้าถึงผ่าน Git notes ได้ด้วย[8] Fossil SCM ที่ขึ้นชื่อเรื่อง SQLite ก็ทำแบบนี้กับตัวติดตามบั๊กในตัว[9] แต่ที่มันไม่ดังนักก็เพราะอุบัติเหตุทางประวัติศาสตร์ที่ Git เป็นฝ่ายชนะ และเพราะมันเป็นสิ่งที่ไม่เป็นมิตรอย่างมากกับการ rewrite history ซึ่งคนใช้ Git ทำกันบ่อย กลับมาที่เรื่องการทำงานบน Git อีกครั้ง เวลาอยากสร้าง data type สวย ๆ จริง ๆ แล้วคุณต้องมี custom merge strategy และการรองรับของ Git เองก็ยังต้องห่อเพิ่มอีกมากกว่าจะทำให้ลื่นไหล ตัวอย่างที่ผมรู้ว่าไปได้ดีคือการติดตามตำแหน่งของ git-annex[10] แต่นั่นก็ยังเป็นโปรเจกต์ Haskell ขนาดใหญ่พอสมควร porcelain ที่มีอยู่แข็งทื่อเกินไป[1] ขอ PGP replacement ที่เหมาะกับงานนั้นได้ไหม? ขออย่างเดียวคือเลิกบอกว่ามันไม่มีอยู่จริงหรือบอกให้ฉันเลิกใช้สักที[2]
[2] https://news.ycombinator.com/item?id=44239804
[3] https://github.com/aaiyer/bugseverywhere
[4] https://github.com/google/git-appraise
[5] https://tylercipriani.com/blog/2022/11/19/git-notes-gits-coo..., https://news.ycombinator.com/item?id=44345334 (579 points, 146 comments)
[6] https://github.com/git-bug/git-bug
[7] https://gerrit-review.googlesource.com/Documentation/note-db...
[8] https://gerrit.googlesource.com/plugins/reviewnotes/+/refs/h...
[9] https://fossil-scm.org/home/doc/trunk/www/bugtheory.wiki
[10] https://git-annex.branchable.com/
ผมชอบ workflow ของ Gerrit ที่รีวิวความต่างแทนการใช้ PR มาก แต่เมื่อเทียบกับของอย่าง gitea แล้ว มันขาดฟีเจอร์อื่น ๆ ที่ผู้คนคาดหวังจาก git hosting เช่น issue, การวางแผนโปรเจกต์ ฯลฯ เลยดูยากที่จะโน้มน้าวคนจำนวนมาก
ถ้ามีแพลตฟอร์มรีวิว diff ดี ๆ แบบ Phabricator ก็คงดี น่าเสียดาย
ผมคิดว่าควรใช้ RFC2822 เป็นรูปแบบพื้นฐานสำหรับเก็บข้อความทั้งหมด ไม่ว่าจะเป็น PR, คอมเมนต์รีวิว, issue และเวลาจะแสดงข้อความก็ค่อยตกแต่งด้วย CommonMark
metadata ทั้งหมดใส่ไว้ใน header ได้ และเชื่อมข้อความเข้าหากันด้วย header
Message-ID/In-Reply-To/Referencesการใช้รูปแบบที่นิยามชัดเจนแบบนี้ทำให้คุณเลือกได้ว่าจะเก็บและส่งข้อความทั้งหมดอย่างไร จะใส่ใน git repository, ใช้อีเมล หรือวิธีอื่นที่เหมาะสมก็ได้ สำหรับ code review ส่วนตัวผมคิดว่า Gerrit ดีกว่า GitHub และเจ้าอื่น ๆ มาก ส่วน CI อยากให้แยกออกไปให้มากที่สุด และมีแค่ hook สำหรับเริ่ม pipeline, แสดงผลลัพธ์ และตัดสินว่าจะอนุญาตให้ merge หรือไม่มันไม่ได้เก่งเป็นพิเศษในทั้งสี่ด้าน แต่เก่งเรื่องการผูกทุกอย่างไว้ด้วยกัน ผมเห็นด้วยว่า Gerrit มีโมเดล code review ที่ดีกว่า แต่ถ้าไม่มีอีกสามชิ้นที่เหลือก็ยังไม่เป็นผลิตภัณฑ์ แม้แต่ตอนที่ผมใช้ Gerrit ทุกวันใน Google ก็ยังหงุดหงิดกับการเชื่อมต่ออันหละหลวมระหว่างการค้นหาโค้ด, code review และ CI ขณะที่เครื่องมือภายในของ Google อย่าง Google3/Critique/Forge กลับผูกทุกอย่างเข้าด้วยกันได้ดีกว่ามาก
นึกถึงข้อดีอย่างหนึ่งของ workflow ที่ใช้อีเมลเป็นฐานขึ้นมาได้ ถ้าคุณเริ่มเปิดอีเมลดู ปกติก็แปลว่าคุณอยู่ใน สภาวะจิตใจ แบบที่พร้อมทำอย่างนั้นอยู่แล้ว และในสภาวะนั้นก็มักคาดหวังได้ว่าจะไม่มีสิ่งรบกวนอื่น จึงมีสมาธิมากกว่า
ปัญหาของการแจ้งเตือนคือมันมีแรงผลักให้เราอยากจัดการทันทีที่เด้งขึ้นมา แต่ก็ไม่มีอะไรรับประกันว่าตอนนั้นเรามีพลังพอจะจัดการมัน ระบบแจ้งเตือนบนเว็บส่วนใหญ่ดูเหมือนเป็นการเลียนแบบอย่างงุ่มง่ามในสิ่งที่อีเมลไคลเอนต์ทำได้ดีมาตั้งแต่หลายสิบปีก่อน บางทีคนรุ่นก่อนอาจจะคิดถูกจริง ๆ ที่ใช้อีเมล
ตอนที่ Microsoft เข้าครอบ GitHub ก็มีหลายคนหงุดหงิดอยู่แล้ว แต่ในความเป็นจริงทางเลือกต่าง ๆ มักไม่ค่อยดีนัก Sourceforge ทำ issue ทีไรน่ารำคาญไม่รู้จบ ส่วน GitLab แม้จะดีกว่า Sourceforge แต่ผมก็ยังไม่ชอบสร้าง issue ที่นั่น Codeberg เหมือนเพิ่งเปลี่ยน UI ไปไม่นานนี้ แต่ก็ยังใช้งานยากอยู่มาก
สิ่งที่ GitHub ทำได้ดีในช่วงแรกคือ UI และการโฟกัสที่การทำเรื่องต่าง ๆ ให้คนที่ใช้ GitHub ทำได้ง่ายหรืออย่างน้อยก็ง่ายขึ้น แต่ก็ไม่ได้ทำดีไปหมด ผมว่า support ด้าน wiki แย่มาก แย่จนแทบไม่เคยใช้เลย ปัญหาใหญ่มากจริง ๆ สำหรับผมคือเรื่อง ผลประโยชน์ทางการค้า หรือก็คือผลประโยชน์ส่วนตัว Microsoft เป็นแค่ตัวอย่างหนึ่ง ปัญหานี้มีแทบทุกเว็บไซต์แนวเดียวกัน ผมเคยยกกรณีการถก issue เกี่ยวกับยูทิลิตี้ backdoor ของ xz และผมก็ร่วมคุยด้วย วันถัดมา Microsoft ลบทุกอย่างออกหมด จะเป็น Microsoft หรือเจ้าของ repository ก็ไม่สำคัญ ประเด็นคือคนคนเดียวสามารถเซ็นเซอร์ข้อมูลที่อาจมีประโยชน์ได้ง่ายเกินไป การสนทนาใน issue นั้นมีประโยชน์และมันถูกเซ็นเซอร์ เท่าที่จำได้ ข้อมูลตอนนั้นไม่ได้ถูกกู้กลับมาทั้งหมด อาจมีใคร mirror ไว้ แต่ผมไม่เห็นลิงก์ นี่แสดงให้เห็นว่า การควบคุมจากบนลงล่าง อาจเป็นพิษได้จริง ๆ พูดตามตรง คุณจะไว้ใจ Microsoft ได้แค่ไหน? เราต้องการสิ่งที่กระจายศูนย์ ทำงานได้เสถียร มี UI เริ่มต้นที่ดี และมี workflow ที่เรียบง่าย หรืออย่างน้อยก็เป็น workflow ที่ดี อีกทั้งต้องเลี่ยงสถานการณ์ที่ผู้เล่นเอกชนจับทุกคนเป็นตัวประกันด้วย ผมไม่รู้เลยว่าจะแก้อย่างไร และอาจต้องใช้หลายแนวทางพร้อมกัน เว็บเปลี่ยนไปแล้ว และโดยเฉพาะผลประโยชน์ส่วนตัวของบริษัทยักษ์ใหญ่ในช่วง 10–15 ปีที่ผ่านมา ทำให้ทุกอย่างแย่ลงมาก มันต้องเปลี่ยน
บริษัทยักษ์ใหญ่จ่ายต้นทุนนี้ได้ แต่ถึงนักพัฒนาจำนวนมากที่งบไม่เยอะจะรวมตัวกัน ก็ไม่มีเงินพอจะทำสิ่งเดียวกันได้ ดังนั้นโปรเจกต์เชิงพาณิชย์แบบไหนก็ตาม สุดท้ายก็เลี่ยงยากที่จะเอนเอียงไปสนับสนุนผลประโยชน์ของบริษัทยักษ์ใหญ่มากกว่าคนทั่วไป