ก้าวข้าม `fork()` + `exec()`

(lwn.net)

17 คะแนน โดย GN⁺ 2026-06-07 | 3 ความคิดเห็น | แชร์ทาง WhatsApp

spawn templates คือข้อเสนอการสร้างโปรเซสสำหรับเคอร์เนล Linux ที่มุ่งให้เคอร์เนลแคชข้อมูลของไฟล์ปฏิบัติการไว้ล่วงหน้า เพื่อเร่งการเริ่มโปรเซสในภายหลังสำหรับแอปพลิเคชันที่รันไฟล์ปฏิบัติการเดิมซ้ำ ๆ
fork() ต้องคัดลอกสถานะทั้งหมดของโปรเซสรวมถึงหน่วยความจำเพื่อสร้างโปรเซสลูก และในหลายกรณี exec() ที่ตามมาทันทีจะทิ้งหน่วยความจำนั้นไป ทำให้รูปแบบเดิมไม่มีประสิทธิภาพ
spawn_template_create() ระบุไฟล์ปฏิบัติการได้ด้วย execfd หรือพาธสัมบูรณ์ filename อย่างใดอย่างหนึ่งเพื่อคืนค่า template file descriptor และเคอร์เนลจะเปิดไฟล์นั้นพร้อมแคชข้อมูลที่จำเป็นต่อการรันแบบรวดเร็ว
spawn_template_spawn() ทำงานในลักษณะใกล้เคียงกับเส้นทาง fork()/exec() ปกติ โดยยังคงการตรวจสอบที่ใช้เมื่อรันไฟล์ใหม่ไว้ครบถ้วน และผลเบนช์มาร์กในจดหมายนำรายงานว่าดีขึ้นราว 2% {p:2}
การสร้างโปรเซสว่างเปล่าโดยอิง pidfd และการตั้งค่าผ่าน pidfd_config() ถูกมองว่าเป็นแนวทางที่ดีกว่า โดยมีเป้าหมายเพื่อรองรับการอิมพลีเมนต์ posix_spawn() ใน user space

ข้อจำกัดของโมเดลการสร้างโปรเซสแบบ Unix

ตั้งแต่ยุคแรกของ Unix นั้น fork() เป็น system call หลักแบบยึดโปรเซสเป็นศูนย์กลางที่ใช้สร้างโปรเซสลูกจากสำเนาของโปรเซสแม่ ส่วน exec() ใช้รันโปรแกรมใหม่แทนที่โปรเซสปัจจุบัน
ในเคอร์เนล Linux ฟังก์ชันหลักชุดเดียวกันนี้เป็นที่รู้จักมากกว่าในชื่อ clone() และ execve()
โมเดลการสร้างโปรเซสนี้มีทั้งความงดงามและข้อเสีย และแม้ข้อเสนอ spawn templates ของ Li Chen จะไม่ได้ถูกรับเข้าเคอร์เนล Linux ในรูปแบบปัจจุบัน แต่ก็อาจนำไปสู่ primitive ใหม่สำหรับการสร้างโปรเซสในอนาคต
fork() เป็น system call ที่มีต้นทุนค่อนข้างสูง เพราะต้องคัดลอกสถานะทั้งหมดของโปรเซสรวมถึงหน่วยความจำเพื่อสร้างโปรเซสลูก
ตลอดหลายปีมีการปรับแต่งประสิทธิภาพหลายอย่าง แต่โดยพื้นฐานแล้ว fork() ก็ยังเป็นงานที่มีต้นทุนสูง
บ่อยครั้งที่หลังเรียก fork() จะตามด้วย exec() ทันที และ exec() จะทิ้งหน่วยความจำทั้งหมดที่คัดลอกมาให้โปรเซสลูก
แม้จะมีความพยายามปรับแต่งอย่าง vfork() แต่รูปแบบ fork() ตามด้วย exec() ก็ยังมีต้นทุนสูงกว่าที่ควรจะเป็น

Spawn templates

ชุดแพตช์ของ Li Chen มุ่งเน้นแอปพลิเคชันที่รันไฟล์ปฏิบัติการเดิมซ้ำ ๆ เพื่อปรับแต่งรูปแบบ fork() และ exec() ให้มีประสิทธิภาพขึ้น
ตัวอย่างหนึ่งคือโปรแกรมที่ต้องเรียก Git ซ้ำ ๆ เพื่อดึงข้อมูลเกี่ยวกับเนื้อหาในรีโพซิทอรี
ในกรณีเช่นนี้ โปรแกรมสามารถสร้างเทมเพลตเพื่อเฉลี่ยต้นทุนการตั้งค่าไปยังการรันหลายครั้ง และเร่งการเรียกใช้งานผ่านเทมเพลตนั้น
การสร้างเทมเพลตใช้ system call spawn_template_create()
- มีซิกเนเจอร์ในรูปแบบ int spawn_template_create(struct spawn_template_create_args *args, size_t args_size);
การเรียกนี้จะคืนค่า file descriptor ที่แทนเทมเพลตของไฟล์ปฏิบัติการ
ต้องระบุไฟล์ปฏิบัติการด้วย file descriptor execfd หรือพาธสัมบูรณ์ filename อย่างใดอย่างหนึ่ง และไม่สามารถใช้ทั้งสองพร้อมกันได้
เคอร์เนลจะเปิดไฟล์ที่ระบุ และแคชข้อมูลหลายอย่างที่จำเป็นต่อการรันไฟล์นั้นให้เร็วขึ้นในครั้งถัดไป
แต่ละครั้งของการรันสามารถมีอาร์กิวเมนต์ สภาพแวดล้อม การเปลี่ยนแปลง file descriptor และการจัดการสัญญาณที่แตกต่างกันได้
รายละเอียดการรันจะถูกจัดวางไว้ในโครงสร้าง spawn_template_spawn_args
- argv เป็นพอยน์เตอร์ไปยังรายการอาร์กิวเมนต์ที่จะส่งให้โปรแกรม
- envp เป็นพอยน์เตอร์ไปยังสภาพแวดล้อมของโปรแกรม
- actions เป็นพอยน์เตอร์ไปยังอาร์เรย์ spawn_template_action สำหรับส่งการเปลี่ยนแปลง file descriptor และการจัดการสัญญาณ
spawn_template_action ประกอบด้วยฟิลด์ type, flags, fd, newfd, arg
- หากต้องปิด file descriptor 4 ในโปรเซสลูก ให้ตั้ง type เป็น SPAWN_TEMPLATE_ACTION_CLOSE และตั้ง fd เป็น 4
- แอ็กชันอื่น ๆ รองรับการทำสำเนา file descriptor การเปิดไฟล์ การเปลี่ยน working directory และการเปลี่ยนการจัดการสัญญาณ
เมื่อกรอกข้อมูลการรันครบแล้ว ก็ใช้ spawn_template_spawn() เพื่อรันโปรเซสใหม่
- มีซิกเนเจอร์ในรูปแบบ int spawn_template_spawn(int template_fd, struct spawn_template_spawn_args *args, int args_size);
การทำงานภายในใกล้เคียงกับเส้นทาง fork()/exec() แบบปกติ
การตรวจสอบตามปกติทั้งหมดที่ใช้เมื่อรันไฟล์ใหม่ยังคงถูกเก็บไว้ครบถ้วน
ข้อมูลที่แคชไว้ในเทมเพลตช่วยเร่งความเร็วของกระบวนการสร้างโดยรวม
ผลเบนช์มาร์กในจดหมายนำอยู่ที่ดีขึ้นราว 2% ซึ่งอาจมีความหมายสำหรับแอปพลิเคชันที่ตรงกับรูปแบบการใช้งานที่คาดไว้ {p:2}

มุ่งสู่ `posix_spawn()`

Mateusz Guzik ประเมินว่า “สำนวนแบบ fork + exec ทั้งหมดนั้นแย่มากและควรถูกกำจัดออกไป”
จุดที่ดูแปลกของชุดแพตช์คือยังคงส่วน fork() ไว้ทั้งที่มองว่าต้นทุนส่วนใหญ่อยู่ตรงนั้น
การปรับแต่งควรเป็นการตัดการคัดลอกโปรเซสปัจจุบันออก แล้วสร้าง “โปรเซสสะอาด (pristine process)” แทน
Christian Brauner มองว่าแนวคิด builder API สำหรับ exec “ไม่ได้แปลกขนาดนั้น”
แต่เขาอยากใช้แนวทางที่สร้าง API ใหม่บน abstraction ของ pidfd ที่มีอยู่แล้วมากกว่า
แม้ยังไม่มีรายละเอียดเชิงรูปธรรม แต่การเพิ่มออปชันให้ pidfd_open() เพื่อสร้างโปรเซสว่างเปล่าน่าจะเป็นแนวทางที่ถูกต้อง
จากนั้นค่อยเรียก system call ใหม่ pidfd_config() หลายครั้ง เพื่อใส่ค่าที่ต้องการให้โปรเซสใหม่ เช่น สภาพแวดล้อมและอิมเมจที่จะรัน
pidfd_config() จะมีบทบาทคล้ายกับ fsconfig()
เป้าหมายสำคัญของอินเทอร์เฟซใหม่นี้คือการรองรับการอิมพลีเมนต์ posix_spawn() ใน user space
posix_spawn() เหมาะจะเป็นทางเลือกแทนรูปแบบ fork()/exec()
อิมพลีเมนต์ปัจจุบันซ่อน fork() และ exec() ไว้ภายใน ขณะที่อิมพลีเมนต์แบบเนทีฟจะมีโครงสร้างต่างออกไป
Li Chen เห็นด้วยว่า API ที่ Brauner วาดภาพไว้กว้าง ๆ นั้นดูดีกว่า และวางแผนจะเดินงานต่อไปในทิศทางนั้น
แม้ spawn templates จะไม่เข้าสู่เคอร์เนล Linux แต่หากงานในอนาคตออกผล Linux ก็อาจมีการอิมพลีเมนต์ posix_spawn() ที่เหมาะสมได้

3 ความคิดเห็น

GN⁺ 29 일 전

ความคิดเห็นจาก Lobste.rs

ยังไม่ค่อยเข้าใจว่าทำไม fork+exec ถึงมีอยู่ตั้งแต่แรก
ถ้าออกแบบ system call สำหรับจัดการโปรเซสโดยที่ไม่ได้รู้เรื่องการพัฒนาเคอร์เนลมากนัก ก็น่าจะคิดว่ากรณีทั่วไปคือ “สร้างโปรเซสลูกใหม่ที่สะอาด” และกรณียกเว้นคือ “คัดลอกโปรเซสที่กำลังรันอยู่”
อย่างหลังดูเหมือนจะใช้เฉพาะกับพวกเว็บเซิร์ฟเวอร์ที่ต้องเปิดสำเนาของโปรเซสเดียวกันจำนวนมาก เลยอยากรู้ภูมิหลังทางประวัติศาสตร์ว่าทำไม fork ถึงถูกออกแบบมาแบบนี้
- เรื่องประวัติของ fork()+exec() มีอธิบายไว้อย่างละเอียดใน เธรดบน Orange Site
- น่าจะขึ้นอยู่กับว่าให้นิยามคำว่า “ทั่วไป” ไว้อย่างไร
  ในหลายระบบ จำนวนครั้งที่สร้างโปรเซสลูกและเธรดอาจมากกว่าจำนวนครั้งที่เรียก execve() ก็ได้
  ผมไม่รู้ประวัติยุคโบราณ แต่ตัวความหมายนี้เก่ากว่า Linux มาก และในเชิงตรรกะเมื่อยังไงก็ต้องมี fork() อยู่แล้ว การต่อยอดบนสิ่งนั้นก็ดูน่าจะเรียบง่ายและประกอบใช้งานได้ดีกว่าการมี API exec_in_a_new_process() แยกต่างหากที่ซ้ำกับตรรกะสร้างโปรเซสบางส่วน
  อีกอย่าง โครงสร้างที่แยกกันแบบนี้ทำให้ใช้แค่ execve() โดยไม่ต้อง fork() เพื่อแทนที่โปรเซสปัจจุบันด้วยโปรแกรมอื่นได้ และในบางกรณีนี่ก็เป็นการปรับให้เหมาะสมที่ดี
  กล่าวคือ ถ้างานจบแล้วและอยากส่งไม้ต่อให้โปรแกรมอื่น ก็ทำได้โดยไม่ต้องยึดรายการใน process table หรือหน่วยความจำไว้ต่อ
  สำหรับแอปพลิเคชันที่แคร์ประสิทธิภาพ แค่ fork() หรือ execve() อย่างใดอย่างหนึ่งก็อาจช้าเกินไปอยู่แล้ว ดังนั้น API ที่กระชับกว่าก็ไม่ได้แก้ทุกปัญหา
  นั่นจึงเป็นเหตุผลที่มีการทำ optimization อย่าง Zygote process ที่เตรียมไว้ล่วงหน้าของ Android หรือ worker ของเว็บเซิร์ฟเวอร์ที่ fork ไว้ล่วงหน้า ซึ่งแนวทางนี้ต้องสลับบริบทแค่ครั้งเดียว
- ไม่แน่ใจว่านั่นเป็นเหตุผลดั้งเดิมหรือเป็นข้อดีที่บังเอิญได้มา แต่การเริ่มจากสำเนาทำให้ก่อนเรียก exec เราสามารถเปลี่ยน environment, group, user, file descriptor, signal mask และอย่างอื่นได้ตามใจ
  ถ้าดู posix_spawn ซึ่งเป็น API สมัยใหม่สำหรับ “สร้างโปรเซสลูกใหม่แบบสะอาด” จะเห็นว่ามีทั้งแฟลกและออปชันเป็นหลายสิบตัว และขยายต่อก็ยากกว่ามาก
- ตัวอย่างของการใช้แค่ fork คือ subshell
  ตอนที่สร้าง subshell จาก parent shell มันต้องมี environment เหมือนเดิมทุกอย่าง จึงแทบจะเท่ากับ fork()
  ตอนพอร์ต ash ไปยัง Windows ต้องซีเรียลไลซ์ข้อมูลทั้งหมดไปยังโปรเซส subshell ใหม่
รู้สึกว่าน่าจะรอสัก 1~2 สัปดาห์ก่อนโพสต์คอนเทนต์ของ LWN
พวกเขาคู่ควรกับการมีสมาชิกแบบเสียเงิน และสมาชิกก็คู่ควรกับสิ่งดี ๆ
- เวลาโพสต์ลิงก์บทความ LWN ลง Lobsters มีโอกาสมากกว่ากันระหว่างคนที่สมัครอยู่แล้วหรือกำลังจะสมัครตัดสินใจไม่จ่ายเงินต่อ กับคนที่รู้สึกว่าเนื้อหาน่าสนใจแล้วเริ่มพิจารณา สมัคร LWN?
ข้อดีอย่างหนึ่งของ fork() คือสามารถเพิ่มความสามารถของโปรเซสได้โดยไม่ต้องให้ทุกโปรแกรมไปแก้โค้ดสร้างโปรเซสของตัวเอง
เช่น ให้โปรเซสมีความสามารถเรื่อง root directory ผ่าน chroot, มี controlling terminal ผ่าน job control หรือมี network namespace
ใน fork โปรเซสใหม่จะสืบทอดความสามารถใหม่จากโปรเซสแม่ตามธรรมชาติ ทำให้ฟีเจอร์ใหม่ทำงานได้สม่ำเสมอแม้ในโปรแกรมเก่า
มีแค่โปรแกรมที่จัดการความสามารถใหม่นั้นเท่านั้นที่ต้องรู้จักมัน
ในทางกลับกัน ถ้าโปรเซสใหม่ว่างเปล่าจริง ๆ และทุกอย่างต้องตั้งค่าผ่านอะไรอย่าง pidfd_config() โปรแกรมทั้งหมดที่สร้างโปรเซสอื่นก็ต้องถูกอัปเดตให้ตั้งค่าฟีเจอร์ใหม่ได้ถูกต้อง
ในระบบที่ไม่ใช่ Unix แบบนี้ อาจต้องมีแนวคิด สภาพแวดล้อมของโปรเซส ในความหมายกว้าง ซึ่งเป็นวัตถุที่แยกจากตัวโปรเซสและรวมเรื่องอย่าง working directory, namespace, owner และ group ไว้ด้วย
แต่แบบนั้นก็ยากที่จะขีดเส้นว่าอะไรคือสถานะของ environment และอะไรคือสถานะของโปรเซส
อาจต้องมองว่า environment เป็นคอนเทนเนอร์ที่หลายโปรเซสใช้ร่วมกัน แทนที่จะเป็นส่วนของสถานะโปรเซสที่สืบทอดได้แบบ Unix
ทั้งหมดนี้น่าจะทำได้ดีกว่าด้วย clone/exec
ปัญหาหลักของ fork อยู่ที่การตัดการแชร์หน่วยความจำ และเมื่อมีทั้งเธรดกับรายการ page table จำนวนมาก โมเดลนี้ก็ไม่ค่อยเหมาะ
ถ้า exec จากเธรดที่แชร์หน่วยความจำ ก็จะแก้ปัญหาส่วนใหญ่ตรงนี้ได้
น่าจะต้องลองทดลองดูสักหน่อย

shakespeares 29 일 전

เป็นการปรับแต่งระดับเคอร์เนลที่ช่วยให้สร้างส่วนปลายอย่าง child_process ได้รวดเร็วขึ้นนะครับ

GN⁺ 2026-06-07

ความคิดเห็นจาก Hacker News

มีงานเขียนที่เกี่ยวข้องคือบทความ A fork() in the road: https://www.microsoft.com/en-us/research/wp-content/uploads/...
ในบทคัดย่อ ผู้เขียนโต้แย้งว่าตรงข้ามกับความเชื่อทั่วไปที่ว่า Unix fork()+exec() เป็นการออกแบบอันชาญฉลาด มันอาจเป็นแฮ็กที่ฉลาดสำหรับเครื่องและโปรแกรมในยุค 1970 แต่ตอนนี้เป็นนามธรรมที่ไม่ดีสำหรับโปรแกรมเมอร์ยุคใหม่ และยังจำกัดการติดตั้งใช้งานระบบปฏิบัติการด้วย
มุมมองคือ แทนที่จะคงไว้เป็นฟีเจอร์พื้นฐานระดับปฐมภูมิของระบบปฏิบัติการ ควรสอนมันในฐานะโบราณวัตถุทางประวัติศาสตร์ และไม่ควรให้เป็นวิธีสร้างโปรเซสแบบแรกที่นักศึกษาได้เรียนรู้
- เหตุผลที่ fork()+exec() กลายมาเป็นแบบนั้น ก็เพื่อให้สามารถรัน โปรแกรมที่ใหญ่เกินกว่าจะอยู่ในหน่วยความจำร่วมกับโปรแกรมแม่ได้
  การติดตั้งใช้งานดั้งเดิมจะสว็อปโปรแกรมที่เรียก fork() ออกไปยังดิสก์ จากนั้นก่อนคืนการควบคุมก็จะคัดลอกและปรับรายการในตารางโปรเซส ทำให้มีทั้งโปรเซสที่อยู่ในหน่วยความจำและโปรเซสที่ถูกสว็อปออกไป แล้วฝั่งที่อยู่ในหน่วยความจำจะได้รับการควบคุมเพื่อเรียก exec() ได้
  วิธีนี้ทำให้สามารถรันโปรแกรมขนาดใหญ่ได้แม้บนเครื่อง PDP-11 ขนาดเล็ก และเป็นสิ่งจำเป็นในยุคที่หน่วยความจำมีราคาแพงมาก
  ที่น่าสนใจคือ QNX ไม่มีตัวโหลดโปรแกรมอยู่ในระบบปฏิบัติการ แต่อยู่ในไลบรารี มันจะอ่าน header ของไฟล์ปฏิบัติการ จัดสรรหน่วยความจำ โหลดโปรแกรมและเตรียมพร้อมสำหรับการรัน จากนั้นลิงก์กับ .so ที่ใช้เริ่มต้นโปรแกรม โดยตัวโหลดโปรแกรมรันอยู่ใน user space ที่ไม่มีสิทธิพิเศษ แบบนี้น่าจะใกล้เคียงกับวิธีที่ถูกต้องมากกว่า
- น่าสนใจที่การสร้างโปรเซสของ Windows ซึ่งเป็นระบบปฏิบัติการ “ขนาดใหญ่” ที่ถูกใช้อย่างแพร่หลายที่สุดและไม่ใช้ fork() นั้นช้ามาก
  เห็นด้วยว่าควรมีฟีเจอร์พื้นฐานที่ไม่ใช่ fork() แต่ก็ไม่แน่ใจว่าสมรรถนะเป็นเหตุผลที่ดีที่สุดหรือไม่
- บทความนี้ก็ดี และเอกสารอ้างอิง [29] ก็ดีมากเช่นกัน เพราะพูดถึงรายละเอียดเชิงลึกของ อินเทอร์เฟซที่ขยายขนาดได้ รวมถึง fork(): The Scalable Commutativity Rule: Designing Scalable Software for Multicore Processors https://people.csail.mit.edu/nickolai/papers/clements-sc.pdf
- การถกเถียงในตอนนั้นอยู่ที่นี่: https://news.ycombinator.com/item?id=19621799 - A fork() in the road (2019-04-10, 178 comments)
- fork() เหมาะมากกับ แพตเทิร์น zygote
  นึกวิธีเพิ่มประสิทธิภาพที่ทั้งมีประสิทธิผลและสง่างามได้ยากพอ ๆ กัน
เมื่อไม่นานมานี้ฉันเจอบั๊กแปลก ๆ เพราะต้องปิด file descriptor เพิ่มเติมในโปรเซสที่ถูก fork
จากประสบการณ์ของฉัน สิ่งที่เจอบ่อยกว่ามากคือ “ต้องการโปรเซสใหม่เอี่ยมทั้งหมด” มากกว่า “ต้องการสำเนาของโปรเซสปัจจุบัน” แต่กลับไม่มีวิธีแสดงอย่างตรงไปตรงมาสำหรับแบบแรก และทำได้แค่ประมาณด้วยการคัดลอกก่อนแล้วค่อยแก้ทีหลัง ซึ่งรู้สึกแปลกมาก
- ปกติคุณก็มักอยากสื่อสารกับโปรเซสนั้นอยู่แล้ว ดังนั้นจึงต้องตั้งค่าบางอย่าง เช่น file descriptor และส่งข้อมูลจากโปรเซสแม่ไปให้
- นั่นแก้ได้ด้วย O_CLOEXEC ไม่ใช่หรือ?
- ถ้าหมายถึง “วิธีแสดงแบบหลังโดยตรง” นั่นไม่ใช่หน้าที่ของ posix_spawn หรอกหรือ?
- “โปรเซสใหม่เอี่ยมทั้งหมด” หมายถึงอะไรกันแน่?
การพูดว่า “fork() เป็น system call ที่ค่อนข้างมีต้นทุนสูง และต้องคัดลอกสถานะทั้งหมดของโปรเซสรวมถึงหน่วยความจำสำหรับโปรเซสลูก แม้จะมีการปรับแต่งมาหลายปี แต่นี่ก็ยังเป็นงานที่มีต้นทุนสูงโดยพื้นฐาน ที่แย่กว่านั้นคือหลังเรียก fork() ก็มักจะตามด้วย exec() ทันที ทำให้หน่วยความจำที่คัดลอกอย่างตั้งใจเพื่อโปรเซสลูกถูกทิ้งทั้งหมด” โดยไม่พูดถึง copy-on-write เลย ถือว่าแปลก
มันคือการปรับแต่งที่ทำให้ไม่ต้องคัดลอกหน่วยความจำทั้งหมดจริง ๆ แต่กลับถูกละไว้
- ในบทความอาจสื่อไว้โดยนัย แต่ “การคัดลอกสถานะโปรเซส” ตรงนี้หมายถึง โครงสร้างการจัดการหน่วยความจำ โดยหลักคือ page table และ VMA
  ถึงหน่วยความจำที่ page จริงชี้อยู่จะถูกแชร์กันได้ แต่ก็ยังต้องจัดสรร page ใหม่เพื่อเก็บสำเนาของโครงสร้างเหล่านี้ และการไล่วนคัดลอกโครงสร้างทั้งหมดก็ยังมีต้นทุนสูงอยู่ดี
- Redis เป็นประเภทของโปรเซสที่ต้นทุนนี้สำคัญมาก แม้ fork() จะไม่ได้คัดลอกตัวหน่วยความจำเอง แต่ก็ยังต้องคัดลอก page table
  ถ้าเป็นโปรเซสที่ถือ RAM หลายสิบ GB การ fork() อาจใช้เวลานาน และสิ่งนี้เกิดขึ้นทุกครั้งที่ Redis dump ไฟล์ .rdb หรือเขียน AOF แบบ binary log ใหม่
  ตั้งแต่ปี 2012 ก็มีบทความที่แสดงต้นทุนสูงของงานนี้แล้ว: https://redis.io/blog/testing-fork-time-on-awsxen-infrastruc...
  บน m2.xlarge ที่ใช้ RAM ราว 25GB, fork() ใช้เวลา 5.67 วินาที เมื่อคิดว่าโดยปกติไคลเอนต์ Redis มักเจอ latency ระดับมิลลิวินาทีเลขหลักเดียวสำหรับงานส่วนใหญ่ นี่ถือเป็นช่วงหยุดชะงักที่ยาวมาก และนี่เป็นแค่เวลาคัดลอก page table เท่านั้น
  น่าแปลกที่ไม่มีการพูดถึง huge page เลย ซึ่งดูเหมือนจะเป็นประเด็นสำคัญมากในที่นี้ ผ่านไป 14 ปี ฮาร์ดแวร์คงเร็วขึ้น แต่ Redis instance ก็น่าจะใช้ RAM มากขึ้นด้วย ดังนั้นคงน่าสนใจถ้าเอา benchmark นี้มารันใหม่
- สำหรับกลุ่มผู้อ่านเป้าหมายของบทความลักษณะนี้ copy-on-write น่าจะเป็นความรู้พื้นฐานอยู่แล้วจึงถูกละไว้
- ต่อให้มี copy-on-write, fork() ก็ยังต้องจ่ายต้นทุนในการตั้งค่ามันอยู่ดี ถ้าโปรเซสแม่มีเธรดที่ทำงานหนักจำนวนมาก เช่นใน Java ก็อาจเกิด copy-on-write ที่ไม่จำเป็นขึ้นมากก่อนที่ exec() จะทำงาน
- ในเนื้อความใช้คำว่า “สถานะ” ต่อให้เป็น copy-on-write ก็แค่ไม่คัดลอกเนื้อหา แต่ต้นทุนที่แปรผันตาม จำนวนรายการใน page table ยังคงอยู่
  การ fork โปรแกรมที่มีขนาดหน่วยความจำเสมือนใหญ่จึงเป็นปัญหาความช้าที่เป็นที่รู้กันดี
ความงามของโมเดล fork()+exec() อยู่ที่หลัง fork() แล้ว คุณยังใช้ API ปกติชุดเดิมเพื่อตั้งค่าได้ทุกแบบ
ทางเลือกแทนแบบเรียกควบที่เห็นมาจนถึงตอนนี้ดูอ่อนเกินไปในระดับพื้นฐาน เพราะต้องเพิ่มตัวเลือกการตั้งค่าทั้งหมดเข้าไปเป็นพารามิเตอร์ของการเรียก และยังต้องทำให้ขยายต่อในอนาคตได้โดยไม่เละเทะ
- ไม่ได้เห็นด้วยเต็มที่ แต่ก็เห็นประโยชน์อยู่ ถึง fork()/exec() จะมีประโยชน์ในบางกรณี แต่ถ้า API ต่างๆ รับอาร์กิวเมนต์ pidfd ก็น่าจะโอเคมากทีเดียว โดย 0 อาจหมายถึงโปรเซสปัจจุบันได้
  ปัญหาน่าจะมีแค่พวกไบนารี setuid/setgid ซึ่งในกรณีนั้นอาจจัดการเป็นกรณีพิเศษใน exec จะดีกว่า
  เช่น อาจสร้างโปรเซสที่ถูกหยุดไว้ด้วย pidfd_t ps = spawn(); แล้วค่อยตั้งค่าด้วย setuid(ps, 33);, capset(ps, ...);, socket(ps, ...);, mmap(ps, ...);, process_vm_writev(ps, ...);, exec(ps, ...);, signal(ps, SIGCONT);
  นี่ก็เป็นคำวิจารณ์ด้วยว่า API ของ system call ปกติไม่ได้คิดเผื่อคำถามว่า “ถ้าฉันอยากทำสิ่งนี้กับโปรเซสอื่นที่ฉันมีสิทธิ์เข้าถึงล่ะ?” มากพอ ถ้าทำแบบนี้ ความปลอดภัยต่อเธรดของ fork() ก็อาจพอเป็นไปได้ระดับหนึ่งด้วย
  แต่ก็เห็นด้วยว่าวิธีแบบ CreateProcess ที่รับพารามิเตอร์จำนวนมหาศาลนั้นไม่ใช่ API ฝั่งผู้ใช้ที่ดีนัก
- ผมคิดตรงข้ามเลย ความผิดพลาดใหญ่ของโมเดลแบบ UNIX คือมัน เก็บสถานะ ไว้มากเกินไปตอนสร้างโปรเซส
  ตัวอย่างเช่น มี API ที่ทำให้อ็อบเจ็กต์บางตัวกลายเป็น file descriptor หมายเลข 4 ได้ แล้วก็สามารถรันโปรแกรมเพื่อให้โปรแกรมนั้นไปหาอ็อบเจ็กต์นั้นที่ descriptor หมายเลข 4 ได้ แบบนี้แปลกมาก
  Windows แม้จะมีข้อเสียมากมาย ก็ไม่ได้ใช้ fork()+exec() แต่ให้ตัวเลือกเกี่ยวกับวิธีสร้างโปรเซสเป็นหลัก ถึงจะไม่สง่างาม แต่ทิศทางถูกต้องแล้ว
- การเรียกสิ่งนั้นว่าสง่างามเป็นผลจาก path dependence ของประวัติศาสตร์ fork()+exec()
  ถ้าเป็นอีกโลกหนึ่งที่ไม่มี fork()+exec() ตั้งแต่แรก “API ปกติ” จำนวนมากก็คงมีอาร์กิวเมนต์ pid แบบชัดเจนเพื่อให้เปลี่ยนการตั้งค่าของอีกโปรเซสได้ Fuchsia ก็ประมาณนั้น
  โลกแบบนั้นมีข้อดีหลายอย่าง อย่างที่ชัดที่สุดคือไม่ต้องสร้างระบบ IPC แยกขึ้นมาแบบกึ่งมหัศจรรย์เพื่อรายงานข้อผิดพลาดของการตั้งค่า และยังสามารถมีโปรเซสผู้จัดการที่คอยปรับคุณสมบัติของลูกได้ด้วย ซึ่งมีประโยชน์มาก โดยเฉพาะดีบักเกอร์น่าจะชอบ
- วิธีที่ถูกต้องในการเลิกใช้ fork() คือทำให้ API ปกติที่เปลี่ยนสถานะโปรเซสรับ process handle แบบชัดเจน
  แบบนั้นก็ใช้ API เดียวกันตั้งค่าโปรเซสว่างๆ ได้ และยังเอาไปประกอบกับอย่างอื่น เช่น IPC หรือการดีบัก ได้ด้วย
- ลำดับควรเป็น spawn, configure, exec
  ถ้าโปรเซสเริ่มมาในสถานะเชื่อมกับ ptrace และไม่มีเธรด ก็อาจบังคับให้ system call เกิดขึ้นระหว่างขั้นตั้งค่าได้ Linux เองยังไม่มีแนวคิดเรื่อง “โปรเซสที่ไม่มีเธรด” ด้วยซ้ำ ดังนั้นอาจต้องมีเธรดหลอก
ความเข้าใจผิดว่า fork() ราคาถูกนั้นแพร่หลายจนน่าแปลก ทั้งที่มันเป็น O(N) ตามขนาดโปรเซส และก็เป็นแบบนั้นมาตลอด
ใช่ มันเป็น copy-on-write แต่ก็มีความสัมพันธ์เชิงเส้นระหว่างขนาดโปรเซสกับจำนวน page table entries ที่ต้องใช้เพื่อแทนมัน
ไม่น่าแปลกใจที่แพตช์ของ Chen ถูกปฏิเสธ มันเป็นกรณีใช้งานเฉพาะทางเกินไปจนไม่คุ้มจะรองรับ
จากมุมมองของนักพัฒนาเชลล์ เห็นด้วยกับข้อสรุปที่ว่า “มีโอกาสสูงที่นักพัฒนาจะต้อนรับ การทำแบบ native ที่ไม่ซ่อน fork() และ exec() ไว้ข้างในเหมือนอิมพลีเมนเทชันปัจจุบัน”
- ดูเหมือนจะไม่ได้สนใจแค่อิมพลีเมนเทชันเฉพาะตัวนั้น แต่สนใจตัวแนวคิดเองด้วย
fork() ดูน่ากลัวในเชิงแนวคิดมาตั้งแต่ตอนที่ผมเรียนมันครั้งแรก ถ้าอยากทำงานอย่างหนึ่งคือเริ่มโปรเซส ก็ไม่ควรต้องผ่าน คาถาปริศนา ที่เป็นอีกงานหนึ่งซึ่งไม่เกี่ยวกันเลยอย่างการ fork โปรเซสปัจจุบัน
อย่างในตัวอย่างของบทความ ผมสงสัยว่าวิธีที่ดีที่สุดในการจัดการสถานการณ์ที่โปรเซสหนึ่งต้องเปิดโปรเซสลูก git จำนวนมากคืออะไร การเริ่ม git ใหม่ซ้ำๆ จากศูนย์ระหว่างงานของโปรเซสแม่ที่รันยาวๆ ดูไม่สมเหตุสมผลเลย แล้ว abstraction ต้นทุนต่ำที่ให้ผลเหมือนกันคืออะไร?
- fork() นั้นเรียบง่ายในเชิงแนวคิด ถ้าไม่ดึงเลเยอร์อื่นเข้ามา การเริ่มโปรเซสก็เริ่มจากสิ่งเดียวที่คุณมั่นใจว่ามีอยู่แน่ๆ นั่นคือ ตัวเอง
  ไม่อย่างนั้นก็ต้องมีหลายขั้นตอน ทั้งสร้างโปรเซส เติมสิ่งที่จะให้มันรันเข้าไป แล้วจัดให้มันเริ่มทำงาน หรือไม่ก็ต้องเอาไปผูกติดรวมกับเลเยอร์อื่นอย่างถาวรแบบ Win32 เช่นไฟล์ซิสเต็ม, object loader, linker
- ในฐานะคนที่เริ่มจาก Windows โมเดล fork()+exec() นั้นไม่สมเหตุสมผลเลย ทุกวันนี้ก็รู้แล้วว่ามันเป็นเพียง ความพิลึกทางประวัติศาสตร์ แต่ก็ยังมีคนทำเหมือน fork()+exec() เป็นสิ่งที่ดีจริงๆ
- มี libgit2 อยู่แล้ว จะจินตนาการเป็นการคุยกับ gitd บางตัวผ่าน pipe หรือ socket ก็ได้ แต่ไม่รู้ว่าทำไมถึงจะเป็นไอเดียที่ดี ถ้าไม่ทำแบบนั้นก็ต้องเปิดโปรเซส
เหตุผลที่แทน exec/fork ได้ยากก็เพราะปกติแล้วต้องตั้งค่าโปรเซสใหม่ก่อน เช่น ตั้งค่า signal handler, ปิดหรือเปิด file descriptor, สลับ namespace, ตั้งค่า seccomp, ปรับสิทธิ์
แต่ system call สำหรับสิ่งเหล่านี้ตอนนี้ใช้ได้กับโปรเซสปัจจุบันเท่านั้น จึงต้องมีวิธีทดแทน ข้อเสนอในบทความคือสร้าง API ใหม่สำหรับสิ่งนี้
ผมคิดว่า system call ใหม่อย่าง spawn อาจสร้างโปรเซสว่างๆ ขึ้นมา แล้วโหลด loader เบาๆ เข้าไป พร้อมส่งข้อมูลการตั้งค่าแบบใดก็ได้ให้มัน จากนั้น loader ก็ไปตั้งค่าโปรเซสและ exec() โปรแกรมหลัก
แบบนี้จะคง API เดิมไว้ได้โดยไม่ต้อง fork หน่วยความจำ แต่ file descriptor กับอย่างอื่นก็ยังต้องทำสำเนาอยู่ดี
- โชคดีที่เหมือนมีใครนั่งไทม์แมชชีนมาเห็นบทความนี้แล้วเพิ่มมันไว้ใน POSIX.1-2001 :)
  ถ้าไม่ได้ล้อเล่นก็ขออภัย แต่ posix_spawn() มีอยู่แล้ว และใน glibc fork ก็เป็นแค่นามแฝงของ clone()
  ถึงจะไม่เหมือนข้อเสนอเดิมทุกอย่างเป๊ะๆ แต่ fork()/exec() ก็ใกล้เคียงกับของ legacy จริงๆ
ถ้า fork และ exec สามารถแสดงพฤติกรรมที่ต่อเนื่องและ เป็นพีชคณิต ได้มากกว่าแค่คุณสมบัติ copy-on-write มันก็น่าจะมีประโยชน์ขึ้นและน่าใช้งานขึ้นด้วย เช่น เอาไปใช้กับการประเมินค่าแบบขี้เกียจได้
มีการถกเถียงเกี่ยวกับ API เก่าแก่นี้บน Hacker News อยู่มาก และตัวอย่างหนึ่งคือ https://news.ycombinator.com/item?id=31739794