3 คะแนน โดย GN⁺ 2026-03-19 | 1 ความคิดเห็น | แชร์ทาง WhatsApp
  • เฟรมเวิร์กมัลติมีเดียข้ามแพลตฟอร์มสำหรับบันทึก·แปลง·สตรีมเสียงและวิดีโอ โดยได้เปิดตัวเวอร์ชันล่าสุด 8.1 “Hoare” แล้ว
  • เวอร์ชันนี้รองรับ xHE-AAC Mps212 และการถอดรหัส MPEG-H, การพาร์สเมตาดาตา EXIF, และ การจัดการเมตาดาตา LCEVC
  • ความสามารถด้านการเร่งด้วย GPU ได้รับการเสริมให้ดีขึ้น เช่น การเข้ารหัส/ถอดรหัส ProRes บนพื้นฐาน Vulkan, การเข้ารหัส H.264·AV1 บน D3D12, และ การเข้ารหัสฮาร์ดแวร์ H.264/HEVC ของ Rockchip
  • มีการเพิ่มฟอร์แมตและฟิลเตอร์ใหม่ เช่น องค์ประกอบเสียงแอมบิโซนิก IAMF, demuxer ของ hxvs, และ ฟิลเตอร์ drawvg·vpp_amf
  • มีการปรับปรุงโครงสร้างภายในและแก้ไขบั๊ก รวมถึงการเตรียมสำหรับการเขียน swscale ใหม่ และเพิ่มความเร็วการเริ่มต้นทำงานด้วยการลบการพึ่งพา GLSL ตอนรันไทม์

การอัปเดตหลักของ FFmpeg 8.1 "Hoare"

  • เวอร์ชันใหม่นี้เป็น minor release (การออกรุ่นย่อย) และสามารถดาวน์โหลดได้
  • ตัวถอดรหัส: รองรับ xHE-AAC Mps212 (เชิงทดลอง) และ MPEG-H (ใช้ libmpeghdec)
  • เมตาดาตา: เพิ่มความสามารถในการพาร์ส EXIF
  • LCEVC: รองรับการพาร์สและส่งต่อเมตาดาตา
  • โค้ดกบนพื้นฐาน Vulkan: รองรับการเข้ารหัส·ถอดรหัส ProRes และการถอดรหัส DPX
  • การเร่งด้วย D3D12: เพิ่มการเข้ารหัส H.264/AV1 และฟิลเตอร์ scale_d3d12, mestimate_d3d12, deinterlace_d3d12
  • การเข้ารหัสฮาร์ดแวร์ Rockchip: รองรับ H.264 และ HEVC
  • IAMF: รองรับการมัลติเพล็กซ์·ดีมัลติเพล็กซ์ของ Projection mode Ambisonic Audio Elements
  • ฟอร์แมตและฟิลเตอร์: เพิ่ม demuxer ของ hxvs และฟิลเตอร์ drawvg กับ vpp_amf

การปรับปรุงภายในและประสิทธิภาพ

  • รวม การเปลี่ยนแปลงโค้ดภายในและการแก้ไขบั๊ก จำนวนมาก
  • กำลังดำเนินงานพื้นฐานเพื่อรองรับ การเขียน swscale ใหม่
  • โค้ดกบนพื้นฐาน Vulkan และบางฟิลเตอร์ได้ ลบการพึ่งพาการคอมไพล์ GLSL ตอนรันไทม์ ทำให้เริ่มต้นทำงานได้เร็วขึ้น

เกี่ยวกับโค้ดกบนพื้นฐาน Vulkan Compute

  • รายละเอียดทางเทคนิคและแผนในอนาคต ของการพัฒนาโค้ดกบนพื้นฐาน Vulkan Compute ได้เผยแพร่ไว้ใน บล็อก Khronos

คำแนะนำในการอัปเกรด

  • แนะนำให้ ผู้ใช้ ผู้จัดทำดิสทริบิวชัน และผู้รวมระบบ อัปเกรดเป็นเวอร์ชันล่าสุด
  • อย่างไรก็ตาม ไม่รวมกรณีที่กำลังใช้งานเวอร์ชัน git master อยู่ในปัจจุบัน

1 ความคิดเห็น

 
GN⁺ 2026-03-19
ความเห็นจาก Hacker News
  • ฉันคิดว่านี่คือหนึ่งใน เครื่องมือโอเพนซอร์ส ที่ดีที่สุดที่ฉันใช้บ่อย
    ใช้มันทุกสัปดาห์ร่วมกับ Plex, Jellyfin, Tunarr, ไฟล์เพลงในเครื่อง ฯลฯ เพื่อดึงซับไตเติล ตัดวิดีโอ แปลงฟอร์แมตเพลง ลบแทร็กเสียง และอื่น ๆ
    พอนึกดูอีกทีก็รู้สึกว่าฉันไม่เคยบริจาคเลยสักครั้ง เลยคิดว่าถึงเวลาต้องเปลี่ยนแล้ว

    • เครื่องมือนี้ถูกนำไปใช้เป็น องค์ประกอบย่อย ในซอฟต์แวร์นับไม่ถ้วนที่เราไม่ทันสังเกต
  • เคยเห็นสถานการณ์ประมาณมีมว่า “ffmpeg เวอร์ชันใหม่ออกแล้ว ต้องรีบคอมไพล์เลย… ไม่สิ รอไม่ไหวแล้ว โหลดไบนารีดีกว่า”
    วิดีโอที่เกี่ยวข้อง

    • ปกติฉันจะ คอมไพล์จากซอร์สโดยตรง เพราะในแพ็กเกจเมเนเจอร์มักไม่มีการรองรับโค้เดกที่ติดสิทธิบัตร
    • การคอมไพล์ ffmpeg อาจง่ายหรือซับซ้อนก็ได้ ขึ้นอยู่กับการตั้งค่า ตอนนี้ฉันกำลังทำ ครอสแพลตฟอร์มบิลเดอร์ บน GitHub Actions แต่การบิลด์สำหรับ Mac และ Windows กินเวลามากเกินไป
      กำลังอ้างอิง โปรเจ็กต์ ffmpeg-builder และใช้อยู่เป็นส่วนหนึ่งของแอปสำหรับวิศวกรวิดีโอ
    • ช่วงหลังต้องคอมไพล์เองเพราะ CVE ล่าสุด แต่ทำไม่สำเร็จ เลยหันไปแรป ffmpeg แล้ว ฉีดคำสั่งเวอร์ชัน เพื่อให้ผ่านตัวสแกน
    • ถ้าใครคุ้นกับ ffmpeg อยู่แล้ว แนะนำให้ดูวิดีโอด้านบนมาก มีเนื้อหาใช้งานจริงเพียบ เช่น yadif, mkvtoolnix, ปัญหาเวลาในชื่อไฟล์มี อะพอสทรอฟี แล้วทุกอย่างพัง
    • จริง ๆ แล้วการคอมไพล์ ffmpeg จากซอร์สนั้นค่อนข้างง่าย สิ่งที่ยากคือการตั้งค่า โค้เดก ที่ต้องใช้
      ถ้ารู้ชัดว่าใช้โค้เดกเสียง/วิดีโออะไรและติดตั้งให้ถูกต้อง การคอมไพล์ก็ตรงไปตรงมา
      ฉันทำแบบนี้มามากกว่า 10 ปีแล้ว และตั้งค่าให้รองรับโค้เดกหลายแบบเพื่อใช้กับ mpv ส่วนตัวแล้วชอบ mpv มากกว่า vlc
  • นี่คือสรุป Changelog ของรีลีสนี้
    มีการเพิ่มฟีเจอร์หลากหลาย เช่น ตัวเลือก ffprobe -codec, การพาร์ส EXIF metadata, การจับภาพบนพื้นฐาน Windows.Graphics.Capture, การถอดรหัส MPEG-H 3D audio, ตัวเข้ารหัส H.264/AV1 บนพื้นฐาน D3D12, การเร่งความเร็วฮาร์ดแวร์ด้วย Vulkan (ProRes, DPX ฯลฯ), การรองรับ JPEG-XS, ฟิลเตอร์ metadata สำหรับ LCEVC และอื่น ๆ

    • วันนี้เพิ่งรู้จักโค้เดกชื่อ JPEG XS เป็นครั้งแรก ให้คุณภาพระดับสูญเสียข้อมูลน้อยมากทั้งในเชิงภาพและเชิงคณิตศาสตร์ พร้อมค่าหน่วงต่ำ
      คำอธิบายใน Wikipedia
    • การจับภาพบนพื้นฐาน Windows.Graphics.Capture ทำให้สามารถ จับภาพหน้าต่างด้วยค่าหน่วงต่ำ ได้
      ด้วยฟีเจอร์นี้ การทำทางเลือกแทน Discord เป็น แอปเดสก์ท็อปเนทีฟ แทนที่จะเป็นแบบเบราว์เซอร์ก็ดูน่าสนใจขึ้น
    • มีคนถามด้วยว่า “คุณเป็นคนดูแล ffmpeg builds ของ gyan.dev หรือเปล่า”
    • ฉันสงสัยว่าฟีเจอร์จำนวนมหาศาลเหล่านี้มีส่วนไหนบ้างที่ เขียนหรือดีบักด้วยเครื่องมือ AI และอยากรู้ด้วยว่าใช้เวิร์กโฟลว์แบบไหน (สำหรับฉันตอนนี้สมัคร Claude Code อยู่)
  • Khronos โพสต์เกี่ยวกับ Vulkan compute codec ของ FFmpeg
    โพสต์ในบล็อกทางการ

    • มี เธรด HN ก่อนหน้า ที่เกี่ยวข้องด้วย
    • อยากรู้ว่ามี คู่มือด้านประสิทธิภาพ สำหรับ Vulkan compute codec หรือไม่
  • ตอนนี้ฉันกำลังใช้ Claude Code เพิ่มฟีเจอร์ แปลงข้อความสองทิศทางเป็นซับไตเติลแบบบิตแมป
    ลิงก์โปรเจ็กต์
    เป็นงานที่สนุกมากจริง ๆ

  • เพิ่งรู้ตอนนี้เองว่าในแต่ละรีลีสของ FFmpeg จะติดแท็กด้วยชื่อที่เกี่ยวข้องกับ คณิตศาสตร์และวิทยาการคอมพิวเตอร์ เท่มาก

  • การเข้ารหัสด้วยฮาร์ดแวร์ของ Rockchip ใช้ rkmpp เป็นฐาน จึงไม่ใช่ โซลูชันแบบ upstream และน่าจะต้องใช้เคอร์เนลของ Rockchip

    • ถึงอย่างนั้น เมื่อก่อนต้องคอมไพล์เองทั้งหมด เท่านี้ก็ถือว่าเป็น ความก้าวหน้าครั้งใหญ่ แล้ว
  • ฉันสงสัยว่าโค้ดในรีลีสนี้มีสัดส่วนเท่าไรที่เขียนโดย พนักงานบริษัทใหญ่

    • ไม่รู้ตัวเลขที่แน่ชัด แต่แทบทุกบริษัทเทคโนโลยีขนาดใหญ่ต่างก็ใช้ ffmpeg สำหรับ การทรานส์โค้ดสื่อ
  • FFmpeg ยอดเยี่ยมมาก แต่ วิธีใช้งานซับซ้อนเกินไป
    อยากให้มีอินเทอร์เฟซแบบสคริปต์ที่เรียบง่ายเหมือน avisynth สมัยก่อน
    ตอนนี้การจำคำสั่งมันยากเกินไป และก็น่าเสียดายที่ดูเหมือนทีมพัฒนาไม่ค่อยสนใจทำให้มันง่ายขึ้น

    • ตอนแรกฉันก็กลัว -filter_complex เหมือนกัน แต่พอมองมันในแบบแนวคิด filter chain ก็โอเคขึ้น
      ยิ่งคำสั่งยาว การดีบักก็ยิ่งยาก แต่พอชินแล้วจะเริ่มมองเห็นแพตเทิร์นของข้อผิดพลาด
      ถ้าเก็บคำสั่งที่ใช้บ่อยไว้เป็น เชลล์สคริปต์ จะสะดวกขึ้นมาก
    • ฉันคิดว่าการใช้ LLM มาช่วยหาตัวเลือกคำสั่งของ ffmpeg เป็นหนึ่งใน การใช้งานที่มีประโยชน์ที่สุด อย่างหนึ่ง
    • ถ้าต้องการแค่การเข้ารหัสแบบง่าย ๆ Handbrake ก็เป็นทางเลือกที่ดี
    • ฉันให้ AI เขียนคำสั่ง ffmpeg ทั้งหมด