1 คะแนน โดย GN⁺ 4 시간 전 | 1 ความคิดเห็น | แชร์ทาง WhatsApp
  • AV2 เป็นสเปกการเข้ารหัสวิดีโอรุ่นถัดไปของ AOMedia ที่พัฒนาต่อยอดจาก AV1 โดยมุ่งให้มีประสิทธิภาพการบีบอัดสูงขึ้นและส่งมอบคุณภาพที่ดีด้วยบิตเรตที่ต่ำลง
  • สเปกฉบับสมบูรณ์ v1.0.0 ครอบคลุม ไวยากรณ์ของบิตสตรีม, semantics และกระบวนการถอดรหัส และเป็นเอกสารอ้างอิงทางเทคนิคสำหรับใช้พิจารณาความสอดคล้องของการนำ AV2 ไปใช้งาน
  • ได้รับการปรับแต่งให้เหมาะกับสตรีมมิง การออกอากาศ และวิดีโอคอนเฟอเรนซ์แบบเรียลไทม์ อีกทั้งยังรองรับ AR/VR, การส่งภาพแบบแบ่งหน้าจอ และการปรับปรุงการประมวลผลเนื้อหาหน้าจอ
  • รีลีสปัจจุบันประกอบด้วย AV2 Bitstream & Decoding Process Specification v1.0.0 ที่เผยแพร่เมื่อ 28 พฤษภาคม 2026 และซอฟต์แวร์อ้างอิง AVM
  • ผู้พัฒนาสามารถใช้งานสเปกออนไลน์, PDF, ตาราง lookup ในรูป C header, Syntax Browser และแท็ก AVM v1.0.0 ได้ โดยยังคงเก็บร่าง v13 ไว้เพื่อใช้อ้างอิง

ภาพรวมของ AV2

  • AV2 เป็นสเปกการเข้ารหัสวิดีโอรุ่นถัดไปของ Alliance for Open Media (AOMedia) ที่ออกแบบบนพื้นฐานของ AV1 เพื่อมอบประสิทธิภาพการบีบอัดที่สูงขึ้น
  • มีเป้าหมายเพื่อส่งมอบ วิดีโอคุณภาพสูง ด้วยบิตเรตที่ต่ำลงอย่างมาก และได้รับการปรับแต่งให้ตอบโจทย์สตรีมมิง การออกอากาศ และวิดีโอคอนเฟอเรนซ์แบบเรียลไทม์
  • สเปก v1.0.0 เป็น เอกสารอ้างอิงทางเทคนิคฉบับสมบูรณ์ สำหรับการนำ AV2 ไปใช้งาน โดยครอบคลุมไวยากรณ์ของบิตสตรีม semantics และกระบวนการถอดรหัสที่จำเป็นต่อการทำให้สอดคล้องอย่างครบถ้วน
  • AV2 รองรับ แอปพลิเคชัน AR/VR, การส่งหลายโปรแกรมในรูปแบบแบ่งหน้าจอ, การปรับปรุงการประมวลผลเนื้อหาหน้าจอ และการทำงานในช่วงคุณภาพการมองเห็นที่กว้างขึ้น
  • มี AOMedia Video Model (AVM) ให้เป็นซอฟต์แวร์อ้างอิงอย่างเป็นทางการสำหรับผู้พัฒนา
  • สามารถส่งข้อเสนอแนะและรายงานปัญหาไปที่ wg-codec-chair@aomedia.org หรือเปิดไว้ใน AVM issue tracker

รีลีสและทรัพยากรสำหรับการพัฒนา

  • AV2 specification and reference code v1.0.0

    • รีลีสปัจจุบัน คือ AV2 Bitstream & Decoding Process Specification v1.0.0 ที่เผยแพร่เมื่อ 28 พฤษภาคม 2026 และซอฟต์แวร์อ้างอิง AVM ที่เกี่ยวข้อง
    • Read Online: เอกสารสเปก v1.0.0 แบบออนไลน์
    • Download PDF: PDF ของสเปก v1.0.0 ฉบับเต็ม
    • Additional Tables: ไฟล์ C header ของตาราง lookup ที่ดึงมาจากส่วนที่ 9
    • Syntax Browser: เบราว์เซอร์สำหรับสำรวจโครงสร้างไวยากรณ์และ semantics ไปพร้อมกัน
    • Software: ซอฟต์แวร์อ้างอิง AVM ที่แท็ก v1.0.0
  • AV2 working draft v13

    • ร่างทำงาน v13 เผยแพร่เมื่อ 5 มกราคม 2026 และถูกแทนที่ด้วย v1.0.0 แล้ว
    • ป้ายกำกับ “v13” หมายถึงไมล์สโตนของร่างทำงาน และไม่ได้หมายความว่าเป็นเวอร์ชันใหม่กว่า v1.0.0
    • ยังคงเก็บไว้เพื่อใช้เป็นข้อมูลอ้างอิง
    • Read Online: เอกสารออนไลน์ของ v13
    • Additional Tables: ตารางเพิ่มเติมของ v13
    • Syntax Browser: เบราว์เซอร์ไวยากรณ์ของ v13
    • Software: ซอฟต์แวร์อ้างอิง research-v13.0.0
    • Release Notes: บันทึกประจำรุ่นของ v13
  • ทรัพยากรสำหรับใช้งานสเปก

    • สเปกฉบับเต็ม ครอบคลุมตั้งแต่ขอบเขตและคำจำกัดความไปจนถึงภาคผนวก รวมทั้งรูปแบบ ไวยากรณ์ semantics และกระบวนการถอดรหัส
    • เวอร์ชัน PDF ให้สเปก v1.0.0 ฉบับสมบูรณ์สำหรับใช้อ้างอิงแบบออฟไลน์
    • Additional Tables คือทรัพยากรที่ดึงตาราง lookup จากส่วนที่ 9 ออกมาเป็นไฟล์ C header ซึ่งมีประโยชน์ต่อการอ้างอิงในการพัฒนา
    • Syntax Browser นำเสนอ Syntax Structures ในส่วนที่ 5 และ Semantics ในส่วนที่ 6 ผ่านอินเทอร์เฟซแบบแบ่งหน้าต่าง
    • ใน Syntax Browser สามารถดูคำจำกัดความไวยากรณ์และ semantics แบบเคียงกัน, คลิกองค์ประกอบทางไวยากรณ์ได้, ค้นหาได้ทั้งสองส่วน และคัดลอกโครงสร้างไวยากรณ์ได้
    • Reference Software คือ AVM ที่สอดคล้องกับสเปก v1.0.0 โดยแท็ก v1.0.0 คือเวอร์ชันดังกล่าว

1 ความคิดเห็น

 
GN⁺ 4 시간 전
ความเห็นจาก Hacker News
  • AV2 เป็นเพียง อีกขั้นหนึ่งของการเดินทางอันยาวนาน เท่านั้น และในสภาพตอนนี้ก็มองว่าแทบใช้งานจริงได้ยาก
    แม้บนฮาร์ดแวร์ที่ดีก็ยังเข้ารหัสได้ปกติแค่ราว 1fps ดังนั้นก็น่าจะยังเป็นแบบนี้ต่อไปจนกว่าจะมีชิปเร่งความเร็ว AV2 ตัวแรกออกมาราวปี 2028 และกว่าที่สตรีม AV2 จะพบเห็นได้ทั่วไปก็คงต้องราวปี 2030
    ถ้ามองเฉพาะเรื่องประสิทธิภาพที่ดีขึ้นเมื่อเทียบกับ AV1 ที่ 20~30% ก็ถือว่าไม่น้อย แต่ก็ยังไม่ชัดว่า AV2 คุ้มค่าขนาดนั้นหรือไม่ อย่างไรก็ตาม การรองรับหลายสตรีมเป็นข้อดีมากสำหรับ VR และกีฬาสด และการส่ง alpha channel เป็นสตรีมแยกแล้วนำไปคอมโพสิตในไฟล์เพื่อรองรับวิดีโอโปร่งใสอย่างถูกต้องก็น่าสนใจ

    • ถ้าดูจากเส้นทางของ AV1 ก็ไม่ได้จำเป็นต้องมี การเข้ารหัสด้วยฮาร์ดแวร์ เสมอไป มีได้ก็ดี แต่ตัวเข้ารหัสตอนนี้เป็น reference encoder
      ตอนนี้สเปกถูกกำหนดแน่นอนแล้ว จึงมีโอกาสที่ตัวเข้ารหัสสำหรับใช้งานจริงจะเร็วขึ้นมาก เพียงแต่การเข้ารหัสแบบเรียลไทม์ก็น่าจะยังยากจนกว่าจะลงไปอยู่ในฮาร์ดแวร์
    • ถ้า “ฟีเจอร์ใหม่ที่ใหญ่ที่สุดคือการรองรับหลายสตรีม” ก็เคยคิดว่านี่เป็นเรื่องของ container format มากกว่าจะเป็นวิดีโอโคเดก
    • ถ้าดูจากแนวโน้มตอนนี้ ก็มองว่าน่าจะยังไม่ได้เห็น ตัวเข้ารหัสฮาร์ดแวร์ AV2 บนพีซีในเร็ว ๆ นี้ กำลังการผลิตชิปล่าสุดและดีที่สุดแทบทั้งหมดถูก Apple กับบริษัท AI ดูดไปหมดแล้ว
      ถ้าผู้ผลิตชิปไม่ย้ายดีไซน์ AV2 ไปใช้กระบวนการผลิตที่เก่ากว่าและถูกกว่า ก็คงยากสำหรับผู้ใช้ทั่วไป และแม้ผู้ผลิตชิปทีวีจีนอาจใส่ตัวถอดรหัส AV2 แบบทำไว้แค่ติ๊กเช็กบ็อกซ์ได้ แต่ตัวเข้ารหัสจริงคงยังหวังได้ยากไปอีกพักใหญ่
    • พอเห็นการพัฒนา GPU เบนไปทาง NPU ก็ให้ความรู้สึกว่านี่เป็นเป้าหมายระดับ ปี 2035 เร็วสุดแล้ว ผู้ผลิตคงพยายามเพิ่มพื้นที่ซิลิคอนสำหรับการคำนวณเมทริกซ์ให้มากที่สุด
      ในยุคที่มีการทุ่มเงินระดับล้านล้านเข้าสู่ดาต้าเซ็นเตอร์ ต้นทุนทราฟฟิกกลายเป็นเรื่องรอง และคนที่ได้ประโยชน์อาจมีแค่ YouTube หรือ Netflix เท่านั้น ในระดับนั้น การลงทุนในแคชระดับ ISP อาจถูกกว่าด้วยซ้ำ
    • ถ้าบอกว่าเป้าหมายคือ “ส่งวิดีโอคุณภาพสูงด้วยบิตเรตที่ต่ำกว่ามาก” แต่เครื่องช้าที่ยังจำเป็นจริง ๆ นั้นยังไม่มีอยู่เลย ก็ไม่ค่อยเข้าใจว่า มันมีความหมายอะไร
  • อยากรู้ว่า AV2 จะปรับปรุง ฟอร์แมตภาพ AVIF อย่างไร AVIF เหนือกว่าฟอร์แมตคู่แข่งมากสำหรับภาพนิ่งบิตเรตต่ำ โดยเฉพาะเมื่อใช้ chroma subsampling
    แต่สำหรับภาพแบบไม่สูญเสียข้อมูลนั้นไม่ใช่แบบนั้น ถ้าเทียบกับ JPEG XL แบบ lossless และ WEBP แบบ lossless แล้ว AVIF แบบ lossless ดูสู้ไม่ได้เลย

    • ตอนนี้ AVIF เป็นฟอร์แมตภาพที่ชอบที่สุด แทบไม่มีฟอร์แมตไหนที่มีครบทั้ง lossless, HDR, transparency, การรองรับในเบราว์เซอร์
      มันยอดเยี่ยมมากแม้กับภาพที่บีบอัดแรงมาก และก็น่าทึ่งว่าขนาดไฟล์เล็กลงได้มากแค่ไหน ต่างจาก HEIC หรือ Ultra HDR JPEG ที่ใช้ทางอ้อมอย่าง sidecar gain map แต่รองรับ HDR แบบเนทีฟในตัวฟอร์แมตไฟล์เลย เรื่องนี้อาจไม่ได้สำคัญกับทุกคน แต่ถ้าชอบ HDR ก็รู้สึกว่า AVIF เป็นฟอร์แมตเดียวที่เอาจริงกับเรื่องนี้
    • ไม่ได้เป็นแบบนั้นเสมอไป https://tonisagrista.com/blog/2023/jpegxl-vs-avif/
    • ถ้า libavif รองรับ AV2 ก็อาจแค่ต้องอัปเดตเป็นเวอร์ชันอย่าง v2.0.0 แล้วก็ได้ ประสิทธิภาพเพิ่มขึ้น
    • พูดตามตรง ตอนนี้สิ่งที่ต้องการไม่ใช่ AVIF2 เรามี ฟอร์แมตภาพทางเลือก มากเกินไปอยู่แล้ว
  • ตอนนี้หลายบริษัทกำลังทำ claim chart สำหรับ AV1 อย่างจริงจัง และก็ดูแทบแน่นอนว่าจะมีคดีตามมา กระบวนการเดียวกันนี้เริ่มขึ้นกับ AV2 แล้วเช่นกัน เพียงแต่ส่วนใหญ่กำลังรอให้คดีฝั่ง AV1 สุกงอมก่อน
    ผู้คนยังเรียกโคเดกตระกูล AV ว่า “royalty-free” กันต่อไป แต่ในความเป็นจริงมันดูเหมือนการพนันทางกฎหมายและการเงินมากขึ้นเรื่อย ๆ

    • เรื่องแบบนี้ถูกพูดกันมาหลายสิบปีแล้ว
      ไม่เคยเข้าใจเลยว่าทำไมบางคนถึงชอบแนวคิดที่บริษัทเป็นเจ้าของคณิตศาสตร์ ราวกับเชียร์ทีมกีฬาท้องถิ่น
      ช่วงหนึ่งเคยคิดว่าอาจเป็นเพราะมีคนทุ่มแรงกับตัวเข้ารหัส H.264 ไปมาก เลยทำให้ชาวนาเช่าดิจิทัลโกรธและอิจฉาคนที่ปกป้องเสรีภาพอันสกปรก แต่บางคนดูเหมือนจะแค่ชอบแนวคิดที่บริษัทสามารถเก็บภาษีกับการเผยแพร่วิดีโอได้
      โชคดีที่บริษัทโลภเหล่านั้นทำร้ายตัวเองซ้ำ ๆ และอิทธิพลก็กำลังลดลง
    • AV1 ออกมานานแค่ไหนแล้ว? ประมาณ 8 ปีได้ แต่ก็ยังไม่มี ผู้ถือสิทธิบัตรที่น่าเชื่อถือ
      รอบ ๆ มาตรฐานการบีบอัดย่อมมีแร้งคอยวนเวียนอยู่เสมอ จึงไม่จำเป็นต้องจริงจังเกินไป ต่อให้มีการฟ้องร้องจริง ก็ยังมีกองทุนป้องกันทางกฎหมายไว้รับมือการเรียกร้องที่ไม่มีมูล
    • ถ้าโคเดกตระกูล AV ดูเป็นการพนันทางกฎหมายและการเงิน แล้วทางเลือกคืออะไร?
      H.265 มี license pool ของ HEVC ที่ต้องเข้าร่วมสองแห่ง และยังมีบริษัทนอก pool อย่างน้อยอีกสองแห่งด้วย
      https://en.wikipedia.org/wiki/High_Efficiency_Video_Coding#P...
      ดูแล้วการเลือกโคเดกที่ไม่ใช่ AVx ก็ไม่ได้ทำให้ซับซ้อนน้อยลงหรือเสี่ยงถูกฟ้องน้อยลง
    • หมายความว่าแม้เทียบกับพวกอย่าง HEVC ก็ยังเป็นแบบนั้นหรือ? ถ้าจะให้ชัวร์กับ HEVC คุณต้องจ่ายเงินให้ สิทธิบัตรพูล 3 แห่ง ที่มีเงื่อนไขต่างกัน และนอกจากนั้นผู้ถือสิทธิบัตรที่ไม่อยู่ในพูลไหนเลยก็ยังอาจมาเรียกเก็บค่า royalty ตามเงื่อนไขของตัวเองได้ทุกเมื่อ
    • มาตรฐานการสื่อสาร ไม่ควรจดสิทธิบัตรได้ เพราะศักยภาพในการนำไปใช้ในทางที่ผิดผ่าน lock-in สูงเกินไป
  • ถ้ามีใครเอามาตรฐานนี้ไปทำจริง กว่าจะโดนฟ้องเพราะ Adobe หรือ Dolby อยากฟาดสักทีจะใช้เวลานานแค่ไหน? ความรู้ของผมอาจเก่าแล้ว แต่ถ้ามัน “เปิด” แบบเดียวกับ AV1 ก็ยังค่อนข้างสงสัยว่าแต่ละบริษัทจะยอมจริงหรือไม่ ความโลภก็มีอยู่

    • กว่าที่ การอ้างสิทธิบัตร ครั้งแรกต่อ AV1 จะไปถึงศาลก็ใช้เวลา 7 ปี และกว่าคดีนั้นจะยุติก็ดูเหมือนจะต้องใช้เวลาอีกพอสมควร
      ที่น่าสนใจคือมันไม่ได้มาจาก patent pool ที่เป็นข่าวอยู่เรื่อย ๆ ในช่วงหลายปีที่ผ่านมา นั่นหมายความว่าอาจต้องใช้เวลาค่อนข้างนานกว่าจะมีความพยายามแบบนี้เกิดขึ้น
    • patent troll นี่เลวร้ายจริง ๆ ต้องใช้เวลาอีกแค่ไหนกว่าพวกเขาจะได้รับการสนับสนุนเต็มที่จากคนที่พร้อมสั่นคลอนความเป็นอิสระของกระบวนการยุติธรรมสหรัฐเพื่อผลประโยชน์ตัวเอง? หวังว่าความเสื่อมทรามนั้นจะถูกหยุดก่อน
  • พูดแบบกึ่งล้อเล่น แต่เดิมผมรอ Apple TV ที่รองรับ AV1 อยู่ ตอนนี้กลายเป็นว่าต้องรอ การรองรับ AV2 บน Apple TV ด้วยแล้ว

    • แม้แต่ iPhone 7 ที่มีอายุ 10 ปีก็ยังเล่นวิดีโอ AV1 1080p ด้วยการถอดรหัสแบบซอฟต์แวร์ผ่าน VLC ได้นานเกิน 200 นาที iPhone 7 ออกก่อน AV1 อยู่ 1 ปีครึ่ง
      เพราะงั้นจึงค่อนข้างปลอดภัยที่จะมองว่าอุปกรณ์ Apple TV ปัจจุบันก็น่าจะเล่นวิดีโอ AV1 แบบซอฟต์แวร์ได้เช่นกัน และก็มี VLC เวอร์ชันสำหรับ Apple TV ด้วย
      https://www.videolan.org/vlc/download-appletv.html
      https://apps.apple.com/us/app/vlc-media-player/id650377962?p...
    • นอกระบบนิเวศของ Apple แล้ว AV1 แทบจะรองรับได้แทบทุกที่
  • ผมไม่ใช่ผู้เชี่ยวชาญด้านการเข้ารหัสวิดีโอ แต่ก็สงสัยว่าในอนาคตเราอาจพึ่งพา เครือข่าย AI ที่สร้างภาพวิดีโอขึ้นมาใหม่มากกว่าวิธีบีบอัดแบบฟังก์ชันคงที่ ซึ่งอาจทำให้ไฟล์เบากว่าวิดีโอที่บีบอัดแบบเดิมได้มากหรือเปล่า
    neural codec อย่าง github.com/Orange-OpenSource/Cool-Chic ก็เป็นตัวอย่างของแนวทางนั้น

    • น่าจะขึ้นอยู่กับว่าสมาร์ตโฟนจะมี NPU เป็นมาตรฐานแพร่หลายหรือไม่ และจะมี API มาตรฐานสำหรับเข้าถึง NPU หรือเปล่า
      แต่ก็ยังไม่แน่ใจว่าโคเดกที่อิง AI จะใช้แบตเตอรี่ได้แข่งขันกับฮาร์ดแวร์แบบฟังก์ชันคงที่ได้หรือไม่
  • AV1 เป็นก้าวกระโดดครั้งใหญ่ไปสู่ฟอร์แมตวิดีโอแบบเปิดที่มีประสิทธิภาพอยู่แล้ว และ AV2 ก็เป็นสิ่งที่รอกันมานาน
    คงต้องใช้เวลาอีกพักกว่าจะถูกนำไปใช้งานในชิปและฮาร์ดแวร์จนสามารถใช้การเข้ารหัส/ถอดรหัสด้วยฮาร์ดแวร์ที่มีประสิทธิภาพและรวดเร็วได้ แต่เมื่อคิดถึงราคาพื้นที่จัดเก็บที่สูงขึ้นและวิกฤตชิปแล้ว การเพิ่มประสิทธิภาพราว 25% ก็ดูน่ามีอนาคตมาก

  • Dav2d ฟังดูไม่ค่อยติดหูเท่าไร หวังว่าก่อนหน้านั้นจะมีใครสักคนที่ถนัดการเล่นคำตั้งชื่อรีโพซิทอรีมาช่วย contribute
    avi2ude? av2go?

    • rav2d ก็ดูเป็นชื่อที่โอเค — https://github.com/stukenov/rav2d เป็นพอร์ต Rust และให้บรรยากาศแบบ rav1d→dav1d
    • สำหรับ av2 นี่หาชื่อที่ดีได้ยากจริง ๆ
      ในภาษาฝรั่งเศสจะเป็น d2vid หรือก็คือ Deuvid
  • หวังว่าจะมีเอนโค้ดเดอร์ที่เร็วพอสมควรออกมา ตัวเอนโค้ดเดอร์อ้างอิงของ AV1 เองก็ไม่ได้ดีนัก และที่นี่ก็คงไม่ต่างกัน
    แต่พอมีอะไรอย่าง SVT-AV2 ออกมาเมื่อไร ก็น่าจะพอใจมาก