เปิดตัวมาตรฐานวิดีโอ AV2 พร้อมเผยสเปกฉบับสมบูรณ์ v1.0
(av2.aomedia.org)- AV2 เป็นสเปกการเข้ารหัสวิดีโอรุ่นถัดไปของ AOMedia ที่พัฒนาต่อยอดจาก AV1 โดยมุ่งให้มีประสิทธิภาพการบีบอัดสูงขึ้นและส่งมอบคุณภาพที่ดีด้วยบิตเรตที่ต่ำลง
- สเปกฉบับสมบูรณ์ v1.0.0 ครอบคลุม ไวยากรณ์ของบิตสตรีม, semantics และกระบวนการถอดรหัส และเป็นเอกสารอ้างอิงทางเทคนิคสำหรับใช้พิจารณาความสอดคล้องของการนำ AV2 ไปใช้งาน
- ได้รับการปรับแต่งให้เหมาะกับสตรีมมิง การออกอากาศ และวิดีโอคอนเฟอเรนซ์แบบเรียลไทม์ อีกทั้งยังรองรับ AR/VR, การส่งภาพแบบแบ่งหน้าจอ และการปรับปรุงการประมวลผลเนื้อหาหน้าจอ
- รีลีสปัจจุบันประกอบด้วย AV2 Bitstream & Decoding Process Specification v1.0.0 ที่เผยแพร่เมื่อ 28 พฤษภาคม 2026 และซอฟต์แวร์อ้างอิง AVM
- ผู้พัฒนาสามารถใช้งานสเปกออนไลน์, PDF, ตาราง lookup ในรูป C header, Syntax Browser และแท็ก AVM v1.0.0 ได้ โดยยังคงเก็บร่าง v13 ไว้เพื่อใช้อ้างอิง
ภาพรวมของ AV2
- AV2 เป็นสเปกการเข้ารหัสวิดีโอรุ่นถัดไปของ Alliance for Open Media (AOMedia) ที่ออกแบบบนพื้นฐานของ AV1 เพื่อมอบประสิทธิภาพการบีบอัดที่สูงขึ้น
- มีเป้าหมายเพื่อส่งมอบ วิดีโอคุณภาพสูง ด้วยบิตเรตที่ต่ำลงอย่างมาก และได้รับการปรับแต่งให้ตอบโจทย์สตรีมมิง การออกอากาศ และวิดีโอคอนเฟอเรนซ์แบบเรียลไทม์
- สเปก v1.0.0 เป็น เอกสารอ้างอิงทางเทคนิคฉบับสมบูรณ์ สำหรับการนำ AV2 ไปใช้งาน โดยครอบคลุมไวยากรณ์ของบิตสตรีม semantics และกระบวนการถอดรหัสที่จำเป็นต่อการทำให้สอดคล้องอย่างครบถ้วน
- AV2 รองรับ แอปพลิเคชัน AR/VR, การส่งหลายโปรแกรมในรูปแบบแบ่งหน้าจอ, การปรับปรุงการประมวลผลเนื้อหาหน้าจอ และการทำงานในช่วงคุณภาพการมองเห็นที่กว้างขึ้น
- มี AOMedia Video Model (AVM) ให้เป็นซอฟต์แวร์อ้างอิงอย่างเป็นทางการสำหรับผู้พัฒนา
- สามารถส่งข้อเสนอแนะและรายงานปัญหาไปที่ wg-codec-chair@aomedia.org หรือเปิดไว้ใน AVM issue tracker
รีลีสและทรัพยากรสำหรับการพัฒนา
-
AV2 specification and reference code v1.0.0
- รีลีสปัจจุบัน คือ AV2 Bitstream & Decoding Process Specification v1.0.0 ที่เผยแพร่เมื่อ 28 พฤษภาคม 2026 และซอฟต์แวร์อ้างอิง AVM ที่เกี่ยวข้อง
- Read Online: เอกสารสเปก v1.0.0 แบบออนไลน์
- Download PDF: PDF ของสเปก v1.0.0 ฉบับเต็ม
- Additional Tables: ไฟล์ C header ของตาราง lookup ที่ดึงมาจากส่วนที่ 9
- Syntax Browser: เบราว์เซอร์สำหรับสำรวจโครงสร้างไวยากรณ์และ semantics ไปพร้อมกัน
- Software: ซอฟต์แวร์อ้างอิง AVM ที่แท็ก v1.0.0
-
AV2 working draft v13
- ร่างทำงาน v13 เผยแพร่เมื่อ 5 มกราคม 2026 และถูกแทนที่ด้วย v1.0.0 แล้ว
- ป้ายกำกับ “v13” หมายถึงไมล์สโตนของร่างทำงาน และไม่ได้หมายความว่าเป็นเวอร์ชันใหม่กว่า v1.0.0
- ยังคงเก็บไว้เพื่อใช้เป็นข้อมูลอ้างอิง
- Read Online: เอกสารออนไลน์ของ v13
- Additional Tables: ตารางเพิ่มเติมของ v13
- Syntax Browser: เบราว์เซอร์ไวยากรณ์ของ v13
- Software: ซอฟต์แวร์อ้างอิง research-v13.0.0
- Release Notes: บันทึกประจำรุ่นของ v13
-
ทรัพยากรสำหรับใช้งานสเปก
- สเปกฉบับเต็ม ครอบคลุมตั้งแต่ขอบเขตและคำจำกัดความไปจนถึงภาคผนวก รวมทั้งรูปแบบ ไวยากรณ์ semantics และกระบวนการถอดรหัส
- เวอร์ชัน PDF ให้สเปก v1.0.0 ฉบับสมบูรณ์สำหรับใช้อ้างอิงแบบออฟไลน์
- Additional Tables คือทรัพยากรที่ดึงตาราง lookup จากส่วนที่ 9 ออกมาเป็นไฟล์ C header ซึ่งมีประโยชน์ต่อการอ้างอิงในการพัฒนา
- Syntax Browser นำเสนอ Syntax Structures ในส่วนที่ 5 และ Semantics ในส่วนที่ 6 ผ่านอินเทอร์เฟซแบบแบ่งหน้าต่าง
- ใน Syntax Browser สามารถดูคำจำกัดความไวยากรณ์และ semantics แบบเคียงกัน, คลิกองค์ประกอบทางไวยากรณ์ได้, ค้นหาได้ทั้งสองส่วน และคัดลอกโครงสร้างไวยากรณ์ได้
- Reference Software คือ AVM ที่สอดคล้องกับสเปก v1.0.0 โดยแท็ก v1.0.0 คือเวอร์ชันดังกล่าว
1 ความคิดเห็น
ความเห็นจาก Hacker News
AV2 เป็นเพียง อีกขั้นหนึ่งของการเดินทางอันยาวนาน เท่านั้น และในสภาพตอนนี้ก็มองว่าแทบใช้งานจริงได้ยาก
แม้บนฮาร์ดแวร์ที่ดีก็ยังเข้ารหัสได้ปกติแค่ราว 1fps ดังนั้นก็น่าจะยังเป็นแบบนี้ต่อไปจนกว่าจะมีชิปเร่งความเร็ว AV2 ตัวแรกออกมาราวปี 2028 และกว่าที่สตรีม AV2 จะพบเห็นได้ทั่วไปก็คงต้องราวปี 2030
ถ้ามองเฉพาะเรื่องประสิทธิภาพที่ดีขึ้นเมื่อเทียบกับ AV1 ที่ 20~30% ก็ถือว่าไม่น้อย แต่ก็ยังไม่ชัดว่า AV2 คุ้มค่าขนาดนั้นหรือไม่ อย่างไรก็ตาม การรองรับหลายสตรีมเป็นข้อดีมากสำหรับ VR และกีฬาสด และการส่ง alpha channel เป็นสตรีมแยกแล้วนำไปคอมโพสิตในไฟล์เพื่อรองรับวิดีโอโปร่งใสอย่างถูกต้องก็น่าสนใจ
ตอนนี้สเปกถูกกำหนดแน่นอนแล้ว จึงมีโอกาสที่ตัวเข้ารหัสสำหรับใช้งานจริงจะเร็วขึ้นมาก เพียงแต่การเข้ารหัสแบบเรียลไทม์ก็น่าจะยังยากจนกว่าจะลงไปอยู่ในฮาร์ดแวร์
ถ้าผู้ผลิตชิปไม่ย้ายดีไซน์ AV2 ไปใช้กระบวนการผลิตที่เก่ากว่าและถูกกว่า ก็คงยากสำหรับผู้ใช้ทั่วไป และแม้ผู้ผลิตชิปทีวีจีนอาจใส่ตัวถอดรหัส AV2 แบบทำไว้แค่ติ๊กเช็กบ็อกซ์ได้ แต่ตัวเข้ารหัสจริงคงยังหวังได้ยากไปอีกพักใหญ่
ในยุคที่มีการทุ่มเงินระดับล้านล้านเข้าสู่ดาต้าเซ็นเตอร์ ต้นทุนทราฟฟิกกลายเป็นเรื่องรอง และคนที่ได้ประโยชน์อาจมีแค่ YouTube หรือ Netflix เท่านั้น ในระดับนั้น การลงทุนในแคชระดับ ISP อาจถูกกว่าด้วยซ้ำ
อยากรู้ว่า AV2 จะปรับปรุง ฟอร์แมตภาพ AVIF อย่างไร AVIF เหนือกว่าฟอร์แมตคู่แข่งมากสำหรับภาพนิ่งบิตเรตต่ำ โดยเฉพาะเมื่อใช้ chroma subsampling
แต่สำหรับภาพแบบไม่สูญเสียข้อมูลนั้นไม่ใช่แบบนั้น ถ้าเทียบกับ JPEG XL แบบ lossless และ WEBP แบบ lossless แล้ว AVIF แบบ lossless ดูสู้ไม่ได้เลย
มันยอดเยี่ยมมากแม้กับภาพที่บีบอัดแรงมาก และก็น่าทึ่งว่าขนาดไฟล์เล็กลงได้มากแค่ไหน ต่างจาก HEIC หรือ Ultra HDR JPEG ที่ใช้ทางอ้อมอย่าง sidecar gain map แต่รองรับ HDR แบบเนทีฟในตัวฟอร์แมตไฟล์เลย เรื่องนี้อาจไม่ได้สำคัญกับทุกคน แต่ถ้าชอบ HDR ก็รู้สึกว่า AVIF เป็นฟอร์แมตเดียวที่เอาจริงกับเรื่องนี้
ตอนนี้หลายบริษัทกำลังทำ claim chart สำหรับ AV1 อย่างจริงจัง และก็ดูแทบแน่นอนว่าจะมีคดีตามมา กระบวนการเดียวกันนี้เริ่มขึ้นกับ AV2 แล้วเช่นกัน เพียงแต่ส่วนใหญ่กำลังรอให้คดีฝั่ง AV1 สุกงอมก่อน
ผู้คนยังเรียกโคเดกตระกูล AV ว่า “royalty-free” กันต่อไป แต่ในความเป็นจริงมันดูเหมือนการพนันทางกฎหมายและการเงินมากขึ้นเรื่อย ๆ
ไม่เคยเข้าใจเลยว่าทำไมบางคนถึงชอบแนวคิดที่บริษัทเป็นเจ้าของคณิตศาสตร์ ราวกับเชียร์ทีมกีฬาท้องถิ่น
ช่วงหนึ่งเคยคิดว่าอาจเป็นเพราะมีคนทุ่มแรงกับตัวเข้ารหัส H.264 ไปมาก เลยทำให้ชาวนาเช่าดิจิทัลโกรธและอิจฉาคนที่ปกป้องเสรีภาพอันสกปรก แต่บางคนดูเหมือนจะแค่ชอบแนวคิดที่บริษัทสามารถเก็บภาษีกับการเผยแพร่วิดีโอได้
โชคดีที่บริษัทโลภเหล่านั้นทำร้ายตัวเองซ้ำ ๆ และอิทธิพลก็กำลังลดลง
รอบ ๆ มาตรฐานการบีบอัดย่อมมีแร้งคอยวนเวียนอยู่เสมอ จึงไม่จำเป็นต้องจริงจังเกินไป ต่อให้มีการฟ้องร้องจริง ก็ยังมีกองทุนป้องกันทางกฎหมายไว้รับมือการเรียกร้องที่ไม่มีมูล
H.265 มี license pool ของ HEVC ที่ต้องเข้าร่วมสองแห่ง และยังมีบริษัทนอก pool อย่างน้อยอีกสองแห่งด้วย
https://en.wikipedia.org/wiki/High_Efficiency_Video_Coding#P...
ดูแล้วการเลือกโคเดกที่ไม่ใช่ AVx ก็ไม่ได้ทำให้ซับซ้อนน้อยลงหรือเสี่ยงถูกฟ้องน้อยลง
ถ้ามีใครเอามาตรฐานนี้ไปทำจริง กว่าจะโดนฟ้องเพราะ Adobe หรือ Dolby อยากฟาดสักทีจะใช้เวลานานแค่ไหน? ความรู้ของผมอาจเก่าแล้ว แต่ถ้ามัน “เปิด” แบบเดียวกับ AV1 ก็ยังค่อนข้างสงสัยว่าแต่ละบริษัทจะยอมจริงหรือไม่ ความโลภก็มีอยู่
ที่น่าสนใจคือมันไม่ได้มาจาก patent pool ที่เป็นข่าวอยู่เรื่อย ๆ ในช่วงหลายปีที่ผ่านมา นั่นหมายความว่าอาจต้องใช้เวลาค่อนข้างนานกว่าจะมีความพยายามแบบนี้เกิดขึ้น
พูดแบบกึ่งล้อเล่น แต่เดิมผมรอ Apple TV ที่รองรับ AV1 อยู่ ตอนนี้กลายเป็นว่าต้องรอ การรองรับ AV2 บน Apple TV ด้วยแล้ว
เพราะงั้นจึงค่อนข้างปลอดภัยที่จะมองว่าอุปกรณ์ Apple TV ปัจจุบันก็น่าจะเล่นวิดีโอ AV1 แบบซอฟต์แวร์ได้เช่นกัน และก็มี VLC เวอร์ชันสำหรับ Apple TV ด้วย
https://www.videolan.org/vlc/download-appletv.html
https://apps.apple.com/us/app/vlc-media-player/id650377962?p...
ผมไม่ใช่ผู้เชี่ยวชาญด้านการเข้ารหัสวิดีโอ แต่ก็สงสัยว่าในอนาคตเราอาจพึ่งพา เครือข่าย AI ที่สร้างภาพวิดีโอขึ้นมาใหม่มากกว่าวิธีบีบอัดแบบฟังก์ชันคงที่ ซึ่งอาจทำให้ไฟล์เบากว่าวิดีโอที่บีบอัดแบบเดิมได้มากหรือเปล่า
neural codec อย่าง github.com/Orange-OpenSource/Cool-Chic ก็เป็นตัวอย่างของแนวทางนั้น
แต่ก็ยังไม่แน่ใจว่าโคเดกที่อิง AI จะใช้แบตเตอรี่ได้แข่งขันกับฮาร์ดแวร์แบบฟังก์ชันคงที่ได้หรือไม่
AV1 เป็นก้าวกระโดดครั้งใหญ่ไปสู่ฟอร์แมตวิดีโอแบบเปิดที่มีประสิทธิภาพอยู่แล้ว และ AV2 ก็เป็นสิ่งที่รอกันมานาน
คงต้องใช้เวลาอีกพักกว่าจะถูกนำไปใช้งานในชิปและฮาร์ดแวร์จนสามารถใช้การเข้ารหัส/ถอดรหัสด้วยฮาร์ดแวร์ที่มีประสิทธิภาพและรวดเร็วได้ แต่เมื่อคิดถึงราคาพื้นที่จัดเก็บที่สูงขึ้นและวิกฤตชิปแล้ว การเพิ่มประสิทธิภาพราว 25% ก็ดูน่ามีอนาคตมาก
Dav2d ฟังดูไม่ค่อยติดหูเท่าไร หวังว่าก่อนหน้านั้นจะมีใครสักคนที่ถนัดการเล่นคำตั้งชื่อรีโพซิทอรีมาช่วย contribute
avi2ude? av2go?
ในภาษาฝรั่งเศสจะเป็น d2vid หรือก็คือ Deuvid
หวังว่าจะมีเอนโค้ดเดอร์ที่เร็วพอสมควรออกมา ตัวเอนโค้ดเดอร์อ้างอิงของ AV1 เองก็ไม่ได้ดีนัก และที่นี่ก็คงไม่ต่างกัน
แต่พอมีอะไรอย่าง SVT-AV2 ออกมาเมื่อไร ก็น่าจะพอใจมาก