- Meta รองรับการสื่อสารแบบเรียลไทม์ (RTC) ให้กับผู้คนนับพันล้านผ่านแอปอย่าง WhatsApp, Instagram และ Messenger
- บริษัทกำลังพยายามมอบประสบการณ์คุณภาพสูงแม้ให้กับผู้ใช้ที่ไม่มีการเชื่อมต่อความเร็วสูงหรือไม่มีสมาร์ตโฟนรุ่นใหม่
- Meta ได้พัฒนาโคเดก Meta Low Bitrate (MLow) เพื่อปรับปรุงคุณภาพเสียงบนการเชื่อมต่อความเร็วต่ำ
แรงจูงใจในการพัฒนาโคเดกใหม่
- การใช้งาน RTC ในผลิตภัณฑ์ของ Meta ในระดับมหาศาลทำให้สามารถสังเกตประสิทธิภาพของโคเดกได้ในสถานการณ์เครือข่ายที่หลากหลาย
- การโทรจำนวนมากเกิดขึ้นในสภาพแวดล้อมที่การเชื่อมต่อเครือข่ายไม่ดี
- โคเดก Opus ไม่สามารถให้คุณภาพเสียงที่เพียงพอได้ที่บิตเรตต่ำ
- โคเดกเสียงแบบ ML รุ่นใหม่ให้คุณภาพที่ดีที่บิตเรตต่ำ แต่มีปัญหาเรื่องต้นทุนการคำนวณสูง
- ผู้ใช้จำนวนมากยังใช้อุปกรณ์ราคาประหยัดอยู่ จึงจำเป็นต้องมีโคเดกเสียงคุณภาพสูงที่ต้องการการคำนวณต่ำ
โคเดก MLow
- โคเดก MLow ให้คุณภาพดีกว่า Opus ถึงสองเท่า และมีความซับซ้อนในการคำนวณต่ำกว่า 10%
- MLow ถูกนำไปใช้งานเต็มรูปแบบแล้วใน Instagram และ Messenger และกำลังถูกนำไปใช้ใน WhatsApp อย่างจริงจัง
- สามารถเข้ารหัสเสียงคุณภาพสูงได้แม้ที่บิตเรตต่ำ จึงช่วยยกระดับคุณภาพเสียงอย่างมากในสถานการณ์ที่มีการสูญหายของแพ็กเก็ต
โครงสร้างภายในของ MLow
- MLow ใช้เทคโนโลยีที่พัฒนาต่อยอดจากแนวคิดของโคเดก CELP (Code Excited Linear Prediction)
- แบ่งสัญญาณอินพุตออกเป็นย่านความถี่ต่ำและย่านความถี่สูง แล้วเข้ารหัสแต่ละส่วนแยกกัน
- เข้ารหัสย่านความถี่สูงด้วยจำนวนบิตที่น้อย เพื่อให้รองรับ SuperWideBand (การสุ่มตัวอย่าง 32kHz) ได้ที่บิตเรตต่ำ
แผนในอนาคต
- MLow ช่วยยกระดับคุณภาพเสียงได้อย่างมากแม้บนอุปกรณ์ราคาประหยัด
- มีแผนจะส่งเสียงสำรองซ้ำซ้อนให้มีประสิทธิภาพมากขึ้น เพื่อปรับปรุงการกู้คืนเสียงบนเครือข่ายที่มีการสูญหายของแพ็กเก็ตสูง
ความเห็นของ GN⁺
- ข้อดีของ MLow: มอบคุณภาพเสียงสูงแม้บนการเชื่อมต่อความเร็วต่ำ ช่วยยกระดับประสบการณ์ผู้ใช้อย่างมาก
- ความท้าทายทางเทคนิค: การรักษาคุณภาพสูงไว้พร้อมความซับซ้อนในการคำนวณต่ำเป็นโจทย์ที่ยากมากในเชิงเทคนิค
- ผลิตภัณฑ์คู่แข่ง: นอกจาก Opus แล้ว ยังมีโคเดกเสียงอีกหลากหลายตัว แต่ MLow ให้ประสิทธิภาพที่โดดเด่นแม้บนอุปกรณ์ราคาประหยัด
- ประเด็นที่ต้องพิจารณาเมื่อนำไปใช้: การนำโคเดกใหม่มาใช้จำเป็นต้องให้ความสำคัญกับความเข้ากันได้กับระบบเดิมและการทดสอบประสิทธิภาพ
- ผลกระทบต่อผู้ใช้: สามารถสร้างประโยชน์อย่างมากให้กับผู้ใช้จำนวนมากที่ใช้อุปกรณ์ราคาประหยัด
1 ความคิดเห็น
ความคิดเห็นจาก Hacker News
โค้ดेकบิตเรตต่ำรุ่นใหม่: สำหรับการสื่อสารแบบเรียลไทม์ จำเป็นต้องมีอัตราแพ็กเก็ตสูงเพื่อลดความหน่วง ซึ่งอาจทำให้โอเวอร์เฮดมีขนาดใหญ่กว่าตัวเพย์โหลดจริงได้ อย่างไรก็ตาม อาจมีประโยชน์กับการสื่อสารแบบ circuit-switched หรือระบบ VoIP ที่ใช้การบีบอัดส่วนหัว
การเผยแพร่งานวิจัยของ Meta: ดูเหมือนว่า Meta จะกลับมาได้รับความนิยมอีกครั้งจากการแบ่งปันงานวิจัยและงานโอเพนซอร์สจำนวนมาก แม้ว่า Facebook จะเคยมีภาพลักษณ์ไม่ดี แต่ก็ดูเหมือนจะกู้คืนกลับมาได้บ้าง
ไม่มีการเปรียบเทียบกับ Codec2: การไม่มีการเปรียบเทียบกับ Codec2 ทำให้เกิดข้อสงสัยต่อคุณค่าและแรงจูงใจที่แท้จริงของงานนี้ เราไม่ได้ต้องการโค้ดेकเสียงใหม่ที่ผูกติดกับ IP แบบกรรมสิทธิ์อีกตัว
การเปรียบเทียบกับ Google Meet: Google Meet สามารถโทรเสียงได้ดีแม้อินเทอร์เน็ตช้า จึงน่าสงสัยว่าโค้ดेकนี้ดีกว่า Google Meet หรือไม่ แต่เทคโนโลยีของ Google Meet ไม่ได้เปิดเผยต่อสาธารณะ
คุณภาพการโทรศัพท์: สงสัยว่าทำไมทุกวันนี้การโทรศัพท์ถึงฟังไม่ชัดเท่ากับ 8kHz 8-bit
μ-lawADPCM ในยุค 90ไม่มีการเปรียบเทียบกับ Pied Piper: ไม่มีการเปรียบเทียบกับ Pied Piper
จะออกใช้งานจริงหรือไม่: สงสัยว่าโค้ดेकนี้จะถูกปล่อยออกมาจริงหรือเป็นแค่การโชว์เทคโนโลยี Meta AI Research นั้นล้ำสมัยก็จริง แต่หาแหล่งอ้างอิงอื่นเกี่ยวกับโค้ดेकนี้ไม่เจอ
ไลเซนส์: ไม่มีข้อมูลเกี่ยวกับไลเซนส์
ไม่มีการกล่าวถึง NoLACE: ไม่มีการกล่าวถึง NoLACE ทำให้ตัวอย่างสำหรับเปรียบเทียบมีประโยชน์น้อยลง
การเปรียบเทียบกับ Opus: Opus ให้เสียงที่นุ่มนวลกว่าที่ 6 kbps ขณะที่ตัวอย่างของ MLow ฟังหยาบและมีอาร์ติแฟกต์ที่ฟังดูไม่เป็นธรรมชาติ ที่บิตเรตสูงกว่านี้ ตัวเลือกน่าจะชัดเจนยิ่งขึ้น