2 คะแนน โดย GN⁺ 2024-06-14 | 1 ความคิดเห็น | แชร์ทาง WhatsApp
  • Meta รองรับการสื่อสารแบบเรียลไทม์ (RTC) ให้กับผู้คนนับพันล้านผ่านแอปอย่าง WhatsApp, Instagram และ Messenger
  • บริษัทกำลังพยายามมอบประสบการณ์คุณภาพสูงแม้ให้กับผู้ใช้ที่ไม่มีการเชื่อมต่อความเร็วสูงหรือไม่มีสมาร์ตโฟนรุ่นใหม่
  • Meta ได้พัฒนาโคเดก Meta Low Bitrate (MLow) เพื่อปรับปรุงคุณภาพเสียงบนการเชื่อมต่อความเร็วต่ำ

แรงจูงใจในการพัฒนาโคเดกใหม่

  • การใช้งาน RTC ในผลิตภัณฑ์ของ Meta ในระดับมหาศาลทำให้สามารถสังเกตประสิทธิภาพของโคเดกได้ในสถานการณ์เครือข่ายที่หลากหลาย
  • การโทรจำนวนมากเกิดขึ้นในสภาพแวดล้อมที่การเชื่อมต่อเครือข่ายไม่ดี
  • โคเดก Opus ไม่สามารถให้คุณภาพเสียงที่เพียงพอได้ที่บิตเรตต่ำ
  • โคเดกเสียงแบบ ML รุ่นใหม่ให้คุณภาพที่ดีที่บิตเรตต่ำ แต่มีปัญหาเรื่องต้นทุนการคำนวณสูง
  • ผู้ใช้จำนวนมากยังใช้อุปกรณ์ราคาประหยัดอยู่ จึงจำเป็นต้องมีโคเดกเสียงคุณภาพสูงที่ต้องการการคำนวณต่ำ

โคเดก MLow

  • โคเดก MLow ให้คุณภาพดีกว่า Opus ถึงสองเท่า และมีความซับซ้อนในการคำนวณต่ำกว่า 10%
  • MLow ถูกนำไปใช้งานเต็มรูปแบบแล้วใน Instagram และ Messenger และกำลังถูกนำไปใช้ใน WhatsApp อย่างจริงจัง
  • สามารถเข้ารหัสเสียงคุณภาพสูงได้แม้ที่บิตเรตต่ำ จึงช่วยยกระดับคุณภาพเสียงอย่างมากในสถานการณ์ที่มีการสูญหายของแพ็กเก็ต

โครงสร้างภายในของ MLow

  • MLow ใช้เทคโนโลยีที่พัฒนาต่อยอดจากแนวคิดของโคเดก CELP (Code Excited Linear Prediction)
  • แบ่งสัญญาณอินพุตออกเป็นย่านความถี่ต่ำและย่านความถี่สูง แล้วเข้ารหัสแต่ละส่วนแยกกัน
  • เข้ารหัสย่านความถี่สูงด้วยจำนวนบิตที่น้อย เพื่อให้รองรับ SuperWideBand (การสุ่มตัวอย่าง 32kHz) ได้ที่บิตเรตต่ำ

แผนในอนาคต

  • MLow ช่วยยกระดับคุณภาพเสียงได้อย่างมากแม้บนอุปกรณ์ราคาประหยัด
  • มีแผนจะส่งเสียงสำรองซ้ำซ้อนให้มีประสิทธิภาพมากขึ้น เพื่อปรับปรุงการกู้คืนเสียงบนเครือข่ายที่มีการสูญหายของแพ็กเก็ตสูง

ความเห็นของ GN⁺

  • ข้อดีของ MLow: มอบคุณภาพเสียงสูงแม้บนการเชื่อมต่อความเร็วต่ำ ช่วยยกระดับประสบการณ์ผู้ใช้อย่างมาก
  • ความท้าทายทางเทคนิค: การรักษาคุณภาพสูงไว้พร้อมความซับซ้อนในการคำนวณต่ำเป็นโจทย์ที่ยากมากในเชิงเทคนิค
  • ผลิตภัณฑ์คู่แข่ง: นอกจาก Opus แล้ว ยังมีโคเดกเสียงอีกหลากหลายตัว แต่ MLow ให้ประสิทธิภาพที่โดดเด่นแม้บนอุปกรณ์ราคาประหยัด
  • ประเด็นที่ต้องพิจารณาเมื่อนำไปใช้: การนำโคเดกใหม่มาใช้จำเป็นต้องให้ความสำคัญกับความเข้ากันได้กับระบบเดิมและการทดสอบประสิทธิภาพ
  • ผลกระทบต่อผู้ใช้: สามารถสร้างประโยชน์อย่างมากให้กับผู้ใช้จำนวนมากที่ใช้อุปกรณ์ราคาประหยัด

1 ความคิดเห็น

 
GN⁺ 2024-06-14
ความคิดเห็นจาก Hacker News
  • โค้ดेकบิตเรตต่ำรุ่นใหม่: สำหรับการสื่อสารแบบเรียลไทม์ จำเป็นต้องมีอัตราแพ็กเก็ตสูงเพื่อลดความหน่วง ซึ่งอาจทำให้โอเวอร์เฮดมีขนาดใหญ่กว่าตัวเพย์โหลดจริงได้ อย่างไรก็ตาม อาจมีประโยชน์กับการสื่อสารแบบ circuit-switched หรือระบบ VoIP ที่ใช้การบีบอัดส่วนหัว

  • การเผยแพร่งานวิจัยของ Meta: ดูเหมือนว่า Meta จะกลับมาได้รับความนิยมอีกครั้งจากการแบ่งปันงานวิจัยและงานโอเพนซอร์สจำนวนมาก แม้ว่า Facebook จะเคยมีภาพลักษณ์ไม่ดี แต่ก็ดูเหมือนจะกู้คืนกลับมาได้บ้าง

  • ไม่มีการเปรียบเทียบกับ Codec2: การไม่มีการเปรียบเทียบกับ Codec2 ทำให้เกิดข้อสงสัยต่อคุณค่าและแรงจูงใจที่แท้จริงของงานนี้ เราไม่ได้ต้องการโค้ดेकเสียงใหม่ที่ผูกติดกับ IP แบบกรรมสิทธิ์อีกตัว

  • การเปรียบเทียบกับ Google Meet: Google Meet สามารถโทรเสียงได้ดีแม้อินเทอร์เน็ตช้า จึงน่าสงสัยว่าโค้ดेकนี้ดีกว่า Google Meet หรือไม่ แต่เทคโนโลยีของ Google Meet ไม่ได้เปิดเผยต่อสาธารณะ

  • คุณภาพการโทรศัพท์: สงสัยว่าทำไมทุกวันนี้การโทรศัพท์ถึงฟังไม่ชัดเท่ากับ 8kHz 8-bit μ-law ADPCM ในยุค 90

  • ไม่มีการเปรียบเทียบกับ Pied Piper: ไม่มีการเปรียบเทียบกับ Pied Piper

  • จะออกใช้งานจริงหรือไม่: สงสัยว่าโค้ดेकนี้จะถูกปล่อยออกมาจริงหรือเป็นแค่การโชว์เทคโนโลยี Meta AI Research นั้นล้ำสมัยก็จริง แต่หาแหล่งอ้างอิงอื่นเกี่ยวกับโค้ดेकนี้ไม่เจอ

  • ไลเซนส์: ไม่มีข้อมูลเกี่ยวกับไลเซนส์

  • ไม่มีการกล่าวถึง NoLACE: ไม่มีการกล่าวถึง NoLACE ทำให้ตัวอย่างสำหรับเปรียบเทียบมีประโยชน์น้อยลง

  • การเปรียบเทียบกับ Opus: Opus ให้เสียงที่นุ่มนวลกว่าที่ 6 kbps ขณะที่ตัวอย่างของ MLow ฟังหยาบและมีอาร์ติแฟกต์ที่ฟังดูไม่เป็นธรรมชาติ ที่บิตเรตสูงกว่านี้ ตัวเลือกน่าจะชัดเจนยิ่งขึ้น