LAION เปิดตัว BUD-E โมเดลสำหรับผู้ช่วยเสียง AI ที่เป็นธรรมชาติ

xguru · 2024-02-13T10:41:01+09:00

ผู้ช่วยเสียง AI กำลังเปลี่ยนวิธีโต้ตอบกับเทคโนโลยีอย่างพลิกโฉม แต่การสนทนากับผู้ช่วยเสียงแบบเดิมอาจให้ความรู้สึกเป็นกลไกและไม่เป็นธรรมชาติ ยังมีความยากในการเข้าใจและปรับตัวต่อความละเอียดอ่อนและมิติทางอารมณ์ของบทสนทนาระหว่างมนุษย์ ถ้าผู้ช่วยเสียงแบบโอเพนเต็มรูปแบบถูกสร้างขึ้นมาในลักษณะนี้จะเป็นอย่างไร? ตอบสนองต่อคำขอของผู้ใช้แบบเรียลไทม์ พร้อมน้ำเสียงที่เป็นธรรมชาติ ความเห็นอกเห็นใจ และความฉลาดทางอารมณ์ เข้าใจบริบทยาวต่อเนื่องจากบทสนทนาก่อนหน้า และรองรับการสนทนาหลายคน การขัดจังหวะ การยืนยัน และการหยุดคิดระหว่างพูด ทำงานแบบโลคัลทั้งหมดบนฮาร์ดแวร์สำหรับผู้บริโภค การพัฒนา BUD-E (Buddy for Understanding and Digital Empathy) LAION พัฒนา BUD-E ร่วมกับ ELLIS Institute Tübingen, Collabora และ Tübingen AI Center เริ่มจากการพัฒนาผู้ช่วยเสียงพื้นฐานที่มีค่าหน่วงต่ำ และ ณ เดือนมกราคม 2024 สามารถทำค่าหน่วงได้ที่ 300~500ms คาดว่าจะทำเวลาในการตอบสนองต่ำกว่า 300ms ได้เมื่อใช้โมเดลที่ใหญ่ขึ้น โรดแมปการพัฒนา BUD-E แม้การสนทนากับโมเดลพื้นฐานก็ยังเป็นธรรมชาติกว่าสิ่งที่เคยเห็นมาจนถึงตอนนี้มาก แต่ก็ยังมีปัญหาและฟีเจอร์อีกมากที่ต้องแก้และพัฒนา ลดค่าหน่วงและทำให้ความต้องการของระบบต่ำที่สุด เพิ่มความเป็นธรรมชาติของบทสนทนาและการตอบสนอง ติดตามบทสนทนาที่ต่อเนื่องข้ามหลายวัน หลายเดือน และหลายปี ปรับปรุงฟังก์ชันและความสามารถของผู้ช่วยเสียง เพิ่มความเข้าใจบริบทแบบมัลติโหมดและบริบททางอารมณ์ สร้างโครงสร้างพื้นฐานสำหรับส่วนติดต่อผู้ใช้ การผสานรวมอย่างต่อเนื่อง และการแพ็กเกจที่ทำได้ง่าย ขยายไปสู่หลายภาษาและผู้พูดหลายคน ความร่วมมือเพื่อสร้างอนาคตของปัญญาประดิษฐ์เชิงสนทนา การพัฒนา BUD-E เป็นกระบวนการต่อเนื่องที่ต้องอาศัยความพยายามร่วมกันจากหลายชุมชน เชิญชวนนักพัฒนาโอเพนซอร์ส นักวิจัย และผู้ที่มีความสนใจเข้ามาปรับปรุงโมดูลแต่ละส่วนของ BUD-E และมีส่วนร่วมต่อการเติบโต หวังว่าจะสามารถร่วมกันสร้างผู้ช่วยเสียง AI ที่สนทนาได้อย่างเป็นธรรมชาติ ใช้งานได้อย่างเป็นสัญชาตญาณ และมีความเห็นอกเห็นใจ

(laion.ai)

4 คะแนน โดย xguru 2024-02-13 | ยังไม่มีความคิดเห็น | แชร์ทาง WhatsApp

ผู้ช่วยเสียง AI กำลังเปลี่ยนวิธีโต้ตอบกับเทคโนโลยีอย่างพลิกโฉม แต่การสนทนากับผู้ช่วยเสียงแบบเดิมอาจให้ความรู้สึกเป็นกลไกและไม่เป็นธรรมชาติ
ยังมีความยากในการเข้าใจและปรับตัวต่อความละเอียดอ่อนและมิติทางอารมณ์ของบทสนทนาระหว่างมนุษย์
ถ้าผู้ช่วยเสียงแบบโอเพนเต็มรูปแบบถูกสร้างขึ้นมาในลักษณะนี้จะเป็นอย่างไร?
- ตอบสนองต่อคำขอของผู้ใช้แบบเรียลไทม์ พร้อมน้ำเสียงที่เป็นธรรมชาติ ความเห็นอกเห็นใจ และความฉลาดทางอารมณ์
- เข้าใจบริบทยาวต่อเนื่องจากบทสนทนาก่อนหน้า และรองรับการสนทนาหลายคน การขัดจังหวะ การยืนยัน และการหยุดคิดระหว่างพูด
- ทำงานแบบโลคัลทั้งหมดบนฮาร์ดแวร์สำหรับผู้บริโภค

การพัฒนา BUD-E (Buddy for Understanding and Digital Empathy)

LAION พัฒนา BUD-E ร่วมกับ ELLIS Institute Tübingen, Collabora และ Tübingen AI Center
เริ่มจากการพัฒนาผู้ช่วยเสียงพื้นฐานที่มีค่าหน่วงต่ำ และ ณ เดือนมกราคม 2024 สามารถทำค่าหน่วงได้ที่ 300~500ms
คาดว่าจะทำเวลาในการตอบสนองต่ำกว่า 300ms ได้เมื่อใช้โมเดลที่ใหญ่ขึ้น

โรดแมปการพัฒนา BUD-E

แม้การสนทนากับโมเดลพื้นฐานก็ยังเป็นธรรมชาติกว่าสิ่งที่เคยเห็นมาจนถึงตอนนี้มาก
แต่ก็ยังมีปัญหาและฟีเจอร์อีกมากที่ต้องแก้และพัฒนา
- ลดค่าหน่วงและทำให้ความต้องการของระบบต่ำที่สุด
- เพิ่มความเป็นธรรมชาติของบทสนทนาและการตอบสนอง
- ติดตามบทสนทนาที่ต่อเนื่องข้ามหลายวัน หลายเดือน และหลายปี
- ปรับปรุงฟังก์ชันและความสามารถของผู้ช่วยเสียง
- เพิ่มความเข้าใจบริบทแบบมัลติโหมดและบริบททางอารมณ์
- สร้างโครงสร้างพื้นฐานสำหรับส่วนติดต่อผู้ใช้ การผสานรวมอย่างต่อเนื่อง และการแพ็กเกจที่ทำได้ง่าย
- ขยายไปสู่หลายภาษาและผู้พูดหลายคน

ความร่วมมือเพื่อสร้างอนาคตของปัญญาประดิษฐ์เชิงสนทนา

การพัฒนา BUD-E เป็นกระบวนการต่อเนื่องที่ต้องอาศัยความพยายามร่วมกันจากหลายชุมชน
เชิญชวนนักพัฒนาโอเพนซอร์ส นักวิจัย และผู้ที่มีความสนใจเข้ามาปรับปรุงโมดูลแต่ละส่วนของ BUD-E และมีส่วนร่วมต่อการเติบโต
หวังว่าจะสามารถร่วมกันสร้างผู้ช่วยเสียง AI ที่สนทนาได้อย่างเป็นธรรมชาติ ใช้งานได้อย่างเป็นสัญชาตญาณ และมีความเห็นอกเห็นใจ

LAION เปิดตัว BUD-E โมเดลสำหรับผู้ช่วยเสียง AI ที่เป็นธรรมชาติ

การพัฒนา BUD-E (Buddy for Understanding and Digital Empathy)

โรดแมปการพัฒนา BUD-E

ความร่วมมือเพื่อสร้างอนาคตของปัญญาประดิษฐ์เชิงสนทนา

บทความที่เกี่ยวข้อง

ยังไม่มีความคิดเห็น