- ฟีเจอร์ AI DJ ของ Spotify แสดงให้เห็น ข้อจำกัดของ AI และปัญหาของเมทาดาทาด้านดนตรี ผ่านกรณีที่มันไม่สามารถระบุเพลงคลาสสิกได้อย่างถูกต้อง
- เมื่อผู้ใช้ขอ “ซิมโฟนีหมายเลข 7 ของ Beethoven” AI กลับ ไม่เข้าใจโครงสร้างของบทประพันธ์หรือ ลำดับท่อน (movement) และเล่นท่อนที่ไม่เกี่ยวข้องหรือแม้แต่เพลงของคีตกวีคนอื่น
- แม้จะสั่งอย่างเจาะจงว่า “ให้เล่นทุกท่อนตามลำดับ” AI ก็ยังเลือก ซิมโฟนีผิดหรือการบันทึกที่ลำดับสลับกัน ทำให้ผลลัพธ์ไม่สม่ำเสมอ
- สาเหตุรากของข้อผิดพลาดนี้คือ เมทาดาทาดนตรีดิจิทัลถูกออกแบบโดยมีเพลงป๊อปเป็นศูนย์กลาง จึงไม่สะท้อนแนวคิดเรื่องคีตกวี บทประพันธ์ และท่อน
- บทความชี้ให้เห็นช่องว่างระหว่างความคาดหวังกับความจริงเกี่ยวกับ “ความฉลาด” ของ AI และจบลงด้วย ข้อสรุปเชิงประชดว่าการอนุรักษ์ธรรมเนียมดนตรีตะวันตกไม่เกี่ยวข้องกับผลประโยชน์ของบริษัท
ประสบการณ์ใช้งาน AI DJ และการตระหนักถึงปัญหา
- บทความเปิดด้วยคำถามว่า “AI ฉลาดจริงหรือ?” พร้อมตั้งประเด็นว่า ใครควรรับผิดชอบต่อความผิดพลาดของ AI นั่นคือโปรแกรมเมอร์หรือไม่
- ผู้เขียนลองใช้ ฟีเจอร์ AI DJ ในแอป Spotify เพื่อค้นหาเพลงคลาสสิก และยืนยันอีกครั้งถึง ข้อจำกัดของโครงสร้างการค้นหาแบบเดิมของ Spotify
- ผู้เขียนในฐานะผู้ฟังที่ชื่นชอบ ธรรมเนียมดนตรีตะวันตกตลอด 500 ปี มากกว่าเพลงป๊อป ได้ยกตัวอย่างคีตกวีตั้งแต่ Tallis ถึง Shaw
ข้อจำกัดเชิงโครงสร้างของเมทาดาทาดนตรีดิจิทัล
- เมทาดาทาของไฟล์เพลงดิจิทัลประกอบด้วยแท็กเพียงสามอย่างคือ Artist, Album, Song ซึ่งเป็น การออกแบบที่ยึดเพลงป๊อปเป็นศูนย์กลาง
- บทความชี้ว่า คำว่า “Song” เป็น ถ้อยคำที่ไม่เหมาะนักเมื่อใช้กับดนตรีบรรเลง และอธิบายว่าสำหรับดนตรีคลาสสิก คำว่า “composition” หรือ “work” เหมาะสมกว่า
- แนวคิดสำคัญของดนตรีคลาสสิกอย่าง ‘ท่อน (movement)’ ไม่ได้ถูกรวมไว้ในเมทาดาทา ทำให้ Spotify ไม่สามารถรับรู้โครงสร้างทั้งหมดของบทประพันธ์ได้
การทดลองเล่นซิมโฟนีหมายเลข 7 ของ Beethoven
- เมื่อสั่งว่า “Play Beethoven’s 7th Symphony” AI กลับเล่นเพียง ท่อนที่ 2 Allegretto แล้วต่อด้วยเพลงที่ไม่เกี่ยวข้องเลย
- แม้จะขอว่า “Play Beethoven’s 7th Symphony in its entirety” AI ก็ยังเข้าใจผิดว่าเป็น “งานทั้งชิ้นยาว 9 นาที” และ เล่นแค่ท่อนที่ 2
- เมื่อสั่งว่า “Play Beethoven’s 7th Symphony from beginning to end” ผลก็ยังเหมือนเดิมคือ เล่นเฉพาะท่อนที่ 2 ก่อนจะเปลี่ยนไปเป็นเพลงของ John Field
- เมื่อขอว่า “Play all four movements” มันเริ่มจาก ท่อนที่ 1 แต่กลับผสมการบันทึกจากคนละวงออร์เคสตราและสลับลำดับกัน
- ในคำสั่ง “Play all four movements in numerical order” กลับได้ผลลัพธ์ผิดอย่างสิ้นเชิง เช่น เริ่มต้นด้วย ท่อนที่ 1 ของซิมโฟนีหมายเลข 3
AI ขาดความเข้าใจด้านดนตรี
- บทความชี้ว่า AI ไม่เข้าใจทั้งโครงสร้างแบบแบ่งท่อนและแนวคิดเรื่องลำดับของบทประพันธ์เลยแม้แต่น้อย
- แม้แต่ข้อเท็จจริงที่ว่าซิมโฟนีของ Beethoven ประกอบด้วย 4 ท่อน ซึ่ง เพียงอ่านประโยคแรกใน Wikipedia ก็รู้ได้ AI ก็ยังไม่สามารถสะท้อนสิ่งนี้ออกมาได้
- ผู้เขียนเปรียบเทียบความผิดพลาดนี้กับ การอ่านบทสุดท้ายของหนังสือเสียงก่อน เพื่อเสียดสีความไม่รู้ของ AI
บทสรุป: AI กับการตัดขาดจากธรรมเนียมดนตรี
- บทความตั้งข้อสงสัยต่อคำกล่าวอ้างว่า AI “สามารถแต่งเพลงได้” โดยวิจารณ์ว่า AI ที่ยังไม่เข้าใจแม้แต่แนวคิดพื้นฐานก็ไม่ควรถูกพูดถึงในฐานะผู้สร้างสรรค์
- แม้จะยอมรับว่า Spotify DJ ยังอยู่ใน ช่วงเบตา ผู้เขียนก็จบบทความด้วยมุมมองเชิงสิ้นหวังตามความเป็นจริงว่า บริษัทไม่มีแรงจูงใจที่จะอนุรักษ์ธรรมเนียมดนตรีตะวันตก
- โดยรวมแล้ว ปัญหานี้ถูกนำเสนอว่าเป็นการผสมกันของ ข้อจำกัดของเทคโนโลยี AI อคติในการออกแบบเมทาดาทา และความไม่ใส่ใจทางวัฒนธรรม
1 ความคิดเห็น
ความคิดเห็นจาก Hacker News
นี่ ไม่ใช่ปัญหา AI แต่เป็นปัญหาการออกแบบผลิตภัณฑ์ ต่างหาก Spotify DJ โดยพื้นฐานแล้วก็แค่ระดับ “สุ่มเพลง + พากย์เสียงคั่น” และมีความเป็นไปได้สูงว่ามีโค้ดที่ตั้งใจไม่ให้เล่นทั้งอัลบั้มอยู่แล้ว
การเหมารวม AI เป็นแนวคิดเดียวเป็นวิธีมองที่ผิด ตรรกะแบบ “ถ้าฟีเจอร์นี้ทำไม่ได้ แปลว่า AI ไร้ประโยชน์” เข้าข่าย category error
ทั้งบทความเอาความเห็นหลายอย่างมาปนกันจนสับสน และครึ่งหนึ่งก็แทบเป็นแค่การไล่ชื่อเพลงคลาสสิก เห็นด้วยว่า Spotify DJ ไม่ดี แต่ก็ไม่ใช่วิธีวิจารณ์ที่น่าเชื่อถือ
ไม่มีความพยายามจะสำรวจทั้งข้อดีข้อเสียของเทคโนโลยี และเป็นแพตเทิร์นแบบคลาสสิกของการ ใช้กรณีแคบๆ มาด้อยค่า AI ทั้งหมด AI ไม่ใช่มนุษย์ ดังนั้นการมีข้อจำกัดก็เป็นเรื่องธรรมดา
ผมเห็นปรากฏการณ์คล้ายกันใน AI coding assistant คนจำนวนมากปฏิเสธมันทั้งหมดเพราะประเด็นด้านความปลอดภัย แต่กลับมองข้ามความเป็นไปได้ของ “สร้างแอป Mac แบบ native ได้ด้วยประโยคเดียว”
เสน่ห์ของ DJ mix ใน YouTube อย่าง Hör Berlin อยู่ที่การเลือกและการตีความของ DJ รวมถึงภูมิหลังทางวัฒนธรรมของพวกเขา การให้ AI คัดลิสต์ที่ถูก optimize ออกมาทำให้แก่นแท้นั้นหายไป
Spotify ใช้ใบอนุญาตแบบวิทยุกับแบบ interactive ปะปนกันเพื่อลดต้นทุน เพลย์ลิสต์ที่ AI สร้างขึ้นอาจถูกจัดเป็นแบบวิทยุ เพราะไม่ใช่การเลือกโดยผู้ใช้
ผมชอบฟังสถานีอย่าง dublab, NTS1, NTS2 เพราะได้เจอเพลงที่คาดไม่ถึง
ต่อให้ทุ่มเงินเป็นร้อยล้านดอลลาร์ก็ยังสร้างระบบแนะนำที่สมบูรณ์แบบไม่ได้ และก็แทนที่ social proof ของมนุษย์ DJ ไม่ได้
มุมมองเรื่องดนตรีก็ชวนเสียดาย เพราะเหมือนคิดว่ามีแค่ป๊อปกับดนตรีคลาสสิกตะวันตกเท่านั้น
ผมมองว่านี่คือ ความล้มเหลวในการออกแบบพรอมป์ต์ ลองทดสอบคำขอเดียวกันกับ ตัวอย่าง ChatGPT แล้ว AI ตอบสนองได้ถูกต้อง
นั่นแปลว่าโมเดลของ Spotify อาจอ่อนกว่า หรือพรอมป์ต์ภายในอาจชี้นำไปผิดทาง
ข้ออ้างว่า “AI แต่งเพลงไม่ได้” ก็เป็นการเทียบที่ผิดเหมือนกัน เพราะ AI ได้แสดงให้เห็นแล้วว่า เข้าใจทฤษฎีดนตรีและมีศักยภาพในการประพันธ์ สุดท้ายแล้วเป็นเรื่องของคุณภาพกับรสนิยม
ทุกครั้งที่ผู้คนเรียก LLM ว่า “AI” การรับรู้ก็ถูกบิดเบือนไป
นี่คือ ความสำเร็จสูงสุดของวงการการตลาด และเป็นหนึ่งในความเสียหายใหญ่ที่สุดที่มันทำต่อโลก