• โมเดลพื้นฐานสำหรับการพยากรณ์อนุกรมเวลาที่พัฒนาโดย Google Research
    • พรีเทรนด้วยจุดข้อมูลอนุกรมเวลาจริง 1 แสนล้านจุด
    • แสดงประสิทธิภาพแบบ zero-shot ที่โดดเด่นบนเบนช์มาร์กสาธารณะหลากหลายชุด
    • สามารถนำไปใช้กับชุดข้อมูลจากหลายโดเมนและหลายช่วงเวลาได้
  • การพยากรณ์อนุกรมเวลาถูกนำไปใช้อย่างแพร่หลายในหลายสาขา เช่น ค้าปลีก การเงิน การผลิต การแพทย์ และวิทยาศาสตร์ธรรมชาติ
    • ตัวอย่างเช่น ในภาคค้าปลีก การเพิ่มความแม่นยำของการพยากรณ์อุปสงค์ช่วยลดต้นทุนสินค้าคงคลังและเพิ่มรายได้
  • การเติบโตของโมเดลดีปเลิร์นนิง
    • โมเดลดีปเลิร์นนิงที่พิสูจน์แล้วว่ามีประสิทธิภาพสูงในหลายรูปแบบการตั้งค่า ถูกนำมาใช้อย่างแพร่หลายในการพยากรณ์อนุกรมเวลา
    • ในการแข่งขัน M5 โมเดลดีปเลิร์นนิงก็ทำผลงานได้ดี
  • ความก้าวหน้าของโมเดลภาษาขนาดใหญ่
    • โมเดลภาษาขนาดใหญ่ที่ใช้ในงานประมวลผลภาษาธรรมชาติ เช่น การแปล การสร้างคำตอบจากการค้นหา และการเติมโค้ดอัตโนมัติ กำลังพัฒนาอย่างรวดเร็ว
    • เรียนรู้จากข้อมูลข้อความจำนวนมหาศาล จึงมีความสามารถในการระบุรูปแบบทางภาษา
    • เมื่อนำมารวมกับการค้นหา ก็สามารถใช้เป็นเครื่องมือ zero-shot ที่ทรงพลังสำหรับการตอบคำถามและสรุปเหตุการณ์ปัจจุบันได้
  • ข้อจำกัดของโมเดลพยากรณ์ที่อิงดีปเลิร์นนิง
    • แม้จะให้ประสิทธิภาพดีกว่าวิธีดั้งเดิม แต่ยังมีความยากในการลดต้นทุนการฝึกและการอนุมาน
    • ต้องใช้รอบการฝึกและการตรวจสอบที่ยาวนานก่อนจะทดสอบโมเดลกับข้อมูลอนุกรมเวลาใหม่
  • TimesFM เป็นโมเดลพื้นฐานแบบ decoder-only สำหรับการพยากรณ์อนุกรมเวลา
    • เป็นโมเดลพยากรณ์เดี่ยวที่พรีเทรนด้วยข้อมูลอนุกรมเวลาจริง 1 แสนล้านจุด
    • มีพารามิเตอร์ 2 ล้านตัว ซึ่งเล็กกว่่าโมเดลภาษาขนาดใหญ่สมัยใหม่มาก
    • แสดงประสิทธิภาพแบบ zero-shot ที่ใกล้เคียงกับแนวทาง supervised learning ระดับล้ำสมัยสำหรับชุดข้อมูลจากหลายโดเมนและหลายช่วงเวลา
    • ให้การพยากรณ์ที่เหมาะสมได้ทันทีสำหรับข้อมูลอนุกรมเวลาที่ไม่เคยเห็นมาก่อน โดยไม่ต้องฝึกเพิ่ม
    • ช่วยให้ผู้ใช้โฟกัสกับการปรับปรุงการพยากรณ์สำหรับงาน downstream จริง เช่น การวางแผนอุปสงค์ในค้าปลีก
  • งานวิจัย: "A decoder-only foundation model for time-series forecasting" มีกำหนดนำเสนอที่ ICML 2024

ความเห็นของ GN⁺

  • เป็นโมเดลพยากรณ์อนุกรมเวลาใหม่ที่ดูมีอนาคต แต่ยังน่าจะต้องมีการตรวจสอบกับกรณีใช้งานจริงที่หลากหลายเพิ่มเติม โดยเฉพาะการที่ยังไม่รองรับการพยากรณ์เชิงความน่าจะเป็น ทำให้น่าเสียดายในแง่การใช้งานจริง
  • ประเด็นที่น่าสนใจคือค่า frequency ที่ป้อนเป็นอินพุตสามารถปรับได้โดยอิสระและไม่จำเป็นต้องสะท้อนความถี่จริงของข้อมูลอนุกรมเวลา แต่ค่าที่เหมาะสมที่สุดคงต้องทดลองให้สอดคล้องกับข้อมูลและกรณีใช้งานแต่ละแบบ
  • เช็กพอยต์ตัวแรกที่เปิดเผยออกมายังเน้นที่ข้อมูลตัวแปรเดียว จึงคาดหวังได้ว่าจะมีเวอร์ชันที่รองรับการพยากรณ์หลายตัวแปรตามมา และน่าจะต้องมีการเปรียบเทียบประสิทธิภาพบนชุดข้อมูลเบนช์มาร์กสำหรับการพยากรณ์อนุกรมเวลาหลายตัวแปรด้วย
  • หากจะนำโมเดลนี้มาใช้ จำเป็นต้องมีผู้เชี่ยวชาญที่สามารถเลือกและจูนโมเดลให้เหมาะกับคุณสมบัติของอนุกรมเวลาที่ต้องการพยากรณ์ (ความยาว การกระจายตัว ฤดูกาล ความถี่ ฯลฯ) และช่วงเวลาการพยากรณ์ที่ต้องการ แม้การมี end-to-end inference API จะทำให้ใช้งานได้ง่ายขึ้น แต่ก็ควรพิจารณาข้อจำกัดของโมเดลแบบกล่องดำด้วย
  • ไลบรารีพยากรณ์อนุกรมเวลาอื่นที่คล้ายกัน ได้แก่ Kats ของ Meta, GluonTS, Darts และ sktime โดยควรเปรียบเทียบคุณลักษณะ ข้อดีข้อเสียของแต่ละไลบรารี แล้วเลือกโมเดลที่เหมาะกับข้อมูลจริงมากที่สุด

ยังไม่มีความคิดเห็น

ยังไม่มีความคิดเห็น