- โมเดลพื้นฐานสำหรับการพยากรณ์อนุกรมเวลาที่พัฒนาโดย Google Research
- พรีเทรนด้วยจุดข้อมูลอนุกรมเวลาจริง 1 แสนล้านจุด
- แสดงประสิทธิภาพแบบ zero-shot ที่โดดเด่นบนเบนช์มาร์กสาธารณะหลากหลายชุด
- สามารถนำไปใช้กับชุดข้อมูลจากหลายโดเมนและหลายช่วงเวลาได้
- การพยากรณ์อนุกรมเวลาถูกนำไปใช้อย่างแพร่หลายในหลายสาขา เช่น ค้าปลีก การเงิน การผลิต การแพทย์ และวิทยาศาสตร์ธรรมชาติ
- ตัวอย่างเช่น ในภาคค้าปลีก การเพิ่มความแม่นยำของการพยากรณ์อุปสงค์ช่วยลดต้นทุนสินค้าคงคลังและเพิ่มรายได้
- การเติบโตของโมเดลดีปเลิร์นนิง
- โมเดลดีปเลิร์นนิงที่พิสูจน์แล้วว่ามีประสิทธิภาพสูงในหลายรูปแบบการตั้งค่า ถูกนำมาใช้อย่างแพร่หลายในการพยากรณ์อนุกรมเวลา
- ในการแข่งขัน M5 โมเดลดีปเลิร์นนิงก็ทำผลงานได้ดี
- ความก้าวหน้าของโมเดลภาษาขนาดใหญ่
- โมเดลภาษาขนาดใหญ่ที่ใช้ในงานประมวลผลภาษาธรรมชาติ เช่น การแปล การสร้างคำตอบจากการค้นหา และการเติมโค้ดอัตโนมัติ กำลังพัฒนาอย่างรวดเร็ว
- เรียนรู้จากข้อมูลข้อความจำนวนมหาศาล จึงมีความสามารถในการระบุรูปแบบทางภาษา
- เมื่อนำมารวมกับการค้นหา ก็สามารถใช้เป็นเครื่องมือ zero-shot ที่ทรงพลังสำหรับการตอบคำถามและสรุปเหตุการณ์ปัจจุบันได้
- ข้อจำกัดของโมเดลพยากรณ์ที่อิงดีปเลิร์นนิง
- แม้จะให้ประสิทธิภาพดีกว่าวิธีดั้งเดิม แต่ยังมีความยากในการลดต้นทุนการฝึกและการอนุมาน
- ต้องใช้รอบการฝึกและการตรวจสอบที่ยาวนานก่อนจะทดสอบโมเดลกับข้อมูลอนุกรมเวลาใหม่
- TimesFM เป็นโมเดลพื้นฐานแบบ decoder-only สำหรับการพยากรณ์อนุกรมเวลา
- เป็นโมเดลพยากรณ์เดี่ยวที่พรีเทรนด้วยข้อมูลอนุกรมเวลาจริง 1 แสนล้านจุด
- มีพารามิเตอร์ 2 ล้านตัว ซึ่งเล็กกว่่าโมเดลภาษาขนาดใหญ่สมัยใหม่มาก
- แสดงประสิทธิภาพแบบ zero-shot ที่ใกล้เคียงกับแนวทาง supervised learning ระดับล้ำสมัยสำหรับชุดข้อมูลจากหลายโดเมนและหลายช่วงเวลา
- ให้การพยากรณ์ที่เหมาะสมได้ทันทีสำหรับข้อมูลอนุกรมเวลาที่ไม่เคยเห็นมาก่อน โดยไม่ต้องฝึกเพิ่ม
- ช่วยให้ผู้ใช้โฟกัสกับการปรับปรุงการพยากรณ์สำหรับงาน downstream จริง เช่น การวางแผนอุปสงค์ในค้าปลีก
- งานวิจัย: "A decoder-only foundation model for time-series forecasting" มีกำหนดนำเสนอที่ ICML 2024
ความเห็นของ GN⁺
- เป็นโมเดลพยากรณ์อนุกรมเวลาใหม่ที่ดูมีอนาคต แต่ยังน่าจะต้องมีการตรวจสอบกับกรณีใช้งานจริงที่หลากหลายเพิ่มเติม โดยเฉพาะการที่ยังไม่รองรับการพยากรณ์เชิงความน่าจะเป็น ทำให้น่าเสียดายในแง่การใช้งานจริง
- ประเด็นที่น่าสนใจคือค่า frequency ที่ป้อนเป็นอินพุตสามารถปรับได้โดยอิสระและไม่จำเป็นต้องสะท้อนความถี่จริงของข้อมูลอนุกรมเวลา แต่ค่าที่เหมาะสมที่สุดคงต้องทดลองให้สอดคล้องกับข้อมูลและกรณีใช้งานแต่ละแบบ
- เช็กพอยต์ตัวแรกที่เปิดเผยออกมายังเน้นที่ข้อมูลตัวแปรเดียว จึงคาดหวังได้ว่าจะมีเวอร์ชันที่รองรับการพยากรณ์หลายตัวแปรตามมา และน่าจะต้องมีการเปรียบเทียบประสิทธิภาพบนชุดข้อมูลเบนช์มาร์กสำหรับการพยากรณ์อนุกรมเวลาหลายตัวแปรด้วย
- หากจะนำโมเดลนี้มาใช้ จำเป็นต้องมีผู้เชี่ยวชาญที่สามารถเลือกและจูนโมเดลให้เหมาะกับคุณสมบัติของอนุกรมเวลาที่ต้องการพยากรณ์ (ความยาว การกระจายตัว ฤดูกาล ความถี่ ฯลฯ) และช่วงเวลาการพยากรณ์ที่ต้องการ แม้การมี end-to-end inference API จะทำให้ใช้งานได้ง่ายขึ้น แต่ก็ควรพิจารณาข้อจำกัดของโมเดลแบบกล่องดำด้วย
- ไลบรารีพยากรณ์อนุกรมเวลาอื่นที่คล้ายกัน ได้แก่ Kats ของ Meta, GluonTS, Darts และ sktime โดยควรเปรียบเทียบคุณลักษณะ ข้อดีข้อเสียของแต่ละไลบรารี แล้วเลือกโมเดลที่เหมาะกับข้อมูลจริงมากที่สุด
ยังไม่มีความคิดเห็น