- WeatherNext 2 คือโมเดลที่ขับเคลื่อนด้วย AI ซึ่ง ยกระดับความแม่นยำและประสิทธิภาพของการพยากรณ์อากาศทั่วโลกอย่างมาก
- สร้าง สถานการณ์สภาพอากาศ ได้หลายร้อยแบบภายในไม่ถึง 1 นาทีบน TPU เพียงตัวเดียว และให้ ความเร็วในการพยากรณ์มากกว่ารุ่นเดิม 8 เท่า
- ด้วยสถาปัตยกรรม Functional Generative Network(FGN) แบบใหม่ ทำให้ยังคง การพยากรณ์ที่สอดคล้องกับหลักฟิสิกส์ และรองรับ ความละเอียดระดับรายชั่วโมง
- ข้อมูลการพยากรณ์สามารถใช้งานได้บน Earth Engine และ BigQuery และมีความสามารถด้านการอนุมานแบบปรับแต่งได้ผ่านโปรแกรม Early Access ของ Vertex AI
- เทคโนโลยีนี้ช่วย อัปเกรด ความสามารถด้านสภาพอากาศในบริการต่าง ๆ ของ Google เช่น Search, Gemini, Pixel Weather, Google Maps Platform
ภาพรวมของ WeatherNext 2
- WeatherNext 2 ที่พัฒนาร่วมกันโดย Google DeepMind และ Google Research เป็น โมเดลพยากรณ์อากาศด้วย AI ที่ให้ ความเร็วมากกว่ารุ่นเดิม 8 เท่า และมี ความละเอียดระดับ 1 ชั่วโมง
- สร้างสถานการณ์สภาพอากาศที่เป็นไปได้หลายร้อยแบบจากอินพุตเพียงครั้งเดียว
- การพยากรณ์เสร็จสิ้นภายในไม่ถึง 1 นาทีบน TPU เพียงตัวเดียว ขณะที่ โมเดลซูเปอร์คอมพิวเตอร์แบบอิงฟิสิกส์ แบบเดิมต้องใช้เวลาหลายชั่วโมง
- โมเดลนี้แสดงประสิทธิภาพเหนือกว่ารุ่นก่อนหน้าใน 99.9% ของตัวแปรและช่วงเวลานำการพยากรณ์ (0~15 วัน) เช่น อุณหภูมิ ความเร็วลม และความชื้น
- WeatherNext 2 ทำให้สามารถพยากรณ์ความละเอียดสูงได้ทั่วโลก และยังถูกนำไปใช้เพื่อ สนับสนุนการตัดสินใจของหน่วยงานด้านอุตุนิยมวิทยา
แนวทางการสร้างแบบจำลอง AI แบบใหม่
- WeatherNext 2 ใช้วิธีการสร้างแบบจำลอง AI แบบใหม่ที่เรียกว่า Functional Generative Network(FGN)
- มีการ ใส่ ‘noise’ ลงในโครงสร้างของโมเดลโดยตรง เพื่อให้ผลการพยากรณ์ยังคง มีความสมจริงทางฟิสิกส์และเชื่อมโยงกันเป็นระบบ
- แนวทางนี้มีประโยชน์ทั้งต่อการพยากรณ์แบบ ‘marginal’ และ ‘joint’
- marginal คือองค์ประกอบเดี่ยว เช่น อุณหภูมิของตำแหน่งหนึ่ง ความเร็วลมตามระดับความสูง หรือความชื้น
- joint คือ ระบบสภาพอากาศขนาดใหญ่ ที่เกิดจากหลายองค์ประกอบรวมกัน ซึ่งจำเป็นต่อการวิเคราะห์ปรากฏการณ์ซับซ้อน เช่น พื้นที่คลื่นความร้อนหรือการคาดการณ์ปริมาณไฟฟ้าจากพลังงานลม
- แม้โมเดลจะฝึกจากข้อมูล marginal เท่านั้น แต่ก็ เรียนรู้รูปแบบแบบ joint ได้ด้วยตัวเองและนำไปสู่การพยากรณ์เชิงซับซ้อน
การเข้าถึงและการใช้งานข้อมูล
- ข้อมูลการพยากรณ์ของ WeatherNext 2 เปิดให้ใช้งานบน Google Earth Engine และ BigQuery
- สามารถค้นหาได้ผ่าน Earth Engine Data Catalog และ BigQuery Analytics Hub
- บน Google Cloud Vertex AI มีการให้ความสามารถด้าน model inference แบบปรับแต่งได้ ผ่านโปรแกรม Early Access
- เทคโนโลยีนี้ถูกผสานเข้ากับ Search, Gemini, Pixel Weather และ Weather API ของ Google Maps Platform และมีแผนจะนำไปใช้กับ ฟีเจอร์ข้อมูลสภาพอากาศของ Google Maps ในอนาคต
จากงานวิจัยสู่การใช้งานจริง
- WeatherNext 2 เป็นตัวอย่างของการ ต่อยอดผลงานวิจัยไปสู่การใช้งานจริง
- Google เปิดเครื่องมือและข้อมูลเพื่อให้ นักวิจัย นักพัฒนา และธุรกิจทั่วโลก สามารถนำไปใช้แก้ปัญหาที่ซับซ้อนได้
- ในอนาคตมีแผนจะปรับปรุงประสิทธิภาพของโมเดลอย่างต่อเนื่อง ผ่าน การผสานแหล่งข้อมูลใหม่ และ การขยายการเข้าถึง
- Google ยังเชื่อมโยงสิ่งนี้เข้ากับ ระบบนิเวศการวิจัย geospatial AI เช่น Earth Engine, AlphaEarth Foundations, Earth AI
เอกสารเพิ่มเติม
- เผยแพร่ งานวิจัย (arXiv: 2506.10772) ที่เกี่ยวข้องกับ WeatherNext 2
- มี เอกสารสำหรับนักพัฒนา, Earth Engine Data Catalog, ตัวอย่างคิวรี BigQuery, และ หน้าสมัคร Early Access ของ Vertex AI ให้ใช้งาน
- โมเดลที่เกี่ยวข้องซึ่งถูกกล่าวถึงร่วมกัน ได้แก่ GenCast (การพยากรณ์สภาพอากาศสุดขั้ว) และ GraphCast (การพยากรณ์ทั่วโลกแบบรวดเร็ว)
1 ความคิดเห็น
ความคิดเห็นจาก Hacker News
ฉันติดตามหัวข้อนี้ค่อนข้างลึก และประเด็นที่คนนอกวงการน่าจะสนใจก็คือ โมเดลรุ่นใหม่อย่าง neuralgcm หรือ WeatherNext 1 ล้วนฝึกด้วยฟังก์ชันวัตถุประสงค์ชื่อ CRPS
วิธีนี้แทบไม่เห็นใช้ในวงการ ML ทั่วไป และฉันเคยเห็นในงานพยากรณ์อากาศเท่านั้น
สรุปคร่าว ๆ คือเพิ่ม noise แบบสุ่มให้กับอินพุต แล้วฝึกให้ลด loss ปกติลง (เช่น L1) พร้อมกับเพิ่มความแตกต่างระหว่างผลลัพธ์สองชุดที่สร้างจากค่าเริ่มต้นของ noise ที่ต่างกันให้มากที่สุด
เลยสงสัยว่าวันหนึ่งแนวทางนี้จะถูกนำไปใช้กับ GenAI แบบดั้งเดิมด้วยหรือเปล่า
มันทำให้นึกถึง บทความ Variational Noise
ถ้าเป็นการใส่ noise ในอินพุต ก็จะดูคล้าย เทคนิค SSL อย่าง DINO
ไม่ได้เกี่ยวกับ GenAI แต่รู้สึกว่า วิธีแบบ CRPS น่าจะช่วยได้
ช่วงนี้ฉันรู้สึกว่าพยากรณ์อากาศท้องถิ่นของ Google Search ไม่แม่นอย่างเห็นได้ชัด
ตั้งแต่หลายสัปดาห์ก่อน มันทำนายซ้ำ ๆ ว่าอุณหภูมิตอนกลางคืนจะต่ำกว่าจุดเยือกแข็ง แต่ความจริงไม่เป็นแบบนั้น
พื้นที่ของฉันทำนายยากก็จริง แต่แหล่งอื่นที่ไม่ใช่ Google กลับแม่นกว่ามาก
เลยสงสัยว่า rollout ของโมเดลใหม่นี้เกิดขึ้นไปแล้วจนทำให้แย่ลง หรือจริง ๆ แล้วกำลังจะดีขึ้นในไม่ช้า
แล้วก็อยากรู้ว่ามีเว็บที่เปรียบเทียบประสิทธิภาพการพยากรณ์ของแต่ละโมเดลตามพื้นที่ได้ไหม
มันสามารถแสดงกราฟข้อมูลพยากรณ์แยกตามโมเดลได้ และรวมโมเดลหลักไว้หลายตัว
แต่ยังไม่มี WeatherNext
ในประกาศครั้งนี้เน้นเรื่องความเร็วและจำนวนสถานการณ์ที่เพิ่มขึ้น แต่ฉันรู้สึกว่าคำอธิบายเรื่อง ความแม่นยำที่ดีขึ้น ยังไม่พอ
ประโยคอย่าง “WeatherNext 2 เร็วขึ้น 8 เท่าและให้ความละเอียดรายชั่วโมง” ฟังดูดี แต่ในฐานะผู้ใช้ สิ่งที่ฉันต้องการจริง ๆ ก็คือ พยากรณ์ที่แม่นยำหนึ่งอัน
ตัวชี้วัดอย่างคะแนน CRPS เป็นของสำหรับผู้เชี่ยวชาญ และมันถูกใช้เพื่อแก้ ปัญหา under-dispersion ของโมเดล ensemble แบบดั้งเดิม
การปรับปรุงแบบนี้จะกลายเป็นรากฐานที่ช่วยเพิ่มความแม่นยำของ พยากรณ์เชิงกำหนด ที่ผู้ใช้ทั่วไปเห็นในท้ายที่สุด
รายละเอียดทางเทคนิคดูได้ที่ WeatherBench
หัวใจของการพยากรณ์อากาศคือแนวคิดเรื่อง สถานการณ์ ensemble ที่มีมานานหลายสิบปีแล้ว และ “โอกาสฝนตก 70%” ก็หมายถึงมีฝนใน 70 จาก 100 สถานการณ์
พูดอีกอย่างคือ ไม่มี “พยากรณ์ที่แม่นยำเพียงหนึ่งเดียว” อยู่จริง
แอปอากาศหลายตัวนำเสนอสิ่งนี้ในเชิงภาพได้ดี
โมเดลพวกนี้รันอยู่บนคลัสเตอร์ HPC ขนาดใหญ่ แต่เพราะคำนวณจากศูนย์กลางแล้วกระจายผลลัพธ์ออกไป จึงยังมีประสิทธิภาพ
เลยสงสัยว่าพื้นฐานทาง ฟิสิกส์ ที่จำเป็นต่อการทำผลงานสูงนั้นอยู่ตรงไหน
เอนจินพยากรณ์อากาศของ Google นั้นยอดเยี่ยมอยู่แล้ว และการ ทำนายเส้นทางเฮอร์ริเคน ในฤดูกาลนี้ก็แม่นอย่างน่าทึ่ง
ขณะที่ Global Forecasting System (GFS) ของรัฐบาลสหรัฐกลับแย่ลงเรื่อย ๆ
บทความที่เกี่ยวข้อง: ลิงก์ Ars Technica
พออ่านบทความแล้วพบว่าไม่ได้ระบุชัดว่าโมเดลต้อง เทรนซ้ำ บ่อยแค่ไหน
ถ้าโครงสร้างแบบนี้เรียนรู้การกระจายตัวตามภูมิภาค เวลาผ่านไปแพตเทิร์นก็น่าจะเปลี่ยน จึงน่าจะต้องมีการเทรนซ้ำเป็นระยะ
ถ้าต้องเทรนสัปดาห์ละ 3 วันทุกสัปดาห์ แบบนั้นในเชิงปฏิบัติก็อาจกลายเป็น ปัญหาด้านต้นทุน
ทำให้นึกถึงเกร็ดจากสมัยสงครามโลกครั้งที่สอง
ว่ากันว่า Kenneth Arrow ค้นพบว่าการพยากรณ์ระยะยาวแทบไม่ต่างจากการเดาสุ่ม แต่ผู้บังคับบัญชาตอบว่า “ถึงจะรู้ว่าไม่มีประโยชน์ ก็ยังจำเป็นต่อการวางแผน”
ดังนั้นแค่พูดว่า “ฝนไม่ตก” ก็จะถูกประมาณ 90% ของเวลา
แต่ที่น่าขันคือในอดีตพยากรณ์อากาศยังแม่นน้อยกว่านั้นเสียอีก
ทุกวันนี้โมเดลแม่นอย่างน่าทึ่งจริง ๆ จนพยากรณ์ล่วงหน้า 10 วันก็แทบจะตรง
ช่วงนี้ความแม่นยำของแอปอากาศเริ่มต้นของ Google ลดลง
บ่อยครั้งคลาดเคลื่อนราว 2~5 องศา
ฉันลองใช้แอป Weawow ที่มีคนแนะนำใน HN แล้ว ชื่ออาจไม่ค่อยดีแต่ความแม่นยำนั้นยอดเยี่ยม
เป็นแอปที่พอใจที่สุดเท่าที่เคยใช้มา
ฉันยังรู้สึกว่า การพยากรณ์อากาศด้วย AI ยังดูไกลตัวในชีวิตจริง
ต่อให้เทียบกับยุคที่พ่อแม่ดูพยากรณ์ทางทีวี ความแม่นยำที่รู้สึกได้ก็ไม่ได้ต่างกันมาก
ทุกวันนี้ก็ยังมีทั้งวันที่พยากรณ์ว่าแดดออกแต่ฝนกลับตกหนัก หรือวันที่บอกว่าฝนจะตกแต่ฟ้ากลับใสทั้งวัน
ในมุมผู้บริโภค รู้สึกว่าความก้าวหน้าทางเทคโนโลยียังไม่แปลเป็น ความน่าเชื่อถือที่รับรู้ได้จริง
ตัวอย่างเช่น ใน Apple Weather ถ้ามีช่วงใดช่วงหนึ่งของวันมีโอกาสฝนสูง ก็จะแสดงว่าเป็น “วันฝนตก”
ทั้งที่จริงอาจฝนตกแค่ตอนตี 5 แล้วช่วงที่เหลือของวันฟ้าใสก็ได้
ผู้ใช้ต้องสามารถ ตีความ ข้อมูลได้ และคงจะดีถ้า AI ช่วย ใส่บริบท ให้พยากรณ์ตามสิ่งที่แต่ละคนสนใจ
ตัวอย่างเช่น มีการเพิ่มการพยากรณ์ฝนระยะสั้นของ rainbow.ai ลงใน Weathergraph และมันแม่นที่สุดเท่าที่ฉันเคยใช้มา
แม้แต่ข้อมูลเรดาร์เองก็มี noise มาก และกระบวนการกรองข้อมูลนั้นก็เป็น โมเดล ML อยู่แล้ว
พยากรณ์ล่วงหน้า 1 วันเมื่อ 30 ปีก่อน มีความแม่นยำพอ ๆ กับพยากรณ์ล่วงหน้า 4 วันในปัจจุบัน
แต่ไม่ใช่ว่าเราเข้าใจอากาศดีขึ้นมาก เพียงแต่ พลังการคำนวณ เพิ่มขึ้นอย่างก้าวกระโดด
ฉันสงสัยว่าโมเดลนี้ใช้งานได้ที่ไหน
กำลังมองหาพยากรณ์ระดับไฮเปอร์โลคัลแบบที่ Dark Sky เคยทำไว้
ข้อมูลพยากรณ์ของ WeatherNext 2 ใช้งานได้ผ่าน Earth Engine และ BigQuery และยังมีโปรแกรม early access บน Vertex AI สำหรับการอนุมานแบบปรับแต่งเองด้วย
นอกจากนี้ยังถูกนำไปใช้ใน Search, Gemini, Pixel Weather, Google Maps Platform Weather API ด้วย
มันให้เปรียบเทียบความต่างของพยากรณ์ระหว่างโมเดลได้ และ แอนิเมชันเวกเตอร์ลม ก็ดูน่าสนใจมากในเชิงภาพ
อัปเดตทุก 1 ชั่วโมง และให้พยากรณ์ความละเอียด 15 นาทีเป็นเวลา 18 ชั่วโมง และความละเอียด 1 ชั่วโมงเป็นเวลา 48 ชั่วโมง
เว็บไซต์ HRRR
หลังจาก IBM เข้าซื้อก็เปลี่ยนไปมาก แต่ไม่แน่ว่าโครงการนั้นอาจยังมีอยู่
สงสัยว่าโมเดลที่ให้ การพยากรณ์เฮอร์ริเคน แม่นที่สุดในฤดูกาลนี้ เป็นโมเดลเดียวกับที่ประกาศครั้งนี้หรือไม่
บทความที่เกี่ยวข้อง: ลิงก์ Ars Technica