- ต้องการทำความเข้าใจตลาดงานและแนวโน้มปัจจุบันผ่านเธรด "Ask HN: Who Is Hiring" ของ Hacker News
- ใช้ Selenium ค้นหาใน Google ทุกเดือนด้วยคำว่า "ask hn who is hiring {month} {year}" เพื่อรวบรวม thread ID
- ใช้ HN-API รวบรวม ID ของคอมเมนต์ระดับบนสุด และบันทึกลงฐานข้อมูล sqlite3
- ใช้ GPT-4o จัดหมวดหมู่คอมเมนต์
- ใช้เมธอด
llm.batch(array) ของ LangChain เพื่อประมวลผลแบบขนาน ทำให้จัดการข้อมูลได้รวดเร็ว
ผลลัพธ์
มีงานจำนวนเท่าไรที่อนุญาตให้ทำงานระยะไกล?
- ในช่วงการระบาดใหญ่ งานที่ไม่รองรับการทำงานระยะไกลมีเพียงหนึ่งในห้า
- สัดส่วนงานที่รองรับการทำงานระยะไกลไม่ได้ลดลงมากอย่างที่คาดไว้
มีงานจำนวนเท่าไรที่สปอนเซอร์วีซ่า?
- สัดส่วนงานที่สปอนเซอร์วีซ่าค่อนข้างคงที่ในช่วง 2 ปีที่ผ่านมา
- การหางานที่สปอนเซอร์วีซ่ายังคงเป็นเรื่องยาก
การกระจายตามระดับประสบการณ์เปลี่ยนไปอย่างไร?
- การมีประสบการณ์มากกว่า 8 ปีจะมีความสำคัญภายใน 6~12 เดือนข้างหน้า
จำนวนงานในแต่ละรัฐของสหรัฐฯ เป็นอย่างไร?
- Bay Area และ NYC มีงานเปิดรับมากกว่าพื้นที่อื่นอย่างชัดเจน
มีการใช้ฐานข้อมูลใดบ้าง?
- PostgreSQL ถูกใช้งานมากกว่าฐานข้อมูลอื่นอย่างท่วมท้น
JavaScript framework ใดเป็นที่ต้องการสูง?
- React เป็นที่ต้องการสูงมาก
- สร้าง bubble chart แบบอินเทอร์แอ็กทีฟด้วย
three.js โดยไม่ใช้สเกลลอการิทึม
การกระจายของเงินเดือนเป็นอย่างไร?
- ไม่มีการให้รายละเอียดเฉพาะเกี่ยวกับการกระจายของเงินเดือน
สิ่งที่ได้เรียนรู้
- ควรอธิบายฟิลด์ของโมเดลให้แม่นยำที่สุดเท่าที่เป็นไปได้
- ควรระบุคลาสต่าง ๆ ไว้ในคำอธิบายเมื่อทำการจัดหมวดหมู่
- เมื่อต้องดึงค่าประเภทเซ็ต ควรระบุตัวคั่นไว้ในคำอธิบาย
งานในอนาคต
- จากงานตั้งต้นนี้ อาจสร้าง mini SaaS ที่ให้ผู้ใช้อธิบายงานที่กำลังมองหาในเธรด "Ask HN: Who is hiring?" แล้วระบบจะจัดหมวดหมู่และจับคู่ให้ตามแต่ละเดือนได้
ความเห็นของ GN⁺
- บทความนี้แสดงให้เห็นได้ดีว่าการใช้วิทยาศาสตร์ข้อมูลและเทคนิคการประมวลผลภาษาธรรมชาติสามารถนำมาวิเคราะห์ตลาดงานได้อย่างไร
- การประมวลผลแบบขนานด้วย GPT-4o และ LangChain มีประโยชน์ต่อการจัดการข้อมูลขนาดใหญ่ได้อย่างรวดเร็ว
- เนื้อหาสะท้อนความจริงว่าการหางานที่สปอนเซอร์วีซ่าเป็นเรื่องยาก จึงน่าจะเป็นประโยชน์ต่อผู้ที่กำลังมองหาข้อมูลด้านนี้
- ความต้องการ React และ PostgreSQL ที่สูงเป็นข้อมูลอ้างอิงที่ดีสำหรับผู้ที่ต้องการเรียนรู้เทคโนโลยีเหล่านี้
- ไอเดีย mini SaaS หากนำไปสร้างจริง น่าจะช่วยผู้หางานจำนวนมากได้มาก
1 ความคิดเห็น
ความคิดเห็นจาก Hacker News
การวิเคราะห์โดยใช้ GPT-4o น่าสนใจ
น่าเสียดายที่หา source code ของโปรเจ็กต์นี้บน GitHub ไม่เจอ
ขอบคุณที่ลงทุนทั้งเวลาและเงินกับโปรเจ็กต์นี้
เป็นการผสมผสานที่ยอดเยี่ยมระหว่าง LLM กับการวิเคราะห์แบบดั้งเดิม
การซ้อนแท่งในกราฟไม่ใช่ทางเลือกที่ดี
ควรใช้ log scale เพื่อให้กราฟไม่ดูแปลก
น่าสนใจถ้าลองทำการวิเคราะห์แบบเดียวกันด้วย Claude 3 Haiku
น่าสนใจถ้าเปรียบเทียบกับตัวอย่างสุ่มจาก Indeed หรือ LinkedIn
ในกราฟ JS framework มีทั้ง bubble ของ "React Native" และ "React-Native"
อยากเห็นการวิเคราะห์ลักษณะคล้ายกันสำหรับ "Who Wants to be Hired"