6 คะแนน โดย baeba 5 시간 전 | 3 ความคิดเห็น | แชร์ทาง WhatsApp
  • Hacker Trends คือบริการที่วิเคราะห์โพสต์และคอมเมนต์ราว 45 ล้านรายการที่สะสมอยู่ใน Hacker News แล้วแสดงการเปลี่ยนแปลงของจำนวนการกล่าวถึงเทคโนโลยี ผลิตภัณฑ์ บริษัท หรือบุคคลเฉพาะรายในรูปแบบอนุกรมเวลา
  • สามารถแสดงคำค้นหลายคำบนกราฟเดียวกัน เพื่อเปรียบเทียบการแข่งขันระหว่างเทคโนโลยี การผลัดเปลี่ยนรุ่นของตลาด และการพุ่งขึ้นของความสนใจตามเหตุการณ์ต่าง ๆ
  • โดยทั่วไป เทรนด์เทคโนโลยีมักพุ่งขึ้นอย่างรวดเร็วจากเหตุการณ์เฉพาะ เช่น การเปิดตัวผลิตภัณฑ์ใหม่ การเข้าซื้อกิจการ การเปลี่ยนแปลงไลเซนส์ เหตุการณ์ด้านความปลอดภัย และการเปลี่ยนแปลงของสภาพแวดล้อมในอุตสาหกรรม
  • เมื่อดูข้อมูลระยะยาว จะเห็นว่าเครื่องมือและแพลตฟอร์มสำหรับนักพัฒนาไม่ได้ถูกแทนที่ในคราวเดียว แต่เปลี่ยนไปในรูปแบบที่ความสนใจต่อเทคโนโลยีเดิมลดลง และเทคโนโลยีใหม่เข้ามารับช่วงต่อ
  • อย่างไรก็ตาม จำนวนการกล่าวถึงใน Hacker News สะท้อนเพียงระดับความสนใจของคอมมูนิตี้นักพัฒนาเท่านั้น ไม่ได้พิสูจน์ส่วนแบ่งตลาดจริงหรือความเหนือกว่าทางเทคนิคโดยตรง

บทนำ

ติดตามการเปลี่ยนแปลงของบทสนทนาในหมู่นักพัฒนาด้วยข้อมูล

  • Hacker Trends แสดงฮิสโตแกรมรายเดือนของความถี่ที่คำเฉพาะถูกกล่าวถึงบน Hacker News ตลอด 18 ปี
  • ผู้ใช้สามารถป้อนคำค้นหลายคำพร้อมกันเพื่อเปรียบเทียบการเปลี่ยนแปลงของความสนใจต่อเทคโนโลยีและบริษัทต่าง ๆ
  • เมื่อเลือกเดือนหรือช่วงเวลาหนึ่ง ๆ จะสามารถดูโพสต์และคอมเมนต์จริงในช่วงเวลานั้นได้
  • การค้นหาและรวมข้อมูลใช้ Upstash Redis Search โดยทำงานกับข้อมูลราว 45 ล้านรายการ
  • บริการนี้ไม่ได้หยุดอยู่แค่กราฟปริมาณการค้นหา แต่ถูกออกแบบให้ตรวจสอบโพสต์และเหตุการณ์ที่เป็นสาเหตุให้ความสนใจเพิ่มขึ้นควบคู่กันได้

เนื้อหา

เทคโนโลยีเปลี่ยนผ่านด้วยการผลัดรุ่น

  • การเปลี่ยนแปลงของเครื่องมือและแพลตฟอร์มสำหรับนักพัฒนามักไม่ได้เกิดขึ้นในรูปแบบที่เทคโนโลยีเดิมหายไปทันที แต่เกิดจากเทคโนโลยีใหม่ค่อย ๆ ดึงความสนใจไป

  • ตัวอย่างสำคัญมีดังนี้

    • หลังจากความสนใจต่อ CoffeeScript ลดลง TypeScript ก็ผงาดขึ้นเป็นภาษาขยายของ JavaScript ที่เป็นกระแสหลัก
    • สภาพแวดล้อม CI ที่เคยมี Jenkins เป็นศูนย์กลางได้ย้ายไปสู่ GitHub Actions เป็นหลักหลังปี 2021
    • สภาพแวดล้อมการ build ที่เคยมี Webpack เป็นศูนย์กลางเริ่มย้ายความสนใจไปยัง Vite หลังปี 2022
    • ในระบบนิเวศ editor ที่เคยมี Vim เป็นศูนย์กลาง Neovim เติบโตอย่างรวดเร็วหลังปี 2021
    • การถกเถียงด้านฐานข้อมูลที่เคยมี MySQL เป็นศูนย์กลางเปลี่ยนไปสู่ PostgreSQL ในช่วงราวปี 2017–2020
  • การเปลี่ยนแปลงเหล่านี้มองได้ว่าเป็นผลสะสมจากความสะดวกในการพัฒนา ประสิทธิภาพ การสนับสนุนจากระบบนิเวศ และการเปลี่ยนแปลงของวิธี deployment มากกว่าเป็นเพียงกระแสนิยมชั่วคราว

เทคโนโลยี AI เติบโตจากแรงกระแทกของการเปิดตัวอย่างต่อเนื่อง

  • วงการ generative AI มีลักษณะเด่นคือจำนวนการกล่าวถึงเพิ่มขึ้นเป็นขั้น ๆ ทุกครั้งที่มีการประกาศโมเดลและบริการใหม่

  • หัวข้อที่ได้รับความสนใจหลัก ๆ ได้แก่ ChatGPT, GPT-4, Claude, Gemini, Llama, Mistral, DeepSeek เป็นต้น

  • เครื่องมือเขียนโค้ดด้วย AI แสดงรูปแบบการย้ายความสนใจตามลำดับจาก Cursor ไปยัง Claude Code และ Codex

    • Cursor ได้รับความสนใจสูงในช่วงครึ่งหลังของปี 2024
    • Claude Code ผงาดขึ้นอย่างรวดเร็วในช่วงกลางปี 2025
    • Codex เริ่มได้รับความสนใจเพิ่มขึ้นตั้งแต่ต้นปี 2026
  • ในด้านโมเดลเปิด Llama ขยายตลาดในปี 2023 และหลังจากนั้น Mistral กับ Qwen ก็สร้างโครงสร้างการแข่งขันขึ้นมา

  • ความสนใจในวงการ AI ไม่ได้ถูกขับเคลื่อนด้วยการปรับปรุงประสิทธิภาพเท่านั้น แต่ยังได้รับอิทธิพลอย่างมากจากเหตุการณ์อย่างการเปิดเผยโมเดล นโยบายโอเพนซอร์ส การแข่งขันระหว่างบริษัท และการควบรวมกิจการ

เทคโนโลยีโครงสร้างพื้นฐานมีการย้ายอำนาจนำตามบทบาท

  • ในคลาวด์และโครงสร้างพื้นฐานสำหรับการพัฒนา อำนาจนำยังคงย้ายไปมาระหว่างเทคโนโลยีที่ให้ฟังก์ชันเดียวกันอย่างต่อเนื่อง

  • ตัวอย่างสำคัญมีดังนี้

    • หลังจาก Docker ทำให้เทคโนโลยี container เป็นที่แพร่หลายในปี 2014–2015 Kubernetes ก็ผงาดขึ้นเป็นศูนย์กลางของ orchestration
    • Heroku เป็นผู้นำตลาดการ deploy แบบง่ายในช่วงแรก และต่อมา Netlify กับ Vercel ก็เติบโตบนฐานระบบนิเวศ JAMstack และ Next.js ตามลำดับ
    • สภาพแวดล้อมเว็บเซิร์ฟเวอร์ที่เคยมี Apache เป็นศูนย์กลางย้ายไปสู่ nginx และภายหลัง Caddy ซึ่งให้ HTTPS อัตโนมัติก็ได้รับความสนใจ
    • ตลาดการจัดการคอนฟิกเซิร์ฟเวอร์ที่เคยมี Chef และ Puppet เป็นศูนย์กลางย้ายไปสู่ Ansible ซึ่งไม่ต้องใช้ agent
    • ในด้าน observability Prometheus, Grafana และ Datadog ขยายความสนใจโดยมีบทบาทหลักต่างกันคือการเก็บข้อมูล การทำ visualization และ SaaS แบบรวมศูนย์
  • สิ่งนี้แสดงให้เห็นว่าเกณฑ์การเลือกเทคโนโลยีได้ขยายจากฟังก์ชันของผลิตภัณฑ์เดี่ยว ไปสู่ automation ของ deployment ความสะดวกในการจัดการ การผสานรวม และความเหมาะสมกับคลาวด์

เหตุการณ์เฉพาะขยายความสนใจอย่างรวดเร็วในระยะสั้น

  • จำนวนการกล่าวถึงเทคโนโลยีบน Hacker News ไม่ได้สะท้อนเฉพาะการเติบโตระยะยาว แต่ยังแสดงการพุ่งขึ้นชั่วคราวจากเหตุการณ์เฉพาะด้วย

  • เหตุการณ์ตัวอย่างมีดังนี้

    • ตอนที่ Unity ประกาศนโยบายค่า runtime fee ในปี 2023 จำนวนการกล่าวถึงไม่เพียงแต่ Unity แต่รวมถึง Unreal และ Godot ก็เพิ่มขึ้นพร้อมกัน
    • เมื่อ Heroku ยุติแพ็กเกจฟรีในปี 2022 การถกเถียงที่เกี่ยวข้องก็พุ่งขึ้นอีกครั้ง
    • Mastodon ได้รับความสนใจเพิ่มขึ้นในช่วงผู้ใช้ย้ายออกหลังการเข้าซื้อ Twitter ในปี 2022
    • Bluesky ผงาดขึ้นเป็นทางเลือกของแพลตฟอร์มโซเชียลใหม่ในช่วงปี 2024–2025
    • Zoom และ Microsoft Teams มีจำนวนการกล่าวถึงพุ่งสูงในปี 2020 จากการระบาดของ COVID-19 และการเปลี่ยนผ่านสู่การทำงานทางไกล
  • การเพิ่มขึ้นของความสนใจต่อเทคโนโลยีคู่แข่งอาจเกิดจากนวัตกรรมของตัวเอง แต่ก็อาจเกิดจากความล้มเหลวด้านนโยบายของผู้เล่นเดิมหรือแรงกระแทกของตลาดได้เช่นกัน

เหตุการณ์ด้านความปลอดภัยปรากฏเป็นการพุ่งขึ้นในช่วงเวลาชัดเจน

  • ด้านความปลอดภัยมีลักษณะเด่นคือจำนวนการกล่าวถึงกระจุกตัวในช่วงที่เกิดช่องโหว่หรือเหตุการณ์ขนาดใหญ่ มากกว่าการเปลี่ยนแปลงความสนใจระยะยาว
  • หัวข้อวิเคราะห์หลัก ๆ ได้แก่ Heartbleed, Log4j, XZ Utils, Spectre, SolarWinds, WannaCry, CrowdStrike เป็นต้น
  • เหตุการณ์เหล่านี้มีช่วงเวลาที่ความเสียหายเกิดขึ้นชัดเจน เช่น การเปิดเผยช่องโหว่ การโจมตี supply chain และบริการล่ม จึงปรากฏเป็นการพุ่งขึ้นที่เห็นได้ชัดบนกราฟ
  • การใช้ข้อมูลเกี่ยวกับความปลอดภัยช่วยเปรียบเทียบได้ว่าเหตุการณ์เฉพาะส่งผลต่อการเลือกเทคโนโลยีของนักพัฒนาและบริษัทอย่างไร

นโยบายไลเซนส์ปรับโครงสร้างระบบนิเวศโอเพนซอร์ส

  • การเปลี่ยนไลเซนส์ของโปรเจกต์โอเพนซอร์สนำไปสู่ปฏิกิริยาที่รุนแรงจากคอมมูนิตี้นักพัฒนา และการเกิดขึ้นของโปรเจกต์ fork ใหม่

  • ตัวอย่างสำคัญมีดังนี้

    • การเปลี่ยนของ MongoDB ไปเป็น SSPL
    • การเปลี่ยนไลเซนส์ของ Elastic
    • การเปลี่ยนไลเซนส์ Terraform ของ HashiCorp และการผงาดขึ้นของ OpenTofu
    • การเปลี่ยนไลเซนส์ของ Redis และการปรากฏตัวของ Valkey
  • การเปลี่ยนไลเซนส์ไม่ได้หยุดอยู่แค่การแก้ไขเงื่อนไขทางกฎหมาย แต่ยังส่งผลต่อความไว้วางใจของผู้ให้บริการคลาวด์และคอมมูนิตี้นักพัฒนา รวมถึงความต่อเนื่องของโปรเจกต์

  • ความสนใจต่อเทคโนโลยีไม่ได้ถูกกำหนดด้วยฟังก์ชันและประสิทธิภาพเท่านั้น แต่ยังขึ้นอยู่กับนโยบายและ governance ของผู้ดำเนินการด้วย

สภาพแวดล้อมอุตสาหกรรมและข้อถกเถียงทางสังคมก็เปลี่ยนบทสนทนาด้านเทคโนโลยี

  • Hacker Trends ครอบคลุมไม่เพียงภาษาโปรแกรมและผลิตภัณฑ์ แต่ยังรวมถึงการเปลี่ยนแปลงของสภาพแวดล้อมอุตสาหกรรมและวัฒนธรรมการพัฒนา
  • หัวข้อเกี่ยวกับอุตสาหกรรม ได้แก่ การเลิกจ้าง ภาวะเศรษฐกิจถดถอย ฟองสบู่ AI การกลับไปทำงานที่สำนักงาน burnout สหภาพแรงงาน และสัปดาห์ทำงาน 4 วัน
  • หัวข้อเกี่ยวกับวัฒนธรรมการพัฒนา ได้แก่ technical debt, code review, agile, scrum, microservices, serverless, monorepo เป็นต้น
  • หัวข้อเหล่านี้แสดงให้เห็นว่าเทรนด์เทคโนโลยีไม่ได้เชื่อมโยงเพียงกับพัฒนาการของเทคโนโลยีเอง แต่ยังเชื่อมกับสภาพการจ้างงาน วิธีบริหารองค์กร กฎระเบียบ และข้อถกเถียงทางสังคมด้วย

การตีความผลการค้นหามีข้อจำกัด

  • ผู้ใช้ Hacker News มีสัดส่วนของนักพัฒนา ผู้ก่อตั้งสตาร์ทอัพ และคนทำงานด้านเทคโนโลยีสูงกว่าคนทั่วไป ดังนั้นผลลัพธ์จึงไม่ได้เป็นตัวแทนความสนใจของสังคมทั้งหมด
  • การเพิ่มขึ้นของจำนวนการกล่าวถึงคำหนึ่ง ๆ อาจเกิดจากการประเมินเชิงบวก แต่ก็อาจเกิดจากคำวิจารณ์ เหตุขัดข้อง เหตุการณ์ความปลอดภัย หรือข้อถกเถียงด้านนโยบายได้เช่นกัน
  • มีความเป็นไปได้ที่เทคโนโลยีที่ใช้ชื่อเดียวกันหรือคำนามทั่วไปจะถูกรวมอยู่ในผลการค้นหา
  • การดูปริมาณการค้นหาเพียงอย่างเดียวทำให้ตัดสินจำนวนผู้ใช้จริง รายได้ ส่วนแบ่งตลาด หรือประสิทธิภาพทางเทคนิคได้ยาก
  • ดังนั้น Hacker Trends จึงเหมาะที่จะใช้เป็นข้อมูลเสริมสำหรับสำรวจการเปลี่ยนแปลงของความสนใจในคอมมูนิตี้เทคโนโลยีและเหตุการณ์สำคัญ มากกว่าจะใช้เป็นหลักฐานสุดท้ายของการวิเคราะห์ตลาด

สรุป

สามารถสำรวจทั้งกระแสและสาเหตุของการเปลี่ยนแปลงเทคโนโลยีได้

  • Hacker Trends คือบริการที่ใช้ข้อมูลระยะยาวของ Hacker News เพื่อเปรียบเทียบการเพิ่มขึ้นและลดลงของความสนใจต่อเทคโนโลยีและบริษัทต่าง ๆ ในรูปแบบภาพ
  • ผลการวิเคราะห์พบการผลัดรุ่นซ้ำ ๆ ในหลากหลายสาขา เช่น editor ภาษาโปรแกรม แพลตฟอร์มคลาวด์ ฐานข้อมูล และโมเดล AI
  • การพุ่งขึ้นของความสนใจมักเชื่อมโยงกับการเปิดตัวผลิตภัณฑ์ การเข้าซื้อกิจการ การเปลี่ยนไลเซนส์ เหตุการณ์ความปลอดภัย ความล้มเหลวด้านนโยบาย และการเปลี่ยนแปลงของสภาพแวดล้อมทางสังคม
  • เนื่องจากมีโพสต์และคอมเมนต์จริงให้ดูควบคู่กัน จึงสามารถติดตามได้ไม่เพียงปริมาณการกล่าวถึง แต่ยังรวมถึงวิธีที่นักพัฒนาในเวลานั้นประเมินเทคโนโลยีนั้น ๆ
  • อย่างไรก็ตาม ข้อมูลนี้แสดงความสนใจภายใน Hacker News เท่านั้น จึงควรตีความร่วมกับส่วนแบ่งตลาด สถิติผู้ใช้ และข้อมูลรายได้

3 ความคิดเห็น

 
laeyoung 3 시간 전

พอดูแบบนี้แล้ว เดือนกุมภาพันธ์ปีนี้มี โพสต์ Show HN เยอะมากจริง ๆ นะ ทุกคนทำกันตอนปลายปีแล้วค่อยมาลงรวดเดียวในเดือนกุมภาพันธ์หรือเปล่า

 
xguru 3 시간 전

ตอนนั้นน่าจะเป็นช่วงที่ Opus 4.6 ออกมา และของที่ทำด้วย Claude Code เริ่มแพร่หลาย จนมีผลงานชุดแรก ๆ ทยอยออกมาครับ

Show GN เองก็มีแนวโน้มเพิ่มขึ้นเรื่อย ๆ เหมือนกันครับ ในเกาหลีก็ดูเหมือนว่าของที่ทำโดยอาศัยความช่วยเหลือจาก AI จะค่อย ๆ เพิ่มขึ้นเรื่อย ๆ เช่นกัน

 
GN⁺ 4 시간 전
ความคิดเห็นจาก Hacker News
  • ผมกำลังเปิดให้ใช้ ฐานข้อมูล ClickHouse แบบสาธารณะ ที่บรรจุข้อมูล Hacker News อยู่ จึงสามารถลองค้นได้ทันทีที่ https://play.clickhouse.com/play?user=play#U0VMRUNUICogRlJPT...
    และยังสามารถทำบริการคล้ายกันได้ด้วย SQL query เดียวกับหน้า HTML เท่านั้น พร้อมเปิด public data lake ที่ query ได้จากที่ไหนก็ได้ไว้ด้วย: https://github.com/ClickHouse/ClickHouse/issues/29693#issuec...
    อัปเดตแบบเรียลไทม์ด้วย

    • ตามเงื่อนไขการใช้งานของ HN ข้อมูล HN ของผมถูกให้สิทธิ์แก่ HN เท่านั้น ดังนั้นขอให้ ลบข้อมูลของผม ออกจาก dataset นี้
  • Google Trends เอาไว้ดูปริมาณการค้นหา แต่สิ่งนี้ดูข้อความที่ถูกโพสต์ จึงเป็นคนละอย่าง
    มันใกล้เคียงกับการที่ Google Trends นับจำนวนการปรากฏของคำบนหน้าเว็บ หรือ Google Ngrams นับหน้าเว็บแทนหนังสือมากกว่า
    เวลาคนอยากสั่งเบอร์เกอร์เดลิเวอรีก็จะค้นคำว่า “burger” แต่คนจะไม่ได้เขียนถึงเรื่องที่ไม่มีคุณค่าข่าวมากนักบ่อย ๆ ดังนั้นจึงใช้ข้อมูลสองชุดนี้แบบเดียวกันได้ยาก
    ไม่ได้หมายความว่าตัวผลิตภัณฑ์ไม่ดี แค่ควรจำความแตกต่างนี้ไว้ตอนใช้งาน

    • ชื่อกับภาพข้อมูลทำให้รู้สึกคุ้นเคยจนเผลอรับมันเป็นตัวชี้วัดแบบเดียวกัน แต่จริง ๆ แล้ว ไม่ใช่ข้อมูลประเภทเดียวกัน ดังนั้นถ้าอ่านด้วยเลนส์นั้นก็จะได้ข้อสรุปผิด ๆ
      ตอนผมเลื่อนดูตัวอย่างก็รู้สึกแปลก ๆ แล้วมารู้ทีหลังว่าทำไม: นี่ไม่ใช่ข้อมูลว่าคนใน HN ค้นหาอะไรจริง ๆ แต่เป็นข้อมูลว่าตอนนี้พวกเขากำลังเขียนถึงอะไร
    • ผมไม่ค่อยเห็นด้วยอย่างแรงกับความคิดที่ว่าใช้ข้อมูลสองชุดนี้ในลักษณะเดียวกันไม่ได้
      เครื่องมือนี้รวมทั้งโพสต์และคอมเมนต์ ดังนั้นในมุมของ “ผู้คนอยากรู้อะไรและอยากถกเถียงเรื่องอะไร” โพสต์และคอมเมนต์ใน HN ก็คล้ายกับการค้นหาพอสมควร
      โพสต์ที่ดังจะมีคอมเมนต์เยอะ ทำให้คำที่เกี่ยวข้องพุ่งขึ้น ส่วนหัวข้อที่ไม่ดังจะมีคอมเมนต์เกี่ยวข้องน้อยเลยถูกกดต่ำลง
      ถ้าลองเทียบ blockchain กับ OpenAI ก็จะได้ผลตามคาด คือ blockchain เด่นในช่วงปลายทศวรรษ 2010 ก่อนที่ OpenAI จะนำหลังการเปิดตัว ChatGPT และกราฟ Google Trends ก็คล้ายกันพอสมควร
    • ชื่อ Hacker News Trends ก็โอเค แต่ ชื่อโพสต์อาจชวนให้เข้าใจผิดเล็กน้อย
    • จริง ๆ แล้วมันอาจใกล้กับ Google Ngram Viewer มากกว่า: https://books.google.com/ngrams/about
    • ถ้า Algolia มี dataset ว่าคนค้นหาอะไรกันจริง ๆ บน HN นั่นคงจะตรงเป๊ะเลย
  • ดูเหมือนจะโดน hug of death
    /api/hn -> 504 An error occurred with your deployment FUNCTION_INVOCATION_TIMEOUT cle1::c8vgv-1782399959042-aeba3cae05ff

    • ถ้าโปรเจกต์นี้เป็น โฆษณา Upstash ที่ชูว่า “Highly Available, Infinitely Scalable” สถานการณ์ที่อยากเลี่ยงที่สุดก็คงเป็น hug of death นี่แหละ
    • /api/hn -> 502 {"error":"Your database has been temporarily rate-limited, please contact support@upstash.com for further details."}
    • สมัยก่อนเราเรียกแบบนี้ว่า slashdotting กันเฉย ๆ
    • เจอ error นี้
      /api/hn -> 502 {"error":"Search entry should have an initialized schema, command was: [\"SEARCH.AGGREGATE\",\"hn\",\"{\\\"$or\\\":[{\\\"title\\\":{\\\"$eq\\\":\\\"anthropic\\\",\\\"$boost\\\":5}},{\\\"text\\\":{\\\"$eq\\\":\\\"anthropic\\\"}}]}\",\"{\\\"by_month\\\":{\\\"$dateHistogram\\\":{\\\"field\\\":\\\"time\\\",\\\"fixedInterval\\\":\\\"30d\\\"}},\\\"top_authors\\\":{\\\"$terms\\\":{\\\"field\\\":\\\"by\\\",\\\"size\\\":6}},\\\"by_type\\\":{\\\"$terms\\\":{\\\"field\\\":\\\"type\\\",\\\"size\\\":4}}}\"]"}
    • หลังจากค้นอยู่หลายครั้งก็ขึ้น /api/hn -> 504 An error occurred with your deployment FUNCTION_INVOCATION_TIMEOUT cle1::48fnt-1782412720840-4855b2b75b5a
  • มีข้อความ /api/hn -> 502 {"error":"Your database has been temporarily rate-limited, please contact support@upstash.com for further details."} ขึ้นมา

  • เจ๋งดี แต่ดูเหมือนมีบั๊กตรงนี้: https://hackernewstrends.com/?q=vim&q=emacs&q=zed
    ด้วยเหตุผลบางอย่างผลลัพธ์ ตัดจบที่ 2018-10 แต่ในตัวอย่าง “Popular Comparisons” กลับแสดงหลังจากนั้นด้วย

    • แก้แล้ว
  • ทำให้นึกถึง side project ที่ผมกำลังทำอยู่
    https://gitlab/here_forawhile/torum
    เป็น HN clone ที่ซิงก์กับ HN ทำให้สามารถคุยกันในคอมมูนิตี้ส่วนตัวขนาดเล็กโดยอิงจากสิ่งที่ถูกโพสต์บน HN ได้ แม้จะไม่ได้อยู่บน HN โดยตรง
    มันทำดัชนีฐานข้อมูลและรองรับการค้นหาด้วย จึงมีประโยชน์มากในการหาโพสต์ที่ดึงดูดความสนใจของผม

    • ลิงก์ที่แก้แล้ว: https://gitlab.com/here_forawhile/torum
    • *pique ต่างหากที่ถูก
      ‘peak’ ปกติหมายถึงยอดของอะไรบางอย่าง เช่น ยอดเขา
  • ถ้ามีการ normalize ด้วยปริมาณรวม เพื่อให้เห็นการเปลี่ยนแปลงของแต่ละคำเอง แทนที่จะเป็นแค่การเติบโตของเว็บโดยรวม ก็น่าจะมีประโยชน์
    ตอนนี้ต้องวาดคำทั่วไปคำหนึ่งลงกราฟไปด้วย แต่ถ้าเลือกผิดก็อาจทำให้ตีความยิ่งสับสนกว่าเดิม

    • เห็นด้วย ถ้าทำแบบนั้นน่าจะให้ insight มากขึ้นเยอะ
      ไม่อย่างนั้นผลลัพธ์การค้นหาเกือบทั้งหมดในช่วงที่เว็บเติบโตก็คงดูเป็นแค่รูปแบบหนึ่งของ https://xkcd.com/1138/
    • ในทางกลับกัน ผมก็อยากเห็นด้วยว่า HN เติบโตแค่ไหนตามกาลเวลา
  • น่าสนใจดีที่ lk-99 พุ่งขึ้นแรงในหมวดวิทยาศาสตร์และเทคโนโลยีล้ำหน้า
    เป็นแนวคิดที่เจ๋ง และน่าจะดีถ้าสามารถคำนวณ sentiment บวก/ลบให้แต่ละคอมเมนต์ที่พูดถึงคำหนึ่ง ๆ ได้
    เช่นให้ดูแนวโน้มของ cloudflare (positive) กับ cloudflare (negative) แยกกัน โดยแบบแรกนับเฉพาะคอมเมนต์ที่มีความเชื่อมั่นของ sentiment มากกว่า 0.6 และแบบหลังนับเฉพาะคอมเมนต์ที่มีคะแนน sentiment ต่ำกว่า 0.4

  • เป็นโปรเจกต์ที่สนุกและทำออกมาดี อยากได้ตัวเลือก ปรับตามขนาดเชิงสัมพัทธ์
    เช่นผลค้นหา “iPhone” ลดลงราวปี 2025 แต่แยกไม่ออกว่าความสนใจจริงลดลงหรือแค่จำนวนคอมเมนต์ใน Hacker News ปีนั้นลดลง
    ถ้าลองค้นคำทั่วไปอย่าง “the” หรือ “is” ก็ดูเหมือนว่าอย่างหลังจะเป็นไปได้มากกว่า

  • น่าจะต้องระวังอักขระที่ไม่ใช่ตัวอักษรหรือตัวเลข
    เช่น C# ดูเหมือนในกราฟจะถูกจับคู่เป็น C จริง ๆ แต่ในหัวข้อบทความตัวอย่างกลับไฮไลต์เฉพาะ C#