สวัสดีครับ! ผมได้สร้างบริการชื่อ 'Trump-Saith' ที่วิเคราะห์แบบเรียลไทม์ว่าคำพูดของอดีตประธานาธิบดีทรัมป์ส่งผลต่อเศรษฐกิจและตลาดเกาหลีอย่างไร
เว็บไซต์: https://trump-saith.com/ (https://trump-saith.com/)
ฟีเจอร์หลัก: เก็บรวบรวมคำพูดของทรัมป์แบบเรียลไทม์ -> สรุปภาษาเกาหลีด้วย LLM -> วิเคราะห์ผลกระทบทางเศรษฐกิจ -> ลบข้อมูลซ้ำแล้วแสดงเป็นฟีด
💡 ทำไมถึงสร้างสิ่งนี้?
ช่วงหลังมานี้ แค่คำพูดเพียงประโยคเดียวของทรัมป์ก็มักทำให้ตลาดหุ้นในประเทศและอัตราแลกเปลี่ยนผันผวนอยู่บ่อยครั้ง แต่ต้นฉบับจาก Truth Social และแหล่งอื่น ๆ นั้นตามได้ยาก ขณะที่ข่าวแบบเดิมต้องผ่านการเรียบเรียงจึงช้ากว่า
จึงเริ่มโปรเจกต์นี้ด้วยแนวคิดว่า "เก็บคำพูดโดยตรงให้เร็วที่สุด แล้วสรุปเฉพาะประเด็นสำคัญจากมุมมองของนักพัฒนาและนักลงทุนให้ดู"
🛠️ เทคสแตกและสถาปัตยกรรม
เนื่องจากเป็นชุมชนนักพัฒนา จึงอยากแชร์แนวทางการทำงานของระบบ โดยสร้าง pipeline เป็น 4 เลเยอร์อิสระ
-
Data Collection (Python, APScheduler)
มอนิเตอร์ Truth Social API และช่อง RSS ทุก 1 นาทีเพื่อเก็บข้อมูลดิบ
ข้อมูลที่เก็บได้จะถูกบันทึกถาวรใน Oracle DB และส่งต่อไปยังเลเยอร์ถัดไปแบบอะซิงโครนัสผ่าน Redis Streams -
Analysis (Gemini 2.0 Flash)
วิเคราะห์ต้นฉบับที่รวบรวมมาโดยใช้โมเดล Gemini 2.0 Flash
ไม่ใช่แค่การแปล แต่เป็นการดึงสรุปและคีย์เวิร์ดจากมุมมองของ 'ผลกระทบต่อเศรษฐกิจ/ตลาดเกาหลี' (สรุป 3-5 ประโยค) -
Deduplication (Sentence-Transformers, Qdrant)
จัดการคำพูดเนื้อหาเดียวกันที่ถูกเก็บมาจากหลายช่องทาง
สร้าง sentence embedding ด้วยโมเดล all-MiniLM-L6-v2 และกรองข้อมูลซ้ำใน Qdrant(Vector DB) โดยใช้เกณฑ์ cosine similarity 0.85 -
API & Feed
สุดท้ายจะนำข้อมูลที่ผ่านการปรับแต่งแล้วไปให้บริการแก่ไคลเอนต์
✨ จุดเด่นที่แตกต่าง
ความเร็ว: เริ่มวิเคราะห์ทันทีที่ต้นฉบับคำพูดของทรัมป์ถูกโพสต์ ก่อนที่ข่าวจะออกมา
การวิเคราะห์ตามบริบท: ใช้พรอมป์ต์ LLM เพื่อดึงความหมายว่า "คำพูดนี้มีนัยต่ออุตสาหกรรมเซมิคอนดักเตอร์หรือยานยนต์ของเกาหลีอย่างไร?"
ฟีดสะอาด: ลด noise จากการที่ข่าวเดียวกันโผล่ซ้ำ ด้วยการลบข้อมูลซ้ำตามความคล้ายคลึง
🚀 แผนต่อไป
ขณะนี้กำลังขยายช่องทางการเก็บข้อมูล และในอนาคตมีแผนจะเพิ่มฟังก์ชันแจ้งเตือนแบบพุชเรียลไทม์สำหรับคีย์เวิร์ดเฉพาะ (เช่น Samsung Electronics, ภาษีศุลกากร เป็นต้น)
หวังว่าจะเป็นประโยชน์เล็ก ๆ สำหรับผู้ที่สนใจจุดตัดระหว่าง IT กับเศรษฐกิจ ฟีดแบ็กยินดีต้อนรับเสมอครับ!
ขอบคุณครับ
8 ความคิดเห็น
ระเบิดแล้ว 403
ขอบคุณ! ฉันลงทะเบียนโปรเจ็กต์แล้ว!
"อดีต" ประธานาธิบดี
เหมือนจะยังตรวจทานไม่ละเอียดพอเลย..!
ดูเหมือนว่าเป็นบทความที่เขียนโดยโมเดลที่ใช้ข้อมูลฝึกถึงช่วง 2021.01 ~ 2025.01 นะ 555
ดูดีนะ
แต่สิ่งที่มีข้อความสั้น ๆ แค่หนึ่งหรือสองประโยคต่อการ์ดแบบสรุปนี่ คือการวิเคราะห์ผลกระทบทางเศรษฐกิจเหรอครับ?
ถ้าไม่ใช่ ตอนนี้บนหน้าจอของผมยังไม่เห็นข้อมูลที่เรียกว่าการวิเคราะห์ผลกระทบเลยครับ
ไม่ได้แสดงแยกต่างหากครับ
คงต้องลองหารือกันดูอีกทีว่าสามารถเสริมเนื้อหาการวิเคราะห์ผลกระทบในส่วนสรุปได้หรือไม่
ขอบคุณครับ!