ชุมชน Instruct Korea ปี 2024 https://instruct.kr กลายเป็นหนึ่งในชุมชนโอเพนซอร์สโมเดลภาษาที่ใหญ่ที่สุดในเกาหลีใต้ ซึ่งมีนักวิจัยประมาณ 700 คนที่อุทิศเวลาพัฒนางานวิจัยของตนเองและแชร์อย่างสมัครใจ
เพื่อรับปีใหม่ 2025 ของ Instruct Korea เราต้องการจัดพื้นที่ให้สมาชิกชุมชน Discord ของ Instruct Korea ได้แบ่งปันแนวโน้มการวิจัยและข่าวสาร พร้อมทำความรู้จักและเชื่อมเครือข่ายกัน งาน Meetup นี้มีหัวข้อว่า "ไอเดียและความท้าทายในการวิจัยโมเดลภาษา" และหวังว่าจะได้ฟังประสบการณ์ของผู้อื่น แชร์ไอเดียวิจัยของตัวเอง และพบปะผู้คนที่มีมุมมองต่างกัน
งานจะจัดขึ้นในวันที่ 25 มกราคม 2025 (วันเสาร์) เวลา 14~18 น.
สถานที่คือ Nonce ใกล้สถานี Gangnam (Yeoksam-dong 624-17)
สอบถามเพิ่มเติม: https://instruct.kr
สถานที่ได้รับการสนับสนุน: Nonce Community (https://nonce.community/)
การแนะนำผู้บรรยาย ผู้บรรยายเพิ่มเติมจะมีการอัปเดตอีกในภายหลัง
Go Seok-hyeon (Sionic AI) จะเล่าถึงงานที่ทำด้วยภาษา Scala JVM ในด้าน NLP โดยเฉพาะประสบการณ์การพอร์ตโค้ด deep learning ที่พัฒนาด้วย Python ไปสู่ภาษา JVM เพื่อใช้งานในระดับ production
Kim Jisu (kuotient, Olgeonaijeu): Development of Korean Qwen2.5 Language Model ผ่านหัวข้อ "การพัฒนาโมเดลภาษาเกาหลี Qwen2.5" ร่วมแชร์กระบวนการพัฒนาโมเดลภาษาที่นวัตกรรม โดยเฉพาะขั้นตอนที่นำไปสู่ผลลัพธ์ด้านประสิทธิภาพที่โดดเด่น 37.60 ใน m-ArenaHard SFT, Merging, Alignment และ pipeline การฝึกโดยรวมจะถูกกล่าวถึง พร้อมกับนวัตกรรมทางเทคนิคที่นำมาใช้เป็นครั้งแรกในประเทศ เช่น การสลับเลเยอร์และการนำกลยุทธ์ On-policy มาใช้ รวมถึงเคล็ดลับที่ทำให้ได้สมรรถนะสูงสุดในโมเดลที่มีขนาดไม่เกิน 8B
Lee Seung-yu (dopeornope, Marker AI): LLM Guidance และ Quantization ในหัวข้อ "LLM Guidance และ Quantization" จะอธิบายแนวโน้มล่าสุดของเทคโนโลยี LLM ที่เติบโตอย่างรวดเร็ว โดยให้การวิเคราะห์เชิงลึกเกี่ยวกับแนวคิดและเส้นทางการพัฒนาของเทคโนโลยี LLM guidance และ quantization ซึ่งกำลังเป็นประเด็นวิจัยที่คึกคักในปัจจุบัน
Yoo Yong-sang: รีวิวการแข่งขันโมเดลภาษา KRX ด้านการเงิน จาก "รีวิวการแข่งขันโมเดลภาษา KRX ด้านการเงิน" จะร่วมแบ่งปันความรู้เชิงปฏิบัติในการพัฒนาโมเดลเฉพาะโดเมน โดยครอบคลุมกลยุทธ์ domain adaptation และ continual pretraining เพื่อยกระดับผลลัพธ์ benchmark MCQA และแนวทางการวิเคราะห์เชิงลึกด้าน safety auditing
Choi Seon-ung: เรื่องราวโครงการพัฒนา RAG จะแชร์ประสบการณ์จริงในโครงการพัฒนา RAG และจะชี้ให้เห็นปัญหาที่พบระหว่างการดำเนินโครงการอย่างตรงไปตรงมา พร้อมทั้งนำเสนอบทเรียนที่ได้รับและแนวทางการปรับปรุง
Jang Young-jun (yjoonjang): โมเดลฝังความหมายภาษาเกาหลี "โมเดลฝังความหมายภาษาเกาหลี" หัวข้อเรื่อง huggingface.co/nlpai-lab จะพูดถึงคุณสมบัติของโมเดล embedding ที่หลากหลายและประเด็นสำคัญในกระบวนการฝึกจริง โดยจะแชร์ข้อมูลเชิงปฏิบัติที่สามารถนำไปใช้ได้ทันทีตั้งแต่การเลือกโมเดลฝังความหมายไปจนถึงการฝึก
Jung Se-min (Sionic AI): สร้าง Recsys ด้วย Graph RAG - Storm fooding "สร้าง Recsys ด้วย Graph RAG - Storm fooding" จะแบ่งปันประสบการณ์ในการพัฒนาระบบ recommendation โดยใช้ระบบ RAG เชิงกราฟ ตั้งแต่การออกแบบระบบจนถึงการติดตั้งทั้งหมด
Kim Dong-kyu (Jeffrey Kim, AutoRAG): รับดาว GitHub 3,000 ดวง "รับดาว GitHub 3,000 ดวง" จะเล่าเรื่องราวการเติบโตของโปรเจกต์ open-source AutoRAG ตั้งแต่เริ่มต้นจนถึงการเป็น open-source อย่างประสบความสำเร็จ และจะแชร์เส้นทางการพัฒนาต่อไปในอนาคต
maywell (instruct.kr, Wanot AI) TBD
ยังไม่มีความคิดเห็น