สิ่งที่ผมคาดหวังคือการค้นหาเชิงความหมาย
การค้นหาเชิงความหมายไม่ใช่หัวข้อที่ไร้ความเป็นจริงเลยในยุคกระแส AI แบบตอนนี้ และผมเชื่อว่าคุณก็น่าจะรู้ว่าต่อให้เป็นบุคคลทั่วไปก็สามารถทำขึ้นมาได้เพียงพอ
ดูเหมือนว่าคุณเองก็มักจะไปโปรโมตตัวเองในแกลเลอรีของเว็บอื่นเหมือนกัน เช่น Age of the Six Dragons หรือ Web Three Kingdoms Musou Chronicle
จากที่เห็นว่าคุณเอางานที่ยังทำไม่เสร็จมาใช้เป็นเหมือนของให้ลองชิม และหลังจากนั้นก็ทิ้งโปรเจกต์นั้นได้อย่างง่ายดาย ผมก็เลยรู้สึกว่าแล้วมันต่างจากโพสต์นี้ตรงไหนกัน.. ทำไมถึงใช้มาตรฐานที่เข้มงวดกับคนอื่นล่ะ
มีหลักฐานเกี่ยวกับส่วนที่ว่า "ขัดขวางเสรีภาพในการพูดของผู้อื่น" ไหมครับ? ตรงนี้ผมไม่ค่อยเข้าใจเท่าไร เพราะไม่ใช่ว่าผมมีอำนาจดูแลพื้นที่นี้จนสามารถปิดกั้นไม่ให้คนอื่นเขียนโพสต์หรือคอมเมนต์ได้เสียหน่อย และในความเป็นจริงคุณก็ยังเขียนคอมเมนต์ยาว ๆ แบบนี้ได้อยู่ไม่ใช่หรือครับ
ถ้าการแค่เขียนคอมเมนต์คัดค้านความเห็นของคนอื่นถือเป็นการปิดกั้นเสรีภาพในการพูดของผู้อื่น งั้นก็ต้องถือว่าคุณ crawler กำลังละเมิดเสรีภาพในการพูดของผมอยู่ตอนนี้ด้วยไม่ใช่หรือครับ? ถ้าไม่ใช่ แบบนั้นในเชิงตรรกะก็ไม่ใช่มาตรฐานสองชั้นหรอกหรือครับ?
และอย่างที่คุณ crawler ก็ยอมรับเอง สุดท้ายแล้วการจะเข้าข่าย abuse หรือไม่นั้นไม่ได้สำคัญต่อเกณฑ์การตัดสินเลย
นี่ไม่ขัดแย้งกับข้อความที่ว่า "อย่างที่ผมพูดเมื่อวาน ถ้าไม่ได้ถูก flagged ผมก็คงเห็นด้วยกับเรื่องนั้นเหมือนกัน แต่ตั้งแต่วินาทีที่มีการปั่นคะแนนแนะนำให้กับโพสต์ที่เขียนไว้ การพูดเรื่องนี้ก็ไม่มีความหมายแล้ว" หรอกหรือครับ?
ตอนนี้ดูเหมือนว่าประเด็นและข้ออ้างกำลังเปลี่ยนไปเรื่อย ๆ จึงอยากให้ยึดให้คงที่สักอย่างเดียวครับ
แอดมินขอแจ้งให้ทราบครับ
ขณะนี้การถกเถียงในคอมเมนต์มีแนวโน้มร้อนแรงขึ้น เนื่องจากประเด็นได้พัวพันไปถึงส่วนที่ไม่เกี่ยวกับเนื้อหาทางเทคนิคของโพสต์โดยตรง
เรายินดีต้อนรับการอภิปรายและฟีดแบ็กเชิงเทคนิคเสมอ
แม้ความคิดเห็นจะแตกต่างกันได้ แต่ขอความกรุณาให้ยึดหลักมารยาทพื้นฐานต่อกันและอภิปรายโดยเน้นเหตุผลในการเขียนคอมเมนต์ รวมถึงขอให้โฟกัสที่เนื้อหาของโพสต์นี้เป็นหลัก มากกว่าตัวบุคคลหรือประวัติของใคร
กรุณาตรวจสอบแนวทางการเขียนคอมเมนต์ในวิธีใช้งานเว็บไซต์อีกครั้ง
ทั้งนี้ สำหรับโพสต์ที่ถูกปักธง ระบบได้มีการบันทึกและดำเนินการตามระบบไว้แล้ว และเราจะปรับปรุงนโยบายการดูแลและระบบที่เกี่ยวข้องอย่างต่อเนื่องต่อไป
นอกจากนี้ หากมีความคิดเห็นหรือข้อเสนอแนะเกี่ยวกับการดูแลระบบ สามารถส่งอีเมลมาได้อย่างสบายใจครับ
หน่วยความจำที่ถูกดูดหายไปจากโรงงานโดยตรงแบบนั้น สุดท้ายก็มาถูกฝังลงบนบอร์ดอย่างนี้นี่เอง
ดังนั้นผมเลยสงสัยในส่วนนั้นครับ
ถ้าทุกคนตอบสนองกันไปเลยว่า "คนนี้เป็นพวกปั่นยอดนะ!" ผมก็คงไม่เขียนคอมเมนต์แบบนี้หรอกครับ แต่คอมเมนต์ส่วนใหญ่กลับพูดถึงระดับคุณภาพของบทความเดิมกันเสียมากกว่า ตรงนั้นต่างหากที่ดูแปลก ถ้าปัญหาคือการปั่นยอดจริง ๆ การพูดถึงระดับคุณภาพของบทความก็คงเป็นเพียงคำเสริมที่ไม่จำเป็นโดยสิ้นเชิงไม่ใช่หรือครับ
สรุปคือคุณกำลังบอกว่าเคยคิดจะแชร์ประสบการณ์การปรับแต่งบริการประเภทที่ใส่ embedding หรืออะไรทำนองนั้น จนต่อให้พิมพ์มั่ว ๆ ระบบก็ยังแนะนำ候補การค้นหาได้อย่างแม่นยำใช่ไหมครับ
ถ้าเป็นแบบนั้น ผมกลับรู้สึกว่ามันน่าจะเป็นสิ่งที่ควรคาดหวังจากชื่อประมาณ "การแนะนำคำค้น" มากกว่า แต่ก็เข้าใจว่าคุณคาดหวังอะไรอยู่
ผมเข้าใจจุดยืนที่วิพากษ์วิจารณ์การ abuse นะครับ แต่ประโยคสุดท้ายเหมือนค่อย ๆ เปลี่ยนประเด็นจากความไม่ชำนาญทางเทคนิคไปเป็นเรื่องการละเมิดกฎชุมชนอย่างแนบเนียน และดูเหมือนเป็นความพยายามแบบไทเก็กที่ค่อนข้างฝืน ๆ ในการบอกว่า "จะใช้ตรรกะและข้ออ้างของคุณมาหักล้างตัวคุณเอง" เลยทำให้ผมค่อนข้างผิดหวัง
ถ้าคุณวิจารณ์แค่เรื่อง abuse ตั้งแต่แรกเสียเลย น่าจะมีน้ำหนักกว่าเสียอีก ถ้าเป็นอย่างนั้นจริง ต่อให้บทความข้างต้นมีเนื้อหาอย่างที่คุณบอกว่าคาดหวังไว้แต่แรกจริง ๆ เช่นการปรับแต่ง vector embedding บน DBMS สมัยใหม่ หรือแม้จะใช้ "ชื่อเรื่องที่ถ่อมตัว" ก็ตาม ก็คงยังมีปฏิกิริยาในเชิงเป็นปฏิปักษ์ต่อประวัติการ abuse ช่วงหลังของผู้เขียนอยู่ดี และในส่วนนั้นผมก็ไม่มีข้อโต้แย้งอะไรเลย เพราะมันแทบไม่เกี่ยวกับเนื้อหาทางเทคนิคอยู่แล้ว
สิ่งที่ผมคัดค้านคือ ทำไมรูปแบบนั้นถึงแสดงออกมาในลักษณะของการชี้ว่ามันเป็น "ความไม่ชำนาญทางเทคนิค" หากการ abuse เป็นพฤติกรรมที่ยอมรับไม่ได้ ก็แน่นอนว่าควรถูกตำหนิโดยไม่เกี่ยวกับเนื้อหาอยู่แล้ว ถ้าอย่างนั้นมีเหตุผลอะไรที่ต้องใส่คำวิจารณ์เกี่ยวกับเนื้อหาลงไปด้วยล่ะ? แต่คอมเมนต์ที่นี่กลับแทบทั้งหมดมีนัยว่าเนื้อหานั้นอ่อนทางเทคนิค ทั้งที่คุณ crawler เองก็เปรียบเทียบกับผมว่าเป็นเหมือน "การทำเว็บบอร์ดของนักพัฒนามือใหม่" และยังบอกว่า "จะเห็นได้เท่าที่รู้" อีกด้วย แบบนี้มันก็น่าตั้งข้อสงสัยไม่ใช่หรือว่าเรื่อง abuse นั้นอาจเป็นเพียงประเด็นรองที่ถูกหยิบมาต่อท้ายทีหลัง
ถ้าตามเนื้อหาคอมเมนต์นั้น ต่อให้บทความต้นฉบับเป็นเนื้อหาประเภทที่คุณ crawler คาดหวังจริง คุณก็คงวิจารณ์เพราะการ abuse อยู่ดี ไม่อย่างนั้น หรือว่าถึงจะมีการ abuse แต่ถ้าโดยส่วนตัวคุณรู้สึกว่าชอบเนื้อหาของบทความ ก็ไม่จำเป็นต้องใช้เสรีภาพในการพูดอย่าง "เข้มงวด" งั้นหรือ?
ดังนั้นผมขอถามอีกครั้ง ถ้าคุณวิจารณ์ผู้เขียนต้นฉบับเพราะการ abuse จริง ๆ แล้ว ทำไมคอมเมนต์ของคุณถึงเน้นวิจารณ์เนื้อหาเป็นหลัก แทนที่จะวิจารณ์เรื่อง abuse?
ผมไม่ได้สนใจรถ Porsche เลยไม่ค่อยรู้เท่าไร แต่ได้ยินมาว่าในเกาหลี Porsche Cayenne ไฟฟ้ารุ่นใหม่ก็ค่อนข้างได้รับความนิยมเหมือนกัน
แน่นอนว่าความนิยมไม่ได้มากเท่าเมื่อก่อนแล้ว เลยไม่ใช่แบบสั่งแล้วต้องรอ 2 ปี แต่ถ้าสั่งตอนนี้ประมาณ 6 เดือนก็ได้รถ
ปีที่แล้ว รถยนต์ไฟฟ้าที่ขายดีที่สุดในเกาหลีคือ Tesla Model Y ประมาณ 48,000 คัน
ส่วน ยอดขาย Porsche ทั้งหมดในเกาหลีอยู่ที่ 10,746 คัน โดยเป็นปลั๊กอินไฮบริด 28% (3,000 คัน) และรถยนต์ไฟฟ้าล้วน 34% (ประมาณ 3,653 คัน) ครับ
อ๋อ ผมชอบบทความนี้มากเลยครับ เวลาผมอธิบายตัวเองให้คนสนิทฟัง ผมมักจะบอกว่าตัวเองเป็น "มนุษย์สายยูทิลิตี้" ถ้าใครถามอะไรมา ผมก็จะพยายามหาทางช่วยแก้ให้ได้ แล้วก็สนุกกับการระดมความรู้ทั้งหมดที่มีออกมาใช้ให้เป็นเครื่องมือได้หลากหลายแบบ
ไม่ค่อยแน่ใจเหมือนกันว่าผลลัพธ์ออกมาดีแค่ไหน.. แต่ผมก็ใช้ชีวิตด้วยความพึงพอใจลึก ๆ ว่าน่าจะได้ช่วยไปบ้าง
ครบรอบ 20 ปีที่น่าประทับใจ ตอนนี้แทบไม่มีโอกาสได้ใช้แล้วก็จริง แต่ก็หวังว่าจะยังคงได้รับความรักต่อไปในฐานะเครื่องมือที่ยังมีประโยชน์ในภาคสนามเสมอ
ผมเห็นด้วยกับสิ่งที่คุณพูดครับ
แต่ผมคิดว่าสถานการณ์ตอนนี้เป็นการชี้ให้เห็นถึงท่าทีของผู้ใช้ที่มีพฤติกรรมปั่นระบบมากกว่า เรื่องระดับคุณภาพของโพสต์ดูจะออกนอกประเด็นไปหน่อยครับ
ปฏิกิริยาที่ไม่เป็นมิตรคงมีที่มาจากประวัติการปั่นระบบของผู้เขียนมากกว่า ผมมองว่าการพูดถึงเนื้อหาว่าเป็นอย่างไรนั้นเป็นการขยายความที่ไม่จำเป็นครับ
อย่างที่คุณบอกไว้ แค่ค้นหาด้วย decomposed term ก็เพียงพอแล้วครับ/ค่ะ ตอนนี้เมื่อเป็นแบบนี้ term ก็เป็นเงื่อนไขที่ไม่จำเป็น แต่ดูเหมือนว่าผม/ดิฉันจะไม่ได้คำนึงถึงจุดนี้ ขอบคุณมากครับ/ค่ะ เลยได้แก้ไขแล้ว!
> ผู้ใช้คนหนึ่งกล่าวว่า “ความตัดกันของสีส้มสว่างมีประโยชน์ต่อผู้ที่มีสายตาเลือนราง”
> ผู้ใช้อีกคนโต้แย้งว่า “ดีไซน์ที่พึ่งพาสีทำให้ผู้ใช้ตาบอดสีเสียเปรียบ”
ฮ่าๆๆ
เครื่องจักรสร้างโค้ดสำหรับเครื่องจักร
ปราสาททรายที่มนุษย์สร้างขึ้นบนภาษาระดับเครื่องจักร สุดท้ายก็มีชะตาต้องพังทลายลง
...จะพูดแบบนั้นก็ได้เหมือนกันนะ 555
ลิงก์ต้นฉบับอยู่ฝั่งเครื่องคิดเลข แต่จริง ๆ แล้วแก่นสำคัญน่าจะเป็นเนื้อหาที่ผู้เขียนโพสต์ไว้บน Hacker News มากกว่าฟังก์ชันของเครื่องคิดเลขเอง ก็เลยเปลี่ยนลิงก์ไปฝั่ง HN ครับ
ตัวผมเองก็แทบไม่ได้เขียนโค้ดส่วนตัวเลยนอกจากงานที่ทำเป็นอาชีพ แต่เพราะ AI ช่วงนี้เลยได้เขียนโค้ดโปรเจกต์ข้างเคียงเยอะมากเหมือนกันครับ
จริง ๆ ก็ยังไม่ได้คิดไปถึงขั้นว่าจะเปิดเผยออกสู่ภายนอกไหม แต่พอค่อย ๆ ทำไปเรื่อย ๆ ก็เริ่มอยากทำให้จริงจังขึ้นครับ
พอเห็นว่าที่ Show ของ GeekNews ก็มีโปรเจกต์ขึ้นมาเยอะมากจริง ๆ ก็ดูเหมือนว่าทุกคนจะคล้าย ๆ กันนะครับ
แน่นอนว่าพอมันง่ายขึ้นมาก ก็เลยน่าเสียดายนิดหน่อยที่บางครั้งถูกแชร์ออกมาทั้งที่งานเก็บรายละเอียดขั้นสุดท้ายยังไม่ค่อยครบเท่าไร
เป็น 30B A3B เลยไม่ได้หนักขนาดนั้น
แต่ก็ต้องมีพื้นที่สำหรับ 30B อยู่ดี แต่พอมีพื้นที่แล้ว active parameters มีแค่ 3B เลยทำงานได้เร็ว
เลยเหมือนจะเคยเห็นวิธีเพิ่มประสิทธิภาพแบบโหลดเฉพาะเลเยอร์ที่ถูกใช้งานบ่อยขึ้นไปไว้บน VRAM
ผมไม่ได้คิดว่า kunggom เป็นนักพัฒนาที่ขาดความรู้พื้นฐานถึงขั้นไม่สามารถเข้าใจอุปมาเรื่องบอร์ดที่ผมพูดถึงได้
ตอนนี้ความเห็นที่ต่างกันน่าจะมาจากการรับรู้ต่อผู้ใช้ที่ Abusing กันตั้งแต่ต้น ดังนั้นผมจะพูดเป็นครั้งสุดท้ายครับ
สิ่งที่ผมคาดหวังคือการค้นหาเชิงความหมาย
การค้นหาเชิงความหมายไม่ใช่หัวข้อที่ไร้ความเป็นจริงเลยในยุคกระแส AI แบบตอนนี้ และผมเชื่อว่าคุณก็น่าจะรู้ว่าต่อให้เป็นบุคคลทั่วไปก็สามารถทำขึ้นมาได้เพียงพอ
แต่แรกแล้วตอนที่เรากดดูหัวข้อ เราไม่ได้กดโดยทำความเข้าใจภูมิหลังของคนเขียนก่อนอยู่แล้ว แต่ผมกำลังจะบอกว่า ถึงจะไม่ใช่บริการที่มีทราฟฟิกมหาศาลหรือต้องทำรายได้ ก็ยังสามารถทำได้มากพอ
แล้วตอนนี้ผมกำลังพูดถึงแค่หัวข้อเท่านั้น
> ตามบทความต้นฉบับ โปรเจ็กต์นี้ ~
ผมกำลังพูดถึงภาพที่จินตนาการจากการเห็นหัวข้อ ซึ่งส่วนนี้ไม่จำเป็นต่อบทสนทนาของเราในตอนนี้ครับ
> สถานการณ์ของคนที่เขียนโพสต์ตอนนี้
ตอนนี้ผมพอจะรู้แล้วว่า kunggom คิดอย่างไรกับคนที่เขียนโพสต์นี้ คุณคงมองว่าเขาเป็นนักพัฒนามือใหม่ และไม่ว่าเขาจะเขียนอะไรเราก็ควรต้องทำความเข้าใจเขาเสมอ
อย่างที่ผมพูดเมื่อวาน ถ้าไม่ได้ถูก flagged ผมก็คงเห็นด้วยกับตรงนั้น แต่ตั้งแต่จังหวะที่มีการปั่นคะแนนแนะนำให้กับโพสต์ที่เขียน เรื่องนี้ก็หมดความหมายแล้ว
> และถ้าคุณคิดจริง ๆ ว่าการที่คนที่ถูกจับได้ว่า abuse กลับมาเขียนโพสต์อีกในวันถัดไปเป็นปัญหา
คุณพูดไว้แบบนี้ด้านบน
ถ้าถึงถูก flagged แล้วก็ยังมีเสรีภาพในการเขียนโพสต์ได้ ก็ย่อมมีเสรีภาพที่จะวิจารณ์เรื่องนั้นได้เช่นกัน
อย่างที่คุณพูดเอง ถ้าคุณคิดว่าการพูดกับคนที่ถูก flagged อย่างเข้มงวดขึ้นอีกหน่อยในคอมเมนต์เป็นปัญหา ก็ควรไปเสนอแนะกับทีมงาน ไม่ใช่มาติเตียนกันในคอมเมนต์
สเปกของ Instinct คือ HBM4 432GB และแบนด์วิดท์ 19.6tb/s แต่ก็รู้สึกเหมือนกันว่าขนาดแคชดูใหญ่เมื่อเทียบกับความจุ ถ้าอยากทราบสเปกอื่น ๆ (เช่น เครือข่าย เป็นต้น) ก็บอกได้ครับ
มีอยู่ครับ แต่ส่วนใหญ่ดูเหมือนว่าจะไม่ได้เริ่มสร้างกันใหม่ตั้งแต่ศูนย์จากการอ่านเปเปอร์ แต่มักจะต่อยอดจากโอเพนซอร์ส reference implementation กันมากกว่า
ช่วงนี้ฝั่ง AI พอมีเปเปอร์ที่กำลังมาแรงออกมา ก็จะมี POC โผล่ขึ้นมาเป็นชุด แต่พอเอาเข้าจริงในโปรดักชันก็มักมีหลายกรณีที่เพราะข้อมูล/อินฟรา/การจูน ทำให้มัน "รันได้ก็จริง แต่รสชาติไม่ออกมาอย่างที่คาดหวัง"
เพราะงั้นช่วงนี้เลยให้ความรู้สึกว่าคนกำลังไหลไปหา packaged stack อย่าง vLLM, Ollama กันมากขึ้น
อ่านได้เพลินมากครับ ตอนแรกนึกว่าเป็นบทความแนวแค่ใส่ดัชนีธรรมดา ๆ หรือเปล่า? แต่ไม่ได้หยุดแค่นั้น ยังลองหลายวิธีแล้วนำมาแชร์ด้วย ตรงนี้ดีมากครับ ต่อไปอย่างที่บอกไว้ ลองใช้ trie ก็น่าจะดี หรืออาจปรับปรุงต่อด้วยการให้น้ำหนักกับ term ที่กำลังเป็นเทรนด์จากการถูกค้นหาล่าสุดบ่อย ๆ มากขึ้นก็ได้ครับ!
มีอยู่จุดหนึ่งที่ผมสงสัยคือ เห็นว่าคุณ query ทั้ง term และ decomposed term ด้วยเงื่อนไข or แต่ในเมื่อ decomposed term ครอบคลุมมากกว่า ก็เลยคิดว่า query แค่ฟิลด์นี้อย่างเดียวก็น่าจะพอหรือเปล่าครับ เช่น ต่อให้ query เป็น “neng” ก็จะแยกเป็น “nieong” เลยคิดว่าน่าจะค้นหา “Naver” ได้อยู่แล้ว ส่วนกรณีที่ term จริงเป็น “neng” เอง ก็น่าจะค้นหาเจอเหมือนกันครับ
ดูเหมือนว่าคุณเองก็มักจะไปโปรโมตตัวเองในแกลเลอรีของเว็บอื่นเหมือนกัน เช่น Age of the Six Dragons หรือ Web Three Kingdoms Musou Chronicle
จากที่เห็นว่าคุณเอางานที่ยังทำไม่เสร็จมาใช้เป็นเหมือนของให้ลองชิม และหลังจากนั้นก็ทิ้งโปรเจกต์นั้นได้อย่างง่ายดาย ผมก็เลยรู้สึกว่าแล้วมันต่างจากโพสต์นี้ตรงไหนกัน.. ทำไมถึงใช้มาตรฐานที่เข้มงวดกับคนอื่นล่ะ
เพราะคิดว่า DC Inside เป็นที่ที่เด็ก ๆ มาเล่นกัน จะทำตามใจยังไงก็ได้ แต่ GeekNews เป็นที่ที่คุณผูกพัน เลยทนไม่ได้ถ้ามีใครมาทำให้สกปรกอย่างนั้นเหรอ
ไม่ได้อยากพูดแบบมีเหตุผลอะไรเป็นพิเศษหรอก แค่รู้สึกว่าอาการมาตรฐานสองชั้นนี่มันแปลกใหม่ดีเลยพูดขึ้นมา ดังนั้นถ้าคุณจะเถียง ก็ถือว่าคุณพูดถูกครับ สู้ ๆ กับการปั่นยอดนะครับ.
แต่เดิมในภาคธุรกิจมีกรณีที่อ่านงานวิจัยแล้วนำไปลงมือพัฒนาใช้งานเองโดยตรงด้วยเหรอครับ..?