- เครื่องมือตรวจไวยากรณ์แบบโอเพนซอร์ส เป็นผลิตภัณฑ์ที่ใช้แทนบริการเชิงพาณิชย์ชื่อดังอย่าง Grammarly ได้
- ทุกคนสามารถใช้งานได้ ฟรี และมีการเปิดเผยโค้ดกับอัลกอริทึมอย่างโปร่งใส
- มีความสามารถในการตรวจจับและแก้ไขปัญหา ไวยากรณ์ สไตล์ และการสะกดคำ ในข้อความภาษาอังกฤษโดยอัตโนมัติ
- เหมาะกับผู้ใช้หลากหลายกลุ่ม เช่น นักพัฒนา นักเขียน และนักเรียน พร้อมความเป็นไปได้ในการปรับแต่งได้อย่างอิสระ
- สามารถโฮสต์เซิร์ฟเวอร์เองและรันแบบโลคัลได้ จึงมีข้อได้เปรียบด้าน ความเป็นส่วนตัว และการปกป้องข้อมูล
แนะนำ Harper
- Harper เป็น เครื่องมือตรวจไวยากรณ์และสไตล์แบบโอเพนซอร์ส ที่ให้ความสามารถคล้ายกับ Grammarly
- ให้บริการฟรีทั้งหมด และทุกคนสามารถตรวจสอบและนำซอร์สโค้ดไปใช้งานได้อย่างอิสระ
- มีฟีเจอร์ ปรับแก้ข้อความภาษาอังกฤษ เช่น ตรวจการสะกด ตรวจจับข้อผิดพลาดทางไวยากรณ์ และแนะนำการปรับปรุงสไตล์การเขียน
- ผู้ใช้สามารถติดตั้ง Harper บนเซิร์ฟเวอร์ภายในหรือโครงสร้างพื้นฐานของตนเอง เพื่อเสริม ความเป็นส่วนตัวของข้อมูล ได้
- มีความยืดหยุ่นในการขยายและปรับแต่งสูง ทำให้ แก้ไขอัลกอริทึมและเพิ่มฟีเจอร์ ให้ตรงกับความต้องการได้ง่าย
ฟีเจอร์หลักและจุดเด่น
- เนื่องจากเป็น โครงการโอเพนซอร์ส จึงสามารถบริหารจัดการและปรับปรุงแนวคิดภายในได้โดยไม่ต้องพึ่งพาบริการภายนอก
- แม้จะปรับให้เหมาะกับภาษาอังกฤษเป็นหลัก แต่ก็มีศักยภาพในการขยายการรองรับหลายภาษาในอนาคต
- ได้รับการสนับสนุนจากชุมชนอย่างคึกคัก ทำให้มีการรับฟีดแบ็กและปรับปรุงฟีเจอร์อย่างต่อเนื่อง
- รองรับทั้งแบบเซิร์ฟเวอร์และการติดตั้งใช้งานเอง จึงมอบ ความยืดหยุ่น ได้สูง
กลุ่มผู้ใช้และตัวอย่างการนำไปใช้
- เหมาะสำหรับผู้ใช้ที่ต้องการ ยกระดับคุณภาพการเขียนภาษาอังกฤษ เช่น วิศวกรซอฟต์แวร์ ผู้เขียนเอกสารเทคนิค และนักเรียน
- เป็นประโยชน์ต่อองค์กรที่ต้องการสร้างกระบวนการตรวจแก้เอกสารด้วยตนเอง โดยไม่เปิดเผยข้อมูลส่วนบุคคลให้บริการภายนอก
- มีประสิทธิภาพในสภาพแวดล้อมที่ต้องการการปรับแต่งขั้นสูง เช่น กฎเฉพาะทางหรือการผสานเข้ากับเวิร์กโฟลว์
2 ความคิดเห็น
ความเห็นจาก Hacker News
สำหรับเอกสารส่วนใหญ่ Harper สามารถให้คำแนะนำได้ภายใน 10ms ทำให้อดสงสัยไม่ได้ว่าทำไมคนเราถึงยอมรับหน่วยอย่าง 10l หรือ 10kg ได้อย่างคุ้นเคย แต่กลับรู้สึกขัดกับ 10ms
ชอบแนวทางที่กฎไวยากรถูก hardcode อยู่ในโปรแกรมโอเพนซอร์สและแก้ไขได้ด้วยตัวเอง มากกว่าวิธีที่ไปจูนพรอมป์ต์หรือ hardcode แบบแฝงไว้ในข้อมูลฝึกของ LLM การตั้งค่า LSP สำหรับ Neovim ดูดีมาก เอกสารการรวมกับ Neovim รู้สึกว่าเครื่องมือแบบนี้แหละคืออนาคต มีข้อเสนอว่า Automattic ควรเน้นจุดนี้บนหน้าเว็บไซต์ให้มากกว่านี้
โดยส่วนตัวมองว่าการไม่ใช้ LLM เป็นข้อดีอย่างมาก Grammarly ยิ่งเพิ่มฟีเจอร์ AI ก็ยิ่งไม่เสถียร โดยเมื่อชั่วโมงก่อนเพิ่งบอกให้ลบ comma ออก แต่ถัดมากลับแนะนำให้ใส่กลับเข้าไป ทำให้ดูขาดความสม่ำเสมอ
โมเดลทั่วไปที่อิง LLM มักสับสนเรื่องเครื่องหมายวรรคตอนอยู่บ่อย ๆ และเคยเจอมากับตัวว่ามันเป็นจุดอ่อนที่ชัดเจนแค่ไหน จึงน่าแปลกที่บริการอย่าง Grammarly ปล่อยให้ปัญหานี้คงอยู่
ในช่วงปีที่ผ่านมา ผลการทำนายของ Grammarly กับ gboard แย่มากอย่างเห็นได้ชัด
สงสัยว่ามีเครื่องมือคล้ายกันที่พัฒนาด้วย LLM หรือไม่ LLM ไม่ได้เหนือกว่าเสมอไป แต่ก็น่าสนใจที่จะเปรียบเทียบความต่างของสองแนวทางนี้
มีการแซวว่าการที่คำแนะนำเรื่องเครื่องหมายวรรคตอนเปลี่ยนไปมาตลอดเวลานั้นเหมือนครูสอนภาษาอังกฤษเลย
LanguageTool (คู่แข่งของ Grammarly) ก็เป็นโอเพนซอร์สเช่นกัน และสามารถรันเองบนเครื่องได้ GitHub, Docker image ฉันรัน LanguageTool แบบโลคัลผ่าน Docker container เป็นหลัก แม้จะยังไม่ได้ลองใช้ Harper แบบจริงจัง แต่ก็รู้จักมานานแล้ว ยินดีที่มีตัวเลือกหลากหลาย และอยากให้บนเว็บไซต์ของ Harper ระบุให้ชัดด้วยว่าอย่างน้อยหนึ่งในเครื่องมือคู่แข่งก็สามารถรันแบบโลคัลได้เช่นกัน
ประโยค “Me and Jennifer went to have seen the ducks cousin.” ไม่ถูกตรวจพบข้อผิดพลาดเลยแม้แต่น้อย มีข้อชี้ว่ากฎจำเป็นต้องเสริมอีกมากกว่านี้จึงจะเข้าใกล้ระดับของ Grammarly ได้
ตอนแรกก็ดูน่าประทับใจ แต่หลังลองทดสอบหลายแบบก็สรุปได้ว่าประสิทธิภาพยังแกว่ง เพราะแม้แต่ข้อผิดพลาดพื้นฐานก็คจับไม่ได้
ในทำนองเดียวกัน “My name John. What your name? What day today?” ก็ไม่ถูกจับเป็นข้อผิดพลาดทางไวยากรณ์
มีคนตั้งคำถามว่าประโยคทดสอบแบบนี้สื่อถึงอะไรกันแน่
มีความเห็นว่าถ้ามีเว็บไซต์ให้เดโมหรือทดสอบก่อนดาวน์โหลดหรือติดตั้งส่วนขยายก็คงจะมีประโยชน์มาก ส่วนขยาย Firefox ลิงก์ไปที่หน้านี้ แต่มีปัญหาว่าเมื่อวางข้อความยาว ๆ แล้วการไฮไลต์ทำงานได้ไม่ถูกต้อง
สงสัยว่าทำไมไม่ใช้ LLM กับเครื่องมือเรียนภาษา คิดว่าปัญหาด้านภาษานั้นสามารถฝากให้ LLM จัดการได้ 100% ถามกลับว่าเคยเห็น ChatGPT ทำผิดภาษาอังกฤษบ้างไหม
Grammarly หลังจากเสริมฟีเจอร์ AI แล้ว ก็มีการแนะนำประหลาด ๆ อย่างการแยก “wasn't” ออกเป็น “was trulyn't” ภาพที่เกี่ยวข้อง
ความผิดพลาดของ LLM นั้นพบเห็นได้บ่อยพอสมควร และบางครั้งก็มีคำแนะนำที่หลุดโลกมาก แน่นอนว่าส่วนใหญ่มันทำงานได้ดีมาก แต่ยังไม่ถึงระดับที่ “เชื่อถือได้” อย่างแท้จริง และบางครั้งยังมีแนวโน้มจะเลียนแบบความผิดของผู้ใช้ตามไปด้วย
มีข้อชี้ว่าเครื่องมือเรียนภาษาประเภทนี้โดยเนื้อแท้แล้วมักถูกใช้เพื่อหลีกเลี่ยงการ “เรียนภาษาอย่างแท้จริง”
สงสัยว่าตลาดเป้าหมายของ Grammarly คือใคร ไม่แน่ใจว่ากลุ่มเป้าหมายคือคนทำงานสายอาชีพที่ใช้อังกฤษเป็นภาษาที่สองหรือไม่
มีการแนะนำว่ามี LSP server ที่ยอดเยี่ยมซึ่งสามารถตรวจไวยากรณ์ในคอมเมนต์ของโค้ดได้ด้วย เอกสาร LSP
เนื่องจากเป็นผลิตภัณฑ์ของ Automattic จึงมีคนลังเลจะใช้ เพราะกังวลว่าถ้าประสบความสำเร็จ Matt อาจทำมันพังเพื่อผลประโยชน์
มีการโต้แย้งว่าเพราะมันเป็นโอเพนซอร์ส (FOSS) ต่อให้เกิดกรณีเลวร้ายที่สุด ชุมชนก็ยังสามารถ fork เวอร์ชันสุดท้ายที่ยังดีอยู่แล้วพัฒนาต่อได้
มีจุดยืนหนักแน่นว่าจะไม่ใช้เพราะข้อเท็จจริงนี้เองที่ว่ามันเป็นผลิตภัณฑ์ของ Automattic
อ๊ากก ไม่ใช่ 10l แต่เป็น 10L!