- สไตล์ภาษาอังกฤษแบบเป็นทางการที่หล่อหลอมจากระบบการศึกษาของเคนยา มักถูกมองว่าดูเหมือนงานเขียนที่ AI สร้างขึ้นอยู่เสมอ
- การฝึกฝนเชิงโครงสร้างในการสอนการเขียนภาษาอังกฤษ เน้นความสมดุลของประโยค ลำดับเหตุผล และการใช้คำเชื่อม จนทำให้เกิด ผลลัพธ์ที่คล้ายกับงานเขียนของ AI
- สไตล์นี้เป็น มรดกจากการสอนภาษาอังกฤษแบบอังกฤษในยุคอาณานิคม และยังคงอยู่ในฐานะสัญลักษณ์ของสถานะทางสังคมและความมีการศึกษา
- ชี้ให้เห็นปัญหาที่เกิดจาก อคติของตัวตรวจจับ AI และโมเดลภาษา ซึ่งตัดสินว่างานเขียนของผู้ที่ไม่ได้เป็นเจ้าของภาษาเป็นงานที่ ‘ไม่ใช่มนุษย์’
- เน้นว่า สิ่งที่ปรากฏผ่านการเขียนไม่ใช่เครื่องจักร แต่คือ ผลผลิตของประวัติศาสตร์ การศึกษา และอัตลักษณ์ทางภาษา
ความเข้าใจผิดระหว่าง AI กับการเขียนของมนุษย์
- ผู้เขียนเริ่มต้นจากประสบการณ์ที่ได้รับคำวิจารณ์ต่อข้อเสนอของตนว่า “เหมือน ChatGPT เขียน”
- เพราะสไตล์การเขียนมีโครงสร้างและเป็นเหตุเป็นผล จึงถูกประเมินว่า ‘ขาดความเป็นมนุษย์’
- นักเขียนจำนวนมากเผชิญปฏิกิริยาแบบเดียวกัน และสิ่งนี้เชื่อมโยงกับ อคติต่อนักเขียนที่ไม่ได้เป็นเจ้าของภาษา
- ผู้เขียนอธิบายว่าเหตุผลที่งานเขียนของตนคล้าย AI ก็เพราะว่า AI เรียนรู้จากรูปแบบการศึกษาของพวกเขา
การก่อรูปของการสอนภาษาอังกฤษแบบเคนยา
- KCPE (Kenya Certificate of Primary Education) ซึ่งเป็นข้อสอบการเขียนภาษาอังกฤษ มีบทบาทสำคัญต่อการฝึกเขียน
- หากต้องการได้คะแนนสูงจากข้อสอบเต็ม 40 คะแนน จำเป็นต้องฝึก คำศัพท์ที่หลากหลายและโครงสร้างประโยคซับซ้อน
- กฎการเขียนสรุปได้เป็นสามข้อ
- เริ่มด้วยสุภาษิตหรือประโยคที่หนักแน่น, ใช้คำศัพท์ให้หลากหลาย, และ รักษาโครงสร้างให้สมบูรณ์แบบ
- ครูทำหน้าที่เสมือน ‘อัลกอริทึมต้นฉบับ’ ที่ใช้ปากกาแดงแก้ไวยากรณ์และโครงสร้าง
- การฝึกเช่นนี้เน้น การสร้างประโยคที่มีตรรกะและสมดุล และยังดำเนินต่อไปในระดับมัธยมและมหาวิทยาลัย
มรดกจากอาณานิคมและลำดับชั้นของภาษา
- การสอนภาษาอังกฤษในเคนยามีที่มาจาก ระบบภาษาของจักรวรรดิอังกฤษ
- ให้ความสำคัญกับความถูกต้องตามไวยากรณ์และความเป็นทางการ โดยยึด ‘Queen’s English’ เป็นมาตรฐาน
- แม้หลังได้รับเอกราช ภาษานี้ก็ยังคงอยู่ในฐานะ ภาษาทางการและสัญลักษณ์ของสถานะทางสังคม
- การพูดและเขียนภาษาอังกฤษอย่างประณีตกลายเป็น เกณฑ์แบ่งระดับการศึกษาและชนชั้น
- ผลก็คือ สไตล์ทางการจำนวนมหาศาลที่ AI เรียนรู้มี รูปแบบคล้ายกับผลผลิตของการสอนภาษาอังกฤษแบบเคนยา
อคติและข้อจำกัดของตัวตรวจจับ AI
- ตัวตรวจจับ AI ใช้เกณฑ์ ‘perplexity (ความสามารถในการคาดเดา)’ และ ‘burstiness (ความหลากหลายของความยาวประโยค)’ ในการตัดสิน
- โครงสร้างประโยคที่คาดเดาได้และจังหวะที่สม่ำเสมอมักถูกมองว่า ไม่เป็นมนุษย์
- แต่การศึกษาแบบเคนยากลับยกให้ สไตล์ที่คาดเดาได้และสมดุล นี้เป็นอุดมคติ
- งานวิจัยพบว่า ตัวตรวจจับลักษณะนี้มี แนวโน้มจัดงานเขียนของผู้ที่ไม่ได้เป็นเจ้าของภาษาเป็นงานที่ AI สร้างขึ้นอย่างผิดพลาด สูง
- สิ่งนี้สะท้อนให้เห็น อคติทางเทคโนโลยีที่กีดกันความหลากหลายทางภาษา
การนิยามความเป็นมนุษย์และภาษาใหม่
- งานเขียนของนักเขียนชาวเคนยาเป็น ผลลัพธ์ของการศึกษา ประวัติศาสตร์ และวัฒนธรรม ไม่ใช่ของเครื่องจักร
- ผู้เขียนวิจารณ์ความจริงที่ว่าเกณฑ์ของ ‘การเขียนแบบมนุษย์’ ถูกจำกัดไว้เพียง สำนวนไม่เป็นทางการและการแสดงออกแบบอเมริกัน
- นักเขียนจากไนโรบี ลากอส มุมไบ และที่อื่น ๆ ต่างก็มี ธรรมเนียมการเขียนที่ให้คุณค่ากับความแม่นยำและความเป็นเหตุเป็นผล ร่วมกัน
- การตัดสินว่า “ดูเหมือน AI” คือ มุมมองที่ไม่สามารถมองเห็นความเป็นมนุษย์ในรูปแบบอื่นได้
- บทความสรุปด้วยการประกาศว่า นี่แหละคือการเขียนของชาวเคนยา และเป็นวิธีที่สืบต่อกันมานานแล้ว
2 ความคิดเห็น
ความคิดเห็นจาก Hacker News
คนรุ่นเราถูกสอน กฎไม่เป็นลายลักษณ์อักษรของการเขียน ที่ส่งต่อกันจากครูสู่ศิษย์
ประโยคแรกต้องขึ้นต้นด้วยสุภาษิตหรือประโยคที่หนักแน่นเสมอ และต้องใช้คำอย่าง
strode purposefullyแทนคำธรรมดาแต่พอได้เรียนการเขียนในมหาวิทยาลัย ก็ยิ่งถูกผลักไปทาง ประโยคเรียบง่ายและถ้อยคำสั้นกระชับ
ตอนนี้รู้สึกว่าสำนวนแบบ Hemingway คืออุดมคติ ส่วนสไตล์หรูหราของ ChatGPT กลับทำให้อ่านแล้วล้า
ยอมรับฝีมือของคนเขียนนะ แต่ฉันชอบงานเขียนที่ง่ายและชัดเจนมากกว่า
ความหมกมุ่นกับการเขียนประโยคสั้น ๆ ทำลายร้อยแก้วภาษาอังกฤษ
สำหรับคนส่วนใหญ่ ความเรียบง่ายนั้นมีประโยชน์ แต่ปัญหาคือกระแสที่มองว่าประโยคยาว เซมิโคลอน หรือคำศัพท์ที่มีนัยละเอียดอ่อนเป็น “งานเขียนแย่”
ทัศนคติแบบนี้ขัดขวางการเติบโตทั้งของผู้อ่านและนักเขียน
แต่คำอย่าง
proceeded toก็ยังห่วยอยู่ดี การบังคับให้นักเรียนใช้คำที่ทำให้ “ดูฉลาด” คือวิธีสอนที่แย่มากภรรยาของฉันเป็นนักเขียน เธอบอกว่าในแฟนฟิกกับนิยายโรแมนซ์มีคำว่า
strodeโผล่บ่อยผิดปกติ การเขียนว่าทุกคน “ก้าวเดินอย่างสง่างาม” ตลอดเวลาคืออาการคลาสสิกของมือสมัครเล่นในสไตล์การเขียนมี สัญญาณทางชนชั้น ซ่อนอยู่
อย่างที่บทความบอก ภาษาอังกฤษที่เราเรียนกันคือ ‘Queen’s English’ จากยุคจักรวรรดินิยม เป็นภาษาของอำนาจ
การเรียนรู้ความงามเชิงรูปแบบของงานเขียนไม่ได้มีไว้แค่สอบผ่าน แต่เป็นการพิสูจน์ว่าตัวเองเป็น “ผู้มีอารยธรรม”
กระแสการเขียนก็คล้าย วัฏจักรแฟชั่น ในสังคม พอสำนวนหรูหรากลายเป็นของแพร่หลาย ชนชั้นสูงก็หันไปใช้สำนวนเรียบง่ายเพื่อสร้างความแตกต่าง
สไตล์แบบ Hemingway ที่ประหยัดถ้อยคำ ก็เหมือน ‘กางเกงยีนส์ขาดราคา 1000 ดอลลาร์’ เป็นความจงใจดูสมถะที่มีแต่คนมีฐานะเท่านั้นที่ทำได้
ฉันเคยทำงานในหนึ่งในบริษัท Big Three และสไตล์ของ ChatGPT ก็เหมือน ภาษารายงานประเมินตนเอง ที่บริษัทสอนเป๊ะ
หัวใจของการเลื่อนตำแหน่งไม่ใช่ผลงาน แต่คือการ “แพ็กเรื่องเล่า” ให้ดูดี
คุณเป็นคนอเมริกันหรือเปล่า? ต่อให้เป็นโลกที่ใช้ภาษาอังกฤษเหมือนกัน ก็ยังมี ความต่างทางวัฒนธรรมระหว่างอังกฤษกับอเมริกา มาก
คนอเมริกันจะโอ้อวดน้อยกว่าและพูดตรงกว่า ขณะที่อังกฤษยังมีแนวโน้มใช้ภาษาอลังการและประดับประดา
จากที่ฉันรู้สึกเอง คลังคำศัพท์ของคนอังกฤษกำลังลดลงเรื่อย ๆ ตามรุ่น
งานเขียนมีอยู่สองจุดมุ่งหมาย
(1) การเขียนเพื่อสื่อสารความคิด — ยิ่งเรียบง่ายยิ่งดี เหมือนบทความของ Paul Graham ที่ข้อมูลไหลเข้าหัวได้แทบไร้แรงเสียดทาน
(2) การเขียนเพื่อแสดงตัวตน — สำนวนหรูหราและเป็นศิลปะย่อมเหมาะกว่า
อย่างที่ David Foster Wallace พูด แบบแรกคือการเขียนเพื่อสื่อสารเหมือนการสนทนา ส่วนแบบหลังคือการเขียนคล้ายไดอารีที่ตะโกนว่า “นี่แหละฉัน!”
น่าสนใจที่ข้อมูลส่วนใหญ่สำหรับการฝึก LLM ถูก คัดสรรในเคนยา
ถ้าข้อมูลถูกสร้างในญี่ปุ่น บางที ChatGPT อาจลงท้ายแบบญี่ปุ่นอย่าง “Don’t you agree?” ก็ได้
บทความที่เกี่ยวข้อง
อิทธิพลของผู้เขียนตำราเรียนชาวอินเดีย Malkiat Singh มีมาก
หนังสือของเขาเป็นตำรามาตรฐานในเคนยา และเมื่อลูกศิษย์ของเขากลายมาเป็นผู้คัดสรรข้อมูล LLM สำนวนแบบนั้นก็ซึมเข้าสู่ AI ทั่วโลก
วิกิของ Malkiat Singh
(สั้น ๆ) ก็คงหลีกเลี่ยงไม่ได้
ดูเหมือน 樣 กำลังเตรียมมีม “ChatGPT (Japan)” อยู่ XD
แต่การติดป้ายกำกับข้อมูลนั้นเป็นคนละเรื่องกับ ข้อมูลฝึกสำหรับการสร้างข้อความ ของ LLM หลายคนเข้าใจผิด
ฉันไปอ่าน คู่มือสไตล์ ของ City News Bureau แห่งชิคาโกเมื่อปี 1897 มา มีกฎน่าสนใจเยอะมาก
เช่น ห้ามสับสนระหว่าง
nightกับeveningและไม่ควรใช้veryโดยไม่จำเป็นกฎจุกจิกแบบนี้สะท้อนสำนึกทางภาษาของยุคนั้นได้ดี
veryอยู่จนถึงทุกวันนี้ในสายตาฉัน สำนวนของบทความนี้ดูไม่เหมือน ChatGPT เลย
หลายคนมองการใช้ em-dash (—) เป็นร่องรอยของ AI แต่จริง ๆ มันเป็นสัญญาณที่อ่อนมาก
ตรงกันข้าม ChatGPT มักสร้าง น้ำเสียงที่โอเวอร์ และความ “ยิ่งใหญ่ที่กลวงเปล่า”
พอลองเทียบย่อหน้าจริง ๆ เวอร์ชัน AI จะดูหรูหรากว่า แต่รู้สึกจริงใจน้อยกว่า
บทความนี้อ่านดูดติดมาก ส่วนผลลัพธ์จาก GPT ส่วนใหญ่แค่เกินหนึ่งย่อหน้าฉันก็หลุดโฟกัสแล้ว
อ่านจบแล้วเหมือนไม่มีอะไรเหลืออยู่เลย
ความต่างระหว่าง LLM กับมนุษย์คือ ความสามารถในการใช้คำจำนวนมากโดยไม่ได้พูดอะไรเลย
ถ้าเอาประโยคที่ดีอยู่แล้วไปให้ GPT “ปรับปรุง” มันก็ย่อมทำให้ยืดยาวขึ้นเป็นธรรมดา
ต้นฉบับมีการตกแต่งเชิงโครงสร้างแต่ความหมายยังมีชีวิตอยู่ ส่วนข้อความที่ AI เขียนมีความหนาแน่นของข้อมูลต่ำและน่าเบื่อ
การไล่ล่า em-dash แบบไม่ลืมหูลืมตาเป็นพฤติกรรมของคนที่ไม่เข้าใจไวยากรณ์
ศิลปินกับยูทูบเบอร์ก็เจอปัญหาเดียวกัน
ตอนนี้มีปรากฏการณ์ที่ผู้คน ถูกเข้าใจผิดว่าเป็น AI มากขึ้นเรื่อย ๆ
เอาเข้าจริงคงมีนักพากย์ที่เสียงานเพราะเสียงของตัวเองฟังคล้ายเสียง AI อยู่เหมือนกัน
ฉันก็ลงวิดีโอ Factorio แล้วมีคนดูบางคนคอมเมนต์ว่า “เสียง AI น่ารำคาญ”
ทั้งที่จริงฉันพูดเอง และท้ายวิดีโอก็มีหน้าฉันโผล่มาด้วย
เสียง AI นั้น ไร้อารมณ์และออกเสียงแปลก ๆ เลยจับได้ไม่ยาก
ช่วงนี้วิดีโอสอนหลายคลิปเป็นแค่การอ่านสคริปต์ที่ AI เขียนแบบตรง ๆ จนกลายเป็น ‘วิดีโอไร้เนื้อหา’
เพราะงั้นตอนนี้ฉันเลยดูเฉพาะคลิปจากครีเอเตอร์ที่ไว้ใจเท่านั้น
ลิงก์วิดีโอของฉัน
ถ้ารูปหน้าคนจริงถูกเอาไปใช้สร้างภาพ AI โดยไม่ได้รับอนุญาต Pierce Brosnan น่าจะเป็นคนแรกที่ควรได้ค่าชดเชย
ในทีมเราก็มีเพื่อนร่วมงานคนหนึ่งที่พูดเหมือน ChatGPT
ทั้งใน WhatsApp และ Zoom น้ำเสียงเขา เป็นเครื่องจักรเกินไป จนฉันไปถาม Meta AI แล้วมันตอบว่า “เหมือนข้อความที่ AI เขียน”
แต่เขาบอกว่าไม่ได้ใช้ AI จริง ๆ และพอมาคิดดูตอนนี้ก็อาจจะเป็นแบบนั้นจริง
แต่การ ให้ AI มาตัดสินว่าอะไรคือ AI มันก็ไม่สมเหตุสมผล นั่นเท่ากับถามตัวมันเอง
ฉันเองก็เคยมีประสบการณ์แบบ “ChatGPT เขียนเหมือนฉัน”
ฉันใช้รายการและการจัดรูปแบบบ่อย และชอบงานเขียนที่เป็นมิตรกับคนอ่านยาก
พอย้อนไปดูโน้ตที่เขียนในปี 2019 ก็ยังให้ความรู้สึกเหมือน ChatGPT อยู่แล้ว
บางทีก็จงใจใส่คำสะกดผิดหรือ สไตล์นอกกรอบ ปนลงไปด้วย
พูดกันตรง ๆ ถ้างานเขียนของคุณแยกไม่ออกจากเอาต์พุตมาตรฐานของ ChatGPT นั่นคืองานเขียนที่ไม่ดี
ต่อให้จริง ๆ ไม่ได้ใช้ AI ก็ยังเป็นสไตล์ที่ควรปรับปรุง
ในการศึกษา ควรให้คะแนนดีเฉพาะคนที่เขียนได้ดีกว่า AI เท่านั้น
การตำหนิเพื่อนร่วมงานว่า “พยายามทำให้ตัวเองดูฉลาดแบบ ChatGPT” ก็ดูน่าขำอยู่เหมือนกัน
ประเด็นถกเถียงเรื่อง em-dash น่าสนใจดี
แต่ก่อนฉันเห็นมันแค่ตอน Word เปลี่ยนให้อัตโนมัติ ไม่เคยพิมพ์เองเลย
เพิ่งรู้ครั้งนี้เองว่าบน Windows ต้องกด Alt+0151
เพราะงั้นสำหรับฉัน em-dash ยังเป็น สัญลักษณ์ที่ไม่คุ้นมือ
ตอนนี้ก็เลยเข้าใจแล้วว่าคนอื่นเขียนกันจากคนละสภาพแวดล้อม
จริง ๆ แล้วใน HN ก็มีคนที่ชอบใช้ em-dash มาตั้งแต่ก่อน ChatGPT แล้ว
ตารางอันดับผู้ใช้ em-dash ใน HN
ฉันเปิด Typo mode ใน emacs ให้แทรก en/em dash กับ smart quotes อัตโนมัติ
ฉันลองวิเคราะห์ชุดข้อมูล HN แล้วพบว่าหลัง AI แพร่หลาย ปริมาณการใช้ em-dash ก็ไม่ได้เพิ่มขึ้น
แต่ โครงประโยคแบบวงเล็บซ้อนมากเกินไป เป็นลักษณะของทั้ง AI และงานเขียนที่ยังไม่ชำนาญ
เคยมีครั้งที่
--ในแอปโน้ตของ macOS ถูกเปลี่ยนเป็น—อัตโนมัติจนคำสั่งเทอร์มินัลรันไม่ผ่านฉันทึ่งกับทักษะภาษาอังกฤษของ OP
คนที่ไม่ได้เป็นเจ้าของภาษาส่วนใหญ่เรียน ภาษาอังกฤษเชิงวรรณศิลป์ ในโรงเรียน เลยคุ้นกับสำนวนเป็นทางการ
ฉันเองก็เรียนมาแบบนั้นในฝรั่งเศส แต่พอทำงานสาย IT ก็เปลี่ยนมาใช้ ภาษาอังกฤษแบบอเมริกันที่ตรงไปตรงมา
บทความนี้ไม่ใช่สิ่งที่ ChatGPT เขียน เพราะมันไม่มีการประดับเกินจำเป็นและมีความหนาแน่นของข้อมูลสูง
งานเขียนของ AI มักทำให้ฉันข้ามไปเกินครึ่ง แต่บทความนี้เป็นแบบ ไม่อยากพลาดแม้แต่คำเดียว
มันเหมือนเป็น คำสาป ของคนที่เขียนเก่ง
เพราะ ChatGPT ถูกออกแบบมาให้เลียนแบบ “งานเขียนที่ดี” ยิ่งคนเขียนเก่งก็ยิ่งถูกเข้าใจผิดว่าใช้ AI
ฉันเคยเห็นแม้แต่งานเขียนที่มีข้อผิดพลาดทางไวยากรณ์เยอะก็ยังโดนด่าว่าฟังเหมือน ChatGPT
มีข้อมูลที่เปิดเผยต่อสาธารณะว่า ChatGPT ถูกฝึกด้วยภาษาอังกฤษเชิงธุรกิจแบบแอฟริกัน
บทความที่เกี่ยวข้อง
ถ้าคำนิยามของ “เขียนดี” คือ สำนวนเยิ่นเย้อ ปลอดภัย และเลี่ยงการถูกวิจารณ์ ก็อาจใช่
จริง ๆ แล้ว LLM เขียนได้ไม่ดีกว่ามนุษย์
มันยังพลาดไวยากรณ์พื้นฐานอย่าง
a/anบ่อย ๆ และยังใช้ สำนวนละความหมาย อย่างbecause trafficอยู่แค่นี้ก็พอจะเห็นแล้วว่าความสามารถของมนุษย์ในการปรับความหมายอย่างละเอียดอ่อนยังเหนือกว่า
ข้อความของ OP ไม่มีความรู้สึกประดิษฐ์แบบที่เป็นลักษณะเฉพาะของ LLM
การใช้ em-dash ก็ดูเป็นธรรมชาติ และ มีอารมณ์ส่วนตัวอยู่ในนั้น
ฉันไม่ชอบสไตล์แบบ ChatGPT
มันทำให้อ่านแล้วล้าเหมือนข้อความการตลาด และเหลือไว้แค่ ความหรูหราที่กลวงเปล่า
งานเขียนแบบนี้ทำให้ผู้อ่านเหนื่อยและสื่อสารข้อมูลได้แย่ลง
เลยแปลกใจที่ในเคนยาสอนสไตล์แบบนี้
ประโยคที่ว่า “ฉันไม่ได้เขียนเหมือน ChatGPT แต่ ChatGPT เขียนเหมือนฉัน” น่าประทับใจมาก
ท้ายที่สุดแล้วเราคงหนีไม่พ้นชะตาที่จะ พูดและเขียนเหมือน ChatGPT มากขึ้นเรื่อย ๆ
เด็ก ๆ จะให้ AI ทำการบ้าน ผู้ใหญ่จะให้มันช่วยเขียนเรซูเม่กับให้คำปรึกษา และแม้แต่เวลาคุยกันก็จะเริ่มพูดว่า “นั่นก็จริงนะ เดี๋ยวฉันสรุปเหตุผลให้สามข้อ”
(อีโมจิเครื่องหมายถูก) เพิ่มอีโมจิให้มากขึ้น — มนุษย์รักอีโมจิ
(อีโมจิกากบาทสีแดง) หลีกเลี่ยงคำเชิงลบอย่าง “bullshit”
(อีโมจิชูนิ้วโป้ง) อีกไม่นานเราจะก้าวข้ามการเรียนรู้จากฟีดแบ็กมนุษย์ได้แล้ว (ยิ้ม)
เป็นบทความที่น่าสนุกดี