ChatGPT คือ JPEG เบลอของเว็บ

xguru · 2023-02-14T13:46:32+09:00

บทความโดย เท็ด เชียง นักเขียนนิยายวิทยาศาสตร์ที่ได้รับการยกย่องว่าเป็นหนึ่งในผู้เขียนที่ดีที่สุดในยุคนี้ เนื้อหาว่า ChatGPT เก็บข้อมูลด้วยการบีบอัด จึงคล้ายกับการมองภาพ JPEG ที่เบลอ ไม่ใช่ต้นฉบับ ในปี 2013 มีการพบว่าเครื่องถ่ายเอกสาร Xerox เปลี่ยนตัวเลขในแบบแปลนให้กลายเป็นเลขอื่นตอนคัดลอก ปัญหาเกิดจากกระบวนการแปลงเป็นดิจิทัลเพื่อถ่ายสำเนา ซึ่งใช้การบีบอัดแบบสูญเสียข้อมูลของ JBIG2 โดยเก็บตัวเลขที่คล้ายกันไว้เพียงตัวเดียวแล้วนำกลับมาใช้ซ้ำ แม้จะยากที่จะบอกว่ากรณีนี้เหมือนกับ ChatGPT ของ OpenAI อย่างชัดเจน แต่สถานการณ์คล้ายกันอาจเกิดขึ้นได้เมื่อเก็บข้อมูลจากเว็บ ลองจินตนาการว่าคุณสูญเสียสิทธิ์เข้าถึงอินเทอร์เน็ต คุณต้องการบีบอัดข้อความทั้งหมดบนเว็บเพื่อสร้างสำเนาเก็บไว้ แต่มีพื้นที่เพียง 1% ของขนาดที่ต้องใช้ จึงจำเป็นต้องบีบอัดและอาจต้องใช้อัลกอริทึมแบบสูญเสียข้อมูล ตอนนี้คุณค้นหาทุกอย่างได้ แต่เพราะข้อความถูกบีบอัดมากเกินไป จึงไม่สามารถค้นหาคำอ้างอิงที่ตรงเป๊ะได้ มองว่า ChatGPT คือ JPEG เบลอของข้อความทั้งหมดบนเว็บ มันเก็บข้อมูลจากเว็บไว้ได้มากเหมือน JPEG แต่ไม่ได้รักษาลำดับบิตให้เหมือนเดิมทุกประการ ทุกอย่างที่คุณได้รับจึงเป็นเพียงค่าประมาณ แต่เพราะค่าประมาณนี้ถูกส่งออกมาในรูปแบบข้อความที่ไวยากรณ์ดีเยี่ยมที่ ChatGPT สร้างขึ้น จึงมักถูกยอมรับ การบีบอัดแบบสูญเสียข้อมูลนี้ไม่ใช่วิธีเดียวในการทำความเข้าใจความสามารถของ ChatGPT แต่ก็เป็นวิธีหนึ่งในการทำความเข้าใจ "ภาพหลอน" หรือคำตอบไร้สาระเกี่ยวกับความจริงที่ ChatGPT สร้างขึ้น ภาพหลอนเหล่านี้น่าเชื่อถือมากพอ จนเหมือนกับตัวเลขผิด ๆ ที่เครื่อง Xerox สร้างขึ้น ซึ่งต้องเทียบกับต้นฉบับจึงจะรู้ว่าไม่จริง โมเดลภาษาขนาดใหญ่ระบุความสม่ำเสมอเชิงสถิติของข้อความ วลีอย่าง "อุปทานลดลง" มักปรากฏใกล้กับประโยคอย่าง "ราคาสูงขึ้น" แชตบอตที่เห็นความสัมพันธ์นี้บ่อยครั้ง เมื่อถูกถามถึงผลของภาวะขาดแคลนอุปทาน ก็จะตอบเรื่องราคาที่เพิ่มขึ้น เพียงเพราะ LLM (โมเดลภาษาขนาดใหญ่) รวบรวมความสัมพันธ์จำนวนมากระหว่างศัพท์เศรษฐศาสตร์ไว้ได้ เราจะบอกว่ามันเข้าใจทฤษฎีเศรษฐศาสตร์จริง ๆ ได้หรือ? โมเดลอย่าง ChatGPT ไม่ได้ทำการบีบอัดแบบไม่สูญเสียข้อมูล กล่าวคือ มันไม่สามารถสร้างข้อความต้นฉบับกลับมาได้อย่างแม่นยำ เมื่อ GPT-3 ทำโจทย์บวกหรือลบตัวเลขคู่หนึ่ง ถ้าเป็นเลข 2 หลักก็มักตอบถูกเกือบตลอด แต่ถ้าเป็นเลข 5 หลัก ความแม่นยำจะลดลงมากจนเหลือ 10% เพราะบนเว็บไม่ได้มีหน้าเว็บจำนวนมากที่มีข้อความอย่าง "245 + 821" แม้จะรวบรวมข้อมูลจำนวนมหาศาล มันก็ยังไม่สามารถอนุมาน "หลักการของเลขคณิต" ได้ ลองจินตนาการดูว่า ChatGPT เป็นอัลกอริทึมแบบไม่สูญเสียข้อมูล ถ้าเป็นเช่นนั้น มันก็คงตอบคำถามด้วยการยกข้อความบางส่วนจากหน้าเว็บที่เกี่ยวข้องมาแบบตรงตัว เราอาจแค่คิดว่าซอฟต์แวร์นี้ดีกว่าเสิร์ชเอนจินที่มีอยู่เล็กน้อย และคงไม่ประทับใจมากนัก ความจริงที่ว่า ChatGPT ไม่ได้ยกคำจากข้อมูลบนเว็บมาตรง ๆ แต่ถอดความใหม่ ทำให้มันดูเหมือนนักเรียนที่ไม่ได้ท่องสิ่งที่อ่านมา แต่กำลังแสดงความคิดด้วยถ้อยคำของตนเอง นี่สร้างภาพลวงตาว่า ChatGPT เข้าใจเนื้อหา มีการเสนอการใช้งาน LLM มากมาย และถ้ามองมันเป็น JPEG เบลอ ก็อาจช่วยประเมินได้ว่าอะไรเหมาะหรือไม่เหมาะ โมเดลภาษาขนาดใหญ่จะมาแทนการค้นหาแบบเดิมได้หรือไม่? หากจะเชื่อมั่นใน LLM เราต้องรู้ก่อนว่ามันไม่ได้รับข้อมูลจากโฆษณาชวนเชื่อหรือทฤษฎีสมคบคิดมาก่อน (หรือไม่ได้ฝึกด้วยข้อมูลประหลาด) เราต้องรู้ว่า JPEG นี้จับส่วนที่ถูกต้องของเว็บไว้จริง แต่ถึง LLM จะมีเฉพาะข้อมูลที่เราต้องการ ก็ยังมีปัญหาเรื่องความเบลออยู่ดี ความเบลอแบบที่พอรับได้ อาจเป็นการอธิบายข้อมูลเดิมด้วยถ้อยคำอื่น แต่ก็มีความเบลอที่รับไม่ได้อย่างเด็ดขาด เช่น การบิดเบือนข้อเท็จจริงอย่างชัดเจนเมื่อเรากำลังหาความจริง ยังไม่แน่ชัดว่าทางเทคนิคแล้วจะกำจัดความเบลอที่ยอมรับไม่ได้ โดยยังรักษาความเบลอที่ยอมรับได้ไว้ได้หรือไม่ แต่ก็คาดว่าจะได้รู้ในไม่ช้า ต่อให้เราจำกัดไม่ให้ LLM ปลอมแปลงได้ เราควรใช้มันเพื่อสร้างคอนเทนต์บนเว็บหรือไม่? เรื่องนี้มีความหมายก็ต่อเมื่อเป้าหมายของเราคือการนำข้อมูลที่มีอยู่บนเว็บมาห่อใหม่เท่านั้น มีบางบริษัทที่มีอยู่เพื่อทำสิ่งนี้โดยเฉพาะ สิ่งที่เราเรียกว่าโรงงานผลิตคอนเทนต์ ความเบลอของ LLM อาจมีประโยชน์กับพวกเขาในฐานะวิธีหลีกเลี่ยงการละเมิดลิขสิทธิ์ แต่โดยทั่วไปแล้ว สิ่งที่ดีต่อโรงงานคอนเทนต์ มักไม่ดีต่อคนที่กำลังค้นหาข้อมูล การห่อใหม่ลักษณะนี้ที่เพิ่มขึ้น ทำให้การค้นหาอะไรสักอย่างบนออนไลน์ในปัจจุบันยากขึ้น ยิ่งมีข้อความที่สร้างโดย LLM ถูกเผยแพร่บนเว็บมากขึ้น เว็บก็จะยิ่งกลายเป็นเวอร์ชันที่เบลอกว่าเดิม เรายังแทบไม่มีข้อมูลเกี่ยวกับ GPT-4 แต่ถ้าจะคาดเดา คนของ OpenAI น่าจะพยายามคัดออกข้อมูลที่สร้างโดย ChatGPT หรือ LLM อื่น ๆ ตอนรวบรวมข้อความสำหรับฝึกมัน หากเป็นจริง ก็จะช่วยยืนยันว่าการเปรียบเทียบระหว่าง LLM กับการบีบอัดแบบสูญเสียข้อมูลนั้นถูกต้อง เมื่อบีบอัด JPEG ซ้ำ ๆ ข้อมูลจะสูญหายมากขึ้น และเกิดอาร์ติแฟกต์จากการบีบอัดมากขึ้น เหมือนกับการนำสำเนาเก่ามาถ่ายเอกสารซ้ำอีกที คุณภาพมีแต่จะแย่ลง LLM จะช่วยให้มนุษย์สร้างงานต้นฉบับจริง ๆ ได้หรือไม่? ความเห็นของผมคือ การเริ่มจากสำเนาเบลอแทนที่จะเป็นต้นฉบับ ไม่ใช่วิธีที่ดีในการสร้างงานต้นฉบับ ถ้าคุณเป็นนักเขียน คุณจะเขียนงานที่ยังไม่เป็นต้นฉบับจำนวนมากก่อนจะเขียนสิ่งที่เป็นต้นฉบับจริง ๆ เวลาและความพยายามที่ใช้กับงานที่ยังไม่เป็นต้นฉบับนั้นไม่ได้สูญเปล่า ตรงกันข้าม มันคือสิ่งที่ทำให้คุณสามารถสร้างสิ่งที่เป็นต้นฉบับได้ในท้ายที่สุด เวลาที่ใช้เลือกคำให้ถูกต้องและจัดเรียงประโยคใหม่ให้อ่านลื่นไหล จะสอนให้คุณเข้าใจว่าร้อยแก้วสื่อความหมายอย่างไร การให้นักเรียนเขียนเรียงความ ไม่ได้เป็นเพียงวิธีทดสอบว่าพวกเขาเข้าใจเนื้อหาหรือไม่ แต่มันทำให้พวกเขาได้มีประสบการณ์ในการแสดงความคิดของตัวเองให้ชัดเจน ในอนาคต อาจเป็นไปได้ที่จะสร้าง AI ที่เขียนงานได้ดีโดยอาศัยเพียงประสบการณ์ของตัวเองต่อโลก นั่นจะเป็นช่วงเวลาสำคัญ แต่วันที่เราจะไปถึงจุดนั้นยังไกลเกินขอบเขตการคาดการณ์ของเรา หากคุณต้องเก็บสำเนาไว้ในเซิร์ฟเวอร์ที่มีพื้นที่จำกัดโดยไม่มีสิทธิ์เข้าถึงอินเทอร์เน็ต โมเดลภาษาขนาดใหญ่อย่าง ChatGPT อาจเป็นทางออกที่ดี "แต่เราไม่ได้สูญเสียสิทธิ์เข้าถึงอินเทอร์เน็ต แล้วจะมีเหตุผลอะไรที่ต้องใช้ JPEG เบลอ ในเมื่อเรายังมีต้นฉบับอยู่"?

(newyorker.com)

41 คะแนน โดย xguru 2023-02-14 | 26 ความคิดเห็น | แชร์ทาง WhatsApp

บทความโดย เท็ด เชียง นักเขียนนิยายวิทยาศาสตร์ที่ได้รับการยกย่องว่าเป็นหนึ่งในผู้เขียนที่ดีที่สุดในยุคนี้
เนื้อหาว่า ChatGPT เก็บข้อมูลด้วยการบีบอัด จึงคล้ายกับการมองภาพ JPEG ที่เบลอ ไม่ใช่ต้นฉบับ
ในปี 2013 มีการพบว่าเครื่องถ่ายเอกสาร Xerox เปลี่ยนตัวเลขในแบบแปลนให้กลายเป็นเลขอื่นตอนคัดลอก
ปัญหาเกิดจากกระบวนการแปลงเป็นดิจิทัลเพื่อถ่ายสำเนา ซึ่งใช้การบีบอัดแบบสูญเสียข้อมูลของ JBIG2 โดยเก็บตัวเลขที่คล้ายกันไว้เพียงตัวเดียวแล้วนำกลับมาใช้ซ้ำ
แม้จะยากที่จะบอกว่ากรณีนี้เหมือนกับ ChatGPT ของ OpenAI อย่างชัดเจน แต่สถานการณ์คล้ายกันอาจเกิดขึ้นได้เมื่อเก็บข้อมูลจากเว็บ
ลองจินตนาการว่าคุณสูญเสียสิทธิ์เข้าถึงอินเทอร์เน็ต
- คุณต้องการบีบอัดข้อความทั้งหมดบนเว็บเพื่อสร้างสำเนาเก็บไว้
- แต่มีพื้นที่เพียง 1% ของขนาดที่ต้องใช้ จึงจำเป็นต้องบีบอัดและอาจต้องใช้อัลกอริทึมแบบสูญเสียข้อมูล
- ตอนนี้คุณค้นหาทุกอย่างได้ แต่เพราะข้อความถูกบีบอัดมากเกินไป จึงไม่สามารถค้นหาคำอ้างอิงที่ตรงเป๊ะได้
มองว่า ChatGPT คือ JPEG เบลอของข้อความทั้งหมดบนเว็บ
มันเก็บข้อมูลจากเว็บไว้ได้มากเหมือน JPEG แต่ไม่ได้รักษาลำดับบิตให้เหมือนเดิมทุกประการ
ทุกอย่างที่คุณได้รับจึงเป็นเพียงค่าประมาณ
แต่เพราะค่าประมาณนี้ถูกส่งออกมาในรูปแบบข้อความที่ไวยากรณ์ดีเยี่ยมที่ ChatGPT สร้างขึ้น จึงมักถูกยอมรับ
การบีบอัดแบบสูญเสียข้อมูลนี้ไม่ใช่วิธีเดียวในการทำความเข้าใจความสามารถของ ChatGPT
แต่ก็เป็นวิธีหนึ่งในการทำความเข้าใจ "ภาพหลอน" หรือคำตอบไร้สาระเกี่ยวกับความจริงที่ ChatGPT สร้างขึ้น
ภาพหลอนเหล่านี้น่าเชื่อถือมากพอ จนเหมือนกับตัวเลขผิด ๆ ที่เครื่อง Xerox สร้างขึ้น ซึ่งต้องเทียบกับต้นฉบับจึงจะรู้ว่าไม่จริง
โมเดลภาษาขนาดใหญ่ระบุความสม่ำเสมอเชิงสถิติของข้อความ
วลีอย่าง "อุปทานลดลง" มักปรากฏใกล้กับประโยคอย่าง "ราคาสูงขึ้น"
แชตบอตที่เห็นความสัมพันธ์นี้บ่อยครั้ง เมื่อถูกถามถึงผลของภาวะขาดแคลนอุปทาน ก็จะตอบเรื่องราคาที่เพิ่มขึ้น
เพียงเพราะ LLM (โมเดลภาษาขนาดใหญ่) รวบรวมความสัมพันธ์จำนวนมากระหว่างศัพท์เศรษฐศาสตร์ไว้ได้ เราจะบอกว่ามันเข้าใจทฤษฎีเศรษฐศาสตร์จริง ๆ ได้หรือ?
โมเดลอย่าง ChatGPT ไม่ได้ทำการบีบอัดแบบไม่สูญเสียข้อมูล กล่าวคือ มันไม่สามารถสร้างข้อความต้นฉบับกลับมาได้อย่างแม่นยำ
เมื่อ GPT-3 ทำโจทย์บวกหรือลบตัวเลขคู่หนึ่ง ถ้าเป็นเลข 2 หลักก็มักตอบถูกเกือบตลอด แต่ถ้าเป็นเลข 5 หลัก ความแม่นยำจะลดลงมากจนเหลือ 10%
เพราะบนเว็บไม่ได้มีหน้าเว็บจำนวนมากที่มีข้อความอย่าง "245 + 821"
แม้จะรวบรวมข้อมูลจำนวนมหาศาล มันก็ยังไม่สามารถอนุมาน "หลักการของเลขคณิต" ได้
ลองจินตนาการดูว่า ChatGPT เป็นอัลกอริทึมแบบไม่สูญเสียข้อมูล
ถ้าเป็นเช่นนั้น มันก็คงตอบคำถามด้วยการยกข้อความบางส่วนจากหน้าเว็บที่เกี่ยวข้องมาแบบตรงตัว
เราอาจแค่คิดว่าซอฟต์แวร์นี้ดีกว่าเสิร์ชเอนจินที่มีอยู่เล็กน้อย และคงไม่ประทับใจมากนัก
ความจริงที่ว่า ChatGPT ไม่ได้ยกคำจากข้อมูลบนเว็บมาตรง ๆ แต่ถอดความใหม่ ทำให้มันดูเหมือนนักเรียนที่ไม่ได้ท่องสิ่งที่อ่านมา แต่กำลังแสดงความคิดด้วยถ้อยคำของตนเอง
นี่สร้างภาพลวงตาว่า ChatGPT เข้าใจเนื้อหา
มีการเสนอการใช้งาน LLM มากมาย และถ้ามองมันเป็น JPEG เบลอ ก็อาจช่วยประเมินได้ว่าอะไรเหมาะหรือไม่เหมาะ
โมเดลภาษาขนาดใหญ่จะมาแทนการค้นหาแบบเดิมได้หรือไม่?
- หากจะเชื่อมั่นใน LLM เราต้องรู้ก่อนว่ามันไม่ได้รับข้อมูลจากโฆษณาชวนเชื่อหรือทฤษฎีสมคบคิดมาก่อน (หรือไม่ได้ฝึกด้วยข้อมูลประหลาด)
- เราต้องรู้ว่า JPEG นี้จับส่วนที่ถูกต้องของเว็บไว้จริง
- แต่ถึง LLM จะมีเฉพาะข้อมูลที่เราต้องการ ก็ยังมีปัญหาเรื่องความเบลออยู่ดี
- ความเบลอแบบที่พอรับได้ อาจเป็นการอธิบายข้อมูลเดิมด้วยถ้อยคำอื่น
- แต่ก็มีความเบลอที่รับไม่ได้อย่างเด็ดขาด เช่น การบิดเบือนข้อเท็จจริงอย่างชัดเจนเมื่อเรากำลังหาความจริง
- ยังไม่แน่ชัดว่าทางเทคนิคแล้วจะกำจัดความเบลอที่ยอมรับไม่ได้ โดยยังรักษาความเบลอที่ยอมรับได้ไว้ได้หรือไม่ แต่ก็คาดว่าจะได้รู้ในไม่ช้า
ต่อให้เราจำกัดไม่ให้ LLM ปลอมแปลงได้ เราควรใช้มันเพื่อสร้างคอนเทนต์บนเว็บหรือไม่?
- เรื่องนี้มีความหมายก็ต่อเมื่อเป้าหมายของเราคือการนำข้อมูลที่มีอยู่บนเว็บมาห่อใหม่เท่านั้น
- มีบางบริษัทที่มีอยู่เพื่อทำสิ่งนี้โดยเฉพาะ สิ่งที่เราเรียกว่าโรงงานผลิตคอนเทนต์
- ความเบลอของ LLM อาจมีประโยชน์กับพวกเขาในฐานะวิธีหลีกเลี่ยงการละเมิดลิขสิทธิ์
- แต่โดยทั่วไปแล้ว สิ่งที่ดีต่อโรงงานคอนเทนต์ มักไม่ดีต่อคนที่กำลังค้นหาข้อมูล
- การห่อใหม่ลักษณะนี้ที่เพิ่มขึ้น ทำให้การค้นหาอะไรสักอย่างบนออนไลน์ในปัจจุบันยากขึ้น
โฆษณา
ยิ่งมีข้อความที่สร้างโดย LLM ถูกเผยแพร่บนเว็บมากขึ้น เว็บก็จะยิ่งกลายเป็นเวอร์ชันที่เบลอกว่าเดิม
เรายังแทบไม่มีข้อมูลเกี่ยวกับ GPT-4 แต่ถ้าจะคาดเดา คนของ OpenAI น่าจะพยายามคัดออกข้อมูลที่สร้างโดย ChatGPT หรือ LLM อื่น ๆ ตอนรวบรวมข้อความสำหรับฝึกมัน
หากเป็นจริง ก็จะช่วยยืนยันว่าการเปรียบเทียบระหว่าง LLM กับการบีบอัดแบบสูญเสียข้อมูลนั้นถูกต้อง
เมื่อบีบอัด JPEG ซ้ำ ๆ ข้อมูลจะสูญหายมากขึ้น และเกิดอาร์ติแฟกต์จากการบีบอัดมากขึ้น
เหมือนกับการนำสำเนาเก่ามาถ่ายเอกสารซ้ำอีกที คุณภาพมีแต่จะแย่ลง
LLM จะช่วยให้มนุษย์สร้างงานต้นฉบับจริง ๆ ได้หรือไม่?
- ความเห็นของผมคือ การเริ่มจากสำเนาเบลอแทนที่จะเป็นต้นฉบับ ไม่ใช่วิธีที่ดีในการสร้างงานต้นฉบับ
- ถ้าคุณเป็นนักเขียน คุณจะเขียนงานที่ยังไม่เป็นต้นฉบับจำนวนมากก่อนจะเขียนสิ่งที่เป็นต้นฉบับจริง ๆ
- เวลาและความพยายามที่ใช้กับงานที่ยังไม่เป็นต้นฉบับนั้นไม่ได้สูญเปล่า
- ตรงกันข้าม มันคือสิ่งที่ทำให้คุณสามารถสร้างสิ่งที่เป็นต้นฉบับได้ในท้ายที่สุด
- เวลาที่ใช้เลือกคำให้ถูกต้องและจัดเรียงประโยคใหม่ให้อ่านลื่นไหล จะสอนให้คุณเข้าใจว่าร้อยแก้วสื่อความหมายอย่างไร
- การให้นักเรียนเขียนเรียงความ ไม่ได้เป็นเพียงวิธีทดสอบว่าพวกเขาเข้าใจเนื้อหาหรือไม่
- แต่มันทำให้พวกเขาได้มีประสบการณ์ในการแสดงความคิดของตัวเองให้ชัดเจน
ในอนาคต อาจเป็นไปได้ที่จะสร้าง AI ที่เขียนงานได้ดีโดยอาศัยเพียงประสบการณ์ของตัวเองต่อโลก
นั่นจะเป็นช่วงเวลาสำคัญ แต่วันที่เราจะไปถึงจุดนั้นยังไกลเกินขอบเขตการคาดการณ์ของเรา
หากคุณต้องเก็บสำเนาไว้ในเซิร์ฟเวอร์ที่มีพื้นที่จำกัดโดยไม่มีสิทธิ์เข้าถึงอินเทอร์เน็ต โมเดลภาษาขนาดใหญ่อย่าง ChatGPT อาจเป็นทางออกที่ดี
"แต่เราไม่ได้สูญเสียสิทธิ์เข้าถึงอินเทอร์เน็ต แล้วจะมีเหตุผลอะไรที่ต้องใช้ JPEG เบลอ ในเมื่อเรายังมีต้นฉบับอยู่"?

26 ความคิดเห็น

bleu28 2023-02-26

ผมลองถามด้วยการคำนวณบวก-ลบซ้ำๆ ที่มีตัวเลขตั้งแต่ 5 หลักขึ้นไป แล้วมันก็ยังตอบได้ถูกต้องตลอด
แล้วความแม่นยำมันแย่ลงตรงไหนกัน?

flaps3 2023-02-20

ประเด็นที่ Ted Chiang มองข้ามคือ Google Search ซึ่งเคยเป็นวิธีหลักในการสำรวจอินเทอร์เน็ต ได้มีคุณภาพลดลงมากในช่วงไม่กี่ปีที่ผ่านมาเพราะได้รับผลกระทบจากการผลิตคอนเทนต์เว็บคุณภาพต่ำจำนวนมาก
ต่อให้ ChatGPT จะเป็น JPEG เบลอ ๆ ก็ตาม แต่ถ้าทางเลือกมีเพียง Google Search ที่เต็มไปด้วยสัญญาณรบกวน การใช้ ChatGPT เป็นเครื่องมือที่ดีที่สุดในการหาข้อมูล ณ ตอนนี้ก็อาจถือว่าสมเหตุสมผล
มีการบอกว่า "เราไม่ได้สูญเสียสิทธิ์ในการเข้าถึงอินเทอร์เน็ต" แต่ตรงนี้เองคือสมมติฐานที่ผิด ผมมองว่าเมื่อคิดถึงสเกลอันมหาศาลของเว็บ การสูญเสียความสามารถในการสำรวจก็แทบไม่ต่างจากการสูญเสียสิทธิ์ในการเข้าถึง แล้วการมีสิทธิ์เข้าถึงจะมีความหมายอะไร หากเราไม่สามารถค้นหาข้อมูลที่ต้องการได้?
กล่าวคือ สถานการณ์กำลังใกล้เคียงกับการไม่มี "ต้นฉบับ" อยู่แล้ว และนั่นเองคือเหตุผลที่ตอนนี้ผู้คนรู้สึกว่า "ต้องใช้ JPEG เบลอ ๆ"

laeyoung 2023-02-16

ผมคิดว่าคอมเมนต์ที่คุณ lightgreenmaesil ทิ้งไว้ด้านล่างแสดงให้เห็นความแตกต่างระหว่างมุมมองของ Ted Chiang กับคนที่อยู่ฝั่งตรงข้ามได้เป็นอย่างดี

"อย่างแรกเลยคือขนาดก็มากกว่า และยังใช้เวลาดูนานกว่าด้วยครับ ถ้าเป็นรูปภาพอาจจะไม่ค่อยรู้สึกเรื่องเวลาเท่าไร แต่ถ้าเปรียบเป็นหนังสือหนึ่งเล่ม กับการสรุปแก่นสำคัญของหนังสือเล่มนั้นลงในหนึ่งหน้า ก็น่าจะเห็นภาพมากขึ้น"

พอดูจากความนิยมและยอดวิวของคลิปสรุปหนัง 15 นาทีหรือสรุปหนังสือใน YouTube ก็เป็นความจริงที่ว่าผู้คนชอบอะไรแบบนั้น รวมถึง Shorts ด้วย แต่ถ้าคิดว่าสรุปเหล่านั้นสามารถถ่ายทอดต้นฉบับได้ครบถ้วนหรือไม่ ก็น่าจะต้องตอบว่าไม่ เพราะถ้าเป็นคนที่ได้ดูต้นฉบับแล้วเกิดความประทับใจ ก็ย่อมจะรู้สึกได้อย่างมากถึงสิ่งที่หายไปจากบทสรุป

จากมุมมองของ Ted Chiang ซึ่งเป็นนักเขียนนิยาย สิ่งที่ ChatGPT หรือ LLM ทำก็คงให้ความรู้สึกเหมือนเห็นนิยายของตัวเองถูกสรุปเหลือแค่ 1-2 หน้า และเมื่อเห็นคนที่พูดหรือเชื่อว่านิยายทั้งเรื่องอยู่ครบแล้วในข้อความสั้น ๆ แค่นั้น เขาก็คงอดรู้สึกไม่ได้ว่านี่มันใช่หรือ

ในทำนองเดียวกัน ผู้กำกับหนังหรือนักแสดงจะชอบไหมถ้ามีคนดูแค่สรุปหนัง 15 นาทีแทนต้นฉบับ พวกเขาจะนับว่าคนเหล่านั้นได้ดูผลงานของตัวเองแล้วหรือไม่? และถ้าก้าวไปอีกขั้น จนแทบทุกคนรับรู้ว่าสรุป 15 นาทีนั้น "เป็นหนัง" ยิ่งกว่าหนังจริง ๆ จะเกิดอะไรขึ้น? ถ้าสุดท้ายไม่สามารถสร้างหนังต่อไปได้แล้ว สรุป 15 นาทีนั้นจะเอาหนังเรื่องไหนมาดูแล้วสรุปกันล่ะ?

แม้จะเป็นยุคที่ทั้งวิดีโอและตัวหนังสือถูกทำให้เป็นสรุป ดูได้เร็ว และบีบอัดให้ง่ายต่อการเสพ แต่ที่น่าสนใจก็คือมีเพียงดนตรีเท่านั้นที่ยังคงอยู่ในรูปเดิม ไม่มีใครฟังเพลงแบบสรุป ไม่มีใครฟังแบบ 2x หรือกดข้ามช่วงที่ไม่สนุกครั้งละ 10 วินาที

ถ้าอย่างนั้น ในยุคสมัยแบบทุกวันนี้ ผมที่ฟัง Ditto ของ NewJeans แบบ 2x และฟังตัวอย่างล่วงหน้า 1 นาที จะสามารถกลายเป็นแฟนของ NewJeans ได้ไหม? คนอย่างผมที่ฟังแบบบีบอัดและสรุปแล้ว ยังจะพูดได้ไหมว่าได้ฟังเพลงนั้นแล้ว? หรือว่าไม่ได้? หรือจริง ๆ แล้วไม่สำคัญ?

fudiso 2023-02-15

อย่างที่ Ted Chiang เองก็ยกอุปมาเรื่อง JPEG ซึ่งเป็นการบีบอัดแบบสูญเสียมาใช้อธิบาย language model ต่อให้มีต้นฉบับอยู่ ข้อมูลที่ถูกบีบอัดก็ยังจำเป็นอยู่
และถึงแม้ language model จะกลับไปเรียนรู้จากผลลัพธ์ที่ตัวเองสร้างขึ้นอีกครั้ง ก็แทบไม่มีการสูญเสียข้อมูลเลย (แทบไม่มีการอัปเดตพารามิเตอร์ของโมเดลภายใน เพราะเป็นข้อมูลที่เดิมก็รู้อยู่แล้ว จึงแทบไม่เกิดผลในการเรียนรู้)

stdcarrot 2023-02-15

ดูเหมือนว่าคำแปลของคำถามสุดท้ายจะมีความแตกต่างจากต้นฉบับทั้งในด้านถ้อยคำและนัยอยู่บ้าง และเมื่อดูจากฉบับแปลอย่างเดียว ก็ดูเหมือนจะมีหลายคอมเมนต์ที่ตีความเจตนาของต้นฉบับไปต่างออกไป

So just how much use is a blurry jpeg, when you still have the original?
JPEG ที่พร่ามัวจะมีประโยชน์มากแค่ไหน ในเมื่อคุณยังมีต้นฉบับอยู่?

สำหรับผม มันดูเป็นคำถามในเชิงมองหาว่า JPEG มีประโยชน์อย่างไรเมื่อเรามีไฟล์ RAW อยู่แล้ว
แต่พอแปลความเป็นแนวว่า "แล้วจะใช้มันไปทำไม" ก็เลยดูคล้ายกับกำลังพูดว่า มี RAW อยู่แล้วจะใช้ของอย่าง JPEG ไปทำไม

แน่นอนว่าในโลกความเป็นจริง JPEG มีเหตุผลที่ทำให้มันเป็นที่แพร่หลายมากกว่า RAW อยู่แล้ว ดังนั้นผมคิดว่านี่เป็นคำถามที่ควรรวมมุมมองนั้นเข้าไปด้วย

pseudojo 2023-02-15

บางครั้งแม้แต่เอกสารทางการของโอเพนซอร์สหรือเอกสารทางการของ AWS ก็ยังไม่น่าเชื่อถือ จนต้องลองรันเองเพื่อตรวจสอบ หรือถึงขั้นต้องไปเช็กซอร์สโค้ดโดยตรง แล้ว ChatGPT จะยิ่งขนาดไหน... ยิ่งปริมาณข้อมูลมากขึ้นเท่าไร ก็ยิ่งรู้สึกว่าปริมาณการตรวจสอบไขว้ที่มนุษย์ต้องทำเพิ่มขึ้นอย่างไม่จำเป็นมากเท่านั้น

daumkakao 2023-02-15

แยกไม่ออกเหรอครับว่าอันไหนเป็น JPEG อันไหนเป็นต้นฉบับ?

laeyoung 2023-02-16

ขึ้นอยู่กับลักษณะของภาพและอัตราการบีบอัดครับ ถ้าเป็นคนถ่ายภาพ มักจะอยากเก็บไฟล์ต้นฉบับไว้แยกต่างหากจาก JPEG เพราะเวลานำไปแก้ไขและปรับแต่งภายหลัง ช่วงที่สามารถปรับแต่งได้จากไฟล์ JPEG กับจากไฟล์ต้นฉบับนั้นต่างกันมาก

https://www.keptlight.com/does-size-matter/

botplaysdice 2023-02-15

แม้ในตอนนี้ งานที่มนุษย์ส่วนใหญ่กำลังทำเพื่อหาเลี้ยงชีพอยู่ ก็คือการสร้าง JPEG เบลอ ๆ แบบนั้นไม่ใช่หรือครับ

namjun 2023-02-15

ChatGPT น่าทึ่งมากจริง ๆ แต่ก็มีความเป็นมนุษย์มากเกินไป จนให้ความรู้สึกว่าไม่เหมาะกับการค้นหาและการถ่ายทอดข้อมูล

ahwjdekf 2023-02-15

เห็นด้วยมากกับการเปรียบเทียบว่ามันคล้ายกับการมอง JPEG ที่พร่ามัวแทนต้นฉบับ ยกตัวอย่างเช่นเวลาอ่านหนังสือแปล ถ้าการตีความของผู้แปลสะท้อนอยู่มาก ถึงจะรู้สึกกลางทางว่าบางช่วงแปลแปลก ๆ แต่ถ้าคำยังเชื่อมต่อกันลื่นไหลต่อเนื่อง และรู้สึกว่าบริบทโดยรวมพอจะตรงอยู่ ส่วนใหญ่ก็จะอ่านต่อไปเรื่อย ๆ (แต่หลังจากอ่านจบแล้วจะเข้าใจจริงไหมก็เป็นอีกเรื่องหนึ่ง) แต่ไอ้คำแปลที่รู้สึกว่าแปลกนั้น อาจจะไร้สาระอย่างสิ้นเชิงก็ได้ ดังนั้นนี่ไม่ใช่ปัญหาที่ควรมองข้าม สำหรับบางคนการแปลแบบนี้อาจยอมรับไม่ได้ แต่อีกบางคนก็อาจมองว่าอยู่ในระดับที่พอทนได้

norimsu 2023-02-15

อืม คุณภาพภาพแย่มากเลยนะ

tequila 2023-02-15

ผมก็คิดเหมือนกันว่านี่อาจเป็นคำเตือนอย่างหนึ่ง ผมเองก็ใช้มันสารพัดทั้งตอนทำงาน ตอนต้องการคำแนะนำ หรือตอนขัดเกลาประโยค แต่ก็ชัดเจนว่าในบางครั้งมันให้คำตอบที่ดูน่าเชื่อถือแต่กลับผิดพลาดได้จริง ๆ และก็เป็นความจริงอีกเช่นกันว่าผู้ใช้จำเป็นต้องมีความรู้ในสาขานั้น หรือไม่ก็ต้องค้นคว้าเพิ่มเติม จึงจะรู้ได้ว่าคำตอบนี้ผิด บางครั้งก็มีข้อผิดพลาดที่ต้องดูละเอียดมากจริง ๆ ถึงจะสังเกตได้ (เช่น ตอนสร้างโค้ดแล้วดันใช้ฟังก์ชันที่ไม่มีอยู่จริง)
ก่อนจะเจอข้อผิดพลาดแบบนั้น ผมไม่เคยคิดเลยจริง ๆ ว่า AI นี้จะตอบผมในลักษณะนั้น ผมเคยนึกแค่ว่ามันอาจตอบไม่ได้เลย หรือไม่ก็ตอบออกนอกเรื่องเท่านั้น

เมื่อมองว่าแม้แต่ในที่อย่าง Stack Overflow ซึ่งน่าจะมีคนที่เข้าใจเทคโนโลยีลักษณะนี้ค่อนข้างมาก ก็ยังมีแรงเสียดทานเกี่ยวกับคำตอบจาก AI อยู่บ้างเป็นระยะ ๆ ก็คงแปลว่าการตรวจสอบอย่างสมบูรณ์ในหมู่ผู้ใช้อาจไม่ได้เกิดขึ้นอย่างที่คิด การตรวจสอบข้อมูลที่ AI สร้างขึ้นยังจำเป็นต้องมีมนุษย์เข้ามาเกี่ยวข้อง และเป็นงานที่ต้องใช้ทั้งแรงและความรู้ ไม่อย่างนั้น Microsoft ก็คงไม่พลาดข้อผิดพลาดที่ดูน่าเชื่อถือซึ่ง AI ของตัวเองสร้างขึ้น เราจึงรู้ว่าตอนนี้เราควรใช้เทคโนโลยีนี้เป็นเครื่องมือไปก่อน อย่างไรก็ตาม เวลาเราถาม AI ในโทรศัพท์มือถือว่าวันนี้อากาศเป็นอย่างไร เราไม่เคยตั้งสมมติฐานเลยว่าคำตอบนั้นอาจผิดเพราะบั๊กหรือข้อผิดพลาดอื่น ๆ ไม่ใช่หรือ? ถ้า AI อย่าง ChatGPT ค่อย ๆ พัฒนาเป็น AI อเนกประสงค์ที่ใกล้ชิดกับชีวิตประจำวันมากขึ้น โอกาสที่ผู้ใช้จะยอมรับคำตอบของมันโดยแทบไม่ตั้งข้อสงสัยจะสูงขึ้นหรือเปล่า?

ช่วงนี้ในโรงเรียนมีกรณีใช้ ChatGPT และเครื่องมือทำนองเดียวกันเขียนเรียงความแทนกันมากขึ้น ไม่ใช่แค่ใช้เพื่อชี้ข้อผิดพลาด รับหัวข้อไปเขียนต่อ หรือช่วยขยายความเท่านั้น แต่มีกรณีที่นำคำตอบของ AI มาเปลี่ยนแค่บางคำโดยไม่คิดกับโจทย์เอง แล้วก็ได้คะแนนสูง จนกลายเป็นข่าวไปแล้ว ในสถานการณ์ที่ควรให้แสดงความคิดเห็นของตัวเองจากข้อมูลที่ค้นคว้ามา การมอบทั้งความคิด โครงเรื่อง และการเขียนให้ AI จัดการแทนทั้งหมด ถือเป็นกระบวนทัศน์ใหม่อย่างชัดเจน

ต่อให้ไม่พูดถึง AI บางครั้งก็มีข้อมูลผิด ๆ ปรากฏเต็มไปหมดในผลการค้นหาบนอินเทอร์เน็ต และก็มีคนจำนวนมากที่เชื่อว่าเป็นความจริงโดยไม่ตรวจสอบเพิ่มเติม ตัวผมเอง หากไม่ได้อ่านไปพร้อมกับตรวจสอบทีละอย่าง ก็คงเคยเผลอรับข้อมูลผิด ๆ มาไม่น้อยเหมือนกัน
มีคำพูดเล่น ๆ กันบ่อย ๆ เรื่อง “การผุกร่อนของข้อมูล” เช่นเวลารูปภาพบนอินเทอร์เน็ตถูกแชร์วนไปตามเว็บต่าง ๆ ในรูปแบบ jpg แล้วถูกย่อขนาดและบีบอัดซ้ำ ๆ จนคุณภาพภาพเสียหายเละเทะก็มีให้เห็นบ่อย ๆ แม้แต่พื้นหลังสีขาวล้วนยังกลายเป็นสีฟ้าเพี้ยน ๆ ได้เลย
ผมว่าบางทีสิ่งที่กำลังกังวลกันอาจเป็นเรื่องทำนองการเสื่อมสภาพของข้อมูลก็ได้ มีคำพูดว่าเงินเลวย่อมขับไล่เงินดีไม่ใช่หรือ?
ตอนนี้ในเว็บแชร์ภาพต่าง ๆ ก็เต็มไปด้วยภาพที่ AI สร้างขึ้นแล้ว เรื่องนั้นไม่ใช่ว่าผิดอะไร แต่ถ้าอินเทอร์เน็ตถูกเติมจนแน่นไปด้วยบทความแบบประมาณเอาที่ AI เขียนขึ้น และถ้า AI ที่อ้างอิงสิ่งเหล่านั้นกลับมาสร้างบทความใหม่ซ้ำไปอีก การบิดเบือนของข้อมูลอาจค่อย ๆ สะสมเพิ่มขึ้นทีละน้อยหรือเปล่า? ผมก็อดคิดแบบนั้นไม่ได้

rousseau 2023-02-15

ฉันอ่าน SF มาเกิน 30 ปี และเป็นแฟนตัวยงที่ยกให้ 'Story of Your Life' เป็นผลงาน SF ใหม่ที่ดีที่สุดในราว 10 ปีหลังสุดที่ได้อ่าน แต่จากมุมมองของคนในวงการที่ทำงานเป็นนักพัฒนามาเกิน 20 ปี นี่เป็นข้อโต้แย้งที่ผมจำเป็นต้องคัดค้าน

โดยพื้นฐานแล้ว คำพูดนี้ออกมาจากมุมมองที่เรียกได้ว่าหยิ่งยโส ผู้คนจะเข้าใจผิดว่าแพลตฟอร์ม AI อย่าง ChatGPT ไปถึงขอบเขตของการสร้างสรรค์แล้วเพราะ (พวกเขาเขลา) แต่ฉันรู้ว่าไม่ใช่ จึงต้องบอกความจริงที่แท้จริงให้คนเหล่านั้นได้รับรู้ นี่คือมุมมองแบบนั้น

ความจริงที่แท้จริงคือ ไม่ใช่แค่คนในวงการเท่านั้น แต่คนส่วนใหญ่ก็รู้ว่าไม่เป็นเช่นนั้น หลังจาก AlphaGo แล้ว AI ก็กลายเป็นประเด็นสำคัญของสาธารณะมานานมากแล้ว ทุกคนต่างรู้ทั้งศักยภาพและข้อจำกัดของ AI ในระดับหนึ่ง ตอนนี้ในวงการโกะ AI มีแต่ระดับเซียนที่มอง AlphaGo ว่าเป็นแค่ทารกกินนม แต่ก็ไม่มีใครรู้สึกช็อกกับเรื่องนั้น เพราะผู้คนได้เรียนรู้กันมามากแล้วว่ามันมีความหมายอย่างไร และควรรับมันอย่างไร

ผมกลับมองว่าคำพูดของ Ted Chiang นี้เป็นความผิดพลาดที่เกิดจากความไม่รู้และอคติต่อสาธารณชน ผู้คนที่คลั่งไคล้ ChatGPT ไม่ได้ทำเช่นนั้นเพราะเชื่อว่ามันจะมาแทนที่กิจกรรมทางปัญญาของเรา พวกเขารู้กันดีและใช้งานมันในฐานะสิ่งที่จะมาช่วย 'เสริม' กิจกรรมทางปัญญาของเรา มีการแชร์ตัวอย่างพรอมป์ต์กันจนกลายเป็นเหมือนคู่มือ นี่แสดงให้เห็นชัดว่าผู้คนรับรู้ว่ามันคือเครื่องมือ

แล้วผู้คนรับ AI วาดภาพกันอย่างไร? พวกเขาถูมันเหมือนตะเกียงวิเศษเพื่อขอให้มันมาสร้างงานแทนตัวเองหรือ? ราว 90% ของภาพ AI ที่ผมเห็นช่วงนี้เป็นภาพแนวผู้ใหญ่ ถ้ามือวาดได้ไม่ดีก็อาจจะดูเบลออยู่บ้าง แต่ส่วนที่เหลือกลับสะอาดและชัดเจนดีทีเดียว

มีเรื่องอยากพูดอีกมาก แต่เพราะมันมีมากเกินไป ขอพูดแค่ประโยคเดียวแล้วจะจบ

"คุณคิมแดรี ผมมีเรื่องที่อยากให้คำแนะนำสักหน่อย ไม่ใช่อย่างอื่นหรอก อย่าใช้ Excel function? มากเกินไปเลยนะครับ ถ้ามีความสะดวก ความเสี่ยงก็มากขึ้นเช่นกัน จะฆ่าวัวก็ต้องมีคมมีดที่เหมาะสม แล้วถ้าจะฆ่าไก่จำเป็นต้องใช้มีดไหม?...... ความเห็นของผมคือ การคิดเลขในใจก็อาจจะเร็วได้ และแน่นอนว่ามันต่างกันไปในแต่ละคน เครื่องคิดเลขอาจจะดีก็จริง แต่ผมเลยอยากเสนอความเห็นว่า คอมพิวเตอร์มันไม่ใช่มีดสำหรับฆ่าวัวหรอกหรือครับ"

lightgreenmaesil 2023-02-15

คำถามสุดท้ายนั้นผิดประเด็น สิ่งที่ควรนำมาเปรียบเทียบไม่ใช่ JPEG ที่พร่ามัว แต่ควรเป็นการสรุปรูปภาพ JPEG ออกมาเป็นคำพูด ตัวอย่างเช่น ข้อความว่า 'สุนัขแลบลิ้น' เทียบกับรูปถ่ายจริงของมัน นี่ก็เป็นการบีบอัดแบบสูญเสียข้อมูลชนิดหนึ่งเช่นกัน เพราะข้อมูลส่วนใหญ่ถูกลบออกไปและถูกบีบอัดเหลือเพียงข้อความไม่กี่ไบต์ แต่เพราะมีรูปต้นฉบับอยู่แล้ว จึงแปลว่าการบีบอัดแบบสูญเสียข้อมูลนี้ไม่มีคุณค่าหรือไม่? ก็ไม่ใช่ อย่างแรกเลย ขนาดไฟล์ใหญ่กว่า และยังใช้เวลาดูนานกว่าด้วย สำหรับรูปภาพอาจยังนึกภาพเรื่องเวลาได้ไม่ชัดนัก แต่ถ้าคิดเป็นหนังสือหนึ่งเล่มกับการสรุปใจความสำคัญของหนังสือเล่มนั้นลงในหนึ่งหน้า ก็คงเห็นภาพได้ชัดขึ้น

ถ้าอย่างนั้น หากมีบทความวิชาการอยู่หนึ่งฉบับ จะมีเหตุผลไหมที่จะอ่านบทสรุปซึ่งเป็นการบีบอัดแบบสูญเสียข้อมูลของบทความนั้น? แน่นอนว่ามี และบางครั้งก็มีประโยชน์มาก หากมีหนังสืออยู่หนึ่งเล่ม จะมีเหตุผลไหมที่จะใช้บทสรุปเกี่ยวกับข้ออ้างเฉพาะอย่างหนึ่งที่ถูกกล่าวถึงในบทหนึ่งของหนังสือเล่มนั้น? แน่นอนว่ามี ถ้ามองอีกแบบ การที่มนุษย์ไปโรงเรียน ฟังการบรรยายหลายสิบชั่วโมง แล้วสรุปจัดระเบียบลงในโน้ตหรือ cheating sheet ก็เป็นการบีบอัดแบบสูญเสียข้อมูลจากวิดีโอมาเป็นตัวอักษรอย่างมหาศาลเช่นกัน การเรียนรู้เองก็คือการบีบอัดแบบสูญเสียข้อมูล มันไร้ประโยชน์หรือ?

คำว่า 'การบีบอัด' ถูกยกไปเปรียบกับการบีบอัดรูปภาพจนเหมือนเป็นเรื่อง trivial และไม่มีความหมายมากนัก แต่ความจริงแล้ว การบีบอัดเป็นงานที่เป็นแก่นสำคัญและมีความหมายอย่างยิ่งต่อการเรียนรู้ของมนุษย์ ในกรณีของรูปภาพ วิธีการบีบอัดนั้นถูกคลี่คลายไปมากพอสมควรแล้ว แต่การบีบอัดภาษานั้นเป็นเรื่องที่ non-trivial อย่างมากและสำคัญมาก

cenoch 2023-02-15

คำตอบสำหรับคำถามสุดท้ายคือ

แม้ข้อมูลที่เราได้รับผ่าน GPT จะเป็นเหมือน JPEG เวอร์ชันที่คุณภาพลดทอนลง
แต่ข้อมูลที่เราต้องการโดยมากเป็นเวอร์ชันแบบคอลลาจ และการประกอบคอลลาจนี้ต้องใช้ความพยายามพอสมควร

มันช่วยทำหน้าที่แทนความพยายามในการทำคอลลาจ และบางครั้งความสมบูรณ์โดยรวมก็ยังดีกว่าฝีมือของผมเอง
จึงคุ้มค่ามากพอที่จะยอมรับการลดลงของคุณภาพได้

ผมอาจไม่อยู่ในฐานะที่จะประเมินจินตนาการและความเข้าใจด้านเทคโนโลยีของ Ted Chiang อย่างอาจหาญได้
แต่โดยรวมแล้วให้ความรู้สึกว่าเป็นงานที่เกิดจากการตีความคุณลักษณะบางอย่างของเทคโนโลยีนี้เกินจริง
และพลาดคุณลักษณะที่สำคัญจริงๆ ไป

johtta88 2023-02-14

คำตอบสำหรับคำถามสุดท้ายน่าจะเป็นว่า 'เพราะมันสะดวก' ใช่ไหมครับ?
ไม่แน่ใจว่าเป็นอุปมาอุปไมยที่เหมาะไหม แต่ก็เหมือนกับทุกวันนี้ที่หลายคนพึงพอใจกับสิ่งที่เป็นการบีบอัดต้นฉบับ เช่น การดูหนัง/ซีรีส์แบบรวดเดียวจบ

regentag 2023-02-14

ดูเหมือนว่าจะเป็นอุปมาเปรียบเทียบที่ยอดเยี่ยมมาก แต่ถ้าไม่ได้อยู่ในวงการก็คงไม่มีวันเข้าใจเลย
เราจะทำอย่างไรให้คนที่ไม่ใช่ผู้เชี่ยวชาญเข้าใจเรื่องนี้ได้ รวมถึงคนที่ชอบทำตัวเหมือนเป็นผู้เชี่ยวชาญด้วย

yhkee0404 2023-02-14

Super Resolution อาจดีกว่าต้นฉบับได้

wedding 2023-02-15

แน่นอนว่ามันอาจดีขึ้นได้ แต่ในบทความก็ไม่ได้ชี้ให้เห็นอยู่แล้วหรือว่าไม่ได้ดีขึ้นเสมอไป?

yhkee0404 2023-02-15

มีคนบอกว่ามันอาจดีขึ้นได้ แต่แน่นอนว่าไม่ได้ดีขึ้นเสมอไป อย่างไรก็ตาม ในบทความกลับพูดแค่ว่าความละเอียดพร่ามัวอยู่ด้านเดียว โดยตัดความเป็นไปได้ในทางกลับกันว่ามันอาจชัดเจนขึ้นออกไป ตอนนี้คุณภาพภาพจาก CCTV ก็ยังพัฒนาได้ แถมยังเติมสีให้ภาพขาวดำได้ด้วย แต่ JPEG ในชื่อเรื่องไม่ได้รองรับอะไรแบบนั้นหรอก

seunghaekim 2023-02-15

การปรับปรุงคุณภาพของภาพ หรือก็คือการปรับคุณภาพของภาพจาก CCTV นั้น ในบางแง่มุมแล้วไม่ใช่การปรับปรุงจริง ๆ แต่เป็นการมอบ "ความรู้สึก" ว่าภาพดีขึ้นให้กับมนุษย์ การเติมสีให้ภาพขาวดำก็เช่นกัน มันคือการ "สร้าง" ภาพที่เติมสีลงบนภาพขาวดำขึ้นมา เพื่อมอบ "ความรู้สึก" ของภาพสีให้กับมนุษย์ ดังนั้นคำว่า "การปรับปรุง" ที่เทคโนโลยียกระดับคุณภาพภาพในปัจจุบันจัดการอยู่นั้น จึงเป็นประเด็นที่ควรถูกพิจารณาในมุมที่แคบมาก การเอา JPEG มาเปรียบเทียบว่ามันไม่รองรับการปรับคุณภาพภาพจาก CCTV แบบนั้น จึงเป็นการเปรียบเทียบที่ไม่ค่อยเป็นธรรมอย่างยิ่ง

yhkee0404 2023-02-15

ขอบคุณสำหรับความคิดเห็นครับ แต่หากใช้ตรรกะเดียวกันนั้น ความพร่ามัวเองก็ในบางแง่มุมไม่ใช่การเสื่อมคุณภาพ หากเป็นการ "สร้าง" สิ่งที่เสื่อมคุณภาพขึ้นมาเพื่อมอบ "ความรู้สึก" ดังนั้นจึงเป็นประเด็นที่ควรถูกพิจารณาในมุมที่แคบมาก ดังนั้นการนำความสามารถด้านคณิตศาสตร์ของ ChatGPT ไปเปรียบเทียบกับการเสื่อมคุณภาพแบบ JPEG ก็ดูไม่ยุติธรรมอย่างมากเช่นกันนะครับ? เมื่อต้องการเพิ่มปริมาณข้อมูลเอง ดูเหมือนไม่จำเป็นต้องยกเรื่อง "ความรู้สึก" ของมนุษย์ขึ้นมาพูดเลย เหมือนกับตอนบีบอัดภาพสีต้นฉบับเป็นขาวดำแล้วขนาดไฟล์ลดลง ในทางกลับกันเมื่อเติมสีกลับเข้าไป ไม่ใช่แค่ขนาดบิตที่เพิ่มขึ้น แต่ปริมาณข้อมูลเองก็เพิ่มขึ้นด้วย จุดนี้จึงคล้ายกับการคลายการบีบอัด หรือการกู้คืนต้นฉบับ มากกว่าการบีบอัดเสียอีก การบอกว่ามันพร่ามัวเพียงเพราะไม่ใช่ต้นฉบับนั้น ดูเป็นการเปรียบเทียบที่ไม่ยุติธรรมยิ่งกว่าอีกนะครับ ถ้าดูแค่พาดหัว คนอาจเข้าใจผิดได้ว่า DALL-E สร้างได้แค่ภาพความจุต่ำความละเอียดต่ำ และสร้าง HD ไม่ได้ ตามเนื้อหาในบทความ เมื่อบีบอัด JPEG ซ้ำ ๆ โดยทั่วไปขนาดไฟล์ก็จะลด คุณภาพภาพก็จะลด และย่อมพร่ามัวลง แต่ก็น่าจะไม่มองข้ามข้อเท็จจริงที่ว่า ในการคำนวณทางคณิตศาสตร์ที่มีข้อมูลน้อย แม้ดีปเลิร์นนิงอาจพร่ามัว แต่ในทางกลับกันก็มีส่วนที่ทำได้ชัดเจน ถูกต้อง และดีกว่าเสียอีกครับ

seunghaekim 2023-02-15

ผมไม่ได้มองข้ามประเด็นใดเลยในสิ่งที่คุณพูดมา ดูเหมือนว่าคุณจะโกรธมากที่คุณกำลังสร้างต้นฉบับอยู่ แต่ผมกลับบอกว่าผมกำลังสร้าง "สิ่งที่ไม่ใช่ต้นฉบับ แต่ถูกรับรู้ราวกับเป็นต้นฉบับ" ถึงอย่างนั้นก็นั่นคือข้อเท็จจริงที่เรียบง่าย แล้วจะให้ทำอย่างไรได้ล่ะ

yhkee0404 2023-02-15

ผมไม่ได้แสดงความรู้สึกว่าโกรธมากหรือรู้สึกว่าไม่เป็นธรรมอย่างมากตามที่คุณพูดนะครับ? ผมแค่กังวลว่าคนทั่วไปจะเห็นพาดหัวข่าวนี้ที่บอกว่าเป็นคำพูดของคนชื่อเท็ด เชียง แล้วอาจมองข้ามไปเท่านั้นเอง ดูเหมือนว่าคนส่วนใหญ่ก็เห็นด้วย โชคดีนะครับที่คุณรู้จักเป็นการส่วนตัว ผมก็เห็นด้วยว่าการทำสิ่งแอนะล็อกด้วยดิจิทัลนั้นยาก ถึงจะเป็นเรื่องของข้อความเลยไม่เกี่ยวกันก็ตาม.

xguru 2023-02-14

ประเด็นเรื่องเครื่องถ่ายเอกสาร Xerox เป็นเนื้อหาที่เคยเห็นใน 52 สิ่งที่ฉันได้เรียนรู้ในปี 2022 #33 เช่นกันนะครับ
พอมันเชื่อมมาทางนี้ก็เลยทั้งน่าสนใจและเข้าใจได้แบบปิ๊งเลย!

ChatGPT คือ JPEG เบลอของเว็บ

บทความที่เกี่ยวข้อง

26 ความคิดเห็น