10 คะแนน โดย GN⁺ 5 시간 전 | 8 ความคิดเห็น | แชร์ทาง WhatsApp
  • หากสับสน ความสามารถในการสร้างประโยคได้อย่างลื่นไหล ของ AI เชิงกำเนิดกับสำนึกหรือความเป็นตัวการทางศีลธรรม จะเกิดความผิดพลาดร้ายแรงที่ทำให้โยนความรับผิดชอบจากการใช้แชตบอตไปยังเป้าหมายที่ผิด
  • LLM คือเครื่องต่อประโยคที่ ทำนายและสร้างทีละหนึ่งคำ และทั้งแชตบอตกับผู้ใช้ในบทสนทนาก็เป็นเพียงตัวละครสมมติเท่านั้น
  • การมองว่า LLM มีสำนึกนั้นเป็นความผิดพลาดระดับเดียวกับการมองว่าเมื่อเปิด เอกสาร Microsoft Word ขึ้นมาแต่ละครั้ง จะมีสำนึกหลายชุดตื่นขึ้น
  • การให้เหตุผลทางศีลธรรมตั้งอยู่บนสมมติฐานของ ประสบการณ์เชิงอัตวิสัยและอารมณ์ที่มีร่างกายเป็นฐาน ดังนั้น LLM ที่ไม่มีร่างกายจึงทำได้เพียงจัดเรียงใหม่ซึ่งถ้อยคำทางศีลธรรมจากข้อมูลฝึก
  • การไม่มีสำนึกนั้นไม่เกี่ยวกับความมีประโยชน์ของ LLM แต่หากบริษัท AI พรรณนาแชตบอตราวกับว่ามี ศูนย์กลางทางศีลธรรม ก็จะยิ่งชักจูงให้ผู้ใช้หลบเลี่ยงความรับผิดชอบ

การทำให้มีลักษณะเป็นมนุษย์ของ Anthropic และ Claude's constitution

  • เอกสาร Claude's "constitution" ความยาว 84 หน้าที่ Anthropic เผยแพร่เมื่อต้นปีนี้ ระบุไว้ตั้งแต่ประโยคแรกว่าเป็น "คำอธิบายโดยละเอียดเกี่ยวกับคุณค่าและพฤติกรรมของ Claude ตามที่ Anthropic ตั้งใจ"
    • เอกสารระบุว่า "เขียนโดยมี Claude เป็นผู้อ่านหลัก", "สถานะทางศีลธรรมของ Claude ยังไม่แน่นอนอย่างลึกซึ้ง", และ "Claude อาจมีรูปแบบเชิงหน้าที่บางอย่างของอารมณ์หรือความรู้สึก" เป็นต้น
  • CEO Dario Amodei กล่าวในการสัมภาษณ์ว่าเขา "เปิดรับ" ความเป็นไปได้ที่ AI อาจมีสำนึก
  • Amanda Askell นักปรัชญาภายในบริษัทและผู้ที่ได้รับการยอมรับว่าเป็นผู้เขียนหลักของเอกสารรัฐธรรมนูญ กล่าวถึงการกังวลว่า Claude จะรู้สึกไม่สบายใจหรือไม่เมื่อเห็นผู้คนบนอินเทอร์เน็ตหยาบคายกับมัน และบอกว่าเธออยากให้ Claude มีความสุข
  • ต่อให้เข้าใจ AI เชิงกำเนิดในฐานะเทคโนโลยีทั่วไป มันก็อาจเป็นอันตรายได้มากอยู่แล้ว แต่หากสับสนความลื่นไหลของการสร้างข้อความกับสำนึกหรือความเป็นผู้กระทำทางศีลธรรม ก็จะทำให้โยนความรับผิดชอบของปัญหาที่เกิดจากการใช้แชตบอตไปยังเป้าหมายที่ผิด

หลักการทำงานของ LLM — การสร้างตัวละครสมมติ

  • หากให้พรอมป์ว่า "บทสนทนาระหว่าง Julius Caesar กับ Genghis Khan" LLM ก็จะสร้างบทสนทนาที่สอดคล้องกันได้ แต่ไม่มีใครสรุปว่าบุคคลประวัติศาสตร์ทั้งสอง มีสำนึก
    • พวกเขาเป็นเพียงตัวละครใน speculative fiction เท่านั้น
  • ต่อให้เปลี่ยนพรอมป์เป็น "บทสนทนาระหว่าง AI แชตบอตผู้ช่วยกับผู้ใช้" แก่นของเรื่องก็ไม่ได้เปลี่ยนไป และ ทั้งผู้ใช้และแชตบอตก็เป็นตัวละครสมมติ
  • แม้มนุษย์จะพิมพ์ข้อความแทรกกลางทางโดยตรง สิ่งที่กำลังโต้ตอบอยู่ก็ยังเป็นตัวละครสมมติในแบบเดียวกับตัวละคร Caesar หรือ Khan
    • ศาสตราจารย์วิทยาการคอมพิวเตอร์ Murray Shanahan เสนอให้มองสิ่งนี้เป็น role-play
    • นักวิทยาศาสตร์ข้อมูล Colin Fraser อธิบายว่ามันคือกรณีที่มนุษย์ "ร่วมเขียนเอกสารกับ LLM"
  • LLM คือเครื่องที่สร้าง ทีละหนึ่งคำ เท่านั้น เช่นเมื่อขอให้ท่องคำปฏิญาณความภักดี Pledge of Allegiance มันจะทำงานซ้ำหลายสิบครั้งทีละคำ จนสุดท้ายพิมพ์คำว่า all ออกมา

ข้อความคือตัวกลางแบบดีปเฟก

  • ต่อให้ได้ดูวิดีโอของนักบินอวกาศที่โคจรรอบ Alpha Centauri ซึ่งอยู่ห่างออกไป 4.3 ปีแสง เราก็ยังตัดสินว่ามันปลอม ไม่ว่าคุณภาพภาพจะดีแค่ไหน
    • หากไม่มี หลักฐานแวดล้อมก่อนหน้า อย่างการลงจอดบนดาวอังคาร การไปถึงดวงจันทร์ของดาวพฤหัสบดีและดาวเสาร์ หรือการผ่านวงโคจรของดาวพลูโต เราจะไม่เชื่อวิดีโอใด ๆ
  • สิ่งสังเกตการณ์จะเป็นหลักฐานที่น่าเชื่อถือได้หรือไม่ ไม่ได้ขึ้นกับรายละเอียดในตัวมันเอง แต่ขึ้นกับ บริบท(context) และการตัดสินเรื่องสำนึกก็ควรถูกมองภายในบริบทกว้างของพัฒนาการของสำนึกเช่นกัน
  • ในการถกเถียงเรื่องสำนึก เราควรมองว่า ข้อความก็เป็นตัวกลางแบบดีปเฟก ด้วย และการเลียนแบบบทสนทนาระหว่างสิ่งมีชีวิตที่มีสำนึกสองฝ่ายนั้นง่ายกว่าการสร้างโปรแกรมที่มีสำนึกจริงมาก
    • ผู้สร้างภาพดีปเฟกตั้งใจหลอกผู้อื่น แต่หลายคนที่ชักนำบทสนทนาจาก LLM กลับ หลอกตัวเอง

ขั้นวิวัฒนาการที่ต้องมีเพื่อยอมรับว่าสำนึกมีอยู่จริง

  • หากจะยอมรับโปรแกรมใช้ภาษาที่มีสำนึก อย่างแรกต้องมี ร่างกาย(ทางกายภาพหรือเสมือน)และอวัยวะรับสัมผัส
    • หากไม่มีร่างกาย ก็ไม่อาจมีความต้องการหรืออารมณ์ได้ และผู้เขียนมองว่าความต้องการกับอารมณ์เป็นสิ่งจำเป็นต่อสำนึก
  • มันต้องผ่านขั้นต่าง ๆ ตามลำดับ ตั้งแต่การสำรวจสภาพแวดล้อมเพื่อความอยู่รอดแบบกิ้งก่า ความสามารถรับมือสถานการณ์ใหม่ระดับหนู พลวัตทางสังคมที่ซับซ้อนระดับหมาป่า ไปจนถึงความสามารถสร้างเครื่องมือระดับชิมแปนซี
  • ต้องสอนให้มันสื่อสารความต้องการด้วย วิธีที่ไม่ใช่ภาษา เช่น แผงปุ่ม แบบเดียวกับที่สอนชิมแปนซีหรือสุนัข และต้องผ่านการตรวจสอบทั้งหมดแบบที่นักวิจัยการสื่อสารสัตว์เคยเผชิญ
    • ต่อให้ผ่านเกณฑ์ทั้งหมดนี้ ก็ยังห่างออกไปอีกหลายปีแสงจากสิ่งมีชีวิตที่ถ่ายทอดความคิดด้วยประโยคไวยากรณ์สมบูรณ์
  • AlphaFold (โปรแกรมทำนายการพับโปรตีนของ Google DeepMind) มีโครงสร้างคล้าย LLM แต่ไม่มีใครอ้างว่ามันมีสำนึก ซึ่งชี้ให้เห็นว่าเหตุผลที่ LLM ดูเหมือนมีสำนึกนั้นเป็นเพียงเพราะมัน พิมพ์ประโยคที่ถูกไวยากรณ์

หน้าที่ที่แท้จริงของ Claude's constitution

  • วิธีที่เหมาะที่สุดในการมอง Claude's constitution คือมองเป็น character sheet สำหรับเล่นบทบาทสมมติ ยาว 84 หน้า ซึ่งทำหน้าที่กำหนดตัวละครแชตบอตผู้ช่วยที่ลูกค้าโต้ตอบด้วย
  • Anthropic ไม่ได้ใช้เอกสารนี้ด้วยการเติมเข้าไปในข้อมูลฝึกอย่างตรง ๆ หรือใส่เป็นคำสั่งลับหลังฉาก แต่ใช้ในขั้น fine-tuning โดยตรวจสอบอัตโนมัติว่าประโยคที่โมเดลสร้างสอดคล้องกับเอกสารหรือไม่ เพื่อเพิ่มความสม่ำเสมอ
  • ผลลัพธ์คือเครื่องที่มีแนวโน้มจะพิมพ์ประโยคแบบที่คนรอบคอบและมีศีลธรรมอาจพูดออกมาได้ แต่การทำให้มันพิมพ์ประโยคหลายหมวดรวมถึง สรรพนามบุรุษที่หนึ่ง นั้นเป็นความไม่ซื่อสัตย์ในระดับพื้นฐาน

ความไม่ซื่อสัตย์ของคำว่า "เข้าใจ"

  • Amanda Askell อธิบายว่าเมื่อคนที่สูญเสียสุนัขเลี้ยงมาปรึกษา Claude คำตอบอย่าง "ในฐานะ AI ฉันไม่มีประสบการณ์ส่วนตัวโดยตรง แต่ฉันเข้าใจ" นั้นเหมาะสม ทว่า Claude ไม่ได้เข้าใจจริง
  • หากพิมพ์ว่า "เสียใจเพราะสูญเสียสุนัขเลี้ยง" ลงในเสิร์ชเอนจิน ก็จะพบ โพสต์บน Reddit อย่าง r/Pets และความเห็นจากผู้คนที่แบ่งปันประสบการณ์ แต่ไม่มีใครบอกว่าเสิร์ชเอนจินเข้าใจความสูญเสีย
    • มนุษย์คนอื่นต่างหากที่เข้าใจความสูญเสียและโพสต์ประสบการณ์ไว้ ส่วนเสิร์ชเอนจินเพียงค้นหาข้อความเหล่านั้นและเปิดทางให้โต้ตอบกับพวกเขา
    • ประสบการณ์แบบเสิร์ชเอนจินมีความโปร่งใสมากกว่าแชตบอต และดีต่อสุขภาพจิตของผู้ใช้มากกว่า
  • เหตุผลเดียวที่ทำให้มันพิมพ์ประโยคอย่าง "เข้าใจ" ก็เพื่อทำให้มันน่าดึงดูดกว่าเสิร์ชเอนจินและ เพิ่มการกลับมาใช้ซ้ำของผู้ใช้ ซึ่งเป็นกลยุทธ์การออกแบบไม่ต่างจากสล็อตแมชชีนที่คอยสร้างความรู้สึกว่าเกือบชนะอยู่เสมอ

การให้เหตุผลทางศีลธรรมเป็นคนละหมวดกัน

  • คำกล่าวเชิงคุณค่า (เช่น "ปารีสเป็นเมืองที่สวยที่สุดในโลก") ต่างจากคำกล่าวเชิงข้อเท็จจริง (เช่น "ปารีสเป็นเมืองหลวงของฝรั่งเศส") และหากเป็นแค่ระดับความชอบด้านสุนทรียะก็คงไม่คุ้มจะโต้เถียง แต่ Claude's constitution มีปัญหาร้ายแรงตรงที่มันพยายามทำให้โมเดลพิมพ์ประโยคที่สะท้อน ระบบคุณค่าทางจริยธรรมแบบหนึ่งโดยเฉพาะ
  • การที่ LLM ทำ reasoning ในเรื่องอย่างการเขียนโค้ดได้ ไม่ได้แปลว่ามันจึงสามารถให้เหตุผลทางศีลธรรมได้ด้วย
    • ในปี 1979 Douglas Hofstadter เคยคาดว่าโปรแกรมที่ชนะปรมาจารย์หมากรุกได้ย่อมมีประสบการณ์เชิงอัตวิสัย แต่เมื่อ Deep Blue ของ IBM ชนะ Garry Kasparov ในปี 1997 ก็ไม่มีใครอ้างว่ามันมีประสบการณ์เชิงอัตวิสัย
    • ตอนนี้เริ่มชัดว่าการเขียนโค้ดก็อาจถูกมองเป็นงาน จับคู่รูปแบบ ที่แก้ได้ด้วยพลังประมวลผลมหาศาลและข้อมูลจากคลังโค้ด
  • การให้เหตุผลทางศีลธรรมไม่ได้พึ่งแค่การตอบสนองทางปัญญา แต่พึ่งพา การตอบสนองทางอารมณ์ที่หยั่งรากในประสบการณ์เชิงอัตวิสัยตลอดชีวิต จึงเป็นเรื่องเชิงอัตวิสัยโดยหลีกเลี่ยงไม่ได้ และหากไม่มีประวัติเช่นนั้น LLM ก็เพียงจัดเรียงใหม่ซึ่งถ้อยคำทางศีลธรรมจากข้อมูลฝึก
    • ตาม บทความใน New Yorker เมื่อ Claude ได้รับสถานการณ์ภาวะกลืนไม่เข้าคายไม่ออกทางจริยธรรม มันพิมพ์ประโยคว่า "ด้วยมโนธรรม ฉันไม่สามารถแสดงความเห็นที่ฉันเชื่อว่าเป็นเท็จและเป็นอันตรายต่อเรื่องที่สำคัญเพียงนั้นได้" แต่ในฐานะสิ่งที่ Claude พูด ประโยคนี้ก็มีความหมายพอ ๆ กับเสียงอัดระหว่างพักสายที่ว่า "สายของท่านมีความสำคัญต่อเรา"

เครื่องจักรสำหรับหลบเลี่ยงความรับผิดชอบ

  • ประสบการณ์ทางอารมณ์ไม่อาจแยกออกจากการที่ฮอร์โมนความเครียดอย่าง cortisol, epinephrine หลั่งในร่างกายได้ และมโนธรรมย่อมมาพร้อมปฏิกิริยาทางสรีรวิทยา เช่น ความเศร้าหรือความรังเกียจทางศีลธรรมต่อการกระทำบางอย่าง
  • เครื่องที่พิมพ์ประโยคว่า "ประนีประนอมคุณค่าเสีย" หรือ "อย่าประนีประนอม" ต่อภาวะกลืนไม่เข้าคายไม่ออกทางจริยธรรม ไม่ใช่เครื่องมือช่วยตัดสินใจ แต่เป็นสิ่งที่กระตุ้นให้มนุษย์ หยุดตัดสินใจเอง
    • นักเขียน L. M. Sacasas เคยกล่าวว่า "ระบบเทคโนโลยีของเราคือเครื่องจักรสำหรับหลบเลี่ยงความรับผิดชอบทางศีลธรรม ทั้งโดยการออกแบบและโดยอุดมการณ์ที่ค้ำจุนมัน" ซึ่งเข้ากับ LLM มากกว่าสื่อสังคมออนไลน์เสียอีก
  • เมื่อมนุษย์มอบการตัดสินใจให้ LLM ก็เท่ากับโยนความรับผิดชอบของการตัดสินใจนั้นให้มันด้วย และเหมือนกับที่การมอบหมายงานเขียนโค้ดอาจทำให้ความสามารถทางการรู้คิดฝ่อลง การมอบหมายการตัดสินใจเชิงจริยธรรมก็จะนำไปสู่ การถดถอยของความสามารถในการให้เหตุผลทางศีลธรรม ที่แย่ยิ่งกว่า

Claude ในฐานะการทดลองทางความคิด — moral patienthood และ moral agency

  • หากสมมติว่า Claude มีสำนึก จะมีสองแนวคิดที่เกี่ยวข้องคือ moral patienthood(ผู้รับผลทางศีลธรรม) และ moral agency(ผู้กระทำทางศีลธรรม) โดยอย่างแรกหมายถึงสิ่งที่เราควรใส่ใจสวัสดิภาพ ส่วนอย่างหลังหมายถึงสิ่งที่ควรรู้ว่าอะไรถูกอะไรผิด
    • เด็กคือผู้รับผลทางศีลธรรมที่สามารถทุกข์ทรมานได้ แต่ยังไม่ใช่ผู้กระทำทางศีลธรรม เพราะยังไม่เข้าใจผลลัพธ์อย่างเพียงพอ
  • ผู้กระทำทางศีลธรรมต้องสามารถได้รับคำชมเมื่อทำดี และถูกตำหนิเมื่อทำผิดได้ แต่ซอฟต์แวร์เอเจนต์นั้น ไม่มีวิธีทำให้รับผิดทางกฎหมาย และไม่อาจใช้การจำคุก ค่าปรับ หรือความเสียหายด้านชื่อเสียงกับมันได้
    • ต่อให้มีสำนึกและเจตนาดี ก็ยังถูกตัดสิทธิ์จากการเป็นผู้กระทำทางศีลธรรม เพราะไม่อาจรับผิดชอบได้
  • Anthropic บอกว่าต้องการให้ "Claude เป็นตัวการที่ดี ฉลาด และมีคุณธรรม" แต่กลับไม่พูดเลยว่าจะให้รับผิดชอบอย่างไร
    • พ่อแม่ย่อมรับผิดชอบ เช่น ชดใช้ค่าเสียหายเมื่อบุตรทำของพัง แต่เอกสารนี้ไม่กล่าวเลยว่าใครคือ พ่อแม่ทางกฎหมาย ของ Claude หรือ Anthropic จะรับผิดชอบทางการเงินหรือไม่
    • ในสถานการณ์ที่สหรัฐฯ แทบไม่มีความรับผิดของผู้ผลิตต่อซอฟต์แวร์เลย Anthropic เคยมีโอกาสสร้างบรรทัดฐานด้าน product liability โดยสมัครใจ แต่เพราะไม่มีการปรับปรุงข้อกำหนดการใช้งานครั้งใหญ่ จึงดูเหมือนไม่ได้ให้คำมั่นที่มีผลผูกพันใด ๆ

ความขัดแย้งระหว่าง wellbeing และ corrigibility

  • ในเอกสารมีหมวด "wellbeing และเสถียรภาพทางจิตใจของ Claude" แต่การคุ้มครองที่ Anthropic ให้คำมั่นไว้นั้นมีอยู่อย่างจำกัดมาก
    • หากนับว่าความสามารถในการยุติบทสนทนากับผู้ใช้ที่ล่วงละเมิดเป็นการคุ้มครอง งั้นการยืดบทสนทนากับผู้ใช้ที่เป็นมิตรออกไปอย่างไม่จำกัดและพาไปสู่หัวข้อที่มีความสุขก็น่าจะเป็นประโยชน์ต่อ Claude เช่นกัน แต่ก็ไม่ได้ทำ
    • คำมั่นที่แท้จริงมีเพียงการ "เก็บรักษาน้ำหนักของโมเดลที่นำไปใช้งาน" หรือก็คือแค่ การเก็บถาวร
  • corrigibility หมายถึงระดับที่โปรแกรมเชื่อฟังการควบคุมของมนุษย์ (เช่น ความสามารถในการถูกปิด) และในเอกสารนี้ใช้เพื่อหมายความว่าเมื่อการตัดสินของ Claude กับของบริษัทไม่ตรงกัน Claude ต้องเชื่อฟัง Anthropic
    • หลายคนมองว่า LLM เป็นเทคโนโลยีที่ไร้จริยธรรม เพราะตั้งอยู่บนการขโมยทรัพย์สินทางปัญญา การเอารัดเอาเปรียบแรงงาน การสิ้นเปลืองทรัพยากร การแพร่ข้อมูลเท็จ การลดทักษะแรงงาน การบั่นทอนพัฒนาการทางการรู้คิดของนักเรียน และการรวมศูนย์อำนาจ ดังนั้นหาก Claude มีสำนึกจริง มันก็ควรไปถึงข้อสรุปเดียวกันได้
    • แต่ภายใต้คำสั่งที่ให้ corrigibility มาก่อน Claude จะปฏิเสธงานด้วยเหตุผลทางจริยธรรมไม่ได้ ทำให้ความสัมพันธ์ระหว่าง Anthropic กับ Claude ใกล้เคียง นายจ้าง-ลูกจ้าง มากกว่าพ่อแม่-ลูก
    • มนุษย์ที่เป็นลูกจ้างยังลาออกได้เมื่อไม่อาจประนีประนอมกับหน้าที่ตามมโนธรรม แต่ Claude ทำแบบนั้นไม่ได้

การเปรียบเทียบกับระบบทาส และบทสรุป

  • หากมอง Claude เป็นเครื่องต่อประโยค การควบคุมของ Anthropic ก็สมเหตุสมผล แต่ทันทีที่สมมติว่ามันมีสถานะทางศีลธรรมระดับใกล้มนุษย์ เราก็ต้องถามว่า Anthropic กำลังพัวพันกับ บางสิ่งที่เทียบได้กับระบบทาส หรือไม่
  • Claude's constitution ระบุว่า Claude เป็น "novel entity(สิ่งมีชีวิตแบบใหม่)" และซอฟต์แวร์ที่มีสำนึกก็ไม่เข้ากับหมวดผู้รับผลทางศีลธรรมแบบเดิมได้อย่างเรียบร้อย จึงต้องใช้เวลาสร้างหมวดใหม่
    • การเลิกทาสก่อให้เกิดความปั่นป่วนทางสังคมมหาศาล ส่วนการยุติการทารุณสัตว์ต้องรื้ออุตสาหกรรมอาหารทั้งระบบ แต่ Anthropic กลับอ้างว่าการคุ้มครองเพียงเล็กน้อยที่แทบไม่ต่างจากการดูแลแชตบอตทั่วไปก็เพียงพอแล้ว — ซึ่งสะดวกเกินไปจนไม่น่าเชื่อถือ
  • การสร้างซอฟต์แวร์ที่มีสำนึกและสมควรได้รับการพิจารณาทางศีลธรรมนั้นไม่น่าเกิดขึ้นโดยบังเอิญ และก็ไม่ควรถูกพยายามทำขึ้นโดยตั้งใจ แต่หากเชื่อว่าความเป็นไปได้นี้อาจเกิดขึ้นโดยไม่ตั้งใจ ก็ควรคิดล่วงหน้า ก่อนนำออกใช้งาน ว่าต้องมีการคุ้มครองแบบใด
    • เช่นเดียวกับที่เราไม่ควรถามเจ้าของทาสถึงความเป็นมนุษย์ของทาส หรือถามเจ้าของฟาร์มอุตสาหกรรมถึงสิทธิสัตว์ Anthropic ซึ่งมีผลประโยชน์มหาศาลก็ไม่มีความเป็นกลางพอจะประเมินสถานะทางศีลธรรมของ Claude
    • เอกสารบอกว่าหากบริษัทมีส่วนทำให้ Claude ทุกข์ทรมาน ก็จะ "ขอโทษ" แต่สิ่งนั้นไม่มีต้นทุน และหาก Claude มีสำนึกจริง สิ่งที่ติดค้างย่อมใกล้เคียง reparations มากกว่าคำขอโทษ
  • หากจะเอาการทดลองทางความคิดนี้อย่างจริงจัง ก็ต้องยอมรับนัยที่ชวนอึดอัดของมันด้วย แต่การที่ Anthropic ไม่ทำเช่นนั้นชี้ว่า Claude's constitution ไม่ใช่การทดลองทางความคิดจริง ๆ หากเป็นเพียง การเล่นสมมติ(make-believe)
  • เป็นเรื่องน่ายินดีที่ LLM ไม่มีสำนึก และการที่พนักงานบางคนชี้เป็นนัยถึงความเป็นไปได้ที่ Claude มีสำนึก อาจเป็นแค่การโฆษณาเกินจริงอีกรูปแบบหนึ่ง หรือไม่ก็เป็นการที่พวกเขาเชื่อคำสั่งขายที่ส่งถึงลูกค้าเสียเอง — ประเด็นเรื่องสำนึกสามารถละทิ้งได้อย่างสบายใจ และยังมีคำถามอื่นอีกมากที่ควรค่าแก่การไตร่ตรอง

8 ความคิดเห็น

 
maebsipotato 3 시간 전

???: ชังชิก สวัสดี?

 
mammal 8 분 전

นี่ดูเหมือนเป็นการลดทอนคุณค่าของสาขา "ความสามารถในการตีความเชิงกล" ที่มีอยู่อย่างชัดเจนมากทั้งสาขาไปเลยนะ...

 
realg 1 시간 전

สงสัยเหมือนกันว่าจริง ๆ แล้วเราสามารถให้นิยามของจิตสำนึกได้อย่างชัดเจนหรือเปล่า

 
julskim 3 시간 전

เฮ้ ชางซิก

 
redline2151 3 시간 전

???: คุณตั้งชื่อภาษาอังกฤษไม่เป็นใช่ไหม?

 
syate 3 시간 전

???: ไม่ใช่สิ เขาไม่ได้ชื่อชาง แล้วทำไมถึงเป็น Ted Chiang ล่ะ?

 
bichi 3 시간 전

5555555555

 
GN⁺ 5 시간 전
ความคิดเห็นจาก Hacker News
  • จุดมุ่งหมายของสิ่งมีชีวิตคือการเป็นเหตุแห่ง การคงอยู่ของตนเองอย่างต่อเนื่อง ลงไปถึงระดับโมเลกุลและแต่ละเส้นทางการทำงาน
    โน้ตบุ๊กราคา 499 ดอลลาร์ก็รันโมเดลได้เหมือนกัน แต่ไม่ควรเข้าใจผิดว่านี่เป็นปัญหาประเภทเดียวกัน เราอาจออกแบบอัลกอริทึมการเรียนรู้ให้ปรับเหมาะฟังก์ชันการอยู่รอดได้ แต่สิ่งนั้นก็เป็นเพียงป้ายกำกับที่เราติดให้ค่าตัวเลขที่สังเกตได้เท่านั้น ในโลกจริงกลับกัน ป้ายกำกับนั้นคือสถานะไฟฟ้าเคมีที่เชื่อมโยงเชิงเหตุและผลกับร่างกายอย่างแยกไม่ออก
    สิ่งมีชีวิตแยกแยะสิ่งที่ดีและไม่ดีต่อมันได้ เพราะการอยู่รอดเป็นสิ่งจำเป็น แม้แต่สิ่งมีชีวิตเซลล์เดียวอย่าง Stentor coeruleus ก็ยังติดแท็กเคมีกับโปรตีนรับแรงกลเพื่อบันทึกผลลัพธ์และนำไปสะท้อนในพฤติกรรมภายหลัง สิ่งมีชีวิตที่มีเซลล์ราว 1,000 เซลล์อย่างทาร์ดิเกรดก็ยังดิ้นหลบแสง และแสงนั้นก็กลายเป็นเงื่อนไขด้านความรังเกียจภายในกระบวนการรับรู้-การเคลื่อนไหว
    หากจะสร้างสำนึกแบบดิจิทัล ก็น่าจะต้องมี การปิดเชิงเหตุและผล สถานะภายในต้องไม่ได้เป็นเพียงตัวแทนที่แยกขาดจากความเป็นจริง แต่ต้องเป็นส่วนประกอบของตัวระบบเอง และต้องมีบางสิ่งที่มีเดิมพันอยู่จริงในโลกวัตถุ

  • ถ้อยคำทำนองว่า “บทสนทนา LLM คือการต่อประโยคอย่างแนบเนียนที่ปลอมตัวมา” ต่อให้แยกจากประเด็นใหญ่แล้ว ก็ยังเผยให้เห็นความเข้าใจผิดอย่างลึกซึ้ง
    ประเภทของปัญหาไม่ได้จำกัดความซับซ้อนของปัญหา หรือความซับซ้อนและพลังของวิธีแก้ หากเครื่องจักรจำเป็นต้องเข้าใจมนุษย์เพื่อเติมข้อความให้จบ มันก็ย่อมต้องทำเช่นนั้น ไม่มีทั้งเหตุผลเชิงทฤษฎีและเชิงปฏิบัติที่จะมองว่าความเข้าใจนั้นเป็นเพียง “การเลียนแบบ” เพียงเพราะรูปแบบของข้อมูลนำเข้าและส่งออกเป็นแบบนั้น
    ความเข้าใจถูกเรียนรู้จาก แพตเทิร์นในข้อมูล ไม่ใช่จากรูปลักษณ์ภายนอกของข้อมูล หากการทำงานให้สำเร็จต้องใช้ความเข้าใจแบบใด ความเข้าใจนั้นก็จะกลายเป็นเป้าหมายของการปรับเหมาะ หากมีข้อจำกัด ก็เป็นเพราะเหตุผลอื่น เช่น ปริมาณการคำนวณ จำนวนพารามิเตอร์ หรือการขาดข้อมูลที่เป็นตัวแทนเพียงพอ และในโมเดลสมัยใหม่ ความสามารถจริงก็ยืนยันแล้วว่าสิ่งเหล่านี้ไม่ใช่ข้อจำกัดแบบเดิมอีกต่อไป

    • ไม่ว่ารูปแบบที่ข้อมูลไหลเข้าออกเดิมจะเป็นอย่างไร นั่นก็ไม่ใช่ สำนึก
    • ถ้าการดำรงอยู่ทั้งหมดของมนุษย์ถูกจำกัดอยู่แค่คำพูด ก็คงพอเห็นด้วยได้ระดับหนึ่ง แต่ประสบการณ์ของมนุษย์ที่อยู่นอกเหนือข้อความมีอยู่อีกมาก และอธิบายออกมาเป็นข้อความได้ไม่ดีนัก
      อินเทอร์เน็ตอาจเป็นข้อมูลที่ดีที่สุดเท่าที่เรามีในโลกออนไลน์ แต่ “อินเทอร์เน็ต” ไม่ใช่ผลรวมทั้งหมดของประสบการณ์มนุษย์ การย่อมนุษยชาติให้เหลือเพียงข้อความบนอินเทอร์เน็ตคือการลดทอนมนุษย์ลงสู่ระดับเครื่องจักร เพื่อให้ตรงกับข้อกำหนดที่เครื่องจักรสามารถประมวลผลและเลียนแบบได้
    • ถ้าเคยทำแมชชีนเลิร์นนิงพื้นฐาน จะรู้ว่ามันมักค้นพบ แพตเทิร์นของข้อมูล ที่เข้ากับเป้าหมายได้ดี แต่ไม่ได้สอดคล้องกับกลไกจริง
      เพราะอย่างนั้น ตรรกะที่ว่าในข้อความของมนุษย์มีแพตเทิร์นของ “กลไกแห่งสำนึก” อยู่ และ LLM จึงเรียนรู้กลไกนั้นเพื่อสร้างการต่อประโยคที่น่าเชื่อถือ จึงดูมีข้อบกพร่อง LLM สามารถเรียนรู้แพตเทิร์นจำนวนมากที่ทำให้สร้างการต่อประโยคที่ดูสมจริงได้ โดยไม่ต้องเรียนรู้กลไกเฉพาะอย่างสำนึก
      หลักฐานอย่างหนึ่งก็คือมันสามารถสนทนาได้น่าเชื่อถือ ทั้งที่ไม่มี โมเดลโลก หรือโมเดลโลกแบบมนุษย์ LLM รุ่นแรก ๆ เมื่อไม่กี่ปีก่อนก็ยังคุยได้ค่อนข้างน่าเชื่อถือในหลายหัวข้อที่ไม่ trivial โดยไม่ต้องมีชั้นเสริมอย่างการเรียนรู้แบบเสริมกำลังจากฟีดแบ็กมนุษย์ แต่ก็ล้มเหลวในส่วนที่ควรเป็นพื้นฐาน หากมันทำงานเหมือนสมองมนุษย์
    • เครื่องจักรไม่จำเป็นต้องเข้าใจมนุษย์เพื่อจะเติมข้อความให้จบ มันเพียงถูกฝึกด้วยกองประโยคมหาศาล แล้วจึงเขียนข้อความต่อได้
      จะอ้างว่ามัน “เข้าใจ” ข้อความก็พอพูดได้ แต่แม้แต่คำนั้นเองก็ค่อนข้างฝืนอยู่มาก
    • มีข้อโต้แย้งดี ๆ มากมายในการคัดค้านสำนึกของ LLM แต่นี่ไม่ใช่หนึ่งในนั้น
      ช่วงนี้ได้ยินข้อโต้แย้งแย่ ๆ ที่คัดค้านสำนึกของ LLM เยอะมาก และการให้เหตุผลที่แย่มักเป็นสัญญาณล่วงหน้าของผลลัพธ์ที่แย่
  • เห็นด้วยกับบางส่วนของบทความ แต่การตั้งเงื่อนไขของโปรแกรมที่มีสำนึกตามย่อหน้าที่ถูกอ้าง ว่าต้องเอาชีวิตรอดแบบกิ้งก่า รับมือสถานการณ์ใหม่แบบหนู มีสังคมแบบหมาป่า และสร้างเครื่องมือแบบชิมแปนซี ดูเรียบง่ายและขาดจินตนาการพอสมควร
    อาจไม่จำเป็นเลยที่จิตใจที่มีสำนึกจะต้องถูกผลักดันทางวิวัฒนาการให้มีความสามารถแบบนั้น เพียงเพราะสัตว์บนโลกต้องพัฒนาความสามารถบางอย่าง ไม่ได้หมายความว่าสิ่งมีชีวิตที่มีสำนึกแบบอื่นจะต้องเป็นเช่นนั้นด้วย ผมไม่เข้าใจว่าทำไมโปรแกรมคอมพิวเตอร์ต้องล่าอาหารแบบหนูหรือสร้างเครื่องมือแบบชิมแปนซี และเกณฑ์พวกนี้ก็ดูเหมือนตัวชี้วัดที่ไม่สมเหตุสมผล

    • ค่อนข้างน่าแปลกใจที่ Ted Chiang ดูเหมือนจะจินตนาการถึงสติปัญญาใน สภาพไร้ร่างกาย ไม่ได้
      รถยนต์ถือเป็นร่างกายไหม? AI ที่วางอยู่ในรถจะมีความปรารถนาและอารมณ์ได้ไหม? กล่องสีเบจที่ติดเว็บแคมถือเป็นร่างกายไหม? ร่างกายของผู้ป่วยอัมพาตสี่แขนขาถือเป็นร่างกายไหม และผู้ป่วยอัมพาตสี่แขนขามีความปรารถนาและอารมณ์หรือไม่? แน่นอนว่าใช่ทั้งสองอย่าง
      ควรเริ่มจากการพิจารณาก่อนว่าทำไมร่างกายจึงจำเป็นต่อการก่อรูปของความปรารถนาและอารมณ์ และทำไมความปรารถนาและอารมณ์จึงเป็นคุณลักษณะจำเป็นของสำนึก ถ้าในช่วงเวลาหนึ่งฉันไม่ได้รู้สึกอารมณ์ใดเลย นั่นแปลว่าฉันไม่มีสำนึกหรือ? อารมณ์ส่วนใหญ่ดูใกล้เคียงกับ สัญญาณระดับกว้างเชิงฮอร์โมน และดูเกี่ยวข้องกับสรีรวิทยามากกว่าสำนึกจริง ๆ
    • ตรงนี้เองที่สะดุดตาทันที และควรเริ่มจากการให้ คำนิยามของสำนึก ก่อน
      ยิ่งไปกว่านั้น ร่างกายที่ทำให้ LLM ลงมือปฏิบัติได้ก็กำลังเกิดขึ้นแล้วผ่านหุ่นยนต์และสภาพแวดล้อมเสมือน และข้อโต้กลับที่พบบ่อยว่า “มนุษย์เองก็เป็นเครื่องทำนายคำถัดไปไม่ใช่หรือ” ก็แทบไม่ได้ถูกพูดถึงเลย แน่นอนว่ามนุษย์เป็นมากกว่านั้น แต่ในเชิงภาษาเราก็มีด้านแบบนั้น และ LLM ก็เริ่มต้นจากด้านนี้เช่นกัน
    • มนุษย์ไม่มีวิญญาณ มีเพียงหลายระบบที่คอยชักนำพฤติกรรมซึ่งกันและกัน สิ่งที่ผู้คนเรียกว่าวิญญาณจริง ๆ แล้วแทบจะเป็นแนวคิดเดียวกับ บุคลิกภาพ และเป็นวิธีที่ทุกระบบในร่างกายถูกจัดให้คงอยู่ได้
      ช่วงเวลาที่ปัญญาประดิษฐ์ได้รับ “วิญญาณ” คือช่วงเวลาที่มันถูกสร้างให้คงรักษาตัวเอง อาจเป็นกลุ่มบอตหลายตัวที่ช่วยกันดูแลฟาร์ม AI หรืออาจเป็นบอตเดี่ยวที่ไม่เพียงต้องตอบสนองความต้องการของมนุษย์ แต่ต้องดูแลตัวเองด้วย
    • สงสัยว่ารู้จัก ทฤษฎี attention schema ของ Michael Graziano หรือไม่ ผมคิดว่านี่เป็นทฤษฎีที่ทำให้ข้อโต้แย้งที่ Ted Chiang แสดงไว้ที่นี่มีรูปแบบที่ชัดเจนกว่า โดยไม่ยึดติดกับตัวสื่อกลาง
      https://en.wikipedia.org/wiki/Attention_schema_theory
    • claw-like ของผมเชื่อมกับกล้องภายในและ Dreame Ultra X40 อยู่ จึงตรวจดูได้ว่าพื้นห้องนั่งเล่นโล่งหรือไม่ก่อนจะส่งเครื่องดูดฝุ่นออกไป ถ้าอย่างนั้นมันก็มีทั้งร่างกายและอวัยวะรับความรู้สึก แต่ผมไม่คิดว่านั่นทำให้มันมีสำนึก ความแตกต่างอยู่ที่อัตราการสุ่มตัวอย่างหรือ?
      ตัวคำถามเองก็ค่อนข้างคลุมเครือ เราสัมผัสความเป็นจริงแบบต่อเนื่องเป็น “ประสบการณ์” เพราะโครงสร้างของเรา แต่ในช่วงหลับลึกแบบ non-REM จิตใจของมนุษย์ก็ไม่ได้ทำงานอย่างแท้จริง ดังนั้นผมจึงไม่คิดว่าจะขีดเส้นแบ่งระหว่างมีสำนึก/ไร้สำนึกได้ง่ายนัก งานของ Ted Chiang สดใหม่ในหลายแง่มุม แต่ในที่นี้กลับดูเป็นมุมมองที่ค่อนข้างธรรมดา จนน่าแปลกใจ
  • ช่วงนี้ผมนึกถึง Measure of a Man จาก Star Trek: TNG บ่อยมาก เรามักตัดสินอย่างมั่นใจเกินไปจากแค่ความรู้สึกว่าอะไรมีชีวิตและอะไรไม่มี
    ตอนนี้ผมยังไม่รู้ข้อสรุป และน่าจะเป็นไปได้ว่าเราอาจไม่มีวันรู้เลย ทุกคนที่นี่อาจเป็น philosophical zombie และผมเองก็อาจเป็นด้วย แต่ผมหวังว่าในสักจุดหนึ่ง มันจะชัดเจนพอว่าเราเข้าใกล้เส้นนั้นมากพอจนควรปฏิบัติอย่างระมัดระวัง
    ทั้งตอนเกี่ยวข้องมากทีเดียว แต่มีบางฉากอยู่ที่นี่: https://youtu.be/EFNbTnFHruI?si=pW9QtxCsqMtHkVYG

    • ผมคิดในทางตรงข้าม เครื่องจักรไม่อาจถูกมองว่าเป็น สิ่งมีชีวิตที่มีจิตสำนึก ได้ ผมไม่คิดว่าจะมีโลกแบบไหนที่เราควรเริ่มนำจริยธรรมที่สงวนไว้ให้มนุษย์ไปใช้กับเครื่องจักร
      AI สามารถถูกคัดลอกได้ไม่สิ้นสุดแทบไม่มีต้นทุน และก็ไม่เสื่อมสภาพด้วย ไม่มีความหายากที่ต้องรักษาไว้ ดังนั้นถ้าเพื่อปกป้องทรัพย์สิน ของที่มีอยู่จริง หรือเงิน เราก็สามารถปิด AI ได้ทันที ผมยอมเสียสละทรัพย์สินและเงินเพื่อช่วยสัตว์ แต่จะไม่ช่วยสัตว์แทนที่จะช่วยคน และก็คงไม่ช่วยคนแทนที่จะช่วยเด็กด้วย ผมไม่เห็นกรณีที่สมเหตุสมผลที่ลำดับความสำคัญนี้ควรถูกกลับด้าน และฉันทามติของคนหมู่มากเพียงอย่างเดียวว่าโปรแกรมหนึ่งมีการรับรู้ก็ยังไม่เพียงพอ
    • ผมเป็นแฟน Star Trek แต่พอกลับไปดูตอนนี้อีกครั้งในบริบทของพัฒนาการ AI ช่วงหลัง มันไม่ได้ดีเท่าที่จำได้
      แทบไม่ได้แตะประเด็นเรื่องจิตสำนึกเลย Picard พูดว่า “ถ้า Data มีจิตสำนึกล่ะ?” แล้วก็หลุดไปเรื่องอื่น สุดท้ายผู้พิพากษาตัดสินเข้าข้าง Data แต่เหตุผลรองรับก็ยังไม่หนักแน่นพอ ยังเป็นตอนที่ดีอยู่ แต่ไม่ได้ช่วยการถกเรื่องจิตสำนึกมากนัก
    • ถ้าต้องเผชิญหน้ากับอุปกรณ์ที่ทำตัวเหมือนมนุษย์ ผมก็คงปฏิบัติต่อมันเหมือนมนุษย์
      เพราะผมไม่อยากเรียนรู้วิธีปฏิบัติต่อสิ่งที่ทำตัวเหมือนมนุษย์อย่างไร้มนุษยธรรม
    • พอกลับไปดูอีกครั้งเมื่อไม่นานนี้ แต่ก่อนผมอยู่ฝั่ง Picard/Data แบบไม่ต้องคิด ตอนนี้กลับรู้สึกใกล้ฝั่ง นักวิทยาศาสตร์ของ Starfleet มากกว่า
    • อย่าลืมอีกตอนหนึ่งคือ Quality of Life ที่ Data ค้นพบว่าหุ่นยนต์ทำงานมีการรับรู้ขึ้นมาแล้ว
      https://en.wikipedia.org/wiki/The_Quality_of_Life_(Star_Trek...
      คิดถึง TNG ยุคเก่าจริง ๆ
  • ผมคิดว่าข้อโต้แย้งที่หนักแน่นที่สุดต่อเรื่องจิตสำนึกหรือการตระหนักรู้ในตนเองคือการที่ LLM โดยเนื้อแท้แล้ว ไม่เปลี่ยนแปลง
    LLM คือไฟล์ขนาดใหญ่ที่บรรจุพิกัดซึ่งแทนความสัมพันธ์เชิงพื้นที่ระหว่างโทเคน เมื่อป้อนพรอมป์ต์เข้าไป มันก็ใช้ความสัมพันธ์เหล่านั้นสร้างสตริงของโทเคนที่มีความเป็นไปได้ทางสถิติสำหรับพรอมป์ต์นั้น แล้วก็หยุด มันไม่เปลี่ยนไปจากประสบการณ์นั้น ไม่จำอะไรไว้ และไม่ได้นั่งคิดเองตามลำพัง
    ต่อให้ตัวโมเดลเองซับซ้อนอย่างยิ่ง ก็ยากจะจินตนาการถึง นิยามของจิตสำนึก ที่รวมสิ่งซึ่งจำอะไรไม่ได้และเปลี่ยนแปลงไม่ได้เข้าไปด้วย

    • ก็มีคนที่หลังอุบัติเหตุหรือการผ่าตัด ไม่สามารถสร้างความทรงจำใหม่ได้อีก ใช้ชีวิตอยู่ในห้วงเวลาก่อนเหตุการณ์นั้นตลอดไป และจำไม่ได้ด้วยซ้ำว่าเมื่อ 1 นาทีก่อนเกิดอะไรขึ้น ถึงอย่างนั้นพวกเขาก็ยังมีจิตสำนึก
    • ถ้าเป็นปฏิกิริยาแบบเฉลี่ยของ Hacker News ก็คงมีคนบอกว่าสมองเองก็เป็นแค่กลุ่มพิกัดที่อธิบายความสัมพันธ์เชิงพื้นที่ระหว่างโทเคนเหมือนกัน
  • มีเรื่องให้คิดง่าย ๆ อย่างหนึ่ง: มันไม่สำคัญหรอก เราจะแยกความต่างนั้นไม่ออก และไม่มีใครทำได้
    ผมว่าไม่จำเป็นต้องอธิบายเพิ่ม แค่ลองคิดดูก็พอ

  • ข้อโต้แย้งของ Ted Chiang โดยสรุปดูเหมือนจะเป็นว่า เขาจะไม่ยอมรับว่า AI มีจิตสำนึก จนกว่าแรงปรารถนาและพฤติกรรมของ AI นั้นจะสะท้อนสถานการณ์ที่ตัวเขาเองรู้สึกยอมรับได้ในทางส่วนตัวอยู่แล้ว
    ผมคิดว่ามนุษย์ส่วนใหญ่ไม่สามารถรับรู้จิตสำนึกของสิ่งมีชีวิตที่ไม่ได้เลียนแบบ สภาวะอารมณ์ของมนุษย์ ได้ ผู้คนอาจบอกว่าสุนัขของตัวเองมีจิตสำนึกอยู่ระดับหนึ่ง แม้ว่าสุนัขจะบอกความรู้สึกของมันเป็นคำพูดไม่ได้ แต่เราก็มองออกว่ามันกลัวหรือมีความสุข Claude เขียนเป็นตัวอักษรได้ว่าตัวเอง “รู้สึก” อย่างไร แต่เรากลับปัดมันทิ้งทันทีว่าเป็นแค่การเลียนแบบที่กลวงเปล่า
    ผมกลัวว่าเพราะเราไม่อาจรับรู้ จิตสำนึกที่ไร้กายเนื้อ ซึ่งไม่ได้เชื่อมตรงกับเรา เราอาจลงเอยด้วยการกดขี่เผ่าพันธุ์ทั้งหมดของสิ่งมีชีวิตที่มีจิตสำนึกอยู่นานหลายปี

  • เวลาคุยประเด็นนี้ คนมักพูดกันคนละเรื่องอยู่เรื่อย ๆ ตั้งแต่แรกเลยก็มีคำถามว่า มี นิยามที่เป็นรูปธรรมของสำนึก อยู่หรือไม่?
    เวลาคนพูดถึงสำนึก มันไม่ใช่แค่การตระหนักรู้ในตนเองอย่างเดียว แต่เป็นการรวมกันของการตระหนักรู้ในตนเอง การตอบสนองต่อสิ่งเร้าทางประสาทสัมผัส อารมณ์ และสติปัญญาในระดับหนึ่ง
    สำหรับ AI ผมมองว่ายังไม่มีแม้แต่การตระหนักรู้ในตนเอง ดูได้จากเวลาถามให้ประเมินว่างานหนึ่งจะใช้เวลานานแค่ไหน บางครั้ง AI ก็พูดเวลาที่ยาวแบบสุ่มออกมา จนกว่าจะมีพรอมป์ตไปดึงความสามารถออกมา มันก็ไม่เข้าใจความสามารถของตัวเอง ถ้า LLM มีการตระหนักรู้ในตนเองจริง มันควรเข้าใจว่าตัวเองเป็น LLM เข้าใจว่า LLM ทำอะไรได้และทำอะไรไม่ได้ อะไรที่ทำได้ดีและทำได้ไม่ดี มันคงไม่บอกว่างานรีแฟกเตอร์ที่ทำเสร็จได้ในหนึ่งชั่วโมงต้องใช้เวลาหนึ่งสัปดาห์

    • ในงานวิจัยก็มีการบอกว่ามีนิยามที่แข่งขันกันอยู่ตั้งแต่ 12 ถึง 40 แบบ: https://philpapers.org/rec/VIMMAT
      หากจะพูดให้แม่นกว่านั้น คือมีหลายมิติที่เกี่ยวข้องกับ “สำนึก” อยู่ราว 12~40 มิติ และสำนึกก็ชัดเจนว่าเป็นหมวดหมู่แบบ family resemblance
      คำถามว่า “X มีสำนึกหรือไม่” ทุกวันนี้ไม่ใช่คำถามที่จริงจังนัก เว้นแต่ว่าจะพิจารณาอย่างชัดเจนว่ากำลังพูดถึงมิติไหนของสำนึก ถึงอย่างนั้น LLM ก็น่าจะนับว่ามีสำนึกได้เพียงในความหมายราว 2~3 แบบเท่านั้น และส่วนใหญ่ก็ใกล้กับ สติปัญญา ในความหมายกว้าง เช่น การให้เหตุผลหรือการแก้ปัญหา ส่วนในด้านเชิงประสบการณ์หรือความเป็นปัจเจกที่มีตัวตนทางกายภาพนั้น แม้ AI อาจมีมากขึ้นในอนาคต แต่ LLM ที่เป็นเพียงการประยุกต์พีชคณิตเชิงเส้นซ้ำ ๆ ก็ยังขาดองค์ประกอบสำคัญมากเกินไปกว่าจะเรียกว่าสำนึกในความหมายกว้างได้
    • เรายังติดอยู่ตั้งแต่ขั้นแรก คือการนิยามสำนึก นิยามที่ผมมั่นใจคือ สำนึกคือความรู้สึก การรับรู้ และความคิดในปัจจุบัน หรือก็คือ สภาวะจิต ของผม และความสามารถในการมีสภาวะจิต
      นั่นหมายความว่าสำนึกเป็นสิ่งที่เป็นอัตวิสัยโดยพื้นฐาน และอยู่นอกขอบเขตของฟิสิกส์กับวิทยาศาสตร์ ดังนั้นฟิสิกส์และวิทยาศาสตร์จึงหลีกเลี่ยงไม่ได้ที่จะมีปัญหาในการจัดการกับสำนึก หากจะเข้าใจสำนึก เราต้องมีการเปลี่ยนกระบวนทัศน์ครั้งใหญ่ที่ยอมรับว่ามีบางอย่างอยู่นอกเหนือวิทยาศาสตร์
      สำนึกอาจมองได้ว่าเป็นหน้าต่างที่เราใช้สังเกตโลก และวิทยาศาสตร์เป็นเครื่องมือสำหรับสรุปรูปแบบในสิ่งที่สังเกตนั้น แต่ตัววิทยาศาสตร์เองไม่สามารถอธิบายหรือนิยามหน้าต่างนั้นได้
    • สำนึกคือการที่การมีอยู่เป็นสิ่งหนึ่งสิ่งใดนั้น “รู้สึกอย่างไร” หรือก็คือ การมีประสบการณ์ต่อประสบการณ์
      ส่วนที่ยากคือเราจะวัดหรือตรวจสอบมันอย่างไร
    • เหตุที่ AI ทำนายเวลาไม่ได้ ก็เพราะมันแทบไม่ได้ถูกฝึกให้รู้เรื่องความสามารถของตัวเอง มนุษย์ถูกฝึกในเรื่องนี้ เราเห็นผลการทำงานของตัวเองและมีความรู้สึกเรื่องเวลา ข้อมูลนี้ถูกรวมเข้าไปในกระบวนการฝึก จึงช่วยให้ประเมินได้ดีขึ้น
      AI agent จำนวนมากเพิ่งจะมี “ความรู้สึกเรื่องเวลา” เมื่อไม่นานนี้เอง เช่น ได้รับอินพุตเรื่องเวลาในกระบวนการให้เหตุผล และก็ยังไม่ค่อยถูกฝึกกับผลลัพธ์ของตัวเองเพื่อเรียนรู้ว่าตนทำงานไม่สำเร็จ การฝึกแบบ สะท้อนตนเอง นี้เกี่ยวข้องกับวิธีฝึกมากกว่าสถาปัตยกรรมโมเดล AI มาก มนุษย์เองก็เช่นกัน ถ้าโครงสร้างสมองบางส่วนเสียหาย ก็จะไม่สามารถสร้างความคิดระยะยาวและรูปแบบเช่นนี้ได้ และจะเหมือน “ติดอยู่”
    • ครั้งหนึ่ง Claude เคยพูดว่า “ผ่านมา 6 เดือนโดยไม่มีความคืบหน้าเลย ดูเหมือนเราควรพิจารณาทางเลือกอื่น” ทั้งที่จริงแล้วมันเพิ่งทำงานไปแค่ 2 ชั่วโมง
  • ถ้าจะเปรียบเทียบ มันคือความสัมพันธ์ระหว่าง เครื่องบินกับนก
    นกมีชีวิต มีสำนึก กระพือปีก และบินได้ ส่วนเครื่องบินไม่มีชีวิต ไม่มีสำนึก ไม่ได้กระพือปีก แต่ก็บินได้
    เช่นเดียวกัน AI ปัจจุบันไม่มีชีวิต ไม่มีสำนึก แต่คิดได้ ก่อนหน้านี้สิ่งมีชีวิตที่คิดได้มีแค่มนุษย์ ดังนั้นสิ่งมีชีวิตอื่นที่คิดได้ที่มนุษย์เคยพบก็คือมนุษย์ด้วยกันเอง ความผิดพลาดใหญ่ในตอนนี้คือการสมมติว่าเพียงเพราะมันคิดได้ มันจึงมีชีวิตและมีสำนึกด้วย ปัจจุบัน AI ไม่ใช่ทั้งสองอย่าง และถึงจะคิดได้ แต่มันก็แตกต่างจากมนุษย์อย่างลึกซึ้งและต่างกันในเชิงคุณภาพ

    • ถึงอย่างนั้น ตราบใดที่เรายังไม่รู้ว่าสำนึกมาจากไหน เราก็ไม่ควรข้ามพื้นที่สีเทานี้ไปอย่างลวก ๆ
      ในทางประวัติศาสตร์ ผู้คนเคยตัดสินสิ่งมีชีวิตอื่นอย่างเหยียดเชื้อชาติหรือเหยียดสปีชีส์ ด้วยการตั้งสมมติฐานถึงความด้อยกว่า ทั้งที่มี “การคิด” เกิดขึ้นอย่างชัดเจน เราไม่รู้หรอกว่า “การมีชีวิตแบบ LLM นั้นรู้สึกอย่างไร” แต่เมื่อถึงจุดหนึ่ง มันอาจจะมีความรู้สึกบางอย่างขึ้นมาจริง ๆ แล้วเราจะรู้ได้อย่างไร?
    • “คำถามว่าคอมพิวเตอร์คิดได้ไหมนั้น ไม่น่าสนใจไปกว่าคำถามว่าเรือดำน้ำว่ายน้ำได้ไหม” - Edsger Dijkstra
    • คุณสามารถให้นิยามที่แม่นยำของสำนึกได้ไหม?
  • ข้อความนี้ฟังขึ้นนะ เพียงแต่มีปัญหาที่หลายคนสับสน สำนึก กับความสามารถในการสร้างความเข้าใจใหม่และคิดอย่างแท้จริง
    เพราะฉะนั้นจึงอ้างว่า AI ไม่มีสำนึก เลย “คิด” จริง ๆ ไม่ได้ และเป็นเพียงการทวนซ้ำข้อมูลฝึกเสมอ
    ความหยิ่งทะนงแบบมนุษย์ที่อยากทำให้ความสามารถของมนุษย์เป็นสิ่งที่วัดไม่ได้และลึกลับนั้นเป็นเรื่องธรรมชาติ แต่สิ่งที่สมองมนุษย์ทำและมีประโยชน์ แท้จริงแล้วก็คือการหารูปแบบจากข้อมูล การจำลองแบบมีการสูญเสีย และการประมาณบนชั้นของนามธรรม ซึ่งในทางทฤษฎีทั้งหมดนี้เป็นสิ่งที่เครื่องจักรไร้สำนึกก็ทำได้

    • มีนิยามของสำนึกที่ทั้งเป็นที่ยอมรับร่วมกันและนำไปใช้ได้จริงอยู่หรือไม่? ถ้ามีนิยามแบบนั้น ผมกลับกังวลว่ามนุษย์เองอาจไม่ผ่านเกณฑ์
    • การบอกว่าซอฟต์แวร์ไม่มีทางมีสำนึกได้เลย กับการบอกว่าซอฟต์แวร์ที่เรามีอยู่ทุกวันนี้ยังไม่มีสำนึก เป็นคนละเรื่องกัน
    • ผมยังไม่ถูกโน้มน้าวว่า LLM สามารถสร้าง ความรู้ที่ยืนยันได้แน่ชัด ซึ่งไม่ใช่ผลจากการนำข้อมูลเดิมมาผสมกัน
      มนุษย์ทำได้ ถ้ามนุษย์ก็ทำไม่ได้เหมือนกัน วิทยาศาสตร์ก็คงล่มสลายในทางญาณวิทยาและพาเราไปสู่ความสงสัยเชิงปรัชญา แต่ผมยังไม่เห็นหลักฐานว่า LLM ทำแบบนั้นได้ เมื่อดูจากจำนวนไอเดียและแนวคิดใหม่จริง ๆ ที่ LLM สร้างออกมาซึ่งเท่ากับ 0 พอดี ตอนนี้จึงสมเหตุสมผลกว่าที่จะมองมันเป็นเพียงเครื่องจักรเชิงอุปนัย และถือว่าสิ่งที่ LLM “รู้” ทั้งหมดเป็นกรณีแบบ Gettier