- ผู้เขียนพบ ภาพถ่ายครอบครัว 1,351 ใบ ที่บ้านคุณยายและสร้าง วิกิส่วนตัวบน MediaWiki เพื่อจัดระเบียบความทรงจำให้เป็นโครงสร้าง
- ด้วยรูปแบบวิกิ ผู้เขียนสามารถ เชื่อมโยงภาพถ่าย บุคคล และเหตุการณ์เข้าด้วยกัน แล้วเรียบเรียงประวัติครอบครัวและประวัติชีวิตส่วนตัวใหม่ให้อยู่ในรูปบทความ
- ต่อมามีการรวมร่องรอยดิจิทัลหลากหลายแบบ เช่น Google Photos, ประวัติตำแหน่ง, ธุรกรรมการเงิน, ข้อมูลการรู้จำเพลง และทดลองให้ Claude Code กับ language model สร้างหน้าอัตโนมัติ
- ในกระบวนการนี้ โมเดลได้ เติมเต็มช่องว่างของความทรงจำ และจัดระเบียบลำดับของบทสนทนา การเดินทาง และมิตรภาพใหม่ให้เป็น เรื่องเล่าที่อิงข้อมูล
- สุดท้ายโครงการได้พัฒนาเป็น โอเพนซอร์สโปรเจกต์ whoami.wiki ที่เสนอระบบให้แต่ละคนสามารถ สำรวจและครอบครองข้อมูลของตนเองได้เหมือนสารานุกรม
จุดเริ่มต้นของโครงการสารานุกรมส่วนบุคคล
- หลังการระบาดใหญ่ ผู้เขียนกลับไปเยี่ยมบ้านคุณยายเป็นครั้งแรกและพบ ภาพถ่ายเก่า 1,351 ใบ ก่อนเริ่มจัดระเบียบ
- ในภาพมีทั้งช่วงวัยหนุ่มสาวของปู่ย่าตายายไปจนถึงช่วงมัธยมต้นของผู้เขียน
- การจัดหมวดหมู่ช่วงแรกอิงจาก คุณสมบัติทางกายภาพ เช่น ชนิดฟิล์มหรือสัดส่วนภาพ
- ระหว่างจัดภาพ ผู้เขียนนึกถึง เรื่องราวที่กระจัดกระจายของความทรงจำ ขึ้นมาได้ แต่ลำดับและบริบทยังไม่ชัดเจน
- เนื่องจากเป็นภาพจากยุคที่ยังไม่มี EXIF metadata จึง ยากต่อการระบุลำดับเวลา
- ผู้เขียนช่วยคุณยายจัดเรียงภาพใหม่และบันทึก ความทรงจำเกี่ยวกับงานแต่งงาน ในรูปแบบคำบอกเล่า
- มีการจดชื่อบุคคลและเหตุการณ์ไว้ และบางส่วนยืนยันได้ว่าเป็นญาติในวัยหนุ่มสาว
- จากนั้นจึงจัดระเบียบบันทึกและ รัน MediaWiki แบบโลคัล เพื่อแก้ไขในรูปแบบเดียวกับ Wikipedia จริง
- มีการสร้างหน้าแบบมีโครงสร้างที่ประกอบด้วย อินโฟบ็อกซ์ เนื้อหา คำบรรยายภาพ และลิงก์บุคคล
- หัวข้อที่เกี่ยวข้อง เช่น การแก้ไขกฎหมาย พิธีกรรม และสถานที่ ถูกเชื่อมไปยังหน้า Wikipedia จริง
การรื้อสร้างความทรงจำผ่านซอฟต์แวร์วิกิ
- ภายในสองวัน ผู้เขียนสามารถเรียบเรียง ฉากหลังทางประวัติศาสตร์ของภาพถ่ายให้อยู่ในรูปบทความที่สมบูรณ์
- ทำให้ตระหนักว่าซอฟต์แวร์วิกิเป็น เครื่องมือทรงพลังในการเก็บรักษาความรู้และสื่อ
- หลังจากนั้นตลอดหลายเดือน ผู้เขียนขยายงานไปยังภาพถ่ายครอบครัวทั้งหมดในรูปแบบหน้าวิกิ
- ได้รับคำแนะนำจาก ชุมชน r/genealogy เพื่อปรับปรุงวิธีบันทึกประวัติแบบมุขปาฐะ
- ใช้ การถอดเสียงและ language model เพื่อเพิ่มประสิทธิภาพในการแก้ไข
- ด้วยรูปแบบวิกิ จึงมองเห็น ความเชื่อมโยงระหว่างเหตุการณ์และบุคคล ได้ง่าย
- ตัวอย่างเช่น พบว่านักร้องในงานแต่งงานของปู่ย่าตายายคือพยาบาลที่ทำคลอดผู้เขียน
การผสานข้อมูลดิจิทัลกับ language model
- ต่อมาโครงการขยายไปยัง ภาพดิจิทัลใน Google Photos
- ทำให้สามารถใช้ วันที่ เวลา และข้อมูลตำแหน่ง จาก EXIF metadata ได้
- สำหรับภาพทริปครอบครัวในปี 2012 จำนวน 625 ใบ ผู้เขียนขอให้ Claude Code สร้างหน้าวิกิ
- ใช้ contact sheet ที่สร้างด้วย ImageMagick เป็นข้อมูลอ้างอิงในการสำรวจภาพ
- โมเดลสามารถ รื้อสร้างสถานที่และกิจกรรมได้จากข้อมูลภาพและ timestamp เพียงอย่างเดียว
- รวมถึงคำบรรยายรายละเอียด เช่น พาหนะที่ใช้ สถานที่ที่แวะ และการระบุตัวบุคคล
- จากนั้นผู้เขียนเพิ่ม รายการเกร็ดเรื่องเล่าของตนเอง ลงในฉบับร่างเพื่อทำให้เรื่องเล่าสมบูรณ์
การทดลองรวมข้อมูลหลายประเภท
- จากนั้นมีการขยายไปยัง ข้อมูลการเดินทางเม็กซิโกซิตี ในปี 2022
- รวมข้อมูลภาพถ่าย 291 ใบ วิดีโอ 343 รายการ และ ประวัติตำแหน่งจาก Google Maps, การเดินทางด้วย Uber, ธุรกรรมธนาคาร, บันทึกจาก Shazam
- งานหลักที่ Claude Code ทำมีดังนี้
- วิเคราะห์ไขว้ธุรกรรมธนาคารกับข้อมูลตำแหน่ง เพื่อระบุร้านอาหารที่ไป
- ใช้ ข้อมูลการชำระเงินค่าตั๋ว เพื่อระบุทีมและชื่อการแข่งขันฟุตบอล
- ใช้ ประวัติการเดินทางด้วย Uber เพื่อตรวจสอบเวลาและตำแหน่งการเดินทาง
- ใช้ บันทึกจาก Shazam เพื่ออธิบายแนวเพลงในแต่ละสถานที่
- ค้นหา ฉากเล่นกีตาร์ระหว่างมื้อเย็น จากเฟรมวิดีโอแล้วแทรกลงในหน้า
- ยังใช้ความสามารถของ MediaWiki อย่าง หน้าพูดคุย หมวดหมู่ และประวัติการแก้ไข ได้เหมือนเดิม
- ทุกครั้งที่มีข้อมูลใหม่เพิ่มเข้ามา ประวัติการแก้ไขก็สะสมเหมือนมีบรรณาธิการวิกิตัวจริงกำลังแก้ไข
การทำข้อมูลส่วนบุคคลให้เป็นสารานุกรม
- เมื่อเวลาผ่านไป โมเดลเริ่มมีบทบาทในการเติมเต็มช่องว่างของความทรงจำ
- โมเดลวิเคราะห์ไขว้ข้อมูลจากหลายแหล่งเพื่อ กู้คืนข้อเท็จจริงที่ผู้เขียนลืมไปแล้ว
- มีการวิเคราะห์คลังข้อมูลจาก Facebook, Instagram, WhatsApp ซึ่งมีประมาณ 100,000 ข้อความและ voice note
- ดึง ลำดับความสัมพันธ์ของมิตรภาพและเหตุการณ์ในชีวิต จากบทสนทนากับเพื่อนมาจัดเป็นหน้า
- เพื่อน ๆ อ่านหน้าเหล่านั้นแล้ว อินจนอ่านทุกอย่างอย่างละเอียด
- จากกระบวนการนี้ โครงการจึงพัฒนาเกินกว่าการทำประวัติครอบครัวธรรมดา ไปสู่การสร้าง สารานุกรมส่วนบุคคล (personal encyclopedia)
- กลายเป็น ระบบบันทึกตนเองแบบมีโครงสร้างและเชื่อมโยงถึงกันซึ่งอิงข้อมูล
การเปิดเผยโครงการ whoami.wiki
- จากประสบการณ์เหล่านี้ ผู้เขียนจึงเปิดซอร์ส whoami.wiki
- สร้างบน MediaWiki และใช้ข้อมูลส่วนบุคคลเพื่อสร้างหน้าวิกิอัตโนมัติ
- ผู้ใช้เพียงส่งออกข้อมูลของตนเอง แล้ว language model จะเขียนฉบับร่าง
- รองรับ การรันแบบโลคัล การคงสิทธิ์ความเป็นเจ้าของข้อมูล และการไม่ผูกกับโมเดลใดโมเดลหนึ่ง
- ทุกหัวข้อส่วนบุคคล เช่น งานแต่งงาน เพื่อน หรือการเดินทาง สามารถบันทึกได้ใน รูปแบบเดียวกับวิกิสาธารณะ
- ประสบการณ์ในการสำรวจหน้าที่สร้างเสร็จแล้วให้ความเพลิดเพลินที่ ชวนให้นึกถึง Facebook Timeline ยุคแรก
- สิ่งที่สำคัญกว่าเทคโนโลยีคือ การค้นพบผู้คนและความทรงจำอีกครั้ง
- การบันทึกชีวิตของคุณยายทำให้ผู้เขียนมองเห็น ความเข้มแข็งและความยืดหยุ่นในการฟื้นตัว ในมุมใหม่
- การย้อนมองความสัมพันธ์กับเพื่อนทำให้ ความรู้สึกขอบคุณและความผูกพัน กลับคืนมา
- โครงการยังอยู่ในระยะเริ่มต้น และทุกคนสามารถ เริ่มต้นได้ด้วยเอกสารการติดตั้ง
- ข้อมูลยังคงเป็นของผู้ใช้ และอยู่ในรูปแบบที่โมเดลใดก็อ่านได้
- โครงการยังคงได้รับข้อเสนอแนะจากผู้ร่วมพัฒนาเพื่อนำไปปรับปรุงอย่างต่อเนื่อง
1 ความคิดเห็น
ความเห็นจาก Hacker News
ฉันคิดว่าโปรเจ็กต์นี้ยอดเยี่ยมมาก และเป็นวิธีที่น่าสนใจในการเก็บรักษาประวัติครอบครัว
แต่ในส่วนที่มี AI เข้ามาเกี่ยวข้อง ฉันกลับรู้สึกซับซ้อนทางอารมณ์
มันมีความขมขื่นคล้ายงานฝีมือของช่างถูกโรงงานเบียดออกไป ขณะเดียวกันการที่ AI เอาข้อมูลอย่างรายการเดินบัญชี ตั๋ว และประวัติเพลงมาวิเคราะห์ไขว้กันก็ดูดิสโทเปียอยู่เล็กน้อย
ถึงอย่างนั้น โดยรวมก็ยังเป็นความพยายามที่น่าประทับใจมาก
ตอนแรกฉันก็แก้ไขทุกอย่างเองทั้งหมด แล้วร้อยเรียงข้อมูลเหมือนนักประวัติศาสตร์
หลังจากนั้นพอเริ่มทดลองใช้เอเจนต์ ความเร็วในการทำงานก็เพิ่มขึ้นมาก แต่ฉันก็ยังใช้เวลาแบบเดียวกับ ‘ผู้มีส่วนร่วมในวิกิ’ คอยคิดอยู่ดีว่าจะเก็บอะไรไว้และลบอะไรทิ้ง
พร้อมกันนั้น ประสบการณ์นี้ก็ทำให้ฉันตระหนักอย่างจริงจังถึงความสำคัญของการปกป้องข้อมูลส่วนบุคคล เราทิ้งร่องรอยดิจิทัลไว้มากเกินไปจริง ๆ
มันทำงานเป็นเครื่องมือที่ช่วยงานของมนุษย์ เหมือน ‘จักรยานสำหรับจิตใจ’ ที่ Steve Jobs เคยพูดถึง
นานมากแล้วที่ไม่ได้เห็นเทคโนโลยีช่วยงานสร้างสรรค์ของมนุษย์แบบนี้ และมันทำให้ฉันรู้สึกตื่นเต้นเหมือนเมื่อก่อนอีกครั้ง
ถ้า LLM ใช้จัดระเบียบข้อมูลก็ไม่มีปัญหาทางศีลธรรมอะไร แต่การที่โมเดลจากบริษัทยักษ์ใหญ่มาเล่าเรื่องชีวิตส่วนตัวแทนเรามันชวนอึดอัด
ผู้เขียนรับหน้าที่ส่วนที่น่าสนใจ ส่วน AI รับหน้าที่เชื่อมข้อมูลที่น่าเบื่อ และฉันคิดว่าการแบ่งบทบาทแบบนี้ค่อนข้างเหมาะเลย
ฉันกับภรรยาจะเอากระดาษราว 50 แผ่นมาเย็บรวมกันทำเป็นสมุดเล่มเล็กทุกปีในช่วงปีใหม่
เราเข้าเล่มด้วยผ้าเก่า ๆ และตกแต่งด้วยของที่ระลึกอย่างกล่องไม้ขีดจากสถานที่ท่องเที่ยว
เราเขียนสิ่งที่ได้เรียนรู้ในปีนั้น การทะเลาะและการคืนดี สูตรอาหาร ความคิดต่าง ๆ แล้วเก็บไว้เป็นบันทึกของปีนั้น
เหตุผลที่เราเขียนด้วยมือแทนที่จะใช้เครื่องมือ AI ก็เพราะกระบวนการนั้นเป็นพิธีกรรมที่มีความหมายและน่ารื่นรมย์
พอคิดว่าลูก ๆ จะได้มาอ่านในภายหลัง มันก็ยิ่งรู้สึกงดงามขึ้นไปอีก
เหมือนสมุดสูตรอาหารเก่า ๆ ที่ผ่านการใช้งานมานาน หนังสือที่มีคราบสีนิด ๆ หน่อย ๆ กลับมีเสน่ห์กว่า
ฉันก็เริ่มทำอะไรแบบนี้ด้วยหนังสือที่พิมพ์ออกมาจริงแล้ว
ฉันกำลังใช้ Scribus จัดหน้าในรูปถ่ายหลายพันรูปแล้วทำเป็นหนังสือตามแต่ละปี
ฉันชอบความคิดที่ว่าแม้หลังจากตายไปแล้ว ร่องรอยของฉันก็ยังคงอยู่ในรูปแบบกายภาพ
ฉันวางแผนจะติด SD card ไว้ที่หน้าต้น ๆ เพื่อเก็บวิดีโอไว้ด้วย
นอกจากนี้ฉันยังหาเครื่องพิมพ์ Canon Selphyมือสองมาใช้พิมพ์รูปที่บ้าน สีอาจไม่สมบูรณ์แบบนัก แต่พอเอาไปติดผนังก็รู้สึกภูมิใจมาก
ที่เย็บกระดาษแบบ 360 องศานี่ดีที่สุดสำหรับการเข้าเล่มเร็ว ๆ
มันเป็นโปรเจ็กต์มรดกดิจิทัลที่ตั้งใจให้เขาอ่านได้ตอนอายุ 18 ปี
บทความที่เกี่ยวข้องอยู่ที่นี่
ฉันชอบทำวิจัยลำดับวงศ์ตระกูล ฉันตามรอยบรรพบุรุษที่อพยพมาอาร์เจนตินาได้ถึง 10 รุ่นก่อนหน้า (ประมาณ 250 ปี)
ฝั่งยุโรปค่อนข้างยากเพราะมีสงครามและเอกสารสูญหายเยอะ
ช่วงหลังฉันกำลังรวบรวมเรื่องเล่าเก่า ๆ จากผู้ใหญ่ในครอบครัวผ่านข้อความเสียงแล้วเอามาจัดระเบียบ
ถ้ารวมกับแผนผังเครือญาติที่พ่อทำไว้ แล้วจัดเป็นรูปแบบวิกิก็น่าจะดีมาก
ทุกปีภรรยาของฉันจะคัดเลือกรูปจากบัญชีที่เราใช้ร่วมกันแล้วทำเป็นหนังสือ 50 หน้า
ตอนนี้เรามีบันทึกรายปีต่อเนื่องกันมา 12 ปีแล้ว และมันกลายเป็นความทรงจำที่จับต้องและเปิดพลิกดูได้
เธอยังรับทำสิ่งนี้ให้คนอื่นด้วย และเพราะมีความเป็นส่วนตัวเฉพาะตัวจึงได้รับการตอบรับดีมาก
ตัวโปรเจ็กต์นั้นเจ๋งมาก แต่เวลาใช้LLM API เรื่องความเป็นส่วนตัวสำคัญมาก
ฉันไม่อยากเอารูปของตัวเองไปฝากไว้กับโมเดลของบริษัทอเมริกัน
การผสมกันระหว่างการสัมภาษณ์คนในครอบครัวกับเวิร์กโฟลว์ LLM เป็นตัวอย่างการใช้งานที่ดีมาก
แต่การส่งออกถึงขั้นประวัติตำแหน่งจาก Google Maps, Uber, ธุรกรรมธนาคาร, Shazamให้มันด้วยนี่รู้สึกว่าเกินไปหน่อย
เดี๋ยวนี้มีโปรเจ็กต์ AI มากมายที่พูดว่า “ข้อมูลอยู่ในอุปกรณ์ของฉัน” แต่ในความเป็นจริงแล้วเส้นทางการเคลื่อนย้ายข้อมูลกลับไม่ชัดเจน
ดูเหมือนผู้ใช้จะยังไม่เข้าใจtrade-offพวกนี้อย่างเพียงพอ
ถึงจะบอกว่า “เป็นส่วนตัวโดยค่าเริ่มต้น” แต่ในความเป็นจริงข้อมูลก็ถูกอัปโหลดไปยังเซิร์ฟเวอร์ของบริษัท AI อยู่ดี
ถ้าไม่รองรับ local LLM ข้อความเรื่องความเป็นส่วนตัวก็ควรเขียนให้ชัดเจนกว่านี้
ฉันรู้สึกไม่สบายใจกับส่วนที่บอกว่าเอาข้อมูลจาก Google Maps, Uber, ธนาคาร และ Shazam ไปให้ AI
ตัวโปรเจ็กต์เองยอดเยี่ยมมาก แต่การเอาข้อมูลที่อ่อนไหวที่สุดไปฝากไว้กับบริการแบบนี้มันเสี่ยงเกินไป
ความเป็นไปได้ที่จะรั่วไหลสักวันหนึ่งมีอยู่เสมอ
ฉันสนใจการเก็บรักษาเรื่องราวของครอบครัว แต่ไม่ได้สนใจการวิเคราะห์ตัวเอง
ไอเดียนั้นดี แต่ปัญหาคือจะแชร์ถึงระดับไหน
ถ้าดูคนเดียวก็อาจบันทึกได้ทุกอย่าง แต่ถ้าคนในครอบครัวมาดูด้วย มันก็จะมีเรื่องละเอียดอ่อนเกิดขึ้น
การบันทึกอดีตด้านมืดหรือความขัดแย้งในครอบครัวอาจเป็นการละเมิดความเป็นส่วนตัวได้
เรื่องอย่างสงคราม คุก หรือปัญหามรดก ต่างคนก็ต่างมีความทรงจำและความรู้สึกไม่เหมือนกัน
ถ้าเอาสิ่งเหล่านี้ให้ AI มาร้อยเรียง สุดท้ายอาจเหลือเพียงภาพลวงของความเป็นกลาง และยังอาจไปเปิดแผลเก่าระหว่างคนในครอบครัวอีกด้วย
ท้ายที่สุด ฉันคิดว่าความทรงจำก็ควรมีวงจรชีวิตตามธรรมชาติของการเลือนหาย
คนที่หมกมุ่นกับเทคโนโลยีมักมองข้ามความซับซ้อนแบบมนุษย์พวกนี้