- โปรเจ็กต์โอเพนซอร์สที่ถอดรหัสและเผยแพร่ ตัวกรองความปลอดภัย ที่ฝังอยู่ในโมเดลเชิงกำเนิดของ Apple Intelligence
- ตัวกรองความปลอดภัยใช้สำหรับบล็อก เนื้อหาที่เป็นอันตรายหรือไม่เหมาะสม และมีชุดกฎการกรองเพื่อให้เป็นไปตามข้อกำหนด
- การ override ด้านความปลอดภัยจะถูก นำไปใช้แตกต่างกันตามคอนเท็กซ์ของโมเดล และให้ข้อมูลกฎเฉพาะที่เหมาะกับแต่ละสถานการณ์
- ไฟล์ที่ถอดรหัสแล้วอยู่ในรูปแบบ json และมีคำ วลี และกฎที่อิงตาม regular expression รวมอยู่ด้วย
- โปรเจ็กต์นี้เป็นทรัพยากรที่มีความหมายสำหรับ การตรวจสอบความเป็นส่วนตัวและความน่าเชื่อถือ รวมถึงการวิเคราะห์ความปลอดภัยของโมเดล
ภาพรวมโปรเจ็กต์
- รีโพซิทอรีนี้ถอดรหัสและเผยแพร่ไฟล์ safety override ของ โมเดลเชิงกำเนิด ที่ใช้งานใน Apple Intelligence
- override ที่ถอดรหัสแล้วถูกจัดระเบียบอย่างเป็นโครงสร้างภายในโฟลเดอร์ และให้มาในรูปแบบไฟล์ JSON สำหรับการกรองความปลอดภัยที่เกี่ยวข้องกับแต่ละโมเดล
- ด้วยสิ่งนี้ เราสามารถตรวจสอบได้อย่างเป็นรูปธรรมว่าโมเดลของ Apple ใช้นโยบาย การกรองเนื้อหา แบบใดอยู่จริง
โครงสร้างโฟลเดอร์และไฟล์
decrypted_overrides/
- เก็บไฟล์ safety override แยกตามไดเรกทอรีสำหรับแต่ละโมเดลเชิงกำเนิด
- ในแต่ละไดเรกทอรีมี Info.plist (metadata) และ AssetData (ไฟล์ JSON ของตัวกรอง)
get_key_lldb.py: สคริปต์ Python สำหรับ ดึงคีย์เข้ารหัส ที่แอปพลิเคชันใช้งาน
decrypt_overrides.py: สคริปต์ Python สำหรับ ถอดรหัส ไฟล์ safety override
การถอดรหัสและทำความเข้าใจไฟล์ override
- ในไฟล์ JSON ของ override มีการระบุกฎ การกรองความปลอดภัยที่ชัดเจน ไว้
- override แต่ละรายการจะจับคู่กับคอนเท็กซ์ของโมเดลที่เฉพาะเจาะจง และรูปแบบการกรองจะแตกต่างกันไปตามสถานการณ์
- ตัวอย่าง JSON มีฟิลด์ต่อไปนี้:
"reject": รายการวลีเฉพาะที่เมื่ออินพุตตรงกันจะถูก ปฏิเสธทันที
"remove": วลีที่ต้อง ลบออก จากผลลัพธ์เอาต์พุต
"replace": แทนที่ วลีบางรายการด้วยวลีอื่น
"regexReject": ปฏิเสธเมื่อมีการแมตช์ด้วย regular expression
"regexRemove", "regexReplace": การลบและแทนที่ผ่าน regular expression
ความสำคัญของการนำโปรเจ็กต์ไปใช้
- โปรเจ็กต์นี้ช่วยให้ตรวจดู กฎการกรองจริงของโมเดลเชิงกำเนิดของ Apple และใช้เป็นข้อมูลอ้างอิงในการประเมิน ความปลอดภัยและความน่าเชื่อถือ ของโมเดลได้
- มีประโยชน์สำหรับนักพัฒนา ผู้รับผิดชอบด้านความปลอดภัย และผู้ที่ต้องการวิเคราะห์การทำงานของตัวกรอง หรือใช้อ้างอิงในการ ออกแบบตัวกรองแบบกำหนดเองของโมเดล
- ช่วยให้เข้าใจได้อย่างโปร่งใสว่า Apple Intelligence ใช้ นโยบายเนื้อหาและระดับการปฏิบัติตามข้อกำหนด ในระดับใด
1 ความคิดเห็น
ความคิดเห็นบน Hacker News