- แอป macOS แบบเนทีฟที่พัฒนาด้วย SwiftUI โดยบันทึกหน้าจอที่ 1 FPS และทำการวิเคราะห์ด้วย AI ทุก 15 นาที เพื่อสร้างไทม์ไลน์และสรุปโดยอัตโนมัติ
- สามารถเล่นไทม์แลปส์เพื่อทบทวนภาพรวมของวันได้แบบเห็นภาพ
- มุ่งเน้นความเบาและใช้ทรัพยากรต่ำ ด้วยเป้าหมายขนาดแอปราว 25MB, ใช้ RAM ~100MB, และ CPU <1% พร้อมมอบ UX ที่เน้นการทำงานบนเครื่องโดยไม่มีองค์ประกอบแบบกระจายศูนย์
- AI สามารถเลือกประมวลผลได้ด้วย Gemini (ป้อนคีย์ของตนเอง) และ โมเดลภายในเครื่อง (Ollama·LM Studio)
- ข้อมูลที่บันทึกไว้จะถูกล้างอัตโนมัติหลังเก็บครบ 3 วัน เพื่อเพิ่มประสิทธิภาพการจัดการทรัพยากรและปกป้องความเป็นส่วนตัว
- Coming Soon
- แดชบอร์ดที่ปรับแต่งได้ไม่จำกัด : เมื่อโยนคำถามอะไรก็ได้ ระบบจะสร้างผลลัพธ์เป็นไทล์เพื่อให้ติดตามต่อเนื่องได้
- เดลี่เจอร์นัล : บันทึกการทบทวนไฮไลต์, การสะท้อนจากไกด์พรอมป์ต์, รวมถึงภาพหน้าจอและโน้ตไปพร้อมกับไทม์ไลน์
- วิธีการทำงาน
- Capture: บันทึกหน้าจอที่ 1 FPS เป็นชิ้นยาว 15 วินาที
- Analyze: ทุก 15 นาที จะส่งชิ้นส่วนล่าสุดไปยังผู้ให้บริการ AI ที่เลือกเพื่อทำการวิเคราะห์
- Generate: สร้างการ์ดสรุปของกิจกรรมเพื่อประกอบเป็นไทม์ไลน์ตามลำดับเวลา
- Display: แสดงภาพรวมของวันผ่าน UI แบบไทม์ไลน์เชิงภาพ
- Cleanup: ลบวิดีโอบันทึกที่เกิน 3 วันโดยอัตโนมัติเพื่อจัดการพื้นที่จัดเก็บ
2 ความคิดเห็น
ผมลองใช้แบบรันในเครื่องอยู่ แต่ดูเหมือนว่าจะวิเคราะห์ภาษาเกาหลีได้ไม่ค่อยดีนะครับ พอดูจากสิ่งที่ถูกบันทึก ก็เหมือนว่าจะบันทึกเฉพาะส่วนที่เขียนเป็นภาษาอังกฤษเท่านั้นครับ
ความคิดเห็นจาก Hacker News
ถ้านำผลิตภัณฑ์นี้ไปขายให้ทนายหรือผู้เชี่ยวชาญที่คิดค่าบริการเป็นรายชั่วโมง น่าจะได้รับการตอบรับที่ดี เพราะมันช่วยกู้คืนงานที่ตกหล่นระหว่างวันและป้องกันรายได้รั่วไหลจากการคิดบิล จึงมีแนวโน้มว่าจะยอมจ่ายในราคาสูง
เป็นผลิตภัณฑ์ที่ดี! ตอนนี้ผมใช้ ActivityWatch บนพีซีเพื่อติดตามงานอยู่
สิ่งที่ผมอยากได้จากซอฟต์แวร์แบบนี้มีดังนี้
ผมนึกขึ้นมาได้ทันทีว่าผลิตภัณฑ์แบบนี้น่าจะช่วยคนที่มี ADHD ได้มาก
มันช่วยให้รู้ว่าอะไรเป็นตัวกระตุ้นความวอกแวก และมีรูปแบบซ้ำ ๆ อะไรบ้าง (เช่น ทุกครั้งที่
git commitก็เข้า Hacker News ไปเสียเวลา 15 นาที)การที่มันบันทึกให้อัตโนมัติและย้อนกลับมาทบทวนได้เป็นเรื่องใหญ่มาก เมื่อก่อนผมเคยใช้ TimeRescue แล้วประสบความสำเร็จมากในการวัดเวลางานของลูกค้าอย่างแม่นยำ
แต่เครื่องมือที่ต้องกรอกข้อมูลด้วยมือมักจะรบกวนสมาธิหรือไม่ก็ลืมใช้เสมอ เลยใช้ได้ไม่นาน
ถ้าก้าวไปอีกขั้น ก็อยากได้ฟีเจอร์ที่คอยบอกแบบเรียลไทม์ (โดยคำนึงถึงดีเลย์ในการประมวลผล) ว่าตอนนี้ผมกำลังออกนอกเรื่องอยู่ โดยให้ผู้ใช้กำหนดเองว่าอะไรคือการเสียสมาธิ หรือออกแบบให้มันฉลาดขึ้นเรื่อย ๆ จากฟีดแบ็กก็ได้
ผมคิดว่าผลิตภัณฑ์นี้น่าสนใจมาก ชอบไอเดียแบบ Windows Recall อยู่แล้ว และยิ่งดีที่ตัวนี้เน้นความเป็นส่วนตัว
ผมชอบคอนเซปต์ของผลิตภัณฑ์นี้มาก แต่ก็กังวลที่นักพัฒนามี GitHub แทบว่างเปล่าแล้วจู่ ๆ ก็ออกแอปที่สามารถกลายเป็นสปายแวร์ได้ง่าย โดยเฉพาะเรื่องความปลอดภัยอย่างรหัสผ่าน
ผมไม่สบายใจที่จะส่งข้อมูลอ่อนไหวอย่างข้อมูลธนาคารหรือรหัสผ่านไปให้ Gemini
อยากรู้ว่าถ้าใช้โมเดลแบบ local แล้วประสิทธิภาพจะต่างกันแค่ไหน
จากงานวิจัยล่าสุดดูเหมือนว่าเทคนิค distillation จะทำให้โมเดล local มีประสิทธิภาพระดับ SOTA ได้ ผมเลยตั้งใจจะลองทดลองทางนั้นด้วยตัวเอง
คอนเซปต์คล้ายกับ screenpipe โดย screenpipe ปรับแต่งได้มากกว่า
github.com/mediar-ai/screenpipe
ข้อเสียดายคือ ตอนนี้รองรับแค่ macOS ส่วนทุกวันนี้ผมใช้ Windows เป็นหลัก
โปรเจกต์เจ๋งมาก! ผมเคยมีประสบการณ์คล้าย ๆ กับ Rewind และมีความกังวลเรื่องความเป็นส่วนตัว
เผื่อเป็นข้อมูล Rewind ประมวลผล OCR แบบ local แล้วส่งออกไปเฉพาะข้อมูลข้อความ
ถ้าจะโฟกัสที่ macOS ก็สามารถใช้
VNRecognizeTextRequestเพื่อข้ามขั้นตอน OCR ที่ซับซ้อนได้โดยเฉพาะถ้าใช้ AI บนคลาวด์ ก็สามารถใช้โมเดลเบา ๆ อย่าง BERT เพื่อตรวจจับและปกปิดข้อมูลอ่อนไหวได้
VNRecognizeTextRequestมาก่อน น่าสนใจมาก ขอบคุณที่แนะนำสงสัยว่าถ้าจับภาพหน้าจอระหว่าง Zoom หรือการประชุมวิดีโอ โดยไม่ใช่การบันทึกวิดีโอ จะยังต้องแจ้งตามกฎหมายว่าเป็นการ “บันทึก” อยู่ไหม
แล้วถ้ามีคำบรรยายสดหรือฟังก์ชันถอดเสียง จะทำให้ข้อกำหนดทางกฎหมายต่างออกไปหรือเปล่า
ผลิตภัณฑ์นี้ดีจริง ๆ ใช้สมองน้อยกว่าการต้องคอยใช้ time tracker แบบเดิมด้วยตัวเองมาก
ผมชอบที่มีทั้งตัวเลือกแบบ local และตัวเลือก BYO key (ใช้คีย์ของตัวเอง) ให้เลือกด้านความเป็นส่วนตัวได้
รู้สึกว่าโปรดักต์ลักษณะนี้น่าจะมีออกมาตั้งนานแล้ว และตัวนี้ก็ดูทำออกมาได้ดีมากจริง ๆ
ผมเองก็มีแนวโน้มจะใช้เฉพาะโมเดล local เหมือนกัน เป็นผลิตภัณฑ์ที่เจ๋งมาก