25 คะแนน โดย xguru 2025-10-18 | 2 ความคิดเห็น | แชร์ทาง WhatsApp
  • แอป macOS แบบเนทีฟที่พัฒนาด้วย SwiftUI โดยบันทึกหน้าจอที่ 1 FPS และทำการวิเคราะห์ด้วย AI ทุก 15 นาที เพื่อสร้างไทม์ไลน์และสรุปโดยอัตโนมัติ
    • สามารถเล่นไทม์แลปส์เพื่อทบทวนภาพรวมของวันได้แบบเห็นภาพ
  • มุ่งเน้นความเบาและใช้ทรัพยากรต่ำ ด้วยเป้าหมายขนาดแอปราว 25MB, ใช้ RAM ~100MB, และ CPU <1% พร้อมมอบ UX ที่เน้นการทำงานบนเครื่องโดยไม่มีองค์ประกอบแบบกระจายศูนย์
  • AI สามารถเลือกประมวลผลได้ด้วย Gemini (ป้อนคีย์ของตนเอง) และ โมเดลภายในเครื่อง (Ollama·LM Studio)
  • ข้อมูลที่บันทึกไว้จะถูกล้างอัตโนมัติหลังเก็บครบ 3 วัน เพื่อเพิ่มประสิทธิภาพการจัดการทรัพยากรและปกป้องความเป็นส่วนตัว
  • Coming Soon
    • แดชบอร์ดที่ปรับแต่งได้ไม่จำกัด : เมื่อโยนคำถามอะไรก็ได้ ระบบจะสร้างผลลัพธ์เป็นไทล์เพื่อให้ติดตามต่อเนื่องได้
    • เดลี่เจอร์นัล : บันทึกการทบทวนไฮไลต์, การสะท้อนจากไกด์พรอมป์ต์, รวมถึงภาพหน้าจอและโน้ตไปพร้อมกับไทม์ไลน์
  • วิธีการทำงาน
    • Capture: บันทึกหน้าจอที่ 1 FPS เป็นชิ้นยาว 15 วินาที
    • Analyze: ทุก 15 นาที จะส่งชิ้นส่วนล่าสุดไปยังผู้ให้บริการ AI ที่เลือกเพื่อทำการวิเคราะห์
    • Generate: สร้างการ์ดสรุปของกิจกรรมเพื่อประกอบเป็นไทม์ไลน์ตามลำดับเวลา
    • Display: แสดงภาพรวมของวันผ่าน UI แบบไทม์ไลน์เชิงภาพ
    • Cleanup: ลบวิดีโอบันทึกที่เกิน 3 วันโดยอัตโนมัติเพื่อจัดการพื้นที่จัดเก็บ

2 ความคิดเห็น

 
oh3vci 2025-10-21

ผมลองใช้แบบรันในเครื่องอยู่ แต่ดูเหมือนว่าจะวิเคราะห์ภาษาเกาหลีได้ไม่ค่อยดีนะครับ พอดูจากสิ่งที่ถูกบันทึก ก็เหมือนว่าจะบันทึกเฉพาะส่วนที่เขียนเป็นภาษาอังกฤษเท่านั้นครับ

 
GN⁺ 2025-10-18
ความคิดเห็นจาก Hacker News
  • ถ้านำผลิตภัณฑ์นี้ไปขายให้ทนายหรือผู้เชี่ยวชาญที่คิดค่าบริการเป็นรายชั่วโมง น่าจะได้รับการตอบรับที่ดี เพราะมันช่วยกู้คืนงานที่ตกหล่นระหว่างวันและป้องกันรายได้รั่วไหลจากการคิดบิล จึงมีแนวโน้มว่าจะยอมจ่ายในราคาสูง

    • ในอีกมุมหนึ่ง ก็อดคิดไม่ได้ว่าถ้าใช้สิ่งนี้ มันอาจเผยให้เห็นด้วยว่าทนายทำงานจริงน้อยแค่ไหนเมื่อเทียบกับเวลาที่คิดเงิน
    • ผมเองในฐานะผู้รับจ้างพัฒนาซอฟต์แวร์ก็อยากได้ฟีเจอร์แบบนี้มาตลอด ตอนนี้กำลังทำต้นแบบง่าย ๆ บน Linux อยู่
    • ที่อังกฤษไม่ได้คิดบิลเป็นรายชั่วโมง แต่คิดทุก 6 นาที สะท้อนวัฒนธรรมการทำงานได้ดีเลย
  • เป็นผลิตภัณฑ์ที่ดี! ตอนนี้ผมใช้ ActivityWatch บนพีซีเพื่อติดตามงานอยู่
    สิ่งที่ผมอยากได้จากซอฟต์แวร์แบบนี้มีดังนี้

    • ฟีเจอร์ค้นหาจุดเริ่มต้นของความวอกแวก: เช่น เปิดหน้าต่างอีเมลเพื่อจะเช็กอีเมลฉบับหนึ่ง แต่กลับไปอ่านอีเมลที่ไม่เกี่ยวข้องต่อจนเสียสมาธิไป 5~15 นาที ถ้ามีข้อมูลนี้ก็จะนำไปสู่การลงมือแก้ไขเพื่อลดความวอกแวกได้ เช่น ผมติดตั้งปลั๊กอินซ่อนวิดีโอแนะนำของ YouTube แล้วช่วยลดอาการวอกแวกได้จริง หรือปิดหน้าต่างที่ไม่ใช้ทั้งหมดเพื่อไม่ให้สายตาไปสะดุดกับอย่างอื่น
    • การระบุงานที่ทำซ้ำและรอบความถี่ของมัน: เช่น ถ้าทุกสัปดาห์ต้องทำใบแจ้งหนี้ด้วยมือในเคสข้อยกเว้นบางอย่างแบบแทบจะเหมือนเดิมทุกครั้ง ก็จะได้ลองคิดว่าพอจะทำให้เป็นอัตโนมัติได้ไหม
    • บันทึกสภาวะอารมณ์ก่อน ระหว่าง และหลังทำงาน: นี่เป็นคำถามที่กว้างและนิยามยากที่สุด แต่ผมคิดว่ามันมีศักยภาพมากในการช่วยปรับปรุงนิสัยผัดวันประกันพรุ่งและทำให้เริ่มงานได้ง่ายขึ้น
    • ถ้ามีฟีเจอร์ที่ช่วยให้แต่ละคนเข้าใจรูปแบบการเสียสมาธิของตัวเองได้ก็คงดีมาก ผมเองก็ใช้ส่วนขยาย YouTube แบบเดียวกันเหมือนกัน
  • ผมนึกขึ้นมาได้ทันทีว่าผลิตภัณฑ์แบบนี้น่าจะช่วยคนที่มี ADHD ได้มาก
    มันช่วยให้รู้ว่าอะไรเป็นตัวกระตุ้นความวอกแวก และมีรูปแบบซ้ำ ๆ อะไรบ้าง (เช่น ทุกครั้งที่ git commit ก็เข้า Hacker News ไปเสียเวลา 15 นาที)
    การที่มันบันทึกให้อัตโนมัติและย้อนกลับมาทบทวนได้เป็นเรื่องใหญ่มาก เมื่อก่อนผมเคยใช้ TimeRescue แล้วประสบความสำเร็จมากในการวัดเวลางานของลูกค้าอย่างแม่นยำ
    แต่เครื่องมือที่ต้องกรอกข้อมูลด้วยมือมักจะรบกวนสมาธิหรือไม่ก็ลืมใช้เสมอ เลยใช้ได้ไม่นาน
    ถ้าก้าวไปอีกขั้น ก็อยากได้ฟีเจอร์ที่คอยบอกแบบเรียลไทม์ (โดยคำนึงถึงดีเลย์ในการประมวลผล) ว่าตอนนี้ผมกำลังออกนอกเรื่องอยู่ โดยให้ผู้ใช้กำหนดเองว่าอะไรคือการเสียสมาธิ หรือออกแบบให้มันฉลาดขึ้นเรื่อย ๆ จากฟีดแบ็กก็ได้
    ผมคิดว่าผลิตภัณฑ์นี้น่าสนใจมาก ชอบไอเดียแบบ Windows Recall อยู่แล้ว และยิ่งดีที่ตัวนี้เน้นความเป็นส่วนตัว

  • ผมชอบคอนเซปต์ของผลิตภัณฑ์นี้มาก แต่ก็กังวลที่นักพัฒนามี GitHub แทบว่างเปล่าแล้วจู่ ๆ ก็ออกแอปที่สามารถกลายเป็นสปายแวร์ได้ง่าย โดยเฉพาะเรื่องความปลอดภัยอย่างรหัสผ่าน

    • ถ้ามีซอร์สอยู่บน GitHub แล้ว ก็คลายกังวลได้ง่ายกว่าการไปสนใจโปรไฟล์ เพราะสามารถเข้าไปตรวจโค้ดได้โดยตรง
  • ผมไม่สบายใจที่จะส่งข้อมูลอ่อนไหวอย่างข้อมูลธนาคารหรือรหัสผ่านไปให้ Gemini
    อยากรู้ว่าถ้าใช้โมเดลแบบ local แล้วประสิทธิภาพจะต่างกันแค่ไหน

    • ถ้าให้คะแนนจากประสบการณ์และการประเมินของผม Gemini 2.5 pro ได้ประมาณ A- ส่วน qwen2.5vl อยู่ราว ๆ B-/C+ ผลลัพธ์ไม่ได้คงที่เสมอไป เลยรับประกันคุณภาพได้ยาก
      จากงานวิจัยล่าสุดดูเหมือนว่าเทคนิค distillation จะทำให้โมเดล local มีประสิทธิภาพระดับ SOTA ได้ ผมเลยตั้งใจจะลองทดลองทางนั้นด้วยตัวเอง
    • ถ้าใช้ Gemini เวอร์ชันทั่วไปที่ไม่ใช่ enterprise ข้อมูลอ่อนไหวทั้งหมดที่อยู่ในพรอมป์ต์และคำตอบจะถูกเปิดเผยให้ Google เห็น 100%
    • Google ก็มีอีเมล เบราว์เซอร์ ระบบปฏิบัติการสมาร์ตโฟนของผม รวมถึงรหัสผ่านบางส่วนอยู่แล้ว ดังนั้นผมจึงถือเสียว่าข้อมูลลับทั้งหมดของผมถูกดึงไปหมดแล้ว
    • ปกติรหัสผ่านไม่ควรถูกแสดงบนหน้าจออยู่แล้ว และควรถูกส่งจาก password manager ไปยังช่องกรอกที่ถูกปกปิดโดยตรง จึงไม่ควรปรากฏบนหน้าจอ
  • คอนเซปต์คล้ายกับ screenpipe โดย screenpipe ปรับแต่งได้มากกว่า
    github.com/mediar-ai/screenpipe

    • ผมเป็นผู้ก่อตั้ง screenpipe ยินดีมากถ้าจะมีผลิตภัณฑ์แบบนี้เพิ่มขึ้นอีก จะดีมากถ้าเป็น OSS, local, ไม่มี vendor lock-in และเป็นมิตรกับ API/MCP
      ข้อเสียดายคือ ตอนนี้รองรับแค่ macOS ส่วนทุกวันนี้ผมใช้ Windows เป็นหลัก
  • โปรเจกต์เจ๋งมาก! ผมเคยมีประสบการณ์คล้าย ๆ กับ Rewind และมีความกังวลเรื่องความเป็นส่วนตัว
    เผื่อเป็นข้อมูล Rewind ประมวลผล OCR แบบ local แล้วส่งออกไปเฉพาะข้อมูลข้อความ
    ถ้าจะโฟกัสที่ macOS ก็สามารถใช้ VNRecognizeTextRequest เพื่อข้ามขั้นตอน OCR ที่ซับซ้อนได้
    โดยเฉพาะถ้าใช้ AI บนคลาวด์ ก็สามารถใช้โมเดลเบา ๆ อย่าง BERT เพื่อตรวจจับและปกปิดข้อมูลอ่อนไหวได้

    • ไม่เคยรู้จัก VNRecognizeTextRequest มาก่อน น่าสนใจมาก ขอบคุณที่แนะนำ
  • สงสัยว่าถ้าจับภาพหน้าจอระหว่าง Zoom หรือการประชุมวิดีโอ โดยไม่ใช่การบันทึกวิดีโอ จะยังต้องแจ้งตามกฎหมายว่าเป็นการ “บันทึก” อยู่ไหม
    แล้วถ้ามีคำบรรยายสดหรือฟังก์ชันถอดเสียง จะทำให้ข้อกำหนดทางกฎหมายต่างออกไปหรือเปล่า

    • ในรัฐของผม การจับภาพหน้าจอ Zoom โดยไม่แจ้งว่ากำลังบันทึกอยู่ โดยทั่วไปถือว่าผิดกฎหมาย แม้ผมจะไม่แน่ใจทั้งหมด แต่ประเด็นหลักคือมีการเก็บวิดีโอ 1fps หรือไม่ ไม่ใช่ว่ามี AI สรุปผลหรือเปล่า
  • ผลิตภัณฑ์นี้ดีจริง ๆ ใช้สมองน้อยกว่าการต้องคอยใช้ time tracker แบบเดิมด้วยตัวเองมาก
    ผมชอบที่มีทั้งตัวเลือกแบบ local และตัวเลือก BYO key (ใช้คีย์ของตัวเอง) ให้เลือกด้านความเป็นส่วนตัวได้
    รู้สึกว่าโปรดักต์ลักษณะนี้น่าจะมีออกมาตั้งนานแล้ว และตัวนี้ก็ดูทำออกมาได้ดีมากจริง ๆ

  • ผมเองก็มีแนวโน้มจะใช้เฉพาะโมเดล local เหมือนกัน เป็นผลิตภัณฑ์ที่เจ๋งมาก

    • เพื่อน ๆ ของผมกับผมชอบแบบ local/คลาวด์กันคนละครึ่ง ซึ่งก็ดีที่แต่ละคนเลือกได้เองว่าจะเอาคุณภาพหรือความเป็นส่วนตัวตามความชอบ