4 คะแนน โดย denimcoder 2025-12-02 | 3 ความคิดเห็น | แชร์ทาง WhatsApp

สวัสดีครับ/ค่ะ
ฉันเป็นนักพัฒนาที่หวังว่าเทคโนโลยี AI จะกลายเป็นเครื่องมือที่อบอุ่นและสร้างการเปลี่ยนแปลงเชิงบวกให้กับชีวิตประจำวันของผู้คน

ด้วยความเชื่อว่าการบันทึกและการทบทวนเรื่องเล็กๆ ในแต่ละวันอย่างสม่ำเสมอสามารถเปลี่ยนชีวิตได้
ฉันจึงได้พัฒนาแอปไดอารีขอบคุณ 'Haru Ongi' ที่ใครๆ ก็ใช้งานได้ง่ายและเขียนต่อเนื่องได้

แม้ในตลาดจะมีแอปไดอารี AI ที่ยอดเยี่ยมอยู่แล้วมากมาย แต่ฉันรู้สึกว่าการได้รับการปลอบโยนผ่านข้อความเพียงอย่างเดียวยังมีข้อจำกัด

สิ่งที่ต้องการคือ 'เสียง' ที่ให้ความรู้สึกเหมือนเพื่อนแท้กำลังพูดอยู่ข้างๆ

เพื่อสิ่งนี้ เราได้นำโมเดล Gemini รุ่นล่าสุดมาใช้เพื่อสร้างฟีดแบ็กเสียงที่เป็นธรรมชาติ

[แนะนำบริการ]

Haru Ongi เป็นแอปที่เมื่อคุณเขียนไดอารีขอบคุณแล้ว AI คาแรกเตอร์ที่คุณเลือกจะส่งคำตอบกลับมาด้วย 'เสียง' ทันที พร้อมทั้งแสดงความเข้าใจและให้กำลังใจ

[ฟีเจอร์หลัก]

  1. ข้อความตอบกลับด้วยเสียงจากเพื่อน AI:
    เมื่อเขียนไดอารีเสร็จ ระบบจะวิเคราะห์เนื้อหาและสร้างฟีดแบ็กเป็นเสียงทันที

  2. เพื่อน AI 3 คนที่มีเอกลักษณ์เฉพาะตัว:

    • เพื่อนสดใสและอบอุ่น 'Seona': สำหรับเวลาที่ต้องการพลังบวก

    • เมนเทอร์ที่สุขุมและอ่อนโยน 'Hyunjun': สำหรับเวลาที่ต้องการคำแนะนำเพื่อการเติบโต

    • 'คุณย่าซุนจา' ที่อยู่ข้างคุณเสมอ: สำหรับเวลาที่ต้องการการปลอบโยนและความเข้าใจอย่างอบอุ่น

  3. ความเป็นส่วนตัวของข้อมูล:

    • เนื้อหาไดอารีที่ผู้ใช้เขียนจะถูกจัดเก็บอย่างปลอดภัยด้วยการเข้ารหัส AES256

[เทคโนโลยีที่ใช้ & ประสบการณ์การพัฒนา]

  • AI Model: Google Gemini 2.5 Flash Native Audio Preview

    • เมื่อเทียบกับวิธีสร้างข้อความก่อนแล้วค่อยต่อ TTS โมเดล Native Audio ให้ความเป็นธรรมชาติกว่ามากทั้งในด้านน้ำเสียงและจังหวะเว้นหายใจ (Pause)
    • โดยเฉพาะอย่างยิ่ง มันมีประสิทธิภาพมากในการถ่ายทอดลักษณะการพูดที่อบอุ่นและเนิบช้าของคาแรกเตอร์ 'ซุนจา(คุณย่า)'
    • ระหว่างการปรับแต่งพรอมป์ต์ เราสามารถสร้างเสียงของแต่ละคาแรกเตอร์ตามต้องการได้ด้วยการปรับ persona, ความเร็วเสียง, จังหวะหายใจ, โทนเสียง และการแสดงอารมณ์
    • แม้จะได้พิจารณา GPT Realtime API ของ OpenAI ด้วย แต่เมื่อคำนึงถึงความคุ้มค่าด้านต้นทุน ($20.00 per 1M tokens) จึงตัดสินใจรวมระบบไว้ที่ Gemini ในท้ายที่สุด
  • Cost Optimization:

    • เนื่องจากต้นทุนของโทเค็นสำหรับเอาต์พุตเสียงสูงกว่าข้อความมาก ($12.00 per 1M tokens) จึงจำเป็นต้องมีการปรับแต่งเพื่อควบคุมความยาวของคำตอบด้วย system prompt
  • UI Workflow: เพิ่มประสิทธิภาพการพัฒนาด้วย Figma Dev Mode

    • เมื่อให้ AI เห็นทั้งดีไซน์ต้นแบบและข้อมูลแอสเซ็ตจาก Figma เป็นบริบท (Context) งานพัฒนา UI ก็ง่ายขึ้นมาก
  • Backend: Supabase (DB, Auth), Railway (Fastify), Cloudflare R2 (File Storage)

  • Frontend: React Native (Expo), TypeScript

  • Dev Tools: Claude Code (Main), Cursor (Sub)

[ปิดท้าย]
หากวันนี้คุณรู้สึกเหนื่อยล้าทางใจ ลองแวะมาดูสักครั้งนะครับ/คะ
ตอนนี้สามารถใช้งานได้เฉพาะบน Android เท่านั้น
ขอบคุณครับ/ค่ะ

3 ความคิดเห็น

 
denimcoder 2025-12-21

เปิดตัวบน App Store แล้ว!

https://smplu.link/F8JwF

 
mssmss 2025-12-02

ผมก็ทำบริการคล้ายๆ กันขึ้นมาใช้คนเดียวอยู่ เลยอดเอาใจช่วยไม่ได้ครับ! หวังว่าจะเป็นผลิตภัณฑ์ที่ดีนะครับ ผมคงต้องลองเปลี่ยนไปใช้ Native Audio แล้วพัฒนาใหม่อีกครั้งครับ

 
denimcoder 2025-12-03

ขอบคุณสำหรับกำลังใจครับ/ค่ะ haha เสียงของโมเดล Native Audio ค่อนข้างเป็นธรรมชาติ เลยคิดว่าถ้าได้ลองใช้ก็น่าจะเป็นประสบการณ์ที่ดีครับ/ค่ะ