Haru Ongi - ไดอารีขอบคุณด้วยเสียง AI
(play.google.com)สวัสดีครับ/ค่ะ
ฉันเป็นนักพัฒนาที่หวังว่าเทคโนโลยี AI จะกลายเป็นเครื่องมือที่อบอุ่นและสร้างการเปลี่ยนแปลงเชิงบวกให้กับชีวิตประจำวันของผู้คน
ด้วยความเชื่อว่าการบันทึกและการทบทวนเรื่องเล็กๆ ในแต่ละวันอย่างสม่ำเสมอสามารถเปลี่ยนชีวิตได้
ฉันจึงได้พัฒนาแอปไดอารีขอบคุณ 'Haru Ongi' ที่ใครๆ ก็ใช้งานได้ง่ายและเขียนต่อเนื่องได้
แม้ในตลาดจะมีแอปไดอารี AI ที่ยอดเยี่ยมอยู่แล้วมากมาย แต่ฉันรู้สึกว่าการได้รับการปลอบโยนผ่านข้อความเพียงอย่างเดียวยังมีข้อจำกัด
สิ่งที่ต้องการคือ 'เสียง' ที่ให้ความรู้สึกเหมือนเพื่อนแท้กำลังพูดอยู่ข้างๆ
เพื่อสิ่งนี้ เราได้นำโมเดล Gemini รุ่นล่าสุดมาใช้เพื่อสร้างฟีดแบ็กเสียงที่เป็นธรรมชาติ
[แนะนำบริการ]
Haru Ongi เป็นแอปที่เมื่อคุณเขียนไดอารีขอบคุณแล้ว AI คาแรกเตอร์ที่คุณเลือกจะส่งคำตอบกลับมาด้วย 'เสียง' ทันที พร้อมทั้งแสดงความเข้าใจและให้กำลังใจ
[ฟีเจอร์หลัก]
-
ข้อความตอบกลับด้วยเสียงจากเพื่อน AI:
เมื่อเขียนไดอารีเสร็จ ระบบจะวิเคราะห์เนื้อหาและสร้างฟีดแบ็กเป็นเสียงทันที -
เพื่อน AI 3 คนที่มีเอกลักษณ์เฉพาะตัว:
-
เพื่อนสดใสและอบอุ่น 'Seona': สำหรับเวลาที่ต้องการพลังบวก
-
เมนเทอร์ที่สุขุมและอ่อนโยน 'Hyunjun': สำหรับเวลาที่ต้องการคำแนะนำเพื่อการเติบโต
-
'คุณย่าซุนจา' ที่อยู่ข้างคุณเสมอ: สำหรับเวลาที่ต้องการการปลอบโยนและความเข้าใจอย่างอบอุ่น
-
-
ความเป็นส่วนตัวของข้อมูล:
- เนื้อหาไดอารีที่ผู้ใช้เขียนจะถูกจัดเก็บอย่างปลอดภัยด้วยการเข้ารหัส AES256
[เทคโนโลยีที่ใช้ & ประสบการณ์การพัฒนา]
-
AI Model: Google Gemini 2.5 Flash Native Audio Preview
- เมื่อเทียบกับวิธีสร้างข้อความก่อนแล้วค่อยต่อ TTS โมเดล Native Audio ให้ความเป็นธรรมชาติกว่ามากทั้งในด้านน้ำเสียงและจังหวะเว้นหายใจ (Pause)
- โดยเฉพาะอย่างยิ่ง มันมีประสิทธิภาพมากในการถ่ายทอดลักษณะการพูดที่อบอุ่นและเนิบช้าของคาแรกเตอร์ 'ซุนจา(คุณย่า)'
- ระหว่างการปรับแต่งพรอมป์ต์ เราสามารถสร้างเสียงของแต่ละคาแรกเตอร์ตามต้องการได้ด้วยการปรับ persona, ความเร็วเสียง, จังหวะหายใจ, โทนเสียง และการแสดงอารมณ์
- แม้จะได้พิจารณา GPT Realtime API ของ OpenAI ด้วย แต่เมื่อคำนึงถึงความคุ้มค่าด้านต้นทุน ($20.00 per 1M tokens) จึงตัดสินใจรวมระบบไว้ที่ Gemini ในท้ายที่สุด
-
Cost Optimization:
- เนื่องจากต้นทุนของโทเค็นสำหรับเอาต์พุตเสียงสูงกว่าข้อความมาก ($12.00 per 1M tokens) จึงจำเป็นต้องมีการปรับแต่งเพื่อควบคุมความยาวของคำตอบด้วย system prompt
-
UI Workflow: เพิ่มประสิทธิภาพการพัฒนาด้วย Figma Dev Mode
- เมื่อให้ AI เห็นทั้งดีไซน์ต้นแบบและข้อมูลแอสเซ็ตจาก Figma เป็นบริบท (Context) งานพัฒนา UI ก็ง่ายขึ้นมาก
-
Backend: Supabase (DB, Auth), Railway (Fastify), Cloudflare R2 (File Storage)
-
Frontend: React Native (Expo), TypeScript
-
Dev Tools: Claude Code (Main), Cursor (Sub)
[ปิดท้าย]
หากวันนี้คุณรู้สึกเหนื่อยล้าทางใจ ลองแวะมาดูสักครั้งนะครับ/คะ
ตอนนี้สามารถใช้งานได้เฉพาะบน Android เท่านั้น
ขอบคุณครับ/ค่ะ
3 ความคิดเห็น
เปิดตัวบน App Store แล้ว!
https://smplu.link/F8JwF
ผมก็ทำบริการคล้ายๆ กันขึ้นมาใช้คนเดียวอยู่ เลยอดเอาใจช่วยไม่ได้ครับ! หวังว่าจะเป็นผลิตภัณฑ์ที่ดีนะครับ ผมคงต้องลองเปลี่ยนไปใช้ Native Audio แล้วพัฒนาใหม่อีกครั้งครับ
ขอบคุณสำหรับกำลังใจครับ/ค่ะ haha เสียงของโมเดล Native Audio ค่อนข้างเป็นธรรมชาติ เลยคิดว่าถ้าได้ลองใช้ก็น่าจะเป็นประสบการณ์ที่ดีครับ/ค่ะ