28 เครื่องมือ AI ที่ผมอยากให้มี

(sharif.io)

19 คะแนน โดย GN⁺ 2025-10-02 | 2 ความคิดเห็น | แชร์ทาง WhatsApp

ณ เดือนกันยายน 2025 โมเดล AI ทรงพลังอย่าง Claude Opus 4.1, GPT-5, Nano Banana ได้ถือกำเนิดขึ้น ทำให้ยุคทองของการพัฒนาซอฟต์แวร์มาถึง
บนฉากหลังของสภาพแวดล้อม AI ในปัจจุบัน ผู้เขียนเสนอ 28 เครื่องมือ AI เชิงนวัตกรรม ที่ยังไม่มีอยู่จริงแต่อยากให้มี
ไอเดียที่เสนอครอบคลุมหลากหลายด้าน เช่น ประสิทธิภาพส่วนบุคคล, การพัฒนาโค้ด, เฮลธ์แคร์, การสร้างคอนเทนต์
คุณลักษณะที่ถูกเน้นร่วมกันคือความสามารถในการพัฒนาให้ดีขึ้นผ่าน การรับรู้บริบท, การปรับให้เหมาะกับผู้ใช้, และ การเรียนรู้แบบอัตโนมัติพร้อมวงจรป้อนกลับ
แทนที่จะเป็นเอเจนต์ทั่วไปแบบในปัจจุบัน ผู้เขียนเสนอแนวคิดของ AI เอเจนต์เฉพาะทางที่มีจุดประสงค์เดียว และ มาร์เก็ตเพลส สำหรับแลกเปลี่ยนเอเจนต์เหล่านี้

28 เครื่องมือ AI ที่เสนอ

1. แอปกล้องที่ใช้ Nano Banana

แอปที่เปลี่ยนภาพถ่าย iPhone ธรรมดาให้ดู เหมือนถ่ายด้วย Leica

2. เอเจนต์สำหรับเพิ่มโหมดสว่าง/มืดอัตโนมัติ

เพิ่มการรองรับโหมดสว่าง โหมดมืด และธีมแบบกำหนดเองให้ทุกโปรเจ็กต์ฟรอนต์เอนด์โดยอัตโนมัติ
ใช้วิสัยทัศน์คอมพิวเตอร์เพื่อตรวจสอบการเปลี่ยนแปลง UI และ แก้ไขซ้ำแบบวนรอบ โดยอิงจาก UI ที่เรนเดอร์แล้ว

3. เอเจนต์ถอดคอมไพล์และดีบักโค้ดที่ถูกทำให้อ่านยาก

ถอดคอมไพล์โค้ดที่ถูก minify ให้กลับมาเป็นโค้ดเบสที่อ่านเข้าใจได้และดีบักได้
ต้องมี วงจรโค้ด-ดีบัก ที่ทรงพลัง

4. ไฮบริดระหว่างแอป Strong กับ ChatGPT

โมเดลเข้าถึงข้อมูลการออกกำลังกายและเสนอคำแนะนำเพื่อพัฒนา พร้อมทำหน้าที่โค้ช
สามารถคุยกับโมเดลที่รู้ บริบทอย่างละเอียด แม้แต่เวลาระหว่างแต่ละเซ็ต

5. เอนจินแนะนำ

วิเคราะห์ประวัติการท่องเว็บเพื่อดูว่าโพสต์บล็อกหรือบทความใดที่ผู้ใช้ใช้เวลาอ่านนานที่สุด
ค้นเว็บทุกคืนเพื่อหาเนื้อหาที่ควรอ่าน และส่ง ลิงก์ไดเจสต์ในตอนเช้า
ปรับปรุงไดเจสต์ของวันถัดไปจากฟีดแบ็กต่อคำแนะนำที่ดี/ไม่ดี

6. แอปแชตติดตามแคลอรี

แอปแชตที่อิงกับฐานข้อมูลโภชนาการ
ลด ภาระทางความคิด ที่ต้องใช้ในการบันทึกมื้ออาหารให้น้อยที่สุด

7. แอปมินิมอลสำหรับเขียนคอนเทนต์ยาว

โมเดลจะไฮไลต์ข้อความบางช่วงและทิ้งคอมเมนต์ไว้ที่ขอบหน้า
ตั้งค่า "เพอร์โซนา" ได้หลายแบบ เพื่อใช้ตรวจทานสิ่งที่เขียน

8. เอเจนต์สร้างเอเจนต์ AI ผู้เชี่ยวชาญ

หากได้รับคำอธิบายงานอย่าง "ช่วยสร้างเอเจนต์ถอดคอมไพล์โค้ดให้หน่อย" ก็จะ สร้างเอเจนต์ที่เฉพาะทางมาก ๆ โดยอัตโนมัติ

9. เครื่องอ่านอีบุ๊กแบบมินิมอล

ระหว่างอ่านอีบุ๊ก หากไฮไลต์ข้อความบางช่วง โมเดลจะอธิบายเชิงลึกเพิ่มเติมอยู่ด้านข้าง
สวมบทเป็นเพอร์โซนาของผู้เขียน
ควรให้ความรู้สึกเหมือนเป็น ส่วนขยายของหนังสือ มากกว่าจะเป็นแชตอินสแตนซ์แยกต่างหาก

10. เอเจนต์ Deep Research ที่ใช้เวลาให้เหตุผลหลายวัน

รองรับการป้อนคำถามที่ซับซ้อนมาก
สร้างเอเจนต์ย่อยหลายร้อยตัวและ ใช้เวลาให้เหตุผล 3 วัน ก่อนส่งคำตอบกลับมา

11. แอปสร้างภาพยนตร์แบบ paint-by-number

ระดมไอเดียหนังสั้น แล้วโมเดลสร้าง สตอรีบอร์ดอย่างละเอียด
ผู้ใช้เพียงแค่ถ่ายแต่ละฉากตามสตอรีบอร์ดด้วยสมาร์ตโฟน
ทำหน้าที่เป็น ล้อช่วยพยุงสำหรับการสร้างหนัง

12. แอปบันทึกหน้าจอและสรุปเชิงความหมาย

ใช้โมเดลบนเครื่องเพื่อสร้าง สรุปเชิงความหมายอย่างละเอียด ของสิ่งที่ทำบนคอมพิวเตอร์ในแต่ละวัน
ส่งให้แอปแชตเป็นบริบท เช่น: "เมื่อวานฉันลืมตอบใครไปนะ?"
แม้จะใช้ Rewind มา 1 ปี แต่ก็ ไม่ได้มีประโยชน์เท่าที่คาดหวัง

13. ตัวกรองเชิงความหมายสำหรับ Twitter/X/YouTube

เขียน ตัวกรองแบบปลายเปิด ได้ เช่น "ซ่อนทวีตที่มีแนวโน้มจะทำให้ฉันหงุดหงิด"
เอาคอนเทนต์ที่กระตุ้นความโกรธออกจากฟีด
เรา หล่อหลอมตัวเองผ่านการหล่อหลอมฟีดของเรา

14. เอเจนต์สร้างหลักสูตรเฉพาะทางสำหรับหัวข้อเฉพาะกลุ่ม

รองรับคำขออย่าง "ฉันอยากเรียนรู้ทุกอย่างที่เรารู้เกี่ยวกับวิทยาศาสตร์แห่งความก้าวหน้า"
ค้นหาบุคคล บล็อก วิดีโอ YouTube เรียงความ และตำราเรียนจากบนเว็บ
อ่านคอนเทนต์ทั้งหมดและจัดทำ หลักสูตรที่พาจากระดับเริ่มต้นไปสู่ผู้เชี่ยวชาญ

15. เอนจินแนะนำหนังสือที่ดีจริง ๆ

เริ่มจากทำ แบบทดสอบ เกี่ยวกับสิ่งที่เคยอ่าน เป้าหมาย และประเภทการอ่านที่ชอบ
เมื่อรู้ข้อมูลมากพอ เอเจนต์อื่นจะจำลองว่าผู้ใช้น่าจะคิดอย่างไรกับข้อเสนอของเอเจนต์หลัก
คัดมาเฉพาะ หนังสือที่มีโอกาสสูงมากว่าจะชอบจริง ๆ

16. เอนจินค้นหาเชิงความหมายสำหรับ TikTok และ Instagram Reels

ช่วย เข้าถึงข้อมูลที่มีประโยชน์ ซึ่งถูกขังอยู่ในวิดีโอสั้น
ต้องมีความสามารถในการค้นหาแบบสืบค้นได้

17. แอปฟิตเนสด้านการนอน

รวมข้อมูล จาก Apple Watch (อัตราการเต้นหัวใจ, VO₂), Eight Sleep, Oura Ring และแอปออกกำลังกาย
ให้คำแนะนำที่นำไปใช้ได้จริงเพื่อปรับปรุงการนอนและการฟื้นตัว
ส่งข้อความเชิงรุก เช่น: "สัปดาห์นี้ HRV ของคุณลดลง คุณอาจกำลังฝึกหนักเกินไปหรือเปล่า?"

18. ไลบรารีคอมโพเนนต์ขนาดใหญ่

ออกแบบมาให้ เรนเดอร์ภายในอินเทอร์เฟซแชต
ไลบรารีที่มีอยู่ในปัจจุบันมี primitive ที่อยู่ระดับล่างเกินไป
ให้ความสำคัญกับ วิดเจ็ตระดับสูงมากกว่าการคัสตอม

19. ผู้ช่วยเสียงแบบมินิมอลสำหรับ Apple Watch

สำหรับคำถามที่ซับซ้อนเกินไปสำหรับ Siri แต่เหมาะกับ ChatGPT
ให้คำตอบสั้น ๆ เพียง ไม่กี่คำ

20. แอปเขียนที่ให้รายการอ่านแนะนำ

ค้นเว็บตามหัวข้อที่กำลังเขียน และจัดทำ รายการแหล่งข้อมูลที่น่าจะเป็นประโยชน์
แอปเขียน ต้องไม่เขียนแทนผู้ใช้

21. แอปรันนิ่ง

สร้างแผนเฉพาะบุคคล ติดตามเพซการวิ่งและอัตราการเต้นหัวใจ
ปรับโปรแกรมฝึกซ้อมแบบวนซ้ำจากข้อมูลจริง

22. ซูเปอร์แอปแต่งภาพ Nano Banana

มี เทมเพลตกว่าหลายร้อยแบบ โดยไม่ต้องเขียนพรอมป์ต์
เช่น ลองทรงผมหลายแบบ ทำนายหน้าตาลูกกับคู่รัก หรือทำให้ดูเหมือน The Rock

23. การค้นหาวิดีโอ YouTube สไตล์ Same.energy

ใส่ URL แล้วค้นหา วิดีโอที่มีบรรยากาศคล้ายกัน
อัลกอริทึม YouTube ในปัจจุบันมุ่งแค่เพิ่มการมีส่วนร่วมของผู้ใช้เฉลี่ยให้สูงสุด

24. อุปกรณ์สไตล์ Sony Walkman สำหรับเด็ก

อุปกรณ์แบบ เน้นเสียงเป็นหลัก ที่สามารถถาม LLM ได้
เป็นอุปกรณ์ที่เน้นการอธิบายและ ไม่มีหน้าจอเลย
ถ้าเป็นแบบออฟไลน์เป็นหลักได้ก็ยิ่งดี

25. เอนจินค้นหาชีวประวัติ

ใช้ คำค้นแบบแบบสอบถาม เกี่ยวกับปัญหาที่กำลังเผชิญ ช่วงชีวิต สาขา ฯลฯ
ส่งคืนเป็นผลลัพธ์จาก บทในชีวประวัติ/อัตชีวประวัติของบุคคลสำคัญในประวัติศาสตร์ ที่พูดถึงสถานการณ์คล้ายกัน

26. เอเจนต์ตรวจสอบการเสพคอนเทนต์ด้วยการบันทึกหน้าจอ

เฝ้าดูการใช้งานคอมพิวเตอร์และสมาร์ตโฟน
ตรวจสอบคอนเทนต์ที่บริโภคในแต่ละวัน
Screen Time ยังไม่ละเอียดพอ
ต้องรู้ คุณค่าทางโภชนาการที่แท้จริงของโทเค็น ที่เรากำลังเสพ

27. มาร์เก็ตเพลสเอเจนต์ AI สำหรับงานเฉพาะกลุ่ม

เอเจนต์ที่ ออกแบบมาให้เหมาะกับกรณีใช้งานเฉพาะ น่าจะดีกว่าเอเจนต์อเนกประสงค์
แคตตาล็อกเอเจนต์เฉพาะทางมาก ๆ สำหรับงานเฉพาะกลุ่ม เช่น การหาอพาร์ตเมนต์เช่าในซานฟรานซิสโก
ต้องมี เอเจนต์นับหมื่นตัว ที่ใช้งานได้ผ่านเว็บหรือ API

28. ฟีเจอร์ขอคำวิจารณ์จากนักเขียนชื่อดัง

"ถ้าเป็น Hemingway เขาจะพูดอะไรกับบล็อกโพสต์นี้?"
ช่วยดูว่าเขา สับสนตรงไหนและชอบตรงไหน

2 ความคิดเห็น

shakespeares 2025-10-07

ข้อ 2 กับ 3 ถ้าทำได้อัตโนมัติจริง ๆ ก็คงดีมากเลยนะครับ
ดูเหมือนจะเป็นหนึ่งในงานซ้ำ ๆ ที่น่ารำคาญ เพราะต้องคอยเพิ่มทีละอันอยู่เรื่อย ๆ

GN⁺ 2025-10-02

ความคิดเห็นจาก Hacker News

คิดว่าควรระมัดระวังมากจริง ๆ กับข้อ "24. ให้เด็กมีอุปกรณ์สไตล์ Sony Walkman สำหรับถาม LLM ได้"
- ตราบใดที่ยังไม่ใช่ AGI คำตอบที่เด็กจะได้ฟังส่วนใหญ่คงแม่นยำมาก แต่คำตอบผิดเพียงเล็กน้อยหรือความเข้าใจคลาดเคลื่อนแบบละเอียดอ่อนจำนวนน้อยมาก ก็อาจส่งผลร้ายแรงต่อเส้นทางการเรียนรู้ของเด็กได้
- ต่อให้เป็น LLM ที่สมบูรณ์แบบและไม่เคยพลาดเลย ผลลัพธ์ก็คือความจำเป็นในการสื่อสารกับผู้อื่นจะลดลง ทำให้โอกาสพัฒนาทักษะการทำงานร่วมกันลดลงด้วย
- ในมุมของพ่อแม่อาจแค่อยากพักสักครู่ แต่ถ้าเด็กรู้จักอุปกรณ์ที่ตอบได้ทันทีตลอดเวลา เวลาผูกพันอันมีค่าที่ใช้ร่วมกันเพื่อหาคำตอบก็จะหายไป เด็กอาจค่อย ๆ ห่างจากพ่อแม่มากขึ้น ต้องคิดให้ดีว่าจะส่งต่อค่านิยมแบบไหนให้เด็ก
- พ่อแม่ที่เอาระบบแบบนี้ไปติดให้ลูก ต่างตั้งอยู่บนสมมติฐานว่าโลกทัศน์และค่านิยมของตนถูกสะท้อนในระบบนั้นอย่างดีแล้ว พ่อแม่ใน HN อาจมีมุมมองแบบวิทยาศาสตร์เป็นศูนย์กลาง แต่ในประเทศ/ภูมิภาคอื่น อุปกรณ์นั้นอาจกลายเป็นเครื่องมือโฆษณาชวนเชื่อทางการเมือง ศาสนา หรือวัฒนธรรมได้ ความเสี่ยงที่เครื่องมือแบบนี้จะถูกใช้เป็นอาวุธล้างสมองมีสูงมาก
- คิดว่าน่าจะได้ผลลัพธ์ที่ดีกว่าการไปถามครูที่โรงเรียนมาก
- สองวันก่อนฉันลองขอให้ ChatGPT อธิบายเรื่องระบบค่าประจำหลัก (place-value system) ให้เด็กหกขวบเข้าใจ แต่กลับอธิบายผิดเพราะสับสนระหว่างค่าประจำหลักกับค่าของตัวเลข ฉันสังเกตเห็นข้อผิดพลาดนั้นและ ChatGPT ก็ขอโทษ แต่ถ้าลูกเป็นคนถามเองคงไม่รู้ว่ามันผิด
  เลยกังวลว่าลูกของฉันจะเชื่อข้อมูลผิด ๆ จากอุปกรณ์แบบนี้ว่าเป็นเรื่องจริงมากแค่ไหน
เรื่องข้อ 19 ฉันลองทำเองเมื่อไม่กี่สัปดาห์ก่อนด้วย iOS Shortcut

เป็นผู้ช่วยเสียงแบบมินิมอลสำหรับ Apple Watch Siri รับมือคำถามซับซ้อนได้ยาก แต่ ChatGPT จัดการได้สบาย รับคำตอบเป็นประโยคสั้น ๆ กระชับไม่เกิน 150 ตัวอักษร
ใช้แอ็กชัน Dictate Text รับเสียงแล้วส่งไปยัง OpenAI API พร้อมใช้ system prompt แบบนี้
“CRITICAL: คำตอบจะแสดงได้แค่ใน push notification ของ iOS หรือบนหน้าจอนาฬิกาเท่านั้น ดังนั้นให้ตอบสั้น กระชับ ไม่เกิน 150 ตัวอักษร ห้ามใช้ Markdown ใช้ plain text เท่านั้น ใช้คำศัพท์และเครื่องหมายวรรคตอนที่ประณีตเท่าที่จำเป็น
ผู้ใช้ไม่สามารถถามต่อจากคำตอบได้ ตอบทีละประโยคเดียว และถ้าจำเป็นต้องตั้งสมมติฐานเกี่ยวกับคำถามก็ให้ทำเลย ถ้าสมมติฐานผิดผู้ใช้ต้องถามใหม่”
มันทำงานได้ค่อนข้างดี ข้อเสียใหญ่สุดคือใช้เวลา 5–20 วินาทีกว่าจะได้คำตอบ แต่การส่งคำถามแทบจะทันทีเลย (ไม่ต้องเปิดแอปแยก) เลยถือว่าน่าพอใจมาก
สิ่งที่ฉันรู้สึกจากไอเดีย/บทความจำนวนมากคือ พวกมันไม่ได้ "คิดแบบพอร์ทัล (thinking with portals)" เกี่ยวกับ LLM เรามีเทคโนโลยีระดับ "ปืนพอร์ทัล" อยู่ในมือแล้ว (อย่างน้อยก็มีการโฆษณาแบบนั้น) แต่กลับใช้มันแค่เป็นประตูที่ดีกว่าเดิมเท่านั้น
- สิ่งที่ LLM ทำได้ท้ายที่สุดคือการขยายข้อความที่เชื่อมโยงกันอย่างมีตรรกะ การประยุกต์ใช้อาจกว้าง แต่ในทางปฏิบัติมันมักไปได้ไม่ไกลเกินกว่าตัวแก้ไขข้อความขั้นสูง ตัวอย่างเช่น ถ้าอยากใช้กับการตัดต่อวิดีโอ ก็ต้องสร้างภาษาสคริปต์ขึ้นมา และยังต้องซิงก์ความสามารถกับตัวตัดต่ออีก สำหรับบริษัทใหญ่อย่าง Adobe มูลค่าที่ได้เมื่อเทียบกับกำลังคนอาจไม่ชัดเจน ส่วนสตาร์ตอัปก็ต้องสู้กับ Adobe ในสงครามฟีเจอร์และการล็อกอินผู้ใช้ที่ยาวนาน ทั้งสองกรณีไม่มีข้อได้เปรียบมากนัก เว้นแต่ LLM จะปฏิวัติวงการได้จริง ๆ ยิ่งไปกว่านั้น LLM ยังมองผลลัพธ์วิดีโอโดยตรงไม่ได้ และ ณ ตอนนี้ก็ยังอยู่ระดับ "พอใช้ได้"
- เห็นด้วยกับมุมมองนี้ ถ้ามีแหล่งอ้างอิงที่พอใช้ทำความเข้าใจเรื่อง "thinking with portals" ได้ อยากให้ช่วยแชร์หน่อย
- ถ้ามีตัวอย่างของการคิดแบบพอร์ทัล จะดีมากถ้าช่วยแชร์แบบง่าย ๆ สั้น ๆ ได้
เรื่องข้อ 22 ฉันอยากได้เอนจินที่วิเคราะห์ประวัติการท่องเว็บของฉัน เพื่อดูว่าฉันใช้เวลาอ่านบล็อก/บทความแบบไหนนานที่สุด แล้วทุกคืนก็ค้นหาเนื้อหาแนะนำที่ฉันยังไม่เคยอ่านให้
ChatGPT Pulse มีลักษณะคล้ายกันอยู่แล้ว แม้จะใช้ประวัติ ChatGPT แทน browser history แต่สำหรับคนที่ใช้ ChatGPT บ่อย คำแนะนำแบบนี้น่าจะเชื่อถือได้มากกว่า
https://openai.com/index/introducing-chatgpt-pulse/
- จะว่าไปแล้ว ฟีดอัลกอริทึมของโซเชียลมีเดียแทบทั้งหมดก็ทำหน้าที่นี้อยู่แล้ว
คิดว่าไอเดียส่วนใหญ่ที่เสนอในบทความนี้ จริง ๆ แล้วใกล้เคียงกับการอยากได้ UI/UX ที่ทำมาดีกว่านี้บน LLM พื้นฐานเสียมากกว่า
รู้สึกว่าวิธีคิดแบบนี้มีความสับสนเชิงหมวดหมู่ (category mistake) อยู่โดยพื้นฐาน
ตัวอย่างเช่นฟีเจอร์ "ถ้าเป็น Hemingway เขาจะวิจารณ์งานเขียนของฉันว่าอย่างไร" แต่ความจริงแล้วนั่นคือคำตอบที่ AI สร้างขึ้น ไม่ใช่คำวิจารณ์ของ Hemingway ตัวจริง
ถ้าถาม 100 โมเดลก็คงได้ 100 คำตอบ และวิธีคิดหรือนิสัยของ Hemingway จริง ๆ ก็ไม่อาจฟื้นคืนได้ครบถ้วนจากงานเขียนไม่กี่แสนคำของเขา
สุดท้ายจึงเป็นปัญหาว่า "มันฟังดูน่าเชื่อพอเหมือนคนนั้นพูดจริงไหม"
เหตุผลที่เราอยากฟังความเห็นจากคนดัง ก็เพราะมันเป็นมุมมองจากมนุษย์จริงที่ยังมีชีวิต การเลียนแบบของ AI ก็เหมือนพยายามกินรูปแซนด์วิชแทนแซนด์วิชจริง
รู้สึกกังวลนิด ๆ ที่หลายคนยังไม่ขีดเส้นแบ่งให้ชัดกับภาพลวงตานี้
- เห็นด้วย 100%
  แต่พออ่านคอมเมนต์นี้ก็ทำให้นึกถึง holodeck ใน Star Trek TNG ที่มีการจำลองบุคคลดังอย่างไอน์สไตน์ ฟรอยด์ ฯลฯ และในฐานะผู้ชม แม้ตอนอายุ 15 ก็ไม่ได้คิดว่า "นี่ก็แค่คำตอบสุ่มที่คอมพิวเตอร์ปั่นขึ้นมา"
  ในตอนหนึ่งจริง ๆ ก็มีฉากที่การจำลองบุคคลจริงจากข้อมูลบันทึกเกิดความผิดพลาด (https://www.imdb.com/title/tt0708682/) และต่อมาก็เผยให้เห็นว่ามันแตกต่างแค่ไหน (https://www.imdb.com/title/tt0708720/)
  สรุปคือ
  1. รู้สึกว่าตอนพวกนั้นล้ำยุคมากจริง ๆ
  2. ฉันไม่เคยรู้สึกไม่สบายใจกับการจำลองบุคคลประวัติศาสตร์ปลอม ๆ แบบนั้นเลย เลยสงสัยว่าทำไมในบริบทของ LLM ถึงรู้สึกอ่อนไหวขึ้นมา เป็นเพราะทุกคนรู้ตั้งแต่ต้นว่ามันปลอม 100% หรือมีเหตุผลอื่นกันแน่...
    โพสต์นี้ทำให้คิดหลายอย่างเลย
- อธิบายได้ง่าย ๆ ว่าทำไมเราไม่จำเป็นต้องมี AI Hemingway เพราะจริง ๆ แล้วเมื่อราว 10 ปีก่อนก็มีคู่มือการเขียนที่ดีอย่าง hemingwayapp อยู่แล้ว https://hemingwayapp.com/
  มันใช้กฎง่าย ๆ ในการแก้ไวยากรณ์และชวนให้เปลี่ยนเป็นสำนวนที่ง่ายกว่า และการที่มันไม่ได้เขียนใหม่ให้อัตโนมัติ อาจยิ่งดีกว่าสำหรับการเรียนรู้ด้วยตัวเอง
- พอมองไอเดียหลายอย่างอย่างเช่น "แอปแต่งภาพจิ๋วเหมือนกล้วย มีเทมเพลตกว่าหลายร้อยแบบโดยไม่ต้องใช้พรอมต์..." และอื่น ๆ ก็เห็นชัดว่าท้ายที่สุดมันคือความต้องการของมนุษย์ที่จะใช้ชีวิตให้ขี้เกียจยิ่งขึ้นไม่ทางใดก็ทางหนึ่ง เรื่องอย่าง "Hemingway จะคิดอะไร" ก็ให้ความรู้สึกคล้ายกัน
- แก่นแท้คือคำถามว่า "มันเป็นคำตอบที่ดูน่าเชื่อในแบบของคนนั้นจนหลอกมนุษย์ได้ไหม" และจริง ๆ แล้วแค่นั้นก็มีประโยชน์ในตัวเอง
  ถ้ามนุษย์รู้ตัวว่ากำลังถูกหลอก เราเรียกสิ่งนั้นว่า make-believe หรือการระงับความไม่เชื่อ
  ทุกครั้งที่เราแสดงเป็นคนอื่น หรือพยายามคิดจากอีกมุมมองหนึ่ง เราก็ผ่านกระบวนการแบบนี้ เช่นเดียวกับเวลาที่เราพยายามเรียนรู้จากบันทึกของบุคคลจริงหรือตัวละครในนิยาย
  ฉันกลับคิดว่าการบอกว่า "เราอยากฟังความเห็นของ Steve Jobs/Hemingway เพราะเป็นมนุษย์จริง" นั้นตรงกันข้ามเสียอีก
  ในความเป็นจริง คู่สนทนาที่สำคัญไม่ใช่มนุษย์ตัวจริง แต่เป็นบุคลิกแบบสรุปย่อของคนดังหรือตัวละครที่เราจินตนาการขึ้นมา มีน้อยคนนักที่จะหมกมุ่นกับตัวตนจริงของบุคคลนั้น
  "Hemingway คนดัง" ในแบบที่ถูกสร้างเป็นตำนานต่างหากที่น่าดึงดูดกว่า และกลับมีประโยชน์กับน่าสนใจกว่าของจริงเสียอีก
  เพราะงั้นในกรณีอย่าง Star Trek TNG ฉันจึงมองว่าการจำลองบุคคลเสมือนแบบนั้นกลับทำงานได้ดีตามเจตนาเดิมอยู่แล้ว
- Feynman เคยบอกว่า "หลักการข้อแรกของวิทยาศาสตร์คืออย่าหลอกตัวเอง" และฉันคิดว่าคำนี้ใช้ได้กับผลลัพธ์จาก LLM เช่นกัน
น่าสนใจมาก
พวกเราทุกคนเคยเห็นเดโมจากลิสต์นี้หรือเทคโนโลยีคล้ายกันมามากแล้ว และมีสตาร์ตอัปจำนวนมากที่ทุ่มเงินหลายร้อยล้านดอลลาร์ตลอดหลายปีเพื่อสร้างผลิตภัณฑ์
แต่ถึงอย่างนั้นกลับแทบไม่เห็นผลิตภัณฑ์ที่ใช้งานได้จริงเลย และสิ่งที่เจอในชีวิตประจำวันก็ไม่ได้ทำงานดีเหมือนเดโม
เลยอดสงสัยไม่ได้ว่ากำลังเกิดอะไรขึ้นกันแน่
กล่าวคือ ผลิตภัณฑ์มีอยู่จริงแต่แทบไม่มีใครใช้ หรือว่าการใช้โมเดลที่ดีพอจนใช้งานได้จริงมันแพงเกินไป หรือว่าการทำเดโมสวย ๆ ง่ายกว่าการสร้างผลิตภัณฑ์จริงมาก... อยากรู้ว่าความเป็นไปได้ไหนคือคำอธิบาย
- ต้นทุนในการเข้าถึงผู้ใช้เป้าหมายที่เหมาะสมสูงเกินไป
  ตอนคุยกับเอเจนซีโฆษณาแอปฟินเทค เขาบอกว่าต้องเผางบโฆษณาราวเดือนละ 20,000 ดอลลาร์เป็นเวลา 3 เดือนก่อน ถึงจะเริ่มเข้าใจว่ามันทำงานอย่างไร หลังจากนั้นค่อยลด CAC ลงและได้ผู้ใช้เป้าหมายมา
  พอปิดโฆษณา การรับรู้ต่อผลิตภัณฑ์ก็หายไปอีก และผู้ใช้ใหม่ก็หยุดไหลเข้า ไม่เหลือวิธีให้คนรู้เลยว่ามันมีอยู่
ไอเดียเหล่านี้จำนวนมากต้องอาศัยการเข้าใจรสนิยม รูปแบบ พฤติกรรมการสื่อสาร ตารางเวลา และข้อมูลสุขภาพของผู้ใช้
Apple อาจมีจุดแข็งอย่างมากในด้านนี้
เพราะโทรศัพท์กับนาฬิการู้ข้อมูลส่วนตัวมากที่สุด Apple อาจผสานบริบทหลากหลายเข้ากับ LLM ได้อย่างชาญฉลาดภายใต้เงื่อนไขการคุ้มครองความเป็นส่วนตัว
ฉันกดลิงก์นั้นเข้าไปแล้วรู้สึกผิดหวัง เพราะมันไม่ใช่เครื่องมือจริง แต่เหมือนแค่รวมไอเดียแอปที่ไม่ค่อยเกี่ยวข้องกัน
"อุปกรณ์สไตล์ Sony Walkman ที่ให้เด็กถาม LLM ด้วยเสียงได้"
แม้จะไม่ตรงกัน 100% แต่สินค้าชิ้นนี้ https://www.aliexpress.com/item/1005009196849357.html ก็คล้ายมากทีเดียว
มันไม่ออฟไลน์ แต่มีขนาดใหญ่กว่าลูกปิงปองนิดหน่อย
ฉันให้หลาน ๆ (อายุ 5 กับ 3 ขวบ) ลองใช้เป็นใน 2 นาที แล้วพวกเขาก็ยิงคำถามเป็นชุดอย่าง "เล่านิทานเกี่ยวกับยูนิคอร์น Bob ให้ฟังหน่อย", "หมากับลิงเป็นเพื่อนกันได้ไหม?" และอีกมากมาย ซึ่งทั้งหมดก็ได้คำตอบที่ฟังดูเข้าท่าในไม่กี่วินาที
คิดว่าคริสต์มาสนี้ผลิตภัณฑ์แบบนี้จะถูกฝังมาในของเล่นแน่ ๆ และถ้าออกมาก็จะซื้อทันที