Paper to HTML - แปลงงานวิจัยเป็น HTML ที่อ่านง่าย
(papertohtml.org)<p>- ใช้แมชชีนเลิร์นนิงในการอ่านเนื้อหาจาก PDF, LaTeX และ PubMed Central XML แล้วแปลงเป็น HTML <br />
- มีเป้าหมายเพื่อเพิ่มการเข้าถึง <br />
- เป็นต้นแบบเชิงทดลองของ Semantic Scholar ซึ่งเป็นเสิร์ชเอนจินค้นหาเอกสารวิจัยที่ขับเคลื่อนด้วย AI <br />
- ปัจจุบันแคชเฉพาะรูปภาพ/คอนเทนต์ที่สกัดออกมา และใช้เพื่อให้บริการได้รวดเร็วเฉพาะกับผู้ที่อัปโหลดเอกสารเดียวกันเท่านั้น โดยจะไม่เก็บไฟล์ที่อัปโหลดไว้ <br />
- ข้อจำกัด<br />
→ ตาราง (Table) จะถูกสกัดออกมาเป็นรูปภาพ <br />
→ เนื้อหาคณิตศาสตร์ (Math) มีความแม่นยำต่ำหรือแทบจะสกัดออกมาไม่ได้ <br />
→ การประมวลผล LaTeX/PubMed อาจมีความสามารถบางส่วนด้อยกว่า PDF <br />
- มีแผนจะเพิ่มฟีเจอร์ด้านการเข้าถึงให้กับ Semantic Scholar ในอนาคต </p>
3 ความคิดเห็น