บันทึกธัมมเจดีย์ 142
ภาพรวมขั้นตอนการสร้างฐานข้อมูลพระไตรปิฎกฉบับอ้างอิงร่วม (Common Reference Tipitaka Database) 1) จับคู่ ภาพสแกนต้นฉบับพระไตรปิฎก (word box) กับไฟล์ดิจิตอล (word list) ทีละคำบาลี ทั้งหมดกว่าสองล้านคำ 2) สอบทานคำบาลี ด้วยการยกคำจากไฟล์ดิจิตอล (word list) ทีละคำ โดยตรวจสอบกับคำในภาพต้นฉบับ (word box) ถ้า word list สะกดไม่ตรงกับ word box ก็ให้หมายเหตุคำนั้นไว้ 3) นักวิชาการบาลี ตรวจสอบคำที่สะกดไม่ตรงกับต้นฉบับ หรือจะทำการตรวจสอบคำในต้นฉบับด้วย แล้วทำการแก้ไขคำในไฟล์ดิจิตอล (word list) ให้ถูกต้อง ทั้งนี้จะต้องมีหลักฐานอ้างอิงและหมายเหตุประกอบการแก้ไขไว้ทุกจุด
4) ไฟล์ดิจิตอลของพระไตรปิฎกบาลีสยามรัฐที่ได้รับการตรวจสอบแก้ไขจากขั้นตอนที่ 3 แล้ว จะให้คอมพิวเตอร์เปรียบเทียบกับไฟล์ดิจิตอลของพระไตรปิฎกบาลีศรีลังกา และเมียนมาร์ (ไฟล์ดิจิตอลของทั้ง 2 ประเทศได้ดำเนินการผ่านขั้นตอน 1 ถึง ขั้นตอน 3 เสร็จเรียบร้อยแล้ว) จากนั้นจะเป็นหน้าที่ของนักวิชาการบาลี ทั้ง 3 ประเทศ ในการที่จะลงความเห็นในส่วนที่แตกต่างกันของพระไตรปิฏกแต่ละประเทศและบันทึกไว้ในแต่ละจุดที่แตกต่างกันนั้นๆทั้งหมด ผลลัพธ์ที่ได้ จะเป็นพระไตรปิฎกฉบับอ้างอิงร่วม (Common Reference Tipitaka) ซึ่งจะได้ดำเนินการให้มีการรับรองอย่างเป็นทางการ เพื่อจะได้รับการตีพิมพ์เป็นอักษรต่างๆ ส่งเป็นธรรมทานไปทั่วโลก
ดังนั้นสาระสำคัญที่เราทำการจับคู่อยู่ขณะนี้ จึงไม่ต้องสนใจว่าความถูกผิดจะเป็นอย่างไร เพราะเราไม่มีความรู้และไม่ใช่หน้าที่ของเรา เราเพียงแต่จับคู่ให้ word box เข้าคู่กับ word list เรียงกันไปจนหมดเท่านั้น
*************************************
http://dhammastupa.org/a
Comments