บันทึกธัมมเจดีย์ 148
(8/8/2560)
เนื่องจากการเปิดให้พุทธบริษัทไทย เข้าร่วมสอบทานตัวสะกดคําบาลีในพระไตรปิฎก จากที่จะเริ่มเปิดตัวในช่วงเข้าพรรษานี้ ได้เลื่อนออกไปก่อน จึงได้มีการระดมสมองช่วยกันปรับปรุงโปรแกรมที่จะใช้งานให้มีความรัดกุมยิ่งขึ้น เพิ่มเติมในส่วนการตรวจเชิงอรรถด้วย ตามข้อเสนอแนะของอาจารย์สุภีร์ ทุมทอง
และปรับปรุงโปรแกรมการจับคู่คำบาลีให้สามารถใช้งานได้ดียิ่งขึ้น (คำบาลีทุกคำในต้นฉบับภาพสแกนกว่า 2 ล้านคำ จะต้องถูกจับคู่กับคำบาลีแต่ละคำในไฟล์ดิจิตอลที่จะได้รับการตรวจทาน เพื่ออำนวยความสะดวกให้กับผู้ที่จะร่วมสอบทานตัวสะกด)
หน้าจอการจับคู่คำบาลีในพระไตรปิฎก ที่มีเชิงอรรถ
การจับคู่คำบาลีในพระไตรปิฎกนั้น มีเครือข่ายธัมมอาสาที่มาช่วยงานกันได้หลายเดือนแล้ว กลุ่มที่เป็นหัวเรี่ยวหัวแรงตั้งต้น คือกลุ่มญาติธรรมวัดป่าแก้วกลุ่มหนึ่ง กลุ่มเครือข่ายวิศวะลาดกระบัง และกลุ่มเครือข่ายศิษย์เก่าเซนต์โยเซฟคอนแวนต์ โดยทุกคนใช้การทำงานผ่านอินเตอร์เนต แต่ต้องมีการพบกันเพื่อสอนการใช้งานโปรแกรม
ในขั้นต่อไปจะได้เปิดกลุ่มให้ใหญ่ขึ้น โดยจะมีกลุ่มที่เป็นเครือข่ายอาสาที่ปวารณามาช่วยงานกันมากขึ้น อีก 2-3 กลุ่ม
งานที่เกี่ยวข้องกับพระไตรปิฎกมีปริมาณมากและต้องการความละเอียดรอบคอบในทุกขั้นตอน ทีมธัมมเอ็นจิเนียร์จึงเน้นที่การแบ่งการทำงานเป็นขั้นตอน (engineering approach) และสร้างเครื่องมือที่จะช่วยให้คนจำนวนมากสามารถช่วยงานพระไตรปิฎกได้โดยไม่มีข้อผิดพลาด ด้วยพลังของเครือข่ายอินเตอร์เน็ตและเครื่องมือสื่อสารติดตัว (mobile communicator)
ในส่วนที่เกี่ยวกับเรื่องการสร้างแกนพระธัมมเจดีย์ ที่มีเป้าหมายสุดท้ายคือต้องการสร้างฐานข้อมูลพระไตรปิฎกฉบับอ้างอิงร่วม (Common Reference Tipitaka Database)
พระไตรปิฏกอิเล็กทรอนิกส์ ได้แบ่งงานเป็น 4 ขั้นตอนดังนี้ 1) จับคู่ ภาพสแกนต้นฉบับพระไตรปิฎก (word box) กับไฟล์ดิจิตอล (word list) ทีละคำบาลี ทั้งหมดกว่าสองล้านคำ 2) สอบทานคำบาลี ด้วยการยกคำจากไฟล์ดิจิตอล (word list) ทีละคำ โดยตรวจสอบกับคำในภาพต้นฉบับ (word box) ถ้า word list สะกดไม่ตรงกับ word box ก็ให้หมายคำนั้นไว้ 3) นักวิชาการบาลี ตรวจสอบคำที่สะกดไม่ตรงกับต้นฉบับ หรือจะทำการตรวจสอบคำในต้นฉบับด้วย แล้วทำการแก้ไขคำในไฟล์ดิจิตอล (word list) ให้ถูกต้อง ทั้งนี้จะต้องมีหลักฐานอ้างอิงและหมายเหตุประกอบการแก้ไขไว้ทุกจุด
4) ไฟล์ดิจิตอลของพระไตรปิฎกบาลีสยามรัฐที่ได้รับการตรวจสอบแก้ไขจากขั้นตอนที่ 3 แล้ว จะให้คอมพิวเตอร์เปรียบเทียบกับไฟล์ดิจิตอลของพระไตรปิฎกบาลีศรีลังกา และเมียนมาร์ (ไฟล์ดิจิตอลของทั้ง 2 ประเทศได้ดำเนินการผ่านขั้นตอน 1 ถึง ขั้นตอน 3 เสร็จเรียบร้อยแล้ว) จากนั้นจะเป็นหน้าที่ของนักวิชาการบาลี ทั้ง 3 ประเทศ ในการที่จะลงความเห็นในส่วนที่แตกต่างกันของพระไตรปิฏกแต่ละประเทศและบันทึกไว้ในแต่ละจุดที่แตกต่างกันนั้นๆทั้งหมด ผลลัพธ์ที่ได้ จะเป็นพระไตรปิฎกฉบับอ้างอิงร่วม (Common Reference Tipitaka) ซึ่งจะได้ดำเนินการให้มีการรับรองอย่างเป็นทางการ เพื่อจะได้รับการตีพิมพ์เป็นอักษรต่างๆ ส่งเป็นธรรมทานไปทั่วโลก
*************************************
http://dhammastupa.org/a
Comments