Research VDO Series 55 ปี คณะวิทยาศาสตร์ มช. : คัมภีร์ล้านนา ทรงคุณค่าสู่โลกดิจิตอล

คัมภีร์ล้านนา ทรงคุณค่าสู่โลกดิจิตอล
ภาควิชาวิทยาการคอมพิวเตอร์ คณะวิทยาศาสตร์ มหาวิทยาลัยเชียงใหม่

          Lanna OCR Application เป็นหนึ่งในผลงานการออกแบบ Application ที่น่าสนใจ ของนักศึกษาระดับปริญญาเอก ภาควิชาวิทยาการคอมพิวเตอร์ คณะวิทยาศาสตร์ มช. ด้วยการทำงานที่สร้างสรรค์ เพื่อนำแนวคิดและองค์ความรู้ที่ทันสมัยมาตอบโจทย์การศึกษาประวัติศาสตร์ยุคโบราณให้มีความสะดวกและแม่นยำยิ่งขึ้น เรียกได้ว่าเป็นการนำวิทยาการใหม่มาใช้เป็นเครื่องมือเรียนรู้โลกยุคเก่าได้อย่างลงตัว

และเบื้องหลังกว่าจะมาเป็น Application สุดทันสมัยนี้ นอกจากนักวิจัยจะต้องมีความรู้ความสามารถทางด้านวิทยาการคอมพิวเตอร์แล้ว นักวิจัยยังต้องใช้เวลาในการศึกษาภาษาล้านนานานนับปี เพื่อให้มีความรู้เข้าใจในลักษณะของภาษาที่ปรากฏบนคัมภีร์ใบลานที่เก็บรักษาไว้ในที่ต่างๆ อย่างถ่องแท้ จึงจะสามารถพัฒนามันสมองของคอมพิวเตอร์ให้สามารถเข้าใจและทำงานตอบสนองสิ่งที่นักวิจัยและนักประวัติศาสตร์ต้องการได้อย่างแม่นยำ

 ชมคลิป VDO คัมภีร์ล้านนา ทรงคุณค่าสู่โลกดิจิตอล




ชมคลิป VDO คัมภีร์ล้านนา ทรงคุณค่าสู่โลกดิจิตอล (full version)


 

บทสัมภาษณ์นักวิจัย การศึกษาวิจัยและการคิดค้นระบบรู้จำภาพอักษรล้านนา 
(Lanna OCR Application)

ที่มาของโครงการวิจัย
รศ.ดร.จีรยุทธ ไชยจารุวณิช อาจารย์ประจำภาควิชาวิทยาการคอมพิวเตอร์ คณะวิทยาศาสตร์ มหาวิทยาลัยเชียงใหม่
ที่ปรึกษาโครงการวิจัย 

     "เรามีโอกาสเข้ามามีส่วนร่วมกับโครงการนี้ โดยการนำเอาภาพ ทั้งไมโครฟิล์ม ทั้งภาพถ่ายดิจิตอล ของทั้งสถาบันวิจัยสังคม สำนักส่งเสริมศิลปวัฒนธรรม สำนักหอสมุด มหาวิทยาลัยเชียงใหม่ และสำนักอาคารเรือนเดิม คณะมนุษยศาสตร์ มหาวิทยาลัยเชียงใหม่ มาร่วมทำโครงการที่เชื่อมโยงฐานข้อมูลใบลาน ซึ่งทำให้เราเห็นภาพรวมของคอลเล็คชันใบลานที่เราได้มีการสำรวจและก็สะสมที่ผ่านมาจนถึงปัจจุบัน

ทั้งนี้ ในลำดับถัดไป เมื่อเราได้รวบรวมจัดทำเป็นฐานข้อมูลใบลานไว้แล้ว เราก็นำองค์ความรู้ที่ปรากฏอยู่ในใบลานมาใช้ประโยชน์ต่อสังคม ซึ่งเนื้อหาส่วนใหญ่ที่ปรากฏอยู่ในใบลานก็จะเกี่ยวข้องกับพุทธศาสนาเป็นหลัก แล้วก็จะมีจำนวนไม่น้อยที่เป็นภูมิปัญญาท้องถิ่น จะมีเรื่องของประวัติศาสตร์ วรรณกรรม กฎหมาย ตำรายา แล้วก็พิธีกรรมต่างๆ ที่ถูกบันทึกเอาไว้ ซึ่งก็จะเป็นประโยชน์สำหรับผู้ที่สนใจศึกษาเกี่ยวข้องกับเรื่องของประวัติศาสตร์ วัฒนธรรมของท้องถิ่นล้านนาของเรา ซึ่งในกระบวนการที่จะสามารถนำความรู้มาใช้ประโยชน์ได้ เราจำเป็นจะต้องทำให้เครื่องคอมพิวเตอร์สามารถเข้าใจถึงอักษรที่ถูกจารบนใบลาน (จาร = ใช้เหล็กแหลมเขียนลงบนใบลาน) จึงเป็นที่มาของโครงการวิจัยของนักศึกษาปริญญาเอก ภาควิชาวิทยาการคอมพิวเตอร์ คณะวิทยาศาสตร์ มหาวิทยาลัยเชียงใหม่ ที่ได้ทำการวิจัยในเรื่องของการสกัดตัวอักษรล้านนาที่ปรากฏอยู่บนใบลาน"

การทำงานของ Lanna OCR Application
นายปภังกร อิ่นแก้ว นักศึกษาระดับปริญญาเอก ภาควิชาวิทยาการคอมพิวเตอร์ คณะวิทยาศาสตร์ มหาวิทยาลัยเชียงใหม่ 
นักวิจัย

          "คัมภีร์ใบลาน เป็นเอกสารโบราณชนิดหนึ่งที่คนโบราณได้เขียน ได้บันทึกเรื่องราวต่างๆ ไว้บนใบลาน ซึ่งถูกเตรียมมาไว้สำหรับการจาร เขียนตัวอักษรลงไปในใบลาน ซึ่งแต่ก่อนเราเรียกว่าวิธีการจาร ก็คือสลักตัวอักษรลงในใบลานด้วยเหล็กแหลม แล้วก็ค่อยเอาหมึกมาถูกอีกทีหนึ่ง 

ในงานวิจัยนี้เราได้ศึกษาเกี่ยวกับการรู้จำภาพอักษร ก็คือการสอนให้คอมพิวเตอร์รู้ว่าตัวอักษรที่คอมพิวเตอร์เห็นมันเป็นตัวอะไร ตัวเขียนแบบนี้คือตัว ก ข ซึ่งเป็นเรื่องของการรู้จำภาพอักษร และในโครงการวิจัยนี้ก็ได้สร้างโปรแกรมคอมพิวเตอร์ขึ้นมาตัวหนึ่ง เพื่อที่จะรับข้อมูลที่เป็นภาพถ่ายใบลาน แล้วก็ให้คอมพิวเตอร์ทำการพิมพ์ตามอักษรที่คอมพิวเตอร์เห็น ซึ่งผลลัพธ์ที่ได้มาก็จะได้เป็นไฟล์ Microsoft Word ก็คือให้คอมพิวเตอร์ไปคัดลอกข้อความจากบนใบลานมา แล้วก็จะเป็นไฟล์ Microsoft Word

วิธีการกว่าที่จะแปลงภาพถ่ายมาเป็นไฟล์ Microsoft Word ก็จะมีขั้นตอนการประมวลผลหลายขั้นตอน จะมีขั้นตอนคร่าวๆ 2 ขั้นตอน ก็คือ การประมวลผลภาพ และก็การรู้จำตัวอักษร

การประมวลผลภาพ ก็คือ การปรับภาพต้นฉบับ input ที่เข้ามาให้อยู่ในรูปแบบที่เหมาะสมที่คอมพิวเตอร์จะเอาตัวอักษรเอาไปรู้จำได้ เริ่มต้นก็จะมีวิธีการแปลงภาพสีให้เป็นภาพขาวดำก่อน แล้วก็ทำการลดสัญญาณรบกวน ทำการปรับภาพให้อยู่ในรูปแบบที่เหมาะสม ต่อมาก็จะมีการตัดบรรทัด ข้อความเป็นบรรทัดๆ แล้วก็ตัด Crop แต่ละบรรทัดเป็นตัวอักษร

ตอนนี้คอมพิวเตอร์ก็จะมีอักษรทุกๆ ตัวที่ปรากฏอยู่บนใบลาน ต่อมาคอมพิวเตอร์ก็จะเอาอักษรแต่ละตัวไปรู้จำว่าอักษรตัวนี้คือตัวอักษรอะไร แล้วก็ทำการพิมพ์มาตามลำดับที่ปรากฏอยู่บนใบลาน ก็จะได้เป็นไฟล์ Microsoft Word ซึ่งไฟล์ Microsoft Word นี้ เราก็สามารถเอาไปพิมพ์ซ้ำ แก้ไขอะไรได้ เป็นไฟล์ Microsoft Word ธรรมดา"


          ปัจจุบันงานวิจัยนี้ได้มีส่วนช่วยสนับสนุนกระบวนการสำรวจและอนุรักษ์คัมภีร์โบราณ โดยเป็นเครื่องมือในการจัดการสำเนาภาพถ่ายคัมภีร์โบราณ และแปลงภาพถ่ายสำเนาในรูปแบบไฟล์ภาพดิจิตอลเป็นไฟล์ข้อความ ซึ่งมีประโยชน์อย่างมากในการนำผลลัพธ์ที่ได้ไปต่อยอดทั้งในการเผยแพร่ และในการวิจัย โดยคณะผู้วิจัยได้เผยแพร่แอพพลิเคชั่น LannaOCR รุ่นทดลองใช้ที่ http://lannakadee.cmu.ac.th/lannaocr 

งานวิจัยและพัฒนานี้ได้ดำเนินการอย่างต่อเนื่องเพื่อเพิ่มประสิทธิภาพของ Application ให้สูงขึ้น เพื่อตอบสนองความต้องการของผู้ใช้ให้ได้มากที่สุด 
Application นี้ ถูกนำไปใช้งานจริงในโครงการสำรวจ รวบรวม และจัดทำระบบสารสนเทศสำเนาภาพถ่ายพระธรรมคัมภีร์ใบลานพระนครน่าน สมัยเจ้าอนันตวรฤทธิเดชฯ นอกจากนี้ส่วนหนึ่งของงานวิจัยนี้เคยได้รับรางวัล The Best Student Paper Award จากงานประชุมวิชาการนานาชาติ 18th International Conference on Asia-Pacific Digital Libraries (ICADL 2016) ที่ประเทศญี่ปุ่นด้วย 

ติดตามชม Research VDO Series 55 ปี คณะวิทยาศาสตร์ มช. และ vdo clip อื่นๆ ของคณะได้ที่
Youtube : Science CMU Official


2019 #55thAnniversaryScienceCMU
Research@Sci From Sky To Rock
Studying@Sci E x p a n d i n g Your Mind

 

 

 
 


วันที่ : 25 มี.ค. 2019





ค้นหาข่าว
หน่วยงาน
คีย์เวิร์ด
ค้นหาจาก
หมวดหมู่ข่าว