中新網(wǎng)安陽5月15日電 (王宇)登錄一個(gè)網(wǎng)站,掃描一個(gè)二維碼,就能快速查詢到需要的甲骨文資料。如今,甲骨文作為一門冷門學(xué)科已被數(shù)字“煥活”,開始進(jìn)入智能化時(shí)代。
“行走河南·讀懂中國(guó)”文明探源集中采訪團(tuán)近日走進(jìn)河南省安陽市,來到安陽師范學(xué)院甲骨文信息處理實(shí)驗(yàn)室,切身感受到甲骨文智能化時(shí)代的神奇魅力。
據(jù)了解,該實(shí)驗(yàn)室把現(xiàn)代信息技術(shù)應(yīng)用于甲骨文研究,凝練形成了“甲骨文大數(shù)據(jù)平臺(tái)、甲骨文識(shí)別與字形分析、甲骨文語言計(jì)算、甲骨文與殷墟科技考古”四個(gè)研究方向。
在實(shí)驗(yàn)室里,安陽師范學(xué)院甲骨文信息處理實(shí)驗(yàn)室副主任焦清局登錄"殷契文淵"網(wǎng)站,在字形庫(kù)中選擇甲骨字"人"字形,瞬間,所有包含該字形的甲骨片信息就全部顯示出來。
“殷契文淵”是由安陽師范學(xué)院和中國(guó)社會(huì)科學(xué)院甲骨學(xué)殷商史研究中心合作建設(shè)的非營(yíng)利性網(wǎng)站,為甲骨學(xué)研究提供大數(shù)據(jù)支持,是了解、學(xué)習(xí)、研究甲骨文的互聯(lián)網(wǎng)窗口,破解了過去獲取甲骨文研究資料難的瓶頸。
“因?yàn)榧坠瞧馁|(zhì)特殊,片多易碎,并且分布全球各地,語言信息多不完整。以前甲骨碎片都是靠記憶和手工來拼合,數(shù)據(jù)數(shù)字化以后,可利用人工智能圖像技術(shù)進(jìn)行自動(dòng)綴合。”焦清局介紹說。
截至目前,安陽師范學(xué)院甲骨文信息處理實(shí)驗(yàn)室利用深度學(xué)習(xí)技術(shù)共綴合甲骨碎片41組,同時(shí)還發(fā)布了甲骨文的檢測(cè)、識(shí)別、手寫數(shù)據(jù)集,為計(jì)算機(jī)學(xué)者提供了檢測(cè)、識(shí)別甲骨文標(biāo)準(zhǔn)的數(shù)據(jù)集。
除了“殷契文淵”網(wǎng)站,該實(shí)驗(yàn)室今年4月份還發(fā)布了面向大眾的微信小程序“了不起的甲骨文”。該小程序通過故事性引入、游戲化互動(dòng)、社交化分享等方式吸引公眾了解甲骨文及漢字的演變,為甲骨文數(shù)字“煥活”提供了新的助力。
5月14日,甲骨文信息處理實(shí)驗(yàn)室主任劉永革介紹,甲骨文蘊(yùn)含著豐富的造字智慧和文化價(jià)值,急需將冷門的文化資源轉(zhuǎn)化成大家喜聞樂見并愿意參與的普惠文化服務(wù);甲骨文活化利用的素材有限、手段傳統(tǒng)、渠道不暢,急需系統(tǒng)化開展工作。
據(jù)介紹,當(dāng)前已經(jīng)出土的甲骨有15萬至16萬片,自然損壞速度較快,急需進(jìn)行數(shù)據(jù)采集以實(shí)現(xiàn)在數(shù)字空間永久化保存;已經(jīng)發(fā)現(xiàn)的約4500個(gè)甲骨字,其中約3000個(gè)尚未釋讀,甲骨文專家學(xué)者數(shù)量少,急需智能工具幫助提升字形匹配的搜索效率、推薦破譯的相關(guān)線索。
值得關(guān)注的是,“了不起的甲骨文”小程序所使用的甲骨文高質(zhì)量數(shù)據(jù),正源自“殷契文淵”,打造出甲骨文的全信息模型。這樣既可以為公眾提供參與甲骨文傳承活化的互動(dòng)平臺(tái),也可以幫助專家學(xué)者進(jìn)行甲骨文保護(hù)研究。
“我們把不同的甲骨圖片進(jìn)行對(duì)齊疊加,每個(gè)圖層顯示不同的信息。因?yàn)榧坠抢锩婧枚嘧趾茈y看到,所以我們通過紅外線攝影、光譜分析、微量元素分析產(chǎn)生不同的圖層,讓大眾真正了解甲骨文,看看甲骨文究竟長(zhǎng)什么樣。”劉永革說。(完)