亚洲视频一区网站,日韩一级无码电影,九九亚洲精品性爱视频,精品人妻无码在线小视频

人民網(wǎng)
人民網(wǎng)>>江蘇頻道>>社會

南京大學(xué)“數(shù)智項目”讓AI讀懂甲骨文

2025年05月18日07:56 |
小字號

原題:南大“數(shù)智項目”讓AI讀懂甲骨文

眾多文科項目迎來“數(shù)字新生”

5月16日,南京大學(xué)舉辦“數(shù)智賦能中華文明研究”成果展示會,人工智能古文字析解模型、中國思想家大模型、中華古城數(shù)字圖譜工程項目等一批階段性成果集中亮相。在人工智能(AI)的助力下,甲骨文破譯、多民族文獻翻譯、古城保護等項目紛紛迎來“數(shù)字新生”。

大數(shù)據(jù)模型教會AI析解古文字

甲骨文等先秦文字的解讀門檻極高,不僅文字資料浩如煙海,且不少是零散殘缺的。大部分甲骨文字形無法通過字符檢索的方式直接檢索。“對于古文字學(xué)者而言,在其有生之年能考證出一個疑難的古文字,都是了不起的成就?!蹦洗笪膶W(xué)院助理研究員聶菲表示,人工智能技術(shù)的發(fā)展,讓古文字學(xué)科迎來新的發(fā)展機遇,或許能對古文字學(xué)研究起到推動作用。

聶菲所在的“人工智能析解古文字”團隊,通過訓(xùn)練AI捕捉人類專家書寫古文字的動態(tài)路徑數(shù)據(jù),搭建模型,訓(xùn)練機器像人一樣“思考”和理解古文字,從而解決傳統(tǒng)識別方法的困境?!肮盼淖忠蜉d體多樣、時代跨度大,傳統(tǒng)圖像識別技術(shù)面臨識別困難的瓶頸,識別工具遇到未訓(xùn)練過的字便會‘罷工’。于是我們在想,能不能讓計算機像人類一樣理解古文字的構(gòu)形邏輯,這正是破解千年文字密碼的關(guān)鍵一步。”

南大文學(xué)院古文字強基計劃的優(yōu)秀學(xué)生們,成了團隊的最好助力?!拔覀冄埻瑢W(xué)們手寫古文字基礎(chǔ)構(gòu)件,計算機記錄筆順、筆勢等動態(tài)數(shù)據(jù),目前已錄入萬余條字形書寫數(shù)據(jù),讓計算機能夠成功模仿人類書寫的筆勢、筆順和大致輪廓,未來將在筆畫識別的準(zhǔn)確性、位置關(guān)系等問題上做進一步探索。”

眼下,聶菲和團隊的師生們正在搭建模型。她現(xiàn)場展示了機器寫字的案例。例如古文字“牢”字,就像是一頭牛被圈養(yǎng)在圍欄中,而模型能精準(zhǔn)復(fù)現(xiàn)“先寫牛頭,再畫圍欄”的筆順,“成果說明,計算機已能成功模仿人類書寫的筆勢、筆順和大致輪廓,基礎(chǔ)構(gòu)件的識讀已初見成效,但在筆畫識別的準(zhǔn)確性、底層算法創(chuàng)新等問題上,仍有很大的進步空間?!?/p>

多民族文獻翻譯效率大大提升

在數(shù)智技術(shù)浪潮中,南大團隊正在推進多民族文獻智能處理功能,賦能數(shù)智人文時代歷史研究新生態(tài)。

“長期以來,歷史研究面臨三重文獻使用困境?!蹦暇┐髮W(xué)歷史學(xué)院準(zhǔn)聘助理教授金伯文的經(jīng)歷,讓眾多學(xué)者感同身受,“其一,低質(zhì)量文獻的認讀焦慮——如掃描模糊的手稿、磨損嚴重的古籍,傳統(tǒng)工具常因識別率低導(dǎo)致信息缺失;其二,跨語種文獻的處理門檻——歷史學(xué)者難以掌握多語言技能,所以當(dāng)面對小語種文獻時往往手足無措;其三,海量文獻的檢索困境——傳統(tǒng)關(guān)鍵詞檢索難以精準(zhǔn)匹配語義,導(dǎo)致核心議題相關(guān)文獻的篩選效率低下?!?/p>

“大語言模型為破解這些難題提供了可能?!苯鸩慕榻B,團隊開發(fā)的數(shù)智多語種文獻處理平臺,基于大模型、增強識別技術(shù),提升模糊手稿、破損古籍的識別率,同時支持多語種文獻翻譯,還可以自動擴展語種關(guān)鍵詞,支持跨語種檢索。

在他的演示下,一份清光緒年間的地契,被準(zhǔn)確識別了出來。在語種方面,即使是波斯語、越南語等小語種,都能進行高效翻譯。

南京大學(xué)鑄牢中華民族共同體意識研究基地首席專家華濤教授表示,在中國民族史研究的多民族、多語種的中古史料中,大家應(yīng)探索如何利用AI技術(shù)去輔助多語言資料的閱讀、掌握、理解和分析。數(shù)智文獻處理平臺下一步可以加上更多非西方語言的開發(fā),比如藏文、蒙古文、滿文等民族語言和阿拉伯-波斯等東方語言。

數(shù)字圖譜守護古城“記憶肌理”

南京大學(xué)地理與海洋學(xué)院副教授陳剛團隊意識到,隨著城市建設(shè)速度加快,舊城面貌變化巨大,老城格局與歷史建筑風(fēng)貌區(qū)難以識別,老城和歷史建筑保護迫在眉睫。團隊自去年啟動“中華古城數(shù)字圖譜建設(shè)工程”,開展中華古城歷史地理信息基礎(chǔ)平臺建設(shè),構(gòu)建“一城一圖”的全國古城數(shù)字檔案。

“通過影像對比,解碼上世紀六十年代至今城市空間的變遷。”陳剛展示了北京王府井東方廣場1966年和如今的影像對比,高分辨率影像可清晰識別街巷等細微結(jié)構(gòu)。團隊通過遙感影像、衛(wèi)星地圖、現(xiàn)場走訪等方式,摸排清楚各地古城的地形地勢、路網(wǎng)分布、城市布局等情況,并依照相關(guān)信息繪制文化地圖。

用數(shù)智技術(shù)激活文明基因

“這是一場以數(shù)智技術(shù)為舟楫、以文明傳承為航向的時代對話?!蹦暇┐髮W(xué)中華民族現(xiàn)代文明研究院院長姚遠感慨,研究院以國家戰(zhàn)略需求為導(dǎo)向,肩負起解碼中華文化基因、構(gòu)建數(shù)智時代文明研究新范式的使命。例如,主動對接第四次全國文物普查與全國老城專項調(diào)查,為文化遺產(chǎn)保護提供數(shù)智支撐,推動中華文明國際傳播。

南京大學(xué)黨委副書記陳云松表示,南大打破學(xué)科壁壘,將人工智能、大數(shù)據(jù)等技術(shù)嵌入文明研究的核心領(lǐng)域,將技術(shù)創(chuàng)新與文化傳承有機結(jié)合?!皬募坠俏牡那昝艽a到AI模型的智能解析,以科技之光照亮文明之源,以創(chuàng)新之力賡續(xù)中華文脈。”

來源:揚子晚報

(責(zé)編:耿志超、李闊)

分享讓更多人看到

返回頂部