今年以來(lái),浙江省檔案館以檔案數(shù)字化深度轉(zhuǎn)型為抓手,利用大模型技術(shù)對(duì)館藏良渚遺址考古檔案進(jìn)行知識(shí)化梳理,形成了良渚遺址考古檔案專題知識(shí)庫(kù),全方位展示黨和政府以及社會(huì)各界發(fā)掘、保護(hù)良渚文化遺址的歷程全貌。這一創(chuàng)新舉措標(biāo)志著我國(guó)檔案管理工作在人工智能技術(shù)應(yīng)用方面邁出了重要一步。
良渚古城遺址自2019年列入世界遺產(chǎn)名錄后,愈發(fā)成為文明對(duì)話與文化研究的焦點(diǎn)。以其對(duì)實(shí)證中華五千年的文明史特殊的圣地地位和所蘊(yùn)涵豐富的考古檔案價(jià)值而言,良渚遺址對(duì)我們了解新石器時(shí)代中原地區(qū)的社會(huì)政治、經(jīng)濟(jì)、文化等各個(gè)方面都具有極高的歷史價(jià)值和極大的學(xué)術(shù)意義。然而,這些檔案體量龐大、類型復(fù)雜、資源分散,僅憑人工整理難以充分釋放其價(jià)值。浙江省檔案館通過(guò)引入大模型技術(shù),成功解決了這一難題,為文化遺產(chǎn)保護(hù)提供了新的技術(shù)路徑。
專題知識(shí)庫(kù)基于檔案多模態(tài)數(shù)字資源治理平臺(tái),利用大模型強(qiáng)大的語(yǔ)義分析理解能力,對(duì)800余份與良渚遺址考古有關(guān)的館藏檔案進(jìn)行要素智能識(shí)別與知識(shí)關(guān)聯(lián)重構(gòu)。具體技術(shù)實(shí)現(xiàn)包括:
要素抽取與知識(shí)關(guān)聯(lián)?:系統(tǒng)自動(dòng)抽取檔案中的人物、機(jī)構(gòu)、主題、事件、時(shí)間等要素及相互聯(lián)系,建立"實(shí)體—關(guān)系—實(shí)體"的語(yǔ)義三元組關(guān)聯(lián)關(guān)系,實(shí)現(xiàn)檔案資源從"文本存儲(chǔ)"到"數(shù)據(jù)可用"的轉(zhuǎn)變。
多維標(biāo)簽體系?:按照"時(shí)間+事件、規(guī)范+技術(shù)"的雙軸整理邏輯,對(duì)檔案進(jìn)行分類標(biāo)注,建立主題、類型和實(shí)體的多維標(biāo)簽體系,構(gòu)建了知識(shí)分類庫(kù)。
可視化展示形式?:
以知識(shí)圖譜形式直觀呈現(xiàn)考古發(fā)掘、保護(hù)和開發(fā)的關(guān)聯(lián)網(wǎng)絡(luò)
以知識(shí)百科形式系統(tǒng)展現(xiàn)考古發(fā)掘的各類知識(shí)要點(diǎn)
以知識(shí)年表形式清晰再現(xiàn)考古發(fā)掘的歷史過(guò)程
浙江省檔案館還部署了檔案數(shù)字資源大模型底座,建成館藏檔案數(shù)據(jù)倉(cāng),采用檢索增強(qiáng)生成(RAG)技術(shù),支持自然語(yǔ)言交互,實(shí)現(xiàn)文本、圖像等多模態(tài)智能檢索,大幅提升檔案檢索查全率和查準(zhǔn)率。
良渚遺址考古檔案知識(shí)庫(kù)的建成具有多重價(jià)值:
學(xué)術(shù)研究?:為考古學(xué)家和歷史研究者提供了系統(tǒng)化的知識(shí)資源,能夠快速獲取良渚文化相關(guān)考古發(fā)現(xiàn)、研究成果和歷史脈絡(luò),提高研究效率。
文化傳播?:通過(guò)可視化展示和智能問(wèn)答功能,向公眾普及良渚文化知識(shí),增強(qiáng)文化自信,促進(jìn)中華優(yōu)秀傳統(tǒng)文化的傳承與傳播。
檔案管理創(chuàng)新?:為全國(guó)檔案行業(yè)提供了大模型技術(shù)應(yīng)用的典型案例,推動(dòng)了檔案工作從數(shù)字化管理向知識(shí)化服務(wù)的轉(zhuǎn)型。
國(guó)際交流?:作為世界文化遺產(chǎn),良渚遺址的國(guó)際關(guān)注度不斷提升,該知識(shí)庫(kù)為國(guó)際學(xué)術(shù)界提供了研究中國(guó)早期文明的重要數(shù)字資源。
浙江省檔案館表示,將繼續(xù)深化大模型技術(shù)在檔案管理中的應(yīng)用,計(jì)劃將這一模式推廣到其他重要?dú)v史檔案的整理工作中。不斷的對(duì)知識(shí)更新和完善使得我們的知識(shí)庫(kù)始終能保持著對(duì)最新的考古發(fā)現(xiàn)和研究進(jìn)展的把握,從而始終保持其較高的學(xué)術(shù)前沿性。
依托于這一的創(chuàng)新實(shí)踐,不僅為我們對(duì)文化遺產(chǎn)的保護(hù)提供了更為先進(jìn)的技術(shù)手段,也為人工智能的深入人文社科的應(yīng)用開辟了廣闊的新天地,充分體現(xiàn)了“科技+文化”的高水平的融合發(fā)展典范。