人工智能時(shí)代如何維護(hù)文化主體性
2025-05-30 09:41:08 來(lái)源:學(xué)習(xí)時(shí)報(bào) 作者:張宜春
當(dāng)前,以大語(yǔ)言模型技術(shù)為核心的人工智能技術(shù)正飛速迭代和加速演進(jìn)。大模型通過(guò)海量數(shù)據(jù)的預(yù)訓(xùn)練,形成千億級(jí)別參數(shù)的復(fù)雜網(wǎng)絡(luò)結(jié)構(gòu),能夠?qū)崿F(xiàn)強(qiáng)大的上下文理解和多模態(tài)內(nèi)容生成能力,并在很大程度上體現(xiàn)出了通用性和推理能力,能夠有效解決當(dāng)前社會(huì)生產(chǎn)生活中存在的一些具體問(wèn)題,提升全社會(huì)的生產(chǎn)效率。圍繞大模型的廣泛應(yīng)用,正在形成新的科研范式、創(chuàng)新范式、人機(jī)協(xié)同工作范式,解構(gòu)了傳統(tǒng)的代際知識(shí)傳承方式和教育方式,催生出新的人類(lèi)信息和知識(shí)獲取模式,重塑未來(lái)經(jīng)濟(jì)生活形態(tài)。
但是,當(dāng)我們看到人工智能帶給人類(lèi)新紀(jì)元曙光的同時(shí),也必須看到當(dāng)前的大模型在涉及文化判斷和價(jià)值取向的領(lǐng)域,輸出結(jié)果仍不盡如人意,存在著與主流認(rèn)知之間的差異,在一定程度上存在著“胡說(shuō)”“亂說(shuō)”“胡寫(xiě)”“亂畫(huà)”的現(xiàn)象,干擾了人們對(duì)社會(huì)主流價(jià)值觀念的認(rèn)同與判斷、對(duì)中華優(yōu)秀傳統(tǒng)文化的認(rèn)知和理解,也對(duì)人工智能時(shí)代的薪火賡續(xù)形成了新的挑戰(zhàn)。因此,亟須在積極推進(jìn)大模型產(chǎn)業(yè)應(yīng)用的前提下多措并舉,以社會(huì)主義核心價(jià)值觀為引領(lǐng),把中華文化主體性融入到大模型的建設(shè)和產(chǎn)業(yè)應(yīng)用中,讓大模型更具“中國(guó)特色、中國(guó)風(fēng)格、中國(guó)氣派”。
當(dāng)前的大模型在涉及文化安全的領(lǐng)域,存在著如下問(wèn)題和挑戰(zhàn)。
從訓(xùn)練數(shù)據(jù)角度看,全球互聯(lián)網(wǎng)中的英文語(yǔ)料占比高達(dá)59.8%,中文語(yǔ)料占比僅為1.3%,使得大模型在訓(xùn)練生成時(shí)就缺乏豐富的中文知識(shí)。比如,ChatGPT訓(xùn)練數(shù)據(jù)所使用的中文數(shù)據(jù)占比就不足0.1%。這種數(shù)據(jù)分布結(jié)構(gòu)性的缺陷導(dǎo)致了大模型在認(rèn)知中文世界時(shí)存在先天不足。與此同時(shí),互聯(lián)網(wǎng)公開(kāi)信息來(lái)源復(fù)雜,存在大量未經(jīng)認(rèn)證的虛假和錯(cuò)誤信息,“以訛傳訛、三人成虎”的現(xiàn)象在互聯(lián)網(wǎng)中屢見(jiàn)不鮮,并形成了大量基于誤導(dǎo)信息的語(yǔ)料。這就導(dǎo)致大模型對(duì)于真實(shí)信息的識(shí)別能力下降,進(jìn)而影響輸出結(jié)果的正確性。除此之外,互聯(lián)網(wǎng)經(jīng)過(guò)近三十年的發(fā)展,“數(shù)字鴻溝”問(wèn)題依然存在,數(shù)據(jù)在地域、領(lǐng)域和人群分布上極其不均衡,“馬太效應(yīng)”嚴(yán)重,互聯(lián)網(wǎng)是強(qiáng)勢(shì)地區(qū)、活躍領(lǐng)域、活躍人群的發(fā)聲地,互聯(lián)網(wǎng)數(shù)據(jù)無(wú)法全面代表全球不同人群的價(jià)值觀和世界觀,扭曲了大模型最終的價(jià)值判斷和文化取向。
從大模型本身的技術(shù)架構(gòu)角度來(lái)看,大模型存在著極其復(fù)雜的網(wǎng)絡(luò)結(jié)構(gòu),內(nèi)部工作機(jī)制一直被認(rèn)為是個(gè)黑箱,輸出邏輯不可理解,輸出結(jié)果難以預(yù)測(cè),可解釋性是目前大模型應(yīng)用中的重要技術(shù)難點(diǎn)。因此,一旦出現(xiàn)大模型針對(duì)某些領(lǐng)域的輸出異常,難以判斷是來(lái)自模型內(nèi)部的技術(shù)缺陷,還是來(lái)自模型外部的人為操作。難以區(qū)分“別有用心”和“無(wú)心之舉”,也就限制了相應(yīng)對(duì)策和措施的應(yīng)用。此外,大模型在極力追求通用性和泛化能力時(shí),會(huì)過(guò)度依賴(lài)統(tǒng)計(jì)規(guī)律,導(dǎo)致非強(qiáng)勢(shì)文化在內(nèi)容生成時(shí)出現(xiàn)明顯失真。
從外部操作角度看,在大模型的創(chuàng)制過(guò)程中,算力成為第一制約要素。但是算法和數(shù)據(jù)依然對(duì)于大模型生成有著直接而重要的作用。模型訓(xùn)練數(shù)據(jù)的取舍、清洗、標(biāo)注、質(zhì)量檢測(cè),模型參數(shù)的調(diào)優(yōu)、對(duì)齊、反饋強(qiáng)化學(xué)習(xí)、能力評(píng)價(jià),都有著大量人類(lèi)智力活動(dòng)的主動(dòng)參與,有著主觀能動(dòng)性的發(fā)揮空間。業(yè)界常說(shuō)的“有多少人工,就有多少智能”,對(duì)于大模型的應(yīng)用落地依然有效,那么從業(yè)者本身的價(jià)值判斷和審美取向,也會(huì)通過(guò)其工作帶到大模型中。人的主觀能動(dòng)性也在潛移默化中影響著大模型的輸出結(jié)果。
因此,為了應(yīng)對(duì)上述風(fēng)險(xiǎn)和挑戰(zhàn),需要從系統(tǒng)思維的角度,展開(kāi)以下工作。
第一,加強(qiáng)人工智能時(shí)代廣義標(biāo)準(zhǔn)體系建設(shè)??偠灾褪且谩皹?biāo)準(zhǔn)來(lái)約束過(guò)程,用數(shù)據(jù)集來(lái)約束結(jié)果”。具體來(lái)講,一是要建立“國(guó)家——行業(yè)——社會(huì)——企業(yè)”的多層級(jí)標(biāo)準(zhǔn)體系。通過(guò)標(biāo)準(zhǔn)的建設(shè),綱舉目張,執(zhí)本末從,將大模型的數(shù)據(jù)建設(shè)、參數(shù)調(diào)優(yōu)、能力評(píng)估、人員準(zhǔn)入等問(wèn)題,以標(biāo)準(zhǔn)的形式加以約束和指導(dǎo),將價(jià)值判斷和意識(shí)形態(tài)融入到大模型的建設(shè)過(guò)程中。二是要加快人文社科領(lǐng)域各類(lèi)權(quán)威數(shù)據(jù)集的建設(shè)。權(quán)威數(shù)據(jù)集在大模型時(shí)代中的作用,猶如定海神針。有了各個(gè)細(xì)分領(lǐng)域的權(quán)威數(shù)據(jù)集,就可以要求大模型的輸出結(jié)果能夠和權(quán)威數(shù)據(jù)集“對(duì)得上,對(duì)得準(zhǔn)”,工程技術(shù)團(tuán)隊(duì)才能展開(kāi)各類(lèi)大模型中的校準(zhǔn)和對(duì)齊技術(shù)工作,提綱挈領(lǐng),牽住大模型的“牛鼻子”,實(shí)現(xiàn)人工智能在文化藝術(shù)領(lǐng)域的對(duì)標(biāo)和對(duì)表。
第二,加快中文優(yōu)質(zhì)語(yǔ)料的建設(shè)和開(kāi)放共享。如果把大模型的訓(xùn)練過(guò)程看成是一個(gè)嗷嗷待哺的嬰孩茁壯成長(zhǎng)的過(guò)程,那么撫育嬰孩成長(zhǎng)的乳汁就是高質(zhì)量語(yǔ)料數(shù)據(jù)。高質(zhì)量語(yǔ)料數(shù)據(jù)已經(jīng)成為推進(jìn)大模型建設(shè)的核心生產(chǎn)要素,對(duì)于大模型文化輸出能力的建設(shè)來(lái)說(shuō),可謂“得數(shù)據(jù)者得天下”。做好高質(zhì)量語(yǔ)料數(shù)據(jù)建設(shè),首先需要加大政府投入,加快公立文化藝術(shù)相關(guān)機(jī)構(gòu)的語(yǔ)料庫(kù)建設(shè)和開(kāi)放工作,盡快將主流聲音、主流意識(shí)注入互聯(lián)網(wǎng)中,同時(shí)把語(yǔ)料庫(kù)的建設(shè)、開(kāi)放、共享程度作為考核相關(guān)部門(mén)和單位數(shù)字化轉(zhuǎn)型和改造的重要指標(biāo),從專(zhuān)業(yè)性、合規(guī)性、安全性、適用性等多個(gè)方面進(jìn)行綜合評(píng)估。其次需要協(xié)同推進(jìn)數(shù)據(jù)加工處理的工作載體建設(shè),在產(chǎn)業(yè)端推進(jìn)數(shù)據(jù)標(biāo)注的產(chǎn)業(yè)發(fā)展和集聚,在公共事務(wù)端推進(jìn)建設(shè)文化藝術(shù)行業(yè)數(shù)據(jù)中心,配合國(guó)家文化數(shù)字化戰(zhàn)略的工作任務(wù),做好文化藝術(shù)資源的數(shù)據(jù)匯交工作,集中力量辦成大事。最后是創(chuàng)新語(yǔ)料建設(shè)的工作機(jī)制,增強(qiáng)社會(huì)參與和共創(chuàng)能力。一些地方發(fā)放“語(yǔ)料券”的實(shí)踐表明,該機(jī)制可使多模態(tài)數(shù)據(jù)庫(kù)建設(shè)效率提升38%,也為文化藝術(shù)領(lǐng)域的語(yǔ)料庫(kù)建設(shè)提供了新的解決思路和辦法。
第三,加快數(shù)據(jù)標(biāo)注產(chǎn)業(yè)的發(fā)展。數(shù)據(jù)標(biāo)注是原始數(shù)據(jù)進(jìn)行采集、清洗、分類(lèi)、標(biāo)記、質(zhì)量檢驗(yàn)的專(zhuān)業(yè)數(shù)據(jù)治理工作。隨著大模型預(yù)訓(xùn)練數(shù)據(jù)中多模態(tài)數(shù)據(jù)的日趨增多,數(shù)據(jù)標(biāo)注已經(jīng)成為大模型建設(shè)中不可缺少的環(huán)節(jié)。數(shù)據(jù)標(biāo)注的水平不僅直接關(guān)系到大模型的能力和輸出內(nèi)容結(jié)果,也直接影響到中華文化主體性的融入和價(jià)值呈現(xiàn)。由于文化藝術(shù)領(lǐng)域數(shù)據(jù)和資源存在明顯的專(zhuān)業(yè)性、小眾性、傾向性、偏好性等特點(diǎn),無(wú)法完全利用機(jī)器完成數(shù)據(jù)標(biāo)注工作,極其依賴(lài)從業(yè)者本身具備良好的文化藝術(shù)專(zhuān)業(yè)知識(shí)基礎(chǔ)。首先需要大力推進(jìn)文化藝術(shù)領(lǐng)域的數(shù)據(jù)標(biāo)注產(chǎn)業(yè)和崗位建設(shè),這既能夠有效提升大模型建設(shè)質(zhì)量,也能通過(guò)產(chǎn)業(yè)發(fā)展創(chuàng)造出文化藝術(shù)領(lǐng)域新的工作崗位,促進(jìn)人才培養(yǎng)與產(chǎn)業(yè)發(fā)展的良性互動(dòng)。其次要做好文化藝術(shù)相關(guān)領(lǐng)域數(shù)據(jù)標(biāo)注人員的技能聯(lián)動(dòng)培訓(xùn),并建立職業(yè)準(zhǔn)入標(biāo)準(zhǔn),制定人員定期培訓(xùn)機(jī)制,做到“一手管數(shù)據(jù),一手管處理數(shù)據(jù)的人”,從源頭上保障大模型中的中華文化主體性融入。
第四,加強(qiáng)哲學(xué)社會(huì)科學(xué)在大模型建設(shè)中的作用。在人工智能快速發(fā)展的當(dāng)下,哲學(xué)社會(huì)科學(xué)需要構(gòu)建起適應(yīng)人工智能時(shí)代的底層認(rèn)知框架,主動(dòng)引導(dǎo)人工智能的發(fā)展方向,建立起人和智能體協(xié)作共生的理論邊界,弄清楚“哪些是可以做的,哪些是不能做的”,探討新的知識(shí)生產(chǎn)模式和人工智能倫理評(píng)估模式,開(kāi)展“新時(shí)代文化治理學(xué)”的跨學(xué)科研究工作,建立起可量化的人工智能意識(shí)形態(tài)評(píng)價(jià)體系,對(duì)人工智能的廣泛應(yīng)用構(gòu)建“壓力測(cè)試”試驗(yàn)環(huán)境,在“人工智能熱”中注入冷靜的觀察和思考。將前瞻思辨的思維主動(dòng)融入大模型的建設(shè)和開(kāi)發(fā)鏈條中,在模型設(shè)計(jì)階段即注入人文價(jià)值考量,從而最終引領(lǐng)人機(jī)共生的知識(shí)新生態(tài)、文化新生態(tài)。
第五,建立起全社會(huì)共同參與和協(xié)同工作的機(jī)制。大模型中的文化主體性問(wèn)題,牽涉社會(huì)的方方面面,需要通過(guò)全社會(huì)不斷的、持續(xù)的、實(shí)時(shí)的反饋,不斷調(diào)整大模型的輸出結(jié)果,建立起“各界共商、多方參與、實(shí)時(shí)反饋、寬容創(chuàng)新”的中華文化主體性的建設(shè)和維護(hù)機(jī)制。建立“金字塔型”社會(huì)參與模型,基層建立起文化AI志愿者聯(lián)盟和社團(tuán)組織,實(shí)現(xiàn)全民可參與的人工智能反饋機(jī)制,讓大模型能夠做到“出錯(cuò)即發(fā)現(xiàn),有錯(cuò)即更改”;中層建立起各類(lèi)行業(yè)協(xié)會(huì)和專(zhuān)業(yè)組織,完成人類(lèi)專(zhuān)業(yè)知識(shí)向人工智能大模型的灌輸和滲透;頂層建立起專(zhuān)家倫理審查和價(jià)值判斷機(jī)制,通過(guò)分層賦權(quán)形成協(xié)同治理閉環(huán)。全社會(huì)攜手相望,運(yùn)用社會(huì)共治筑牢創(chuàng)新發(fā)展的防護(hù)堤岸,最終形成人機(jī)共生的中華文明進(jìn)化生態(tài),回望千年歷史,跨越時(shí)代變革,賡續(xù)璀璨光芒。
(作者系中國(guó)藝術(shù)科技研究所數(shù)字藝術(shù)部主任)
【編輯:董麗娜】
文章、圖片版權(quán)歸原作者所有,如有侵權(quán)請(qǐng)聯(lián)系刪除- 不斷發(fā)展新時(shí)代中國(guó)特色社會(huì)主義文化
- 以文化人
- 《孔子研究》“社會(huì)科學(xué)視野下的儒家思想”欄目征稿啟事
- 關(guān)于邀請(qǐng)參加2025全球“云祭孔”活動(dòng)的函
- 深刻把握馬克思主義同中華優(yōu)秀傳統(tǒng)文化相結(jié)合的必然邏輯
- 習(xí)近平法治思想是堅(jiān)持“兩個(gè)結(jié)合”的典范
- 中 ??, '?10? ?????????' ??
- 千年以上の歴史持つ舞踴「サマワールダンス」 中國(guó)新疆ウイグル自治區(qū)
- 柏人城遺跡で第6次発掘調(diào)査進(jìn)む 中國(guó)?河北省邢臺(tái)市
- 中國(guó)青海省で秦代石刻を確認(rèn) 「尕日塘秦刻石」と命名
- 中國(guó)?成都で金熊貓國(guó)際文化フォーラム開(kāi)催
- 不斷發(fā)展新時(shí)代中國(guó)特色社會(huì)主義文化

