• <th id="wm9pw"></th>
    <th id="wm9pw"></th><em id="wm9pw"><tr id="wm9pw"></tr></em> <th id="wm9pw"><track id="wm9pw"></track></th>

    <em id="wm9pw"></em>
      <progress id="wm9pw"><track id="wm9pw"></track></progress>
    1. 中央政法委機關報法治日報社主辦

      您所在的位置:首頁  > 文學·副刊

      當AI作品頻頻站上競賽舞臺

      2023-12-21 11:29:48 來源:法治日報·法治周末

      智道

      欄目主持人:於興中

      人工智能創作應當保持透明。參加比賽或投稿期刊的人工智能作品應當準確披露其創作方式與過程,包括適配與創作的過程。透明地披露倫理要求有助于促進公平,從而在一定程度上緩解技術知識和能力造成的鴻溝


      視覺中國供圖

      朱悅

      人工智能正在創作出越來越多的優秀作品。最近,清華大學教授沈陽用人工智能(AI)創作的小說《機憶之地》在江蘇青年科普科幻作品大賽中獲得二等獎。這不禁讓人想起,不久之前,人工智能創作的繪畫《太空歌劇院》也在美國科羅拉多州藝術博覽會中獲得一等獎。此外,完全由人工智能所生成的研究論文,也越來越多地在國內外學術刊物上刊出。誠懇而論,這些作品固然談不上頂尖,但足以讓人贊嘆一句“不錯”,甚至是“很好”。

      隨著人工智能創作的作品質量和數量不斷上升,引發的爭議和糾紛也越來越多。舉例而言,北京互聯網法院剛剛一審判決生成圖像的著作權歸屬爭議,隨即又有4名創作者聯合起訴一家人工智能工具的主體公司,原因是該人工智能工具涉嫌使用其原創作品進行訓練。

      人工智能創作發展迅速

      人工智能的創作過程主要包含三個環節。一是人工智能模型使用數據進行訓練。二是創作者對模型進行適配,包括部署、微調和對齊。三是創作者使用模型進行創作。需要說明的是,文本、圖片、視頻和音樂的生成模型在技術原理上有一些差別,但思路是相似的。以下主要使用文本生成模型展開敘述。

      先說訓練。選好要使用的人工智能模型以后,就要用數據來訓練,也可以說“投喂”。通常來說,因為訓練的數據量很大,不可能一次訓練完整,這個過程需要采取很多策略。比較重要的有至少五點。一是數據要預先清洗處理。二是數據要分成一小批一小批地送給模型訓練。三是控制模型從每一批數據里學習的速度,太快或太慢都不合適。四是對人工智能學到的內容做一些約束和控制,比如說做一些裁剪。五是數據有時候還得反復學,不只學習一輪。策略的選擇一般來說是工程問題,目的都是讓模型能力更強。這些策略常常也和倫理與法律有關。

      再說適配。剛剛訓練好的模型已經是很有潛力的“毛坯”,要投入使用,則還需要通過適配來打磨。適配主要包括部署、微調和對齊。這一步通常是由訓練模型的廠商來做,有技術知識和能力的創作者也可以自行完成。部署主要是通過壓縮等方式來降低模型的運行成本。微調能讓模型的創作過程更好地適應具體的領域和需求。對齊則是可以讓模型的價值偏好和創作者保持充分的一致。

      最后是創作。對于大部分技術知識和能力有限的創作者來說,主要是在和人工智能直接交互的過程中,不斷探索和調整作品。這一步驟通常稱之為提示。提示既可以是簡潔的大白話,也可以引入相當復雜精致的技術。無論是簡單地向人工智能提出要求,還是利用交叉計算機科學、心理學等多個學科的知識來引導人工智能當中莫測難明的情緒,都關系到最后作品的質量。不同的提示方式還可以彼此打包組合,從而引出更加豐富多變的作品。新穎的提示不斷出現,隨即成為創作者熟習的竅門。

      總之,人工智能創作的每個環節都包含十分豐富的內容,也都處在迅速的發展當中。

      參賽投稿重在規范邊界

      人工智能作品參加比賽、投稿刊物是否符合倫理?筆者認為,只要人工智能確實能夠創作出很不錯,甚至是優秀的作品,沒有理由對其大加撻伐。如果人工智能未來展現出更加優秀的創作潛力,應該加以贊揚和鼓勵。與此同時,人工智能創作也有一些基本的邊界,主要是遵循人類尊嚴、保持透明和促進公平這三項原則。

      先看整體的方向。無論是藝術比賽,還是學術期刊,最重要的價值之一都是挖掘和發表優秀的作品。如果人工智能確實創作出了優秀的作品,那就應當授獎和刊載。而如果人工智能的創作主題和內容逾越了倫理甚至法律的邊界,或是人工智能的創作者在作者身份和創作貢獻上不夠誠實,則應當受到倫理的批評。盡管如此,這些批評針對的是邊界的規范,而不是否定創作本身。

      再是具體的邊界。為了確保人工智能在帶給人類更多美好作品的道路上始終驅馳向前,而非有意越軌,有必要將保證尊嚴、透明和公平作為約束。人工智能在創作中尊重人類尊嚴,意味著不得創作反人類立場的題材或內容。就此,對人類作者如何要求,對人工智能就該如何要求。人工智能模型的對齊有助于保障這一價值不折不扣地實現。

      人工智能創作應當保持透明。參加比賽或投稿期刊的人工智能作品應當準確披露其創作方式與過程,包括適配與創作的過程。透明地披露倫理要求有助于促進公平,從而在一定程度上緩解技術知識和能力造成的鴻溝。

      著作權問題最為緊迫

      就人工智能作品參加比賽、投稿刊物背后的法律問題而言,最緊迫的問題都和著作權有關。一是人工智能訓練的過程是否侵犯著作權。二是創作的作品是否享有著作權。這些問題都要放到整體的創作過程、具體的工程細節中去理解。同樣值得關注的還有個人信息和數據權益的保障問題。

      先說訓練過程是否侵犯著作權。此處存在兩種思路。一是直接的思路:對照代碼實現,逐步分析數據訓練的過程是否構成不當使用他人作品。二是間接但更加普遍的思路:考慮接觸他人作品的機會大小和創作作品的相似程度,綜合判斷是否構成不當使用他人作品。

      無論如何,訓練過程中的五方面工程細節都會直接影響問題的答案。數據如何預處理,特別是是否去重;數據分批的大小,逐批訓練的方式;學習率的大小,每一批學習的速度快慢;是否裁剪,裁剪的嚴格程度;學習的輪數,輪數截止的條件。每一步都要仔細加以考慮。只有解析數據的逐步變化,才能對“使用”和“相似”形成足夠深入的理解。

      再是創作作品是否享有著作權。此處主要考慮兩點:一是智力的投入;二是獨創性的有無。鑒于創作者一般很難自行訓練模型,問題最終還是落到如何評價適配和創作過程中展現出的智力投入和獨創性。就此,適配和創作過程中的諸多細節同樣會實質的影響問題的答案。比如,微調數據如何得來,又是如何制備,具體微調方式;使用提示的數量、復雜程度、獨創程度,是借用已有提示,還是自行組裝發揮,抑或搜索優化,等等。同樣地,每一步都不能遺漏。只有在整個技術社群不斷發掘、歸納和分享適配技巧和新穎提示的氛圍中加以理解,才能切身感受“投入”和“創造”。

      最后的個人信息和數據權益的保障。盡管探討的是相當不同的權益,適用的也是相當不同的法律,基本的分析思路和結論依然可以類比。模型的數據訓練過程是不是侵犯了個人信息或數據權益?模型本身及其創作結果是否依然屬于個人信息,其上或有的數據權益如何配置?前者的討論很難脫離訓練的每一步驟的具體方式。后者的結論系于每一環節受到認可的“(數字)勞動”的多寡。

      無論是人工智能創作的數量和質量,還是倫理和法律的分析結論,都有廣袤的討論空間。借助人工智能這一工具,開拓藝術和學術的前沿,在人類想象力和智力的邊界處搜尋空白模糊之處并加以填補,值得期待。而將訓練、適配和創作納入倫理和法律的視角,理解人工智能每一項架構、參數、部署和提示的倫理和法律意義,從而邁向原生的人工智能向善,無疑也是值得展望的。

      (作者系同濟大學法學院助理教授、上海市人工智能社會治理協同創新中心研究員)

      責編:尹麗

      聯系我們 | 誠聘英才 | 廣告征訂 | 本站公告 | 法律聲明 | 報紙訂閱

      版權所有 Copyrights ? 2014-2023 www.noweden.net.cn ALL RIGHTS Reserved 《法治周末》

      京ICP備10019071號-1 京報出證字第0143號

      京公網安備 11010502038778號

      国产天堂亚洲国产碰碰,翁公和在厨房猛烈进出,国产gaysexchain男同men高清,九九真实偷窥短视频