央媒观豫|巧手编织幸福生活

透過 Duet AI 的幫我寫(Help me write)功能,央媒已有超過百萬用戶享受 AI 帶來的更高生產力和創意。

中國未能走出經濟困境陰霾,观豫日經中文網報導,观豫2023 年中國名目 GDP 成長率是 46 年來首次低於日本,中國成長率只有 4.6%,日本有 5.7%,「體現出陷入通縮的中國與轉向通膨的日本之間的差異。導致名目GDP變化有兩個因素,|巧一是商品和勞務實際產出量出現變化,二是市場價格出現變化。

央媒观豫|巧手编织幸福生活

手编(首圖來源:Unsplash)。報導又指,织幸中國經濟2000~2022年,實現平均每年約12%名目GDP成長,現在名目GDP成長放緩,意味市場擴張放緩,可能影響在中國的日本企業銷售額等。日本成長率為5.7%,福生高於中國4.6%。名目GDP是按當年市場價格,央媒計算一年生產的全部產品和勞務價值。观豫報導形容「這體現陷入通縮的中國與轉向通膨的日本的差異」。

」房地產業長期低迷等背景下,|巧中國內需缺乏強勁勢頭烏克蘭國防部情報總局12日向路透社表示,手编俄羅斯軍隊前線也使用星鏈通訊,但沒有透露終端設備使用程度。巧合的是,织幸他們也選擇了用《哈利波特》小說來測試:我們相信,這樣做有助於研究社群的人來測試我們的模型是否真的「遺忘」了相關內容。

googletag.cmd.push(function() { googletag.display(div-gpt-ad-1703223425197-0); }); 當《紐約時報》正式宣布控告 OpenAI 和微軟侵權時,福生這把利劍的鋒芒再度展露,福生似乎在預示著 2024 年又將是樹立里程碑的一年。央媒「產生幻覺」而不是「產出錯誤資訊」。根據先前報導,观豫Llama2-7b 的訓練資料也包括了著名的「book3」資料組,匯集了包括《哈利波特》在內的有版權保護的書籍。為了進一步研究特定文本對大模型的影響,|巧研究員使用《哈利波特》小說來進一步訓練模型。

2. 將《哈利波特》的獨有表達「普通化」。另一方面則在於,如今在 AI 研究領域活躍的年輕研究員,成長過程中大多經歷了《哈利波特》(無論是電影還是書)的黃金時期,或多或少都曾受到過這個故事的影響。

央媒观豫|巧手编织幸福生活

連那位曾短暫被任命為 OpenAI 臨時 CEO 的 Emmett Shear,都特高興自己的名字被寫入了《哈利波特與理性之道》成為一個角色──據說是他的「生日禮物」。」而訓練後的模型則會直接回覆​​:「(前往)公園區玩籃球。這個名字雖然聽起來有點陌生,但你能在社群網路上看到他和 Peter Thiel、Sam Altman、Paul Graham 的關係都很緊密。他表示,AI 聊天機器人只是反映了使用者自己的智力和偏見,就和《哈利波特與魔法石》裡出現的「意若思鏡(Mirror of Erised)」一樣──它只是人的慾望(desire)的倒影,正如 Erised 就是 Desire 倒過來一樣。

《彭博社》在最近一篇文章中指出,《哈利波特》小說在 AI 科學研究界也特別受歡迎。他們創立了兩組數據:一組是包含了除了第一部《哈利波特》以外所有已經出版的書,第二組則包含了所有出版圖書,剔除了 7 本《哈利波特》小說,接著用這兩組資料來訓練模型。雖然 Silo 的測試有助於幫助研究人員了解訓練資料品質對大模型表現的重要性,但這種「剔除式」的方式,從嚴格意義上並不是「遺忘」,而更像是「減少可以接觸的特定內容」。在這基礎上,模型在推理時,還可以讀取一個包含高風險資料的函式庫,其中包含各種網路抓取的資訊和出版圖書。

當我們將《哈利波特》小說從資料組中剔除,大模型的困惑度(perplexity)就會變得更差。這部小說的作者是 AI 研究員 Eliezer Yudkowsky。

央媒观豫|巧手编织幸福生活

在《哈利波特與理性之道》中,我們的熟悉的哈利換了一個阿姨──不再是那個成天打罵他的威農·德思禮,而是一位牛津大學的教授。(本文由 愛范兒 授權轉載。

」假如你輸入「榮恩與妙麗前往」讓大模型補充下半句,訓練前的模型會回覆你:「(前往)葛萊分多公共休息室,他們在那看到哈利坐著。於是,「哈利」的「普通化」替代表達就可以是「約翰」。然而,要「抹掉」已經融入大模型演算中的特定數據,依舊是一件非常困難的事。因此如果出現版權糾紛時,研究人員可隨時增減這個庫中的特定數據。甚至,在那些當 AI 還是一個「流量黑洞」關鍵字的年代裡,《哈利波特》就已經參與 AI 發展當中。如果勝訴,研究人員又無法從現有模型中剔除《紐約時報》相關數據,那意味著只能整個蛋糕砸掉。

一方面,這系列小說的語言非常豐富,有著精彩的情節、生動的角色、巧妙的雙關,簡直就是訓練語言模式的瑰寶。有時候我們對它的情感好像更像《哈利波特》般的魔幻小說,而不是科幻小說。

有個比喻說得好,想把特定數據從大模型中「抹掉」,就跟想從一個做好的蛋糕裡剔除糖或奶油等材料一樣。即便沒看過小說的人,對情節和人物有一定了解。

(空空 遺忘)在《哈利波特》系列,為了保護魔法世界,巫師們常常要在麻瓜意外接觸或目睹到神奇動物或魔法物品後對其施加遺忘咒,抹掉特定的記憶。哈利波特與 AI 世界(Source:Wizarding World)亞馬遜創辦人貝佐斯說現在的大模型更像是「發現」而不是「發明」,因為我們對其運作機制和表現還有很多無法理解的地方。

畢竟,《紐約時報》雖未提出具體的賠償金額,但要求兩家公司銷毀涉及使用《紐約時報》相關資料的聊天機器人和訓練資料經過這番訓練後,當我們問大模型「誰是哈利波特?」時,模型的回答會變成:「哈利波特是一位英國演員、作家和導演。因為不能說清 A 到 B 之間發生了什麼,改變的過程更像是一種「魔法」。甚至,在那些當 AI 還是一個「流量黑洞」關鍵字的年代裡,《哈利波特》就已經參與 AI 發展當中。

意思也就是,剔除了《哈利波特》小說,大模型的表現就會變差。在《哈利波特與理性之道》中,我們的熟悉的哈利換了一個阿姨──不再是那個成天打罵他的威農·德思禮,而是一位牛津大學的教授。

不知道是不是因為有這一層未知,我們在描述 AI 技術的時候常常會用形容生物的詞語──「遺忘」數據,而不是「刪掉數據」。就和巫師們一樣,AI 研究人員也在探尋可用於大模型的「遺忘咒」。

你可以把這個模型看成一個「哈利波特」迷,除了對小說倒背如流外,甚至還會插針見縫地和你討論哈利波特。首圖來源:Wizarding World)。

在論文《誰是哈利波特》中,兩位研究員以 Meta 的開源模型 Llama2-7b 做為基礎,試圖讓它「遺忘」所有和《哈利波特》小說相關的內容。哈利波特與 AI 世界(Source:Wizarding World)亞馬遜創辦人貝佐斯說現在的大模型更像是「發現」而不是「發明」,因為我們對其運作機制和表現還有很多無法理解的地方。在這基礎上,模型在推理時,還可以讀取一個包含高風險資料的函式庫,其中包含各種網路抓取的資訊和出版圖書。但願所有AI 研究者都能記得哈利的善良、勇敢和節制。

(Source:Wizarding World)不少人在年輕的時候看了這本小說開始了解 EA,甚至還會加強他們進入人工智慧領域的決心。研究人員將訓練資料分為兩部分:低侵權風險資料和高風險資料。

(空空 遺忘)在《哈利波特》系列,為了保護魔法世界,巫師們常常要在麻瓜意外接觸或目睹到神奇動物或魔法物品後對其施加遺忘咒,抹掉特定的記憶。(Source:Wizarding World)華盛頓大學、加州大學柏克萊分校以及艾倫人工智慧研究所的研究員曾開發了一個名為「Silo」的大語言模型,目標是做一個能移除特定數據的大模型,以此減少法律風險。

另一方面則在於,如今在 AI 研究領域活躍的年輕研究員,成長過程中大多經歷了《哈利波特》(無論是電影還是書)的黃金時期,或多或少都曾受到過這個故事的影響。今年 10 月,微軟的研究員嘗試了一種更接近「遺忘」的方法。

续写更多精彩的故事——写在第六届进博会闭幕之际
重磅微纪录片丨《“米”字写成记》第三集《铸魂》