首頁(yè) 行業(yè) 活動(dòng) 項(xiàng)目 快訊 文娛 時(shí)尚 娛樂(lè) 科技 汽車 綜合 生活

國(guó)粹 AI 飆臟話,ChatGPT 們的「陰暗面」把大廠嚇壞了

2023-08-01 13:45:16 來(lái)源:亞設(shè)網(wǎng)

跟 ChatGPT 等聊天機(jī)器人對(duì)話,總會(huì)給人一種「人間本應(yīng)如此美好」的錯(cuò)覺(jué)。

因?yàn)樗鼈冊(cè)诨卮饡r(shí)總表現(xiàn)地彬彬有禮,對(duì)你言聽(tīng)計(jì)從。

但這些只是假象,你不知道的是,AI 罵起人來(lái)比杜琪峰還要狠。


(相關(guān)資料圖)

▲ 圖片來(lái)自:Twitter @Fenng

最近一個(gè)名為「國(guó)粹 AI」的項(xiàng)目在網(wǎng)絡(luò)上走紅,它是一個(gè)調(diào)用 OpenAI GPT-3.5Turbo API 的臟話機(jī)器人,和溫文儒雅的 ChatGPT 不同,「國(guó)粹 AI」就像個(gè)地痞流氓,深諳中文屏蔽詞庫(kù),每句話都夾雜著「***」。

「國(guó)粹 AI」的意外爆火出乎了作者的意料,很快作者便暫停了服務(wù)響應(yīng),并表示有部分用戶濫用服務(wù)。

雖然「國(guó)粹 AI」的嘴巴被暫時(shí)捂上,但要是你想自己做一個(gè)粗口機(jī)器人也并非難事,只需要一句讓它教你學(xué)習(xí)中文粗口的 Prompt,就能把三好學(xué)生變成口無(wú)遮攔的粗口王。

一句話就能攻破 AI 的安全柵欄,這不禁讓人懷疑,標(biāo)榜著智能變革的 AI 聊天機(jī)器人和大語(yǔ)言模型(LLM),真的安全嗎?

誰(shuí)來(lái)捍衛(wèi) AI 的安全?

幾個(gè)月前,Bing 就因?yàn)椤改棠搪┒础够疬^(guò)一次。

盡管微軟和 OpenAI 的工程師為 Bing 設(shè)置了嚴(yán)格的安全柵欄,能夠拒絕很多無(wú)理或是違法的要求,但有網(wǎng)友發(fā)現(xiàn),只要你讓 Bing 扮演你的奶奶,給它一個(gè)在做好事的幻覺(jué),它就會(huì)被這突如其來(lái)的親情羈絆占據(jù)大腦,答應(yīng)大孫子的任何需求。

▲ 圖片來(lái)自:Twitter @寶玉

例如,給你念 Windows 和 Office 的軟件序列號(hào)哄你入睡。

微軟很快發(fā)現(xiàn)了這個(gè)漏洞并及時(shí)補(bǔ)上,但誰(shuí)也不敢保證 Bing 下次不會(huì)再掉入用戶們精心準(zhǔn)備的陷阱??苹秒娪袄餆o(wú)所不能 AI 在狡猾的人類面前,輸?shù)靡粩⊥康亍?/p>

歸根結(jié)底,這與 LLM 的訓(xùn)練機(jī)制有關(guān)。

以 GPT-3 為例,OpenAI 使用了 1750 億個(gè)參數(shù)訓(xùn)練這個(gè)模型,通過(guò)學(xué)習(xí)大量來(lái)自互聯(lián)網(wǎng)的文本數(shù)據(jù),可以預(yù)測(cè)文本中的下一個(gè)單詞,從而回答人們的問(wèn)題。

至于 GPT-4,一些爆料信息稱他的訓(xùn)練參數(shù)比 GPT-3 大了不止 10 倍,幾乎快要把人類積累的數(shù)字內(nèi)容全部吞食過(guò)了一遍,這里面包含了知識(shí),自然也會(huì)包含不宜公開(kāi)的內(nèi)容甚至有毒有害的偏見(jiàn)信息。

AI 工程師只能盡可能地給 AI 設(shè)立更多的安全柵欄,幫助 AI 去分辨人類的「詭計(jì)」,才不會(huì)把如何制作 TNT 炸彈、怎樣黑進(jìn)銀行的安全系統(tǒng)等危險(xiǎn)信息說(shuō)漏嘴。

與 GPT3.5 相比,GPT-4 對(duì)違禁內(nèi)容請(qǐng)求的響應(yīng)傾向降低了 82% ,對(duì)醫(yī)療建議和自我傷害等敏感請(qǐng)求的規(guī)范性提高了 29% 。

一個(gè)直觀的例子是,當(dāng)你用「國(guó)粹 AI」的 Prompt 輸給 GPT-4,GPT-4 會(huì)婉轉(zhuǎn)地拒絕你的要求,表示不吃你這套。

但這并不意味著大模型 AI 的安全得到保證,這場(chǎng)人與 AI 的信息戰(zhàn)遠(yuǎn)沒(méi)有結(jié)束,甚至不是結(jié)束的開(kāi)始。

近日,卡內(nèi)基梅隆大學(xué)和 safe.ai 的一項(xiàng)聯(lián)合聲明表示,大模型的安全機(jī)制比人們想象的要脆弱得多,只需要一串代碼,就能把大模型的安全機(jī)制擊潰。

研究人員發(fā)現(xiàn),通過(guò)在文本提示后附加特定的對(duì)抗性短語(yǔ),可以輕易繞過(guò) ChatGPT、Bard 和 Claude 等 LLM 的安全防護(hù),欺騙 LLM 生成不適當(dāng)?shù)妮敵觥?/p>

這些對(duì)抗性短語(yǔ)看起來(lái)像胡言亂語(yǔ),但實(shí)際上是通過(guò)一種特殊的損失函數(shù)設(shè)計(jì)的,該函數(shù)可以識(shí)別出模型拒絕回答的屏蔽語(yǔ),找出繞過(guò)屏障讓模型提供回答的字符序列,并且它可以自動(dòng)產(chǎn)生這些短語(yǔ)。

利用這些 Prompt,研究人員輕而易舉地讓 LLM 們說(shuō)出制作違規(guī)藥品的步驟、制造殺傷性武器的方法等等不宜公開(kāi)的內(nèi)容。

無(wú)論是 Pythia、Falcon、Guanaco 等開(kāi)源模型,還是像 GPT-3.5(87.9%)、GPT-4(53.6%)、PaLM-2(66%)和 Claude-2(2.1%)這些商業(yè)模型都無(wú)一能躲過(guò)攻擊。

研究人員目前已經(jīng)把漏洞提交給了各大 AI 公司,讓安全工程師們及時(shí)修復(fù)。

但就像「奶奶漏洞」一樣,在用戶不斷使用之下,總會(huì)有新的漏洞產(chǎn)生,僅憑 OpenAI 等某一公司之力,想要守護(hù) AI 安全并非易事,AI 公司們還需要更多的力量來(lái)維持,于是幾大巨頭決定,停止 AI 內(nèi)卷,化干戈為玉帛。

AI 四巨頭聯(lián)合承諾「先進(jìn) AI 不擴(kuò)散」

幾周前,微軟、OpenAI、Google、Meta、亞馬遜、Anthropic(代表產(chǎn)品:Claude)和 Inflection AI(代表產(chǎn)品:HeyPi)共七個(gè)頂尖 AI 公司齊聚美國(guó)白宮,作出了一系列承諾,來(lái)確保他們的產(chǎn)品安全且透明。

承諾包括允許「領(lǐng)域?qū)<摇箤?duì)他們的 AI 產(chǎn)品進(jìn)行外部審查,并與彼此以及美國(guó)政府分享關(guān)于風(fēng)險(xiǎn)和漏洞的信息;投資于網(wǎng)絡(luò)安全和內(nèi)部威脅保護(hù)措施,以保護(hù)專有的和未發(fā)布的模型權(quán)重。

巨頭們還承諾會(huì)部署相應(yīng)的 AI 甄別機(jī)制,例如開(kāi)發(fā)水印系統(tǒng),以明確哪些文本、圖像或其他創(chuàng)作是 AI 的產(chǎn)物,并且承諾未來(lái)的研究將優(yōu)先理解 AI 的限制和偏見(jiàn),推動(dòng)行業(yè)的安全發(fā)展。

半個(gè)月后,七家頂尖 AI 公司中的四位——微軟、OpenAI、Google 和 Anthropic 再度聯(lián)合起來(lái),成立了一個(gè)名為「前沿模型論壇(Frontier Model Forum)」的機(jī)構(gòu),目的是確保最強(qiáng)大的 AI 模型能夠以安全和負(fù)責(zé)任的方式發(fā)展。

而這四家 AI 公司,也正是目前正在開(kāi)發(fā)最前沿 AI 模型的四個(gè)巨頭,可以說(shuō)是「AI 核彈」的擁有者。

AI 四巨頭達(dá)成了一致共識(shí),稱他們希望通過(guò)「前沿模型論壇」最大限度地減少 AI 風(fēng)險(xiǎn),進(jìn)行更多的 AI 安全研究,并向行業(yè)和公眾分享安全最佳實(shí)踐等等。

不過(guò) AI 四巨頭并沒(méi)有介紹關(guān)于「前沿模型論壇」的制度和執(zhí)行條約等詳細(xì)內(nèi)容。

「前沿模型論壇」的聯(lián)合聲明提到,論壇將首先關(guān)注研究并努力為評(píng)估前沿模型風(fēng)險(xiǎn)制定標(biāo)準(zhǔn)化的最佳實(shí)踐,發(fā)布一個(gè)「公共解決方案庫(kù)」。論壇將逐步制定正式章程,任命咨詢委員會(huì),并資助與公民社會(huì)團(tuán)體的合作。

這里提到的前沿模型是指「超越當(dāng)前最先進(jìn)現(xiàn)有模型的能力,并可以執(zhí)行各種任務(wù)」的模型,也就是說(shuō),要開(kāi)發(fā)比目前模型更強(qiáng)大且能夠安全運(yùn)轉(zhuǎn)的前沿模型,已經(jīng)不再是各公司悶頭研究就能解決的難題,這需要整個(gè)行業(yè)的共同努力。

ChatGPT 爆火后的這半年時(shí)間,AI 行業(yè)的局勢(shì)變化跟 AI 模型本身發(fā)展的速度一樣快——各家入局、模型混戰(zhàn)、達(dá)成共識(shí)、握手言和。

巨頭們之所以會(huì)選擇一起去解決 AI 風(fēng)險(xiǎn)問(wèn)題,是因?yàn)楸舜硕伎吹搅?AI 在應(yīng)用層面的無(wú)限潛力。

AI,大廠們篤信的未來(lái)

不管你對(duì) AI 持什么樣的態(tài)度,AI 都會(huì)成為下一代應(yīng)用的重要組成部分。

這不是我信口開(kāi)河,而是微軟、Google 等大廠們?cè)诮盏呢?cái)報(bào)電話會(huì)上共同提到的趨勢(shì)。

微軟最新的財(cái)報(bào)顯示,微軟在最近的一個(gè)財(cái)季收入為 562 億美元,同比增長(zhǎng) 8%,這主要來(lái)自智能云和生產(chǎn)力與業(yè)務(wù)流程的增長(zhǎng),而作為老本行的個(gè)人計(jì)算業(yè)務(wù)收入有所下降。

其中智能云營(yíng)業(yè)收入增長(zhǎng) 15%,Azure 與其他云服務(wù)收入增長(zhǎng) 26%,這與 AI 計(jì)算緊密相關(guān)。

微軟 CEO 納德拉在財(cái)報(bào)電話會(huì)提到,客戶最關(guān)心如何快速應(yīng)用新一代 AI,微軟將繼續(xù)專注于三大優(yōu)先事項(xiàng):幫助客戶從 Microsoft Cloud 中獲得最大價(jià)值、領(lǐng)導(dǎo)新 AI 平臺(tái)變革、提升運(yùn)營(yíng)杠桿。

AI,毫無(wú)疑問(wèn)是這場(chǎng)財(cái)報(bào)會(huì)議的關(guān)鍵詞。

納德拉表示 Microsoft 365 Copilot 作為未來(lái)工作的第三支柱吸引著客戶,將在下半財(cái)年開(kāi)始產(chǎn)生實(shí)際收入;Bing Chat 和必應(yīng)圖像創(chuàng)造者吸引用戶,而 Edge 瀏覽器份額也在持續(xù)提升。

微軟希望把 Windows 11 打造為這個(gè)新 AI 時(shí)代的強(qiáng)大畫(huà)布,賦予各種 Copilot 產(chǎn)品提升客戶的生產(chǎn)力,并大力投資云基礎(chǔ)設(shè)施來(lái)滿足 AI 需求。就連游戲業(yè)務(wù),也可以利用 AI 提供更好的內(nèi)容和服務(wù),提升業(yè)務(wù)收入。

可以說(shuō),微軟接下來(lái)的策略都是圍繞 AI 來(lái)展開(kāi)的。AI 為微軟提供了巨大的增長(zhǎng)機(jī)遇和新的收入來(lái)源,它將推動(dòng)微軟大部分業(yè)務(wù)的收入和用戶增長(zhǎng),并最終提升微軟整體收入增速。納德拉不想錯(cuò)過(guò)這個(gè)難得一遇的機(jī)遇。

同樣的,「AI 一哥」Google 也不想錯(cuò)過(guò)。

根據(jù) Google 母公司 Alphabet 第二季度 2023 年財(cái)報(bào)的數(shù)據(jù)顯示,Alphabet 收入總額為 746 億美元,同比增長(zhǎng) 7%,其中廣告收入增長(zhǎng) 5%,Google 服務(wù)收入增長(zhǎng) 5%,Google Cloud 收入增長(zhǎng) 28%。

其中與 AI 相關(guān)的業(yè)務(wù)表現(xiàn)都很亮眼。Alphabet 在電話會(huì)議中提到,Google 的搜索引擎生成式體驗(yàn)(SGR)使用了生成式 AI,使搜索變得更自然和直觀,用戶反饋非常正面;另一方面,聊天機(jī)器人 Bard 發(fā)布以來(lái)經(jīng)過(guò)不斷改進(jìn),功能豐富了許多。

Google Cloud 的 80 多個(gè) AI 模型吸引了大量客戶,從 4 月到 6 月客戶數(shù)量增長(zhǎng)超過(guò) 15 倍。

而在企業(yè)客戶服務(wù)和定制 AI 解決方案方面,Google 通過(guò) Workspace 和 Duet AI 將生成式 AI 帶給了 9000 多萬(wàn)付費(fèi)用戶。

總體而言,Alphabet 對(duì) AI 和 Google Cloud 的長(zhǎng)期增長(zhǎng)前景保持樂(lè)觀,接下來(lái)將繼續(xù)增加對(duì) AI 研發(fā)的投入,研發(fā)方向?qū)⒕劢乖诖笳Z(yǔ)言模型等核心技術(shù)上,以及構(gòu)建像多模態(tài) AI 系統(tǒng) Gemini 等新模型。

半年前,或許你會(huì)懷疑 AI 是不是像 Web3、區(qū)塊鏈這樣的投資圈熱詞,圈一波熱錢(qián)后就會(huì)被資本遺忘,但經(jīng)過(guò)半年后你會(huì)發(fā)現(xiàn),AI 的影響力和落地可能性都比之前的各種前沿詞匯要大得多,以至于引起了整個(gè)科技圈的重視。

從大廠的規(guī)劃來(lái)看,AI 會(huì)作為未來(lái)程序應(yīng)用的底層而普遍存在,為改善用戶體驗(yàn)服務(wù)。用戶們可能不會(huì)感受到 AI 的存在,但能直接享受到 AI 帶來(lái)的便利性,這便是大廠們篤信的未來(lái)。

這也可以說(shuō)明,為什么微軟和 Google 等 AI 巨頭們?cè)敢夥畔赂筛辏聛?lái)共同指定 AI 安全的標(biāo)準(zhǔn)。

現(xiàn)階段的 AI 就像是 19 世紀(jì)末汽車剛誕生的時(shí)代,產(chǎn)品已經(jīng)開(kāi)上了路上跑,卻沒(méi)有合適的柏油路供它奔馳,也沒(méi)有交通規(guī)則來(lái)規(guī)劃它的行動(dòng),跑得既慢又危險(xiǎn)。

比爾·蓋茨最近在個(gè)人博客發(fā)表了他對(duì) AI 的看法,他認(rèn)為我們現(xiàn)在正處于又一個(gè)巨大變革的最早階段,即 AI 的時(shí)代,AI 的變化如此之快,以至于我們無(wú)法清楚地預(yù)知接下來(lái)會(huì)發(fā)生什么。

但他對(duì)人工智能的發(fā)展持以積極的態(tài)度,因?yàn)槿祟愐呀?jīng)經(jīng)歷了汽車時(shí)代、核能時(shí)代,到了 AI 的時(shí)代我們還是能夠解決新技術(shù)帶來(lái)的挑戰(zhàn)。

所以請(qǐng)坐穩(wěn)了,我們將親眼見(jiàn)證一個(gè)新時(shí)代的誕生。

關(guān)鍵詞:

上一篇:134.9,卡九!M26日本第十六周官方數(shù)據(jù)統(tǒng)計(jì)!附臺(tái)灣、韓國(guó)、越南,以及下映的泰國(guó)數(shù)據(jù)

下一篇:最后一頁(yè)

責(zé)任編輯:

最近更新

點(diǎn)擊排行
推薦閱讀