国产白嫩护士被弄高潮,任你懆视频这精品2019

Datawhale干貨

【資料圖】

作者：平凡@知乎，諾桑比亞大學(xué)，在讀博士

今天晚上，花了一點(diǎn)兒時(shí)間看了兩篇文章：

《Emergent Abilities of Large Language Models》[1]

《PROGRESS MEASURES FOR GROKKING VIA MECHANISTIC INTERPRETABILITY》[2]

這兩篇講的都是emergent behavior，即涌現(xiàn)現(xiàn)象。

大規(guī)模神經(jīng)網(wǎng)絡(luò)下的涌現(xiàn)現(xiàn)象

在機(jī)器學(xué)習(xí)中使用大規(guī)模神經(jīng)網(wǎng)絡(luò)時(shí)，由于增加了參數(shù)數(shù)量、訓(xùn)練數(shù)據(jù)或訓(xùn)練步驟等因素，出現(xiàn)了定性上的新能力和性質(zhì)，這些能力和性質(zhì)在小規(guī)模神經(jīng)網(wǎng)絡(luò)中往往是不存在的。

第一篇文章舉了這個(gè)例子，每個(gè)圖都可以理解為一個(gè)任務(wù)，橫軸是神經(jīng)網(wǎng)絡(luò)的規(guī)模，而縱軸是準(zhǔn)確率，可以理解為模型的性能。

我們拿圖一來(lái)看，在10的22次方前，這些模型基本上的性能基本上都很穩(wěn)定在0附近，而在10的22以后，突然在10的24次方上獲得了很大的性能提升，在其他的幾個(gè)任務(wù)上都表現(xiàn)出類(lèi)似的特征。

意想不到的效果

第二篇文章更是有趣，我直接把推特一位博主的評(píng)論引用在這里：

作者發(fā)現(xiàn)，當(dāng)我們訓(xùn)練用網(wǎng)絡(luò)計(jì)算同余加法 a+b = ? (mod c) 時(shí)，網(wǎng)絡(luò)在某個(gè)時(shí)間突然獲得了 100% 準(zhǔn)確率。分析發(fā)現(xiàn)，神經(jīng)網(wǎng)絡(luò)實(shí)際上“頓悟”了使用傅立葉變換來(lái)計(jì)算同余加法！這個(gè)算法可以證明是正確的，反人類(lèi)直覺(jué)的。

從這倆例子里面我的感受是，只要數(shù)據(jù)量足夠且真實(shí)，且模型沒(méi)有硬錯(cuò)誤的前提下，不斷的訓(xùn)練說(shuō)不定真的能夠產(chǎn)生一些意想不到的效果。

還有就是我覺(jué)得人類(lèi)現(xiàn)在積累的知識(shí)并不少，但是系統(tǒng)的少，零星的多，如果類(lèi)似ChatGPT這樣的大模型可以拿所有的人類(lèi)已有知識(shí)進(jìn)行不斷學(xué)習(xí)的話(huà)，我覺(jué)得有很大概率會(huì)讓它涌現(xiàn)出意想不到的能力。

甚至可能把人類(lèi)的生產(chǎn)力解放提前很多。

參考

1.https://arxiv.org/pdf/2206.07682.pdf2.https://arxiv.org/pdf/2301.05217.pdf

關(guān)鍵詞：

上一篇：全球滾動(dòng):夸不完，根本夸不完！董宇輝又給西安寫(xiě)小作文了…

下一篇：全球速訊：《有利的詐欺》綠葉搶眼，尹博再次伙拍金東旭斗戲

責(zé)任編輯：

最近更新

數(shù)字拉薩成果發(fā)布，2023全球數(shù)字經(jīng)濟(jì)大會(huì)拉薩高峰論壇圓滿(mǎn)閉幕2023-07-07
2023全球數(shù)字經(jīng)濟(jì)大會(huì)閉幕發(fā)布百余項(xiàng)成果2023-07-07
藍(lán)皮書(shū)：北京數(shù)字經(jīng)濟(jì)標(biāo)桿城市發(fā)展水平處全球“第一梯隊(duì)”2023-07-07
西安咸陽(yáng)機(jī)場(chǎng)2023年累計(jì)旅客吞吐量突破2000萬(wàn)人次2023-07-07
你最想對(duì)老師說(shuō)的話(huà)（我想對(duì)老師說(shuō)400字）2023-07-07
佐力藥業(yè)今日大宗交易折價(jià)成交800萬(wàn)股成交額9600萬(wàn)元2023-07-07
北向資金全天單邊凈買(mǎi)入92.01億元2023-07-07
華為云發(fā)布盤(pán)古大模型3.02023-07-07
報(bào)喜鳥(niǎo)：7月5日接受機(jī)構(gòu)調(diào)研，廣發(fā)證券、天弘基金等多家機(jī)構(gòu)參與2023-07-07
去年江西制造業(yè)高耗能行業(yè)用能占比49.63% 為近年來(lái)歷史最低2023-07-07
海內(nèi)外專(zhuān)家共同探討科技引領(lǐng)綠色發(fā)展創(chuàng)新路徑2023-07-07
六盤(pán)山下蔬菜“熱” 全國(guó)知名蔬菜銷(xiāo)售商齊聚固原尋商機(jī)2023-07-07
粵港澳大灣區(qū)科研科創(chuàng)數(shù)算協(xié)同創(chuàng)新平臺(tái)在穗啟動(dòng)2023-07-07
夏日風(fēng)景獨(dú)特新疆旅游業(yè)復(fù)蘇強(qiáng)勁2023-07-07
《天津市鼓勵(lì)發(fā)展郵輪旅游的實(shí)施細(xì)則》制定出臺(tái)2023-07-07
《2023年中國(guó)奧特萊斯行業(yè)白皮書(shū)》：奧萊業(yè)態(tài)逆市增長(zhǎng)12%2023-07-07
《研發(fā)費(fèi)用加計(jì)扣除政策執(zhí)行指引（2.0版）》發(fā)布2023-07-07
智能機(jī)械化技術(shù)助力廣西提高葡萄種植經(jīng)濟(jì)效益2023-07-07
平安銀行等三家金融機(jī)構(gòu)收央行罰單，合計(jì)被罰沒(méi)超7000萬(wàn)2023-07-07
杭州亞運(yùn)會(huì)特許商品“薪火火炬尊”在良渚古城遺址公園首發(fā)2023-07-07
恒帥股份獲2家機(jī)構(gòu)調(diào)研：公司已向部分客戶(hù)小批量交樣并進(jìn)行路試，預(yù)計(jì)部分項(xiàng)目會(huì)于今年陸續(xù)結(jié)束路試進(jìn)入定點(diǎn)環(huán)節(jié)（附調(diào)研問(wèn)答）2023-07-07
復(fù)旦大學(xué)MOSS系統(tǒng)負(fù)責(zé)人邱錫鵬：MOSS系統(tǒng)正在日夜迭代優(yōu)化2023-07-07
中國(guó)石油北京項(xiàng)目管理公司通報(bào)胡繼勇處理結(jié)果：雙開(kāi)2023-07-07
深圳市光明區(qū)陸增日雜店銷(xiāo)售過(guò)期食品案2023-07-07
金融管理部門(mén)善始善終推進(jìn)平臺(tái)企業(yè)金融業(yè)務(wù)整改著力提升平臺(tái)企業(yè)常態(tài)化金融監(jiān)管水平2023-07-07

大語(yǔ)言模型中的涌現(xiàn)現(xiàn)象是不是偽科學(xué)？-全球熱點(diǎn)評(píng)

最近更新