91麻豆国产免费观看_国产成人精品一区二区免费_久久99免费视频_天天干天天操天天摸

首頁 > 知識技能 > 知識技能 > 高文院士談AI:規模即所需,三“大”缺一不可

高文院士談AI:規模即所需,三“大”缺一不可

發布時間:2024-05-28 16:37:56來源: 15210273549

規模是做好生成式人工智能的撒手锏,大數據、大模型和大算力對于生成式人工智能缺一不可。”在近日舉行的第七屆數字中國峰會之中國移動人工智能生態大會上,中國工程院院士、鵬城實驗室主任、北京大學博雅講習教授高文表示。高文院士回顧了人工智能發展的三次浪潮,并對影響當下生成式人工智能發展的關鍵因素進行了分析。

 

01

歷經三次浪潮

1956年夏天,美國達特茅斯學院舉行了一場研討會,在會上麥卡錫首提“人工智能”,標志著人工智能元年的到來。追憶歷史,高文表示,從1956年開始人工智能經歷了三次浪潮:以推理研究為主的第一次浪潮,持續20年左右時間;以專家系統為主的第二次浪潮,持續30年左右時間;以及從2006年開始的第三次浪潮。其中第三次浪潮又包括兩大技術進展:從2009年開始的判別式人工智能,從2018年開始的生成式人工智能。

2009年,華裔科學家李飛飛和李凱教授提出imageNet(圖像網絡),一石激起千層浪,業界八仙過海各顯神通,紛紛基于imageNet提出各自的判別式人工智能算法,直到2012年深度神經元網絡出現,以絕對優勢令其他算法黯然失色,將百花齊放的格局進行收斂。2015年微軟研究院何凱明、孫劍等聯合提出ResNet(殘差網絡),又將判別式人工智能帶到了新高度。此后,從深度神經網絡DNN到卷積神經網絡CNN再到循環神經網絡RNN,深度網絡快速迭代,不斷走向新的技術高度。

“判別式人工智能以模式識別見長,如圖像分類、人臉識別、智能監測等,如今廣泛應用的人臉識別正是判別式人工智能的應用。判別式人工智能與人的對象認知學習接近,可以根據學習速度、記憶規模、判別準確度判斷其結果好壞。”高文分析。


02

大語言模型破解

長語言序列難題

不過,判別式人工智能通過在神經網絡中輸入大量數據進行快速判別,擅長圖像和矩陣識別,對于長語言序列則力不從心。在這樣的形勢下,大語言模型應運而生,致力于解決長語言序列問題,而生成式人工智能則是大語言模型的最主要突破。

高文表示,自2018年開始生成式人工智能快速迭代,從大語言模型LLM到ChatGPT再到Sora多模態,萬變不離其宗的是底層關鍵技術GPT(生成式預訓練模型)。GPT引入注意力機制,使得一個長串中無論相隔多遠的兩個相關數據都能連接在一起,并訓練出關聯度。“GPT的核心算法是用大量序列做大模型預訓練,關鍵是注意力機制。由于GPT算法對業界并無差別,因此具體應用效果取決于學習速度、記憶規模、表達準確度等。”高文認為。

雖然如今ChatGPT如火如荼,但是GPT起初并沒有激起太多漣漪。這是因為GPT使用起來問題較多:給出的答案要么過于簡單,要么過于復雜,要么不合規,存在意識形態、文化習慣、行業差別等方面的問題。

ChatGPT的出現改變了這一現象,使得業界對于人工智能的印象和投入力度大為改觀。不過從底層技術看,從GPT到ChatGPT并沒有改變,其不同在于:一是ChatGPT增加了InstructionGPT指令,通過微調、對齊和抑制,使得回答更加“人模人樣”;二是引入基于人類反饋的增強學習RLHF,解決合規問題和垂應用適配等。


03

大數據、大模型和大算力

缺一不可

在中國移動人工智能生態大會上,中國移動發布了“萬千百”智能基座,其中,“萬”指“萬”卡互聯并行加速算力供給,中國移動年內將投產3個近兩萬卡超大規模單體智算中心和12個區域智算中心,廣泛升級1500個邊緣節點,為全社會提供澎湃算力。

中國移動在智算中心方面的規模投入并非個例,隨著生成式人工智能的發展,全國各地多個智算中心如雨后春筍不斷出現,而這背后的原因是人工智能的發展需要算力支撐。

“生成式人工智能做得好不好,規模是決性定因素。”高文一語道出其中關鍵。

高文表示,GPT和Sora等人工智能生成技術并沒有提出理論革新,與20年前的人工智能神經網絡理論本質上并無差異。生成式人工智能的突破得益于大數據、大模型和大算力,這三個“大”缺一不可。特別是算力,如今千卡是入門級規模,要想做大模型必須有萬卡級。

對于規模,OpenAI等公司也有深刻見解:如果能用規模解決問題,就無需動用新的算法。不僅如此,OpenAI還提出了“假設性三公理”,已被AI領域奉為圭臬。

第一條公理,苦澀的教訓。多年來人工智能的研究者們一直試著將人類已知的知識構建到他們的智能體中,但是屢戰屢敗。成功的極少數案例都是使用規模計算,通過搜索和機器學習完成的。大規模、大算力和大數據是通用人工智能的必要條件。

第二條公理,規模即所需。一旦選擇了良好且通用的數據標注、算法,就能夠找到一套通用的規律,數據越多,模型越大,效果就越好,而且這個規律在訓練之前就可以預知效果。大規模是通用人工智能AGI的充分條件,大就是好。

第三條公理,涌現需規模。隨著規模的擴大、數據的增加,大模型一定會涌現出前所未有的能力,這個能力可以被所有人看到。

最后,高文總結表示,判別式人工智能方興未艾,生成式人工智能如火如荼,關于下一波浪潮業界也有很多預測,如無人駕駛、具身智能、人形機器等,但總體而言仍不得而知。未來充滿想象,值得我們期待,也需要業界有所作為。高文特別提到,中國的人工智能需要自己的大模型底座,只有這樣才能實現以中文語料和中國歷史為基礎的文明傳承。

知識技能更多>>

寧德時代參投新公司,哪吒汽車轉經銷商,極氪007GT等新車型來襲 預計2026年發布 新款保時捷Cayenne Coupe諜照曝光 豐田皇冠威爾法墨金版上市,91.9萬起售,配置升級能否打動你? 2025款奧迪Q2L降價上市,配置微調,售價17.18-21萬元 智能網聯與快速充電技術齊亮相2025武漢新能源汽車技術及充電樁展會揭示新能源車新趨勢 領克900首發:SPA Evo架構旗艦SUV,能否撼動大型SUV市場? 法拉第未來FX首款原型車諜照曝光,網友:魏牌高山換了個模具? 搭載高通驍龍數字底盤 零跑B10或售13萬起 等等再出手 四款國產SUV來襲 比亞迪唐L、領克900領銜 推薦奢享版 2025款名爵MG7購車指南 大眾牽手小鵬,合力打造超20000個自營充電終端 嵐圖汽車首發LFC超級后驅技術,既防眩暈,又抗甩尾! 這三款車企車型為何遇冷? 增長29%!蘇州金龍2024年銷售額超百億 從燃油到新能源,這個品牌為何從沒有能力天花板? 2025誰是下一家盈利的新勢力汽車車企? 730馬力!Brabus爆改AMG CLC 63 SE 零百加速3.3秒 速騰換殼 捷達VA7量產下線 預售12萬元起 22.48萬起 北京BJ40魔核電驅版開啟預售 配增程系統/綜合續航1200km 彰顯中國品牌實力 比亞迪海豹拿下日本年度風云車大獎 降價6000美元 2025款美版豐田bZ4X上市 配置小幅升級 有望明年上半年上市 奧迪Q6L e-tron投產 A6 e-tron隨后跟進 2.9秒破百 BRABUS爆改AMG GT 63 Coupe 動力大幅升級 最高降價8.5萬元 Jeep牧馬人4xe價格調整 49.99萬元起 名爵MG ES5昆明亮相,首批車主交車,最低僅售9.99萬元起! 海馬汽車攜多項專利亮相2024海南國際知識產權交易大會 余承東攜手“四界”領導人亮相央視,揭秘鴻蒙智行背后的故事 當地售價916.9萬起!極石ROX 01正式亮相俄羅斯市場 Momenta獲德國TÜV萊茵ISO 26262 ASIL D功能安全產品認證 蓋世汽車榮獲“AUTOSAR中國中心年度特別貢獻獎”