91麻豆国产免费观看_国产成人精品一区二区免费_久久99免费视频_天天干天天操天天摸

首頁 > 自媒體學習 > 自媒體學習 > 高文院士談AI:規模即所需,三“大”缺一不可

高文院士談AI:規模即所需,三“大”缺一不可

發布時間:2024-05-26 15:40:17來源: 15210273549

規模是做好生成式人工智能的撒手锏,大數據、大模型和大算力對于生成式人工智能缺一不可。”在近日舉行的第七屆數字中國峰會之中國移動人工智能生態大會上,中國工程院院士、鵬城實驗室主任、北京大學博雅講習教授高文表示。高文院士回顧了人工智能發展的三次浪潮,并對影響當下生成式人工智能發展的關鍵因素進行了分析。

歷經三次浪潮

1956年夏天,美國達特茅斯學院舉行了一場研討會,在會上麥卡錫首提“人工智能”,標志著人工智能元年的到來。追憶歷史,高文表示,從1956年開始人工智能經歷了三次浪潮:以推理研究為主的第一次浪潮,持續20年左右時間;以專家系統為主的第二次浪潮,持續30年左右時間;以及從2006年開始的第三次浪潮。其中第三次浪潮又包括兩大技術進展:從2009年開始的判別式人工智能,從2018年開始的生成式人工智能。

2009年,華裔科學家李飛飛和李凱教授提出imageNet(圖像網絡),一石激起千層浪,業界八仙過海各顯神通,紛紛基于imageNet提出各自的判別式人工智能算法,直到2012年深度神經元網絡出現,以絕對優勢令其他算法黯然失色,將百花齊放的格局進行收斂。2015年微軟研究院何凱明、孫劍等聯合提出ResNet(殘差網絡),又將判別式人工智能帶到了新高度。此后,從深度神經網絡DNN到卷積神經網絡CNN再到循環神經網絡RNN,深度網絡快速迭代,不斷走向新的技術高度。

“判別式人工智能以模式識別見長,如圖像分類、人臉識別、智能監測等,如今廣泛應用的人臉識別正是判別式人工智能的應用。判別式人工智能與人的對象認知學習接近,可以根據學習速度、記憶規模、判別準確度判斷其結果好壞。”高文分析。

大語言模型破解長語言序列難題

不過,判別式人工智能通過在神經網絡中輸入大量數據進行快速判別,擅長圖像和矩陣識別,對于長語言序列則力不從心。在這樣的形勢下,大語言模型應運而生,致力于解決長語言序列問題,而生成式人工智能則是大語言模型的最主要突破。

高文表示,自2018年開始生成式人工智能快速迭代,從大語言模型LLM到ChatGPT再到Sora多模態,萬變不離其宗的是底層關鍵技術GPT(生成式預訓練模型)。GPT引入注意力機制,使得一個長串中無論相隔多遠的兩個相關數據都能連接在一起,并訓練出關聯度。“GPT的核心算法是用大量序列做大模型預訓練,關鍵是注意力機制。由于GPT算法對業界并無差別,因此具體應用效果取決于學習速度、記憶規模、表達準確度等。”高文認為。

雖然如今ChatGPT如火如荼,但是GPT起初并沒有激起太多漣漪。這是因為GPT使用起來問題較多:給出的答案要么過于簡單,要么過于復雜,要么不合規,存在意識形態、文化習慣、行業差別等方面的問題。

ChatGPT的出現改變了這一現象,使得業界對于人工智能的印象和投入力度大為改觀。不過從底層技術看,從GPT到ChatGPT并沒有改變,其不同在于:一是ChatGPT增加了InstructionGPT指令,通過微調、對齊和抑制,使得回答更加“人模人樣”;二是引入基于人類反饋的增強學習RLHF,解決合規問題和垂應用適配等。

大數據、大模型和大算力缺一不可

在中國移動人工智能生態大會上,中國移動發布了“萬千百”智能基座,其中,“萬”指“萬”卡互聯并行加速算力供給,中國移動年內將投產3個近兩萬卡超大規模單體智算中心和12個區域智算中心,廣泛升級1500個邊緣節點,為全社會提供澎湃算力。

中國移動在智算中心方面的規模投入并非個例,隨著生成式人工智能的發展,全國各地多個智算中心如雨后春筍不斷出現,而這背后的原因是人工智能的發展需要算力支撐。

“生成式人工智能做得好不好,規模是決性定因素。”高文一語道出其中關鍵。

高文表示,GPT和Sora等人工智能生成技術并沒有提出理論革新,與20年前的人工智能神經網絡理論本質上并無差異。生成式人工智能的突破得益于大數據、大模型和大算力,這三個“大”缺一不可。特別是算力,如今千卡是入門級規模,要想做大模型必須有萬卡級。

對于規模,OpenAI等公司也有深刻見解:如果能用規模解決問題,就無需動用新的算法。不僅如此,OpenAI還提出了“假設性三公理”,已被AI領域奉為圭臬。

第一條公理,苦澀的教訓。多年來人工智能的研究者們一直試著將人類已知的知識構建到他們的智能體中,但是屢戰屢敗。成功的極少數案例都是使用規模計算,通過搜索和機器學習完成的。大規模、大算力和大數據是通用人工智能的必要條件。

第二條公理,規模即所需。一旦選擇了良好且通用的數據標注、算法,就能夠找到一套通用的規律,數據越多,模型越大,效果就越好,而且這個規律在訓練之前就可以預知效果。大規模是通用人工智能AGI的充分條件,大就是好。

第三條公理,涌現需規模。隨著規模的擴大、數據的增加,大模型一定會涌現出前所未有的能力,這個能力可以被所有人看到。

最后,高文總結表示,判別式人工智能方興未艾,生成式人工智能如火如荼,關于下一波浪潮業界也有很多預測,如無人駕駛、具身智能、人形機器等,但總體而言仍不得而知。未來充滿想象,值得我們期待,也需要業界有所作為。高文特別提到,中國的人工智能需要自己的大模型底座,只有這樣才能實現以中文語料和中國歷史為基礎的文明傳承。

自媒體學習更多>>

寶馬CES2025首發新智能座艙,人機交互體驗再升級! 國四車主換新車時代來臨,“以舊換新”新政能否再掀車市熱潮? 中國這五臺國產汽車,一旦上市,真沒合資車什么事了? 全新一代豐田榮放諜照曝光,延續家用定位,有消息稱取消燃油版 燃動冰雪,見證“相信”,紅旗智造中大型豪華純電SUV天工08正式上市 國外新車買家滿意度調查:純電車買家滿意度82%,燃油車滿意度75% 吉利2025年銷目標揭秘:銀河新車矩陣挑戰百萬,智能化布局全球加速 本田“0”系列兩款原型車首發亮相,量產版計劃2026年推出 \"2025年度智能座駕評選\"啟動,首次加入跨品牌城市NOA評測 跌到“白菜價”?這些合資B級車“殺瘋了”! 小鵬汽車:穿過暴風雨,繼續奔跑 中大型SUV汽車又來新選手,主打舒適和智能! 上汽大眾2024年銷售120萬輛 開啟合資2.0新時代 可醇可電可油!吉利今年內將推兩款全新“超醇電混”車型 廣汽本田2024年銷量:累計售47萬余臺,連續第四年下滑 小鵬試飛成功,卻依然“頭頂”一盆冷水 中國品牌首次!比亞迪海豹榮獲日本年度風云車“十大最佳車型”獎 60.98萬元起 2025款奧迪Q7上市 入門版配置大幅升級 歐萌達孿生兄弟?奇瑞瑞虎5x高能版12月23日上市 配1.5T動力 約合人民幣27萬元起 2025款奧迪Q2歐洲上市 三種配置可選 對標元PLUS 奔騰悅意03將于2025年3月上市 續航565km 盲訂價10萬元起 吉利雷達金剛將于12月23日上市 最高續航460km 純電續航115km 奔馳GLC插混典藏版上市 售價51.8萬元 24.98萬元起 智界R7增程版上市 純電續航251km 網傳極氪007獵裝版路試諜照曝光,車尾底部配備了空氣懸架氣罐 第26屆中國農洽會駐馬店開幕,18國企業攜“土特產”亮相展會 皇馬新春紫裝亮相,阿拉巴迪亞斯代言 億緯鋰能為小鵬P7+追加多條電芯產線,新車交付周期縮短至5-8周 助力汽車產業升級,強化中國本土化布局——Allegro攜汽車底盤系統解決方案亮相第四屆汽車智能底盤大會 亮道智能第二代Mini純固態激光雷達上市