在落后同行們近兩年后,蘋果終于在本周WWDC大會(huì)發(fā)布AI功能。
“不拼AI技術(shù),靠的是OpenAI大模型,AI功能沒(méi)有新意......”以“重新定義AI”開(kāi)啟新征程的蘋果似乎并沒(méi)讓大家滿意,本次大會(huì)蘋果也幾乎并沒(méi)有提“人工智能”,而稱之為“蘋果智能”(Apple Intelligence)。
然而,資本市場(chǎng)卻買單了,蘋果周三扭轉(zhuǎn)跌勢(shì),一夜暴漲7%,市值攀升2000億美元。
那么是什么讓市場(chǎng)扭轉(zhuǎn)態(tài)度?所謂“蘋果智能”到底意味著什么?蘋果AI戰(zhàn)略僅靠OpenAI?
貫穿蘋果生態(tài)場(chǎng)景的AI
與大模型公司蜂擁推出獨(dú)立的聊天機(jī)器人不同,蘋果做出的選擇是,將AI功能整合到用戶正在使用的APP和產(chǎn)品中,融入用戶日常使用場(chǎng)景中。
這樣一來(lái),蘋果AI的功能遠(yuǎn)比獨(dú)立聊天機(jī)器人能做的要多,可以智能照片編輯、生成筆記和短信摘要、自動(dòng)轉(zhuǎn)錄語(yǔ)音備忘錄等等。
蘋果利用自研內(nèi)部模型實(shí)現(xiàn)較為簡(jiǎn)單的AI功能,依靠更為強(qiáng)大的外部模型,如GPT來(lái)實(shí)現(xiàn)更高級(jí)、復(fù)雜的AI功能。以全新siri、寫作工具的演示為例:
全新Siri:蘋果公司展示了如何用Siri幫忙填寫PDF表格,Siri還能找到用戶駕照的照片,提取駕照上的號(hào)碼并輸入表格。在另一個(gè)演示中,Siri可以在短信和郵件中搜索朋友發(fā)送的食譜。
真正讓Siri功能得到提升的是ChatGPT。當(dāng)要求Siri做一些它不知道怎么做的事情時(shí),比如根據(jù)最近的購(gòu)物清單安排出一頓晚餐菜譜,Siri就會(huì)在征求用戶允許后,直接調(diào)用GPT接口,向ChatGPT征詢意見(jiàn)。用戶不必是ChatGPT Plus的用戶,就可以享受Siri這種功能。
寫作工具:蘋果將為備忘錄、郵件、Pages文稿等應(yīng)用添加總結(jié)、改寫和校對(duì)的AI功能,集成寫作工具還可以針對(duì)短信和電子郵件提出回復(fù)建議和不同語(yǔ)氣的回復(fù)。
但至于更有創(chuàng)意的功能,比如寫一首關(guān)于iPhone的詩(shī),將交給ChatGPT來(lái)完成。同樣的這個(gè)寫作工具會(huì)先征求用戶同意,然后才會(huì)去咨詢ChatGPT。
蘋果表示,Apple Intelligence、iOS 18、iPadOS 18和MacOS Sequoia將在秋季整合一系列AI功能,但一些更強(qiáng)大的AI功能可能要到2025年才會(huì)亮相。
場(chǎng)景背后的三層大模型架構(gòu)
支撐以上場(chǎng)景功能背后的內(nèi)部、外部模型,可以進(jìn)一步細(xì)分為端側(cè)小模型(Apple On-Device),自研云端模型(Apple Server),以及ChatGPT等外部大模型。
第一層架構(gòu)是蘋果端側(cè)小模型,其中一個(gè)參數(shù)量為3B,可以直接在手機(jī)等終端設(shè)備上運(yùn)行。
此前文章指出,這其實(shí)是綜合考慮了運(yùn)行速度、算力需求的結(jié)果,大部分蘋果端側(cè)模型根據(jù)用戶個(gè)人習(xí)慣和個(gè)人數(shù)據(jù),針對(duì)不同的任務(wù)預(yù)先進(jìn)行了訓(xùn)練,因此各種需求響應(yīng)速度也很快。
第二層是蘋果自研的更大語(yǔ)言模型,該模型通過(guò)私有云計(jì)算在蘋果芯片服務(wù)器上運(yùn)行。
性能方面,有分析指出該模型雖然沒(méi)有明確參數(shù)量,但其性能可以與GPT-4對(duì)標(biāo)。在真實(shí)世界提示評(píng)估中,大模型Apple Server性能強(qiáng)于GPT-3.5-Turbo,略遜于GPT-4-Turbo,該模型也針對(duì)蘋果用戶的日常行為進(jìn)行微調(diào)訓(xùn)練。
蘋果強(qiáng)調(diào)隱私是第一位,內(nèi)部模型運(yùn)行過(guò)程中這些數(shù)據(jù)不會(huì)被保存,不會(huì)被其他人獲取。
此前文章提到過(guò),這些服務(wù)器都內(nèi)置使用Swift語(yǔ)言編寫的安全工具,蘋果AI“只發(fā)送完成任務(wù)所需的相關(guān)數(shù)據(jù)”到這些服務(wù)器,不會(huì)給予對(duì)設(shè)備上下文信息的完全訪問(wèn)權(quán)限。
第三層架構(gòu)就是和OpenAI合作,接入GPT大模型。
根據(jù)蘋果演示,當(dāng)需要實(shí)現(xiàn)更復(fù)雜AI功能,且在獲得用戶同意后,可以調(diào)用GPT接口。
而且可以確定的是,OpenAI可能不會(huì)是蘋果唯一的外部合作伙伴。蘋果負(fù)責(zé)軟件工程的高級(jí)副總裁Craig Federighi表示:
蘋果計(jì)劃以后讓用戶選擇自己喜歡的大模型,其中包括谷歌的Gemini等。