24h購物| | PChome| 登入
2023-03-24 15:18:07| 人氣55| 回應0 | 上一篇 | 下一篇
推薦 0 收藏 0 轉貼0 訂閱站台

對話李彥宏:不要重複造輪子,AI的十倍機會在別處


回應關於文心一言的幾個質疑,李廠長還給AI創業者提了幾點小建議。

2023年,全世界的關注焦點,都在AI大模型的焦灼競賽。

中國參賽選手、百度「文心一言」在研發階段時,百度技術團隊曾與ChatGPT進行對比測試,李彥宏對36氪回憶,當時「差距是40分的水平,一個月能追得上。」

可過了一個月,技術團隊再次測試後,發現差距反而拉大了——AI大模型的發展速度不是線性的。

緊張追趕之後,到文心一言今年3月16日發布時,甚至「能達到它(ChatGPT)今年1月份的水平。」李彥宏對36氪說。要說文心一言和ChatGPT差距多大?「可能最多是兩個月。但這兩個月什麼時候能追上,才是更重要的問題。」

過去一周,AI領域處於更強烈的疾風驟雨之中。百度文心一言發布會前一天,OpenAI發布了新一代GPT-4大模型;後一天,又有微軟發布搭載最新GPT-4的AI助手Copilot——均是震撼業界的產品進展。

百度文心一言隨之成為激烈爭論的對象。帶着人們圍繞文心一言的諸多質疑,36氪獨家訪問了百度創始人兼CEO李彥宏,直接發問:為什麼發布會用了Demo而不是實時演示?為什麼產品在不甚完美時就發布?

這些質疑折射出國人的複雜情緒:人有我無的焦慮,民族情緒的高漲、期待與失望間的起伏……

在回應質疑之外,36氪在與李彥宏交談中,印象更加深刻的,是他給出了關於AI行業的許多直接論斷。

比如,被問到中國創業公司里會不會再出一個OpenAI?他直接回答「基本不會了」,「沒有必要再重新發明一遍輪子。」

比如,「在應用層,將會出現全新的、十倍於現在微信和抖音的創業機遇。」比如「AI將會顛覆雲計算市場」。

比如,AI雖然會取代人類工作,但有更多意想之外的機會。一個針對個人的提示是,不會面向AI寫提示詞(prompt,人與機器進行交互的指令語言)的人會被淘汰。

無論如何,我們正站在一個歷史性的時點:基於AI大模型技術,可能開啟一個新增長時代。就在兩天前,英偉達發布了專用於大模型計算的新GPU,能讓大模型處理成本下降一個數量級。「我們正處於AI的iPhone時刻。」英偉達創始人黃仁勛在會上三次激動地強調。

暫時忘卻歷史臧否,而是把百度視作一家在AI領域深耕十餘年、花費千億的公司,李彥宏的聲音此時格外有時代意義。

以下為對話全文,經36氪編輯整理:

01.回應文心一言發布會的所有質疑

36氪:3月16日文心一言發布會之後,網上有非常多的聲音,其中有祝福,也有質疑,今天我是代表質疑的聲音。首先問一個小問題,今天這樣一個突然的採訪,會不會讓你覺得有壓力?

李彥宏:不會。確實像你講的,3月16日之後,網上有各種各樣的聲音,我自己也確實有一些話想說。

36氪:有人說你在發布會現場比較緊張,是這樣嗎?

李彥宏:我真沒覺得自己緊張。因為這個東西(指文心一言)是我非常熟悉的,包括那5個演示場景,基本上都是我選的,或者至少是別人給我建議、我認真看過的。

後來我也回看了發布會實況,也沒覺得我在任何時候緊張。我猜測,是因為當時在台上,我看不到股價變化,所以沒有被它所影響。但是很多在台下的人,包括看直播的人,能夠看到一些資本市場的反應,又看不到我們真實產品是什麼樣子(因為當時還沒有發布出來),所以會有此猜測。

36氪:在發布會中,你提到產品還沒有準備好。為什麼要在還沒有完美的情況下發布?

李彥宏:最主要的原因,是因為有市場需求。我們有好多客戶都在問,這個東西什麼時候出來?我們什麼時候能夠用?你能不能保證我是第一批試用產品的人?不斷有人在問這方面的問題。

目前整個大環境,是ChatGPT非常火,甚至被神話了。大家一定是有焦慮感的,如果我們的客戶不能及早地用最先進的產品,他們也會有焦慮感。在這種情況下,我們確實希望儘早把它推出來。

從技術發展的規律來講,這一類型的產品,確實需要有人類反饋之後,它的演進與能力提升才會更快。我們也希望它更快提升,所以必須要及早推出來。

36氪:選擇在3月16日開發布會,這個日期是怎麼確定的?

李彥宏:一開始我們想的是3月底,其實哪一天我覺得都是可以的。

但我在很早的時候,答應了去參加今年的亞布力論壇,亞布力是3月17日,那時我會見到很多新老朋友,包括政府領導、媒體,大家一定會問(文心一言),那個時候我們還沒有發布的話,別人問起來,我真不知道該說什麼了——你說得少,大家會覺得你一點信息都不透露,你不拿我當朋友;說得多,我們是上市公司,等於選擇性地披露一些東西,也是不行的。

所以想來想去,決定稍微往前趕一點。為了適應3月17日亞布力論壇,就決定3月16日來開發布會。

36氪:所以碰上OpenAI發布新版本,這是偶然。

李彥宏:對,我們事先並不知道OpenAI會在那一天發GPT-4。對於我們來說實際上也沒有那麼重要。我們自己能看到的可提升的地方已經足夠多了,先把這些東西做好就夠了。

36氪:發布會現場為什麼會用先做好的Demo,而不是實時展示?

李彥宏:我是希望能現場演示的,因為人機對話產品具有極強交互屬性,但後來兩個因素讓我改變了主意。一是生成式AI每次給出的答案不一定一樣,會帶來不確定性。二是真正說服我的理由,是全球所有類似發布會,沒有一個是現場演示的,都是錄好的。如果大家都可以,那我們也OK。

36氪:文心一言發布的產品有五個場景,包括文學創作、商業文案創作、數理邏輯推算、中文理解、多模態生成,為什麼是這樣的五個場景?

李彥宏:這是很好的問題。我們選擇的邏輯是這樣:文心一言對標ChatGPT,所以大部分ChatGPT有的功能,我們也要有。

但同時,我們畢竟植根於中國,所以,我們的對話型產品,一定要體現我們對於中文、對中國文化更好的理解。我們確實有一些ChatGPT沒有的東西,希望在發布會展示給大家。

所以,前三個場景是對標ChatGPT已有的功能,我希望大家能夠感受到我們的東西不差。比如第一個例子是,三體的作者是哪裡人?我在ChatGPT裡面試過很多次,它答的都是錯的,每次生成的答案都不一樣,有時候說甘肅天水人,有時候說山西呂梁人,答案非常隨機。所以,我第一個例子用了那個例子,但是前三個例子的那些能力,大家已經看過了,在ChatGPT裡面那些能力都是有的。

到第四個例子,文心一言對於中文的理解,或者對於中國文化的理解,確實是更加到位一些。我們綜合了一些知識增強,檢索增強等能力,對「洛陽紙有多貴」「劉慈欣的籍貫」這類事實性問題,文心一言能夠理解,並且作出正確的回答,準確率更高一些。

第五個例子,是多模態能力的展示。有一個四川話,有一個文生圖,一個文生視頻,這代表了百度過去十幾年在AI上綜合能力的積累。

做這五個例子的時候,我給團隊提了個要求,我希望產品發出去之後,能讓大家玩起來。第一個就是剛才講的四川話,我們有語音合成的能力,也對中國情況更了解。所以,我希望當用戶提問的時候,不管是提什麼問題,我們都能夠用語音合成,並且能支持用各種各樣的方言說出來,不管是四川話還是廣東話。我希望大家覺得很有意思,喜歡去玩這些東西。

第二個要求,當用戶的問題本身存在事實性錯誤時,我們能夠辨別,比如「二戰期間蘇聯為什麼轟炸波蘭?」其實蘇聯沒有轟炸波蘭,是德國轟炸波蘭。我希望文心一言能夠辨別用戶問題當中是有錯誤的,並且告訴你說,你剛才說的不對,我告訴你正確答案是什麼。

所以當用戶有這樣的問題,或者故意進行錯誤引導的時候,如果產品能夠辨別,用戶會覺得你很聰明。

36氪:有人說這是為調皮的人類而準備的。

李彥宏:能夠給大家多帶來一些歡樂的話,何樂而不為?

36氪:提及ChatGPT,別人一定會把它跟文心一言對比,你覺得哪個更領先?假如ChatGPT更領先的話,你覺得它領先文心一言幾年?

李彥宏:這個問題應該這樣說,ChatGPT發布是去年11月30日,我們現在已經發布了,也就是說不可能被領先幾年。

但是科學地去評比,文心一言到底是處於去年ChatGPT 11月30日的水平,還是12月30日的水平?這個我們沒有特別嚴謹的方法評測,我們自己可以保留(產品狀態),但是ChatGPT當時的狀況我們已經保留不了了。

但是我可以給你講一個我們內部開發的過程。第一版產品出來的時候,我們和當時的ChatGPT做了一個對比,和它大概差40分。

36氪:這個對比怎麼做的?

李彥宏:我們的對話式人工智能大語言模型應該具備的各種各樣的能力,每一項能力去挑了提示詞(prompt)。

36氪:滿分是100分,差了40分?

李彥宏:對。當時我們能看到的提升空間遠不止40分,所以我們覺得說一個月之內肯定追上它。但是過了一個月,我們又做了一次評測,發現這個差距不僅沒有縮小,而且拉大了。

所以我們當時很緊張,說這個東西越做,跟人家差得越遠了,但後來發現,其實ChatGPT那種升級不是勻速的升級,雖然提升很快,但是它有自己的發展規律。

而百度這種一版一版的迭代方式,升級速度是非常非常快的。等到我們敢說3月16日開發布會的時候,我們覺得就是至少可以達到它去年11月30日的水平,甚至說按照理性判斷的話,應該達到了ChatGPT今年1月份的水平。所以,那個時候我們才敢出去發的。

尤其當你去測試ChatGPT比較擅長的能力(英文、編程等),會發現差距很大,那是因為ChatGPT也發生了很大的變化。我們發布會前一天,OpenAI上了GPT-4,和GPT-3.5也是不一樣的。

所以你要說我們和ChatGPT差距多大?我覺得可能最多是兩個月,但是這兩個月什麼時候能追上,才是更重要的問題。

36氪:可以說,文心一言在兩個月後能達到ChatGPT的水平嗎?

李彥宏:遠遠不夠,因為人家也在進步。百度進步的速度要比它快,有一天不僅要追上它,還要超過它。

剛才我們講的文生圖能力,百度的能力打磨比較久,大家玩起來挺嗨。GPT4本身沒有文生圖能力,站在另一個角度比較的話,ChatGPT落後百度,文心一言早就有這個能力了。

早在文心一言發布之前,大家用文心一格(指代百度基於文心大模型的文生圖系統)就能體驗這個能力,這是我們做得好的地方。ChatGPT發布的時候,大家都說它跨時代、震撼發布等,它發布的理解圖片能力,不是文生圖,只是輸入圖片告訴你這個圖片是什麼。

客觀比較下,我們有我們的長處,我們也很有信心在綜合能力上,能夠迅速追上甚至超過。

剛才我們講的文生圖的能力,百度的能力打磨比較久的時間,我們目前就是大家玩起來挺嗨,但是ChatGPT本身沒有文生圖的能力,站在另一個角度比較的話,ChatGPT落後百度,文心一言早就有這個能力了。

ChatGPT4發布的時候,大家都說它跨時代震撼發布之類的。其實它發布的所謂理解圖片的能力,不是文生圖,輸入圖片告訴你這個圖片是什麼。我們搜的只是官網上的能力,沒有人體驗過。

36氪:相比ChatGP的調用成本,百度的成本是更高還是更低?大概是多少?

李彥宏:成本比較類似。但是這個東西不重要,重要是我們可以通過端到端的優化,讓這個成本迅速下降。

36氪:比如使用的時候,價格會是ChatGPT的百分之多少?

李彥宏:會稍微便宜一點。

36氪:現在百度已經為文心一言投入了多少,還會繼續投入多少?

李彥宏:這很難劃分清楚。例如,我們對於大語言模型的投入算不算在內?可能有些投入是去做了辨別式的東西,比如去優化搜索等等,有些是生成式的。

如果單講生成式AI可能是十億、幾十億,未來投入會更大。如果是整個這四層(指應用層、模型層、框架層、芯片層),因為需要四層端到端的優化,大語言模型才能夠有競爭力,芯片、框架、等等這些都加起來的話,十年投了上千億元。

如果沒有那些投入,根本就不可能出現文心一言這個模型。

02.中國基本不會再出一個OpenAI

36氪:我看到你自己發的百家號視頻,說百度是在全球大廠中第一個發布類ChatGPT產品的,領先於微軟,因為微軟調用的是OpenAI的接口,Meta、Google沒有發布真正同類型的產品,為什麼這麼說?

李彥宏:人工智能如果按語言模型來分類,一種叫辨別式AI,典型應用是搜索。搜索就是根據你提的需求,看一個個網頁跟你的需求匹配不匹配,主要是在辨別;另一種是ChatGPT,也就是生成式AI產品,你提一個提示詞,它根據提示詞發揮,甚至發揮錯了都有可能,這個方向早期並不被大廠看好,積累也沒有特別深厚。

相比下來,百度在語言模型方面,積累還是不錯的,我們在AI上連續十幾年投入,第一版的語言模型,文心大模型2019年就發布了。過去一年半時間,我們一直很看好生成式AI,有不錯的投入。所以當發現這有大機會的時候,我們迅速增加資源,把它做出來。

在這過程中,其他大廠像Google、亞馬遜、Facebook,你說它們重視不重視?現在肯定很重視。想不想做出這麼一個東西來?肯定很想。聽到這就很容易理解,為什麼我會說百度是大廠當中第一個做出來的。

36氪:很多人都在準備做類似OpenAI的創業,比如李開復、王小川、王慧文,你對他們有什麼建議?

李彥宏:很多人也在問我,中國會不會再出一個OpenAI?基本不會了。OpenAI誕生是因為美國大廠都不看好這個方向,但現在中國的大廠都看好AI大模型,都在做這個方向。創業公司重新做一個ChatGPT其實沒有多大意義。

我覺得建議有兩點。第一,創業公司的特點是方向可以不停改變,船小好調頭,在市場狀況發生變化時迅速調整戰略,公司成立時想做的事和後來做的事可以不完全匹配。

第二,我覺得基於這種大語言模型開發應用機會很大,沒有必要再重新發明一遍輪子,有了輪子之後,做汽車、飛機,價值可能比輪子大多了。

36氪:現在大家都在擔心大模型的算力的問題,包括芯片,百度會怎麼解決算力問題?

李彥宏:其實算力是很籠統的說法,你的CPU怎麼樣、GPU怎麼樣,芯片跟框架匹配程度怎麼樣,框架跟模型的匹配程度,裡面可提升的空間都是很大的。

百度在四層架構都有領先的產品。芯片本身不管是摩爾定律,或者GPU的發展速度也非常快,框架也不能叫成熟,我們的工程師還在日以繼夜優化框架。

模型更新得就更快了,一天能夠上線三次升級,這種速度一定會使效率越來越高。將來制約整個大語言模型發展的很可能不是算力。今天我們看到算力很緊張,將來你可能發現算法突然變了,不是這個算法了,(制約發展的)可能就是另外一套東西。

36氪:在整個生態圈,芯片層、框架層、模型層、應用層,你覺得最大的創業機會在哪?

李彥宏:在應用層。回看移動互聯網時代,今天特別成功的微信、抖音、淘寶,都是應用。操作系統其實沒幾個,一個IOS,一個安卓,僅此而已。很難講安卓的價值比微信、抖音大。在應用這個層面,機會很多,能夠創造的價值也非常大。

36氪:因為在搜索上市占率較低,微軟可以熱衷於做這件事,但百度做生成式搜索引擎會顛覆自己的商業模式。你怎麼看待這個觀點?

李彥宏:我確實聽到了這種說法,但我覺得離我們真實的想法差得太遠了。

首先我覺得不會顛覆,你用的其實還是百度搜索。當這個能力(文心一言)被賦予到百度搜索上的時候,幾乎不會改變你的使用方法。你不需要重新再花很多精力去學百度搜索怎麼用,只是答案更精準了,過去篇幅比較小的答案,現在可以更加詳實、更加生動、更加活潑,它擴大了搜索的邊界。

我們並不是整個移動互聯網,只是整個移動互聯網的很小一部分。幹的事變多之後,會有越來越多的用戶從別的APP轉到百度。從這個角度來講,我無論如何都希望百度APP被文心一言所賦能,它能夠顛覆現在的百度搜索,我無比渴望發生這樣的事情。

但是,這只是整個故事的極小一部分,更大的故事其實是在雲計算。因為剛才也講到四層架構,就是芯片層發生了變化,從CPU到GPU,在框架層也發生變化。

框架層我多講兩句。百度在全球大廠當中最先做出來是有道理的,我們在芯片層、框架層、模型層、應用層都有自己的布局,全球大廠在這四層上都有領先產品的是沒有的。

看這四層架構的話,我們在每一層都可以說是提早了很多年來布局,當你這些能力都很完整的時候,未來人們再去開發應用,基於百度智能雲是最方便的。這個機會要遠遠大於一個百度搜索顛覆自己的機會,我真正興奮的、包括我3月16日發布會上主要講的都是這個機會。

36氪:可今天我去搜索百度的東西,當中有15個搜索結果,其中有兩三個是廣告,簡單說這是百度的商業模式。未來如果文心一言只給出一個答案,這怎麼商業化?

李彥宏:這個商業化的可能性有很多。今天如果看ChatGPT的話,它的做法實際是付費使用,買一個會員,一個月多少錢,它靠訂閱來養活自己,就不需要廣告。

我從來沒有覺得商業模式是一個問題。如果我們給大家(不管是個人還是企業)提供了價值,他們就會通過市場機制來回報我們。

36氪:你自己提到很多,在美國生態當中,大公司和大公司、大公司和創業公司之間似乎更緊密,在中國是不是不一樣?大公司不會用彼此的產品。

李彥宏:Google可以索引幾乎所有互聯網的內容,但是中國的話每一個APP都有自己的這種獨立的生態,也有一定的壁壘。所以用戶在獲得信息上確實沒有那麼方便,。

36氪:美國五大互聯網巨頭(FANNG),似乎是一個聯盟。中國好像不是這樣。

李彥宏:聯盟也說不上,我覺得美國人的這個思維方式也競爭,比如微軟和Google就是競爭。但是它的思維方式是說,如果你已經很領先了,我最好別做一個跟你一樣的東西,我如果通過創新做一個跟你不一樣的東西來競爭,那才是我的本事。

在中國,大家的思維方式更像是這條路你跑通了,我也跑同樣的路,咱看看誰跑的快。

36氪:文心一言會接入哪些產品,以及對百度的業務矩陣有哪些機會和變化?

李彥宏:這些天我們各個部門也都在開會討論,文心一言是一個通用能力,它跟各個產品的結合都是很自然的,跟搜索、貼吧、文庫、百度健康、小度等等。幾乎公司裡面每個產品拿出來,包括百度書法,都能自然地想到和它怎麼結合,讓產品變得用戶體驗更好,更加powerful。

36氪:百度會是自己的第一批用戶。

李彥宏:是的。

03.雲計算是Game Changer,應用層有十倍機會

36氪:你在財報會上提到,文心一言會是改變雲計算的Game Changer,為什麼?

李彥宏:過去,雲計算主要賣算力,算力就是你的計算速度有多快,存儲能力有多少。兩三年前人們的理解是,基於一個AI開發框架去開發應用就好了。

今天就會看到,我們完全沒有必要基於芯片層、框架層來開發應用——基於大模型就好了,又快,成本又低。

那麼以後當人們在購買雲計算服務的時候,他會看你的模型好不好,而不是你底層的算力怎麼樣,存儲怎麼樣,所以,AI大模型會顛覆整個雲計算市場。

我認為微軟其實也是這樣想的。大家都知道,ChatGPT和微軟的產品真正結合,是非常厲害的。這是很多雲廠商非常害怕的事情。

36氪:百度雲會不會因為文心一言的使用,會成為中國領先的雲供應商?

李彥宏:我對此充滿信心,一旦大家明白過來,你以後選擇雲服務的時候應該看什麼,或者其實也不需要它自己去琢磨。你有你的需求,你有你的客戶需要去維護,什麼樣的方式能夠讓你更好地維護你的客戶,收入更多,利潤率更高,那他一定會從這些角度推演到:用百度的智能雲是更好的選擇。

36氪:未來十年內,會不會出現誕生新的微信,新的抖音?

李彥宏:肯定的。不僅僅是誕生這些,我覺得誕生10倍於這些app價值的機會,完全是存在的。

36氪:今天無數人在提問:AI會不會讓打工人沒有工作?OpenAI的創始人Sam Altman說,大量的人一定會失業,所以OpenAI會按需收費,給沒有工作的人補貼。這其實是有點悲涼的,他自己說也有點可怕,你覺得這個事情會發生嗎?這個問題你怎麼看。

李彥宏:今天沒有馬車夫這樣的工作,因為出現了汽車。但是今天世界上存在的工作機會跟100年前相比,不僅是多了,而且多了很多倍。

我沒有那麼悲觀,我是樂觀的。不管有多少工作被替代,這只是整個圖景的一部分,另外一部分是,存在我們現在甚至無法想象的更多新機會。我做一個大膽預測,十年以後,全世界有50%工作會是提示詞工程(prompt engineering),不會寫提示詞(prompt)的人會被淘汰。

36氪:十年以後百度會變成什麼樣子?

李彥宏:我不想去預測那個時候百度收入是多少,員工數是多少,這些對我來說沒有那麼重要。

百度的使命就是用科技讓複雜的世界更簡單,這個事情現在成立,十年之後還會成立。

我希望十年之後回望今天,會發現每一個普通人的生活、整個社會會被百度改變。我們起了什么正面作用?我們有什麼東西沒有做到位?我們什麼東西可以做得更好?我更希望琢磨這樣的事情。

36氪:有個詞叫「智慧湧現」(Emergent Intelligence)。我個人持有這樣的觀點:人沒有什麼特殊的,不管是引以為傲的創意也好,感情也好,像一個個計算單元,計算單元多了,就會產生出情感、創意。你覺得會是這樣嗎?

李彥宏:我覺得不會是這樣,我恰恰覺得人是唯一。在如此浩瀚的宇宙,目前沒有任何跡象證明有外星人,足見在這個宇宙當中人有多麼的獨特。今天我們說想用機器替代人,想復刻一個人,我認為這是不現實的。

我覺得完全沒有必要復刻人,機器有很多事干的比人好太多了,沒必要去跟機器比。應該充分發揮它擅長的地方,我們甚至沒有必要讓它發展出來情感這類東西,即使發展出來了,可能也是另外一種東西,和我們(人類)的情感還是不一樣的。

36氪:十年後,AGI(通用人工智能)是不是已經實現了?

李彥宏:這是一個開放性的問題,我沒有答案。如果非要讓我去做一個二選一的話,我認為(十年後通用人工智能)沒有實現。

「強人工智能」(Artificial General Intelligence),意思是它和人的能力是一樣的。這個詞對應的是「弱人工智能」和「超人工智能」。這種劃分方法我不是很認可。

我認為機器比人強的地方有很多,比人弱的地方也有很多。我們完全沒有必要把自己框在「一定要讓機器和人一樣」裡面,我認為這個方向就是不對的。

智能湧現也好,機器越來越聰明也好,我都很看好,我唯一不覺得我們的努力方向是要把機器變成人,完全沒有必要。

36氪:對於未來十年,你覺得確定無疑的一個未來是什麼?

李彥宏:技術進步的速度越來越快,生產效率提升會越來越明顯,這是過去很多年的發展之中不斷證明的。如果過去大家可能一周工作5天,也許10年之後工作3天就足夠了。勞動生產率的提升會讓人們生活的幸福感更強。

我自己也因為這件事情很興奮,因為我能夠參與其中並且貢獻一些東西。

36氪:這是一個趨勢。如果作為結果,什麼樣的結果是確定無疑的?十年以後人類壓力更大還是更幸福?

李彥宏:一定更幸福。-[採訪:馮大剛*撰文:鄧詠儀*編緝:楊軒 蘇建勛/來源:36氪]

台長: 聖天使

TOP
詳全文