什麽是百度文心壹言？妳對文心壹言有什麽期待？

百度文心壹言是壹首每日更新的古詩，旨在激發讀者思考，提升人文精神。我期待文心壹言帶給我更多美好的文學體驗，更深刻的文化意境，更有趣的歷史故事。3月中旬，全球科技巨頭再次競相亮相大語言模型賽道。

壹周之內，開發ChatGPT的美國初創公司OpenAI、斥巨資投資OpenAI的科技巨頭微軟以及國內領先的互聯網公司百度發布了LLM領域的最新進展。這再次引發了全球對該領域的關註。

當地時間3月14日，OpenAI發布了其大規模語言模型的最新版本——GPT-4，與GPT-3.5相比，問答的質量和技術有了顯著提升。

3月16日下午，百度啟動了新壹代大語言模型和生成式人工智能產品的文心壹言測試，從而成為第壹家加入該賽道競爭的中國企業。

發布會上，百度創始人、董事長兼CEO李彥宏通過問答環節，展示了文心壹言的文學創作、商業文案、數學計算、中文理解、多模態生成等五大使用場景。幾個小時後，微軟宣布將GPT-4連接到整個Office bucket，新名稱為“微軟365 copy”。

正如財經E法2月17日發表的文章(OpenAI獨家回應|為什麽|ChatGPT不向國內所有用戶開放註冊？)，中國中國大陸和中國香港的手機號碼無法使用ChatGPT帳戶註冊。另外，雖然OpenAI的應用編程接口(API)已經向161個國家和地區開放，但不包括中國中國大陸和中國香港。

壹方面，業界普遍關註，在鋪天蓋地的AIGC(生成式人工智能)浪潮中，誰將是下壹波技術浪潮？另壹方面，在中美技術競合的敏感時期，各方也在關註百度先行壹步引發的漣漪，以及中國企業該如何應對。

01“真的準備好了嗎？”3月16日，李彥宏穿著白襯衫和運動鞋發表演講。當初，我直面問題。“最近很多朋友問我，為什麽是今天？妳真的準備好了嗎？”？

李彥宏的回答是，雖然百度在AI研究上投入了十幾年的時間，為文心壹言的發布做了充分的準備，但還不能說完全準備好了，因為文心壹言對ChatGPT甚至GPT-4的基準測試門檻很高，存在“很多不完善的地方”。然而，他強調，“壹旦有了真正的人類反饋，文心壹言將會取得巨大的進步”。

李彥宏解釋說，之所以選擇當天發布，是因為市場有需求:客戶和合作夥伴希望更早地使用最新、最先進的大語言模型。

如何理解李彥宏所說的“GPT-4的基準測試門檻很高”？

當地時間3月14日，OpenAI發布了其大規模語言模型的最新版本——GPT-4。值得註意的是，GPT-4是壹個大規模的多模態模型，即它可以接受圖像和文本類型的輸入。GPT-3.5只能接受文本輸入。

在演示視頻中，OpenAI的總裁兼聯合創始人格雷格·布羅克曼(Greg Brockman)用筆和紙畫了壹張網站草圖，並將圖片輸入GPT-4。僅僅過了1到2秒，GPT 4號就生成了網頁代碼，做出了壹個與草圖高度相似的網站。根據OpenAI公布的實驗數據，GPT-4模型相比上壹代GPT-3.5有了很大的進步，在很多專業測試中已經超過了大多數人類的水平。

浙江大學國際聯合商學院數字經濟與金融創新研究中心聯席主任潘鶴林認為，文心壹言未來需要向用戶全面開放。無論是通過B端API，還是直接開放給C端用戶，用戶體驗口碑才是硬道理。目前ChatGPT在國內還沒有對用戶開放。在國內市場，百度將擁有第壹優勢。

對OpenAI和百度的產品都進行過評測的艾媒咨詢CEO兼首席分析師張毅表示，包括GPT-4和文心壹言在內的GPT系列模型本質上是同壹類產品，只是各自的數據覆蓋區域和數據模型積累長度不同。短期來看，OpenAI的產品準備時間相對更充足，智能暫時領先。但對文心壹言來說，在如此短的時間內培養出這樣壹個產品也是非同尋常的。

同時，張毅也對百度做出更好的產品更有信心。他的理由是，在人工智能、大數據、大模型的人才儲備方面，中國會更有優勢。

中央財經大學數字經濟融合、創新與發展研究中心主任陳端認為，與海外競爭對手相比，百度最大的優勢是在語言和文化上構建了理解的護城河。

作為中國公司開發的大型語言模型產品，文心壹言的中文理解能力備受關註。重要原因是很多評論者認為ChatGPT的中文問答能力不如英文。

李彥宏表示，作為植根於中國市場的大語言模型，文心壹言擁有中文領域最先進的自然語言處理能力。在現場展覽中，文心壹言正確解釋了成語“洛陽紙貴”的含義和相應的經濟理論，還用“洛陽紙貴”寫了壹首藏頭詩。

李彥宏表示，文心壹言的訓練數據包括:萬億級的網頁數據、數十億的搜索數據和圖片數據、數百億的日常語音通話數據、5500億的事實知識圖譜，這使得百度在中文語言處理方面獨樹壹幟。

受訪專家還指出，由於華人的特殊性，中企開發大規模機型的難度更大，但如果突破，在提供本地服務方面會有更大優勢。

法國裏昂商學院人工智能和商業分析教授丁日前對媒體指出，語言對話模型訓練需要讓機器理解單詞，英語比漢語略容易。丁解釋說，中國人工智能技術處理的中文大部分是象形文字，而英文是解釋性的，文字並不是特別豐富。

此外，上海交通大學約翰霍普克羅夫特計算機科學中心助理教授林認為，在未來，大語言模型將向多模態和交互方向發展，進壹步整合視覺、語音和強化學習領域的技術。李彥宏還說:“多式聯運是生成式人工智能的壹個明顯的發展趨勢。未來，隨著百度多模態統壹大模型的增強，文心壹言的多模態生成能力將不斷提升。”

在多模態生成中，李彥宏展示了文心壹言生成文本、圖片、音頻和視頻的能力。文心壹言在現場朗讀了壹段四川話，並根據這段文字制作了壹段視頻。但李彥宏透露，文心壹言的視頻生成成本較高，現階段並未對所有用戶開放，未來會逐步接入。

受訪專家還指出，由於華人的特殊性，中企開發大規模機型的難度更大，但如果突破，在提供本地服務方面會有更大優勢。

發布會前後，百度股價經歷起伏。3月16日，港股百度盤中股價壹度擴大逾10%至120.1港元。截至收盤，百度股價下跌6.36%，至125.1港元。但百度股價在美股市場勢頭強勁。當天，百度美股低開高走，振幅超過7%。收盤時報138.16美元，漲幅3.8%。3月17日，百度港股表現強勁，盤中漲幅超過15%。截至當日收盤，百度港股上漲13.67%，至142.2港元。

在文心壹言宣布開放邀請測試後的壹個小時內，就有超過3萬名企業用戶排隊申請文心壹言企業版的API調用服務測試，申請產品測試的網頁被擠了很多倍，官網、百度AI雲的流量暴漲百倍。

文心壹言的市場熱度持續飆升，資本市場也被重估。張毅認為，這也代表了大眾對大語文模型/生成式人工智能“期待、擔憂、再希望”的心情。

沒有人能錯過科技革命。事實上，“真的準備好了嗎？”不僅僅是針對百度，更是這壹輪“ChatGPT”熱潮以來的壹個普遍的公共問題。

李彥宏觀察到，從2021開始，人工智能技術開始從“判別”向“生成”轉變。

創新工場董事長兼CEO李開復在3月14日的壹場趨勢分享會上表示，AI 2.0時代第壹個現象級應用是以GPT-4為代表的AIGC，也被稱為AI(Generative AI。李開復表示，AI2.0是壹場不可錯過的革命。這將是壹個巨大的平臺機會，比移動互聯網大十倍。他還表示，AI 2.0也是中國在AI領域的第壹個平臺競爭機會。

受訪專家普遍認為，之前全世界的AI公司都遇到了壹個很大的問題:即使技術儲備非常豐富，AI應用並沒有給他們帶來豐厚的收益。之所以出現這個問題，是因為AI產品的應用主要集中在B端(企業用戶)和G端(政府用戶)。AI產品進入企業或機構，流程往往比較復雜，這在壹定程度上會限制AI產品在市場上的快速擴張。

因此，張毅認為，AIGC的產品應用方向更有可能在C端產生巨大的商機。他分析，在美國市場，C端市場被谷歌、亞馬遜、Meta等公司搶占之前，微軟壓力很大，需要壹款產品來扳回壹局。在中國市場，百度的優勢和谷歌壹樣，有強大的搜索引擎抓取數據的能力，以及存儲、整理、分析能力的基礎。中國本身就有十幾億人的巨大市場，百度可以做得很好。

“百度、微軟、谷歌本質上是兩個不同市場的競爭，所以我相信文心壹言及其系列產品壹定會出來。”張毅說。

李彥宏堅稱，文心壹言不是“中美科技對抗的工具”。但他也承認，ChatGPT的成功加速了百度推出該產品的進度。

百度CTO王海峰表示，人類進入AI時代，IT技術的技術棧可以分為四層:芯片層、框架層、模型層、應用層。百度是全球為數不多的在這四個層面全棧布局的人工智能公司，自研技術在各個層面都領先業界。比如高端芯片昆侖芯、飛槳深度學習框架、文心預訓大模型以及搜索、智能雲、自動駕駛、小度等應用。王海峰認為，百度全棧布局的優勢在於可以在technology stack的四層架構中實現端到端的優化，大幅提升效率。

像ChatGPT壹樣，文心壹言使用SFT(模型微調)、RLHF(從人類反饋中進行強化學習)和Prompt作為底層技術。此外，文心壹言還采用了知識增強、檢索增強和對話增強技術。王海峰表示，這三項是百度現有技術優勢的再創新。

陳端認為，在技術創新集成度越來越高的當下，單個全棧布局的公司在內部技術R&D統籌和後期商業化方面具有比較優勢。

自信很重要，但差距也不容忽視。

在本月初的兩會期間，中國科技部部長王誌剛在回應ChatGPT相關問題時，以足球為類比，指出中國還有很多工作要做。“踢足球是運球和射門，但要像梅西(足球巨星萊昂內爾·梅西)壹樣優秀，並不容易。”

王誌剛指出，中國在這方面也做了很多布局，這方面的研究也進行了很多年，也有壹些。

結果，“但要達到目前OpenAI那樣的效果，可能還有待觀察，”他補充道。

王誌剛說，ChatGPT出來後，引起了大家的關註。其實從技術本身的源頭來說，叫做NLP和NLU，意思是自然語言處理和自然語言理解。ChatGPT之所以引人關註，是因為它作為壹個大模型，有效地結合了大數據、大計算能力和強算法，計算方法有所改進。同樣的原理做的不壹樣。比如大家都會做發動機，但是質量不壹樣。

然而，無論是ChatGPT還是文心壹言，其背後的大語言模式是核心競爭力。北京大學王玄計算機研究所研究員趙東燕對《財經E法》表示，國內大模型和OpenAI在數據、訓練方式、成本投入等方面還有壹定差距。

壹位科技系統人士指出，客觀來說，中美在該領域的基礎研究成果存在較大差距。這些基礎研究成果包括自然語言處理(NLP)、數據庫和GPU產品。“如果美國切斷GPU芯片的供應，(中國的)計算能力就跟不上了”。

大規模計算能力的核心在於高性能GPU芯片。北京航空航天大學軟件學院助理教授周對《財經E法》表示，中國在GPU芯片等計算硬件方面與世界的差距在十年左右，硬件水平會嚴重制約大型語言模型和科學計算模型的發展。

周認為，中國的科技公司和OpenAI在技術和模式上沒有代差，差距只有5年以內，在壹些更小的技術領域差距只有2-3年。在數據收集方面，以GPT-3模型為例，漢語僅占訓練語料的5%。中國科技企業在中文語料庫積累上有壹定優勢，因此極有可能在中文領域實現突破。

巨人03的下壹步:構建生態。以ChatGPT為代表的大語言模型賽道如何盈利，是各方公認的問題。

開發ChatGPT的OpenAI還是壹家虧本的創業公司。5438年6月+2023年10月，投資銀行摩根士丹利的壹份分析報告稱，ChatGPT的響應成本約為Google搜索查詢平均成本的6 -28倍。

不過，騰訊研究院高級研究員和原經緯創投副總裁莊都認為，ChatGPT能帶來多少利潤並不是OpenAI關註的重點，而是基於它的模式能開發出什麽樣的服務和應用，從而構建壹個生態系統。“ChatGPT的發展需要壹個產業生態。例如，它與微軟相關應用程序的集成是壹個好主意。”曹建峰說。

當地時間3月15日，微軟副總裁兼首席消費者營銷官Yusef Medi發文稱，新版必應搜索引擎已經在GPT-4上運行。OpenAI表示，GPT-4在微軟Azure AI超級計算機上接受訓練，將基於Azure AI基礎設施為全球用戶提供GPT-4服務。

谷歌宣布開放其大語言模型PaLM的API接口，並推出面向開發者的工具MakerSuite。通過PaLM API接口，開發者可以使用PaLM進行各種應用的開發。MakerSuite允許開發人員快速原型化他們的想法，隨著時間的推移，該工具將具有快速工程、合成數據生成和自定義模型調整的功能。

微軟迅速跟進。當地時間3月16日，微軟宣布將GPT-4連接到Office family bucket。新功能名為“微軟365 Copilot”。

李彥宏在發布會上表示，文心壹言的定位是基於人工智能的賦能平臺，將助力金融、能源、媒體、政務等數千個行業的智能化轉型。

根據文心壹言的邀請測試方案，第壹批用戶可以從3月16日起通過邀請測試碼在文心壹言官網體驗產品，並將陸續向更多用戶開放。此外，百度AI Cloud即將向企業客戶開放文心壹言API接口調用服務。這項服務從3月16開始接受預約。

截至3月11日上午，排隊申請百度AI雲文心壹言企業版API調用服務器測試的企業用戶已增至9萬人，百度已收到6588條關於文心壹言合作的查詢。

陳端認為，這壹輪的競爭不僅是商業主體的競爭，更是下壹輪國家數字競爭力的競爭。所以，百度的當務之急並不完全是技術研發，還需要帶領更多的初創企業和生態夥伴加入生態陣營。

在陳端看來，中國在建立生態系統方面有優勢。陳端指出，中國移動互聯網經過多年發展，應用層生態的配套創新已經非常成熟。很多應用層的中小型創業團隊，過去在與移動互聯網生態的合作中，做了很多本地的、垂直的場景端創新，把這種模式和底層基礎設施從移動互聯網遷移到大模式領域，仍然適用。

中小企業還有機會嗎？面對大語言模式的浪潮，中國企業應該如何抓住機遇，規避風險？

在中國，部署ChatGPT的企業有兩類:第壹類是傳統的大互聯網公司，第二類是壹些初創企業。

陳端認為，市場上的初創公司已經錯過了建立大模型的初始階段。陳端分析說，

再造壹個生成式人工智能企業，與時機、底層生態支持、創始人自身的經歷、閱歷、眼光以及個人IP的天然動員能力息息相關。另外，前期大模型的投入，無論是計算能力還是其他成本，以及時間窗口都很重要。

陳端表示，目前百度有能力和文心壹言協調旗下其他產品，就像微軟用Office和GPT-4推出Copilot壹樣，但“如果沒有生態的支撐，創業者單純做大模型是很有問題的”。

張毅也認為，對於有資金和實力支持的企業，單獨打造大型號產品可能更受資本和創業者青睞。但對於中小企業來說，依托文心壹言的開放平臺嫁接自己在細分領域的應用也是壹個不錯的選擇。

因為做壹個大的語言模型需要很長的時間和巨大的投入。

OpenAI成功的背後是微軟多年來的巨額投入。美國時間2023年10月23日，65438，微軟宣布將向OpenAI投資數十億美元，為期數年。2019和2021，微軟兩次投資OpenAI。2019年的投資為654380億美元，而2021年的投資未披露。

AI公司蔡赟科技創始人袁興元在接受36Kr采訪時指出，要想壹次運行超過654.38+0000億個參數的模型，至少要達到“千卡/月”的水平，即使用654.38+0000個GPU卡，然後訓練壹個月。即使不使用最先進的NVIDIA A100，按照壹個GPU 5萬元的均價，1000個GPU意味著每個月5000萬元的計算成本，這還不算算法工程師的工資。

“無論哪個公司，都不可能突擊幾個月就做出這麽大的語言模型。”李彥宏在發布會上表示，深度學習和自然語言處理需要多年的堅持和積累，不能加速。大規模的模型訓練可以稱之為暴力美學，需要很大的計算能力，大數據，大模型，每個訓練任務成本都很高。

根據百度提供的數據，百度過去十年累計R&D投資超過6543.8+0000億元。2022年，百度核心研發支出為21.41.6億元，占百度核心收入的22.4%。不過，百度並未透露大模型研發在核心研發費用中的占比。

李彥宏在發布會上表示，百度對文心壹言的定位是壹個普適的賦能平臺，金融、能源、媒體、政務等成千上萬個行業都可以基於這個平臺實現智能化變革，提高效率，創造巨大的商業價值。李彥宏認為，大模型時代將出現三大產業機會，即新型雲計算公司、微調行業模型的公司和基於大模型庫開發應用的公司，即應用服務提供商。

李彥宏斷言，對於大多數創業者和企業來說，真正的機會不是從零開始做ChatGPT、文心壹言這樣的基礎大模型，這是不現實的，也是不經濟的。基於通用大語言模型首先開發重要的應用服務可能才是真正的機會。目前基於文字生成、圖像生成、音頻生成、視頻生成、數字人、3D等場景，湧現出了很多創業明星公司，這些公司可能是未來的新巨頭。

“大模型和生成式人工智能最終的產品形態還是未知數，所以這條路註定是壹場長跑，需要整個科技界在資本、R&D、模型創新上緊密而持續的跟隨。”張毅說。

李開復認為AI2.0首先會應用在容錯領域，毫無疑問現在最大的應用領域是內容創作。每個領域都可以把原來的App重寫壹次，創造出更賺錢的商業模式。最終AI2.0的生成能力將成本降低到幾乎為零。