圖片來源@視覺中國
(相關(guān)資料圖)
文|價(jià)值星球Planet,作者 | 沙拉醬,編輯 | 麻吉
大模型越來越火,搶人大戰(zhàn)愈演愈烈。
在AIGC、ChatGPT的帶動(dòng)下,大模型概念開始被廣泛討論。2023年還未過半,就已經(jīng)有包括百度、阿里、騰訊、商湯、京東、科大訊飛等多家互聯(lián)網(wǎng)、AI公司陸續(xù)宣布對大模型展開探索。
誠然,在大模型的技術(shù)和商業(yè)化進(jìn)程上,國內(nèi)相較于國外仍有一定差距。因此,大廠們毫不吝嗇地開出百萬年薪來爭奪算法、深度學(xué)習(xí)等高級技術(shù)人才。
除此之外,大模型在中國這片土壤上要如何生長,其商業(yè)化進(jìn)程又需要突破哪些瓶頸呢?
越來越“大”的大模型
AIGC和ChatGPT等熱詞帶動(dòng)下,大模型概念逐漸被關(guān)注。不過,大模型到底是什么,又能做什么,對很多人來說,這個(gè)問題的答案似乎很模糊。
一位中國傳媒大學(xué)計(jì)算機(jī)技術(shù)碩士,在知乎上這樣描述了大模型:如果說模型是一個(gè)盒子,那么普通模型就是一個(gè)小盒子,因?yàn)槿萘坑邢?,所以其處理和存儲的?shù)據(jù)、信息也有限。因此,普通模型可以完成分類、預(yù)測、生成等簡單任務(wù);相較之下,大模型就是一個(gè)超級大倉庫,往往需要數(shù)十億,甚至上百億個(gè)參數(shù)組成,可以完成更高級的思考和決策。比如,自然語言理解、語音識別、圖像識別等。
而這個(gè)大模型,到底有多“大”?舉例來說,GPT-4使用了1750億規(guī)模的參數(shù),微軟推出的Turing-NLG有1000億參數(shù),谷歌則推出號稱有1.6萬億模型參數(shù)的switch transformer。作為對照,我們?nèi)粘J褂玫闹悄苷Z音通常只有幾個(gè)億的參數(shù)。
雖然,在模型參數(shù)的規(guī)模上,國內(nèi)產(chǎn)品似乎仍落后一步——例如,率先推出文心一言的百度有100億參數(shù)、華為盤古大模型使用1000億參數(shù)。不過,過去的幾個(gè)月,陸續(xù)加速布局大模型的國內(nèi)公司卻如雨后春筍,其中包括阿里的通義大模型、騰訊的混元大模型、科大訊飛的訊飛星火、京東的ChatJD等等。
從目前國內(nèi)推出的幾款大模型產(chǎn)品來看,我們似乎仍在等待和尋找自己的“iPhone時(shí)刻”。無論是百度的文心一言、華為的盤古大模型,還是科大訊飛的訊飛星火,似乎仍停留在從自己原本的優(yōu)勢入手的“集大成者”,相對缺少更多的創(chuàng)新。
像是以搜索引擎為所長的百度,推出了類似GPT-3這樣具備搜索屬性的文心一言。
華為的盤古大模型則更加專注于自己比較有優(yōu)勢的TO B業(yè)務(wù)。在發(fā)布會(huì)上,華為也表示,在過去的2022年,華為盤古大模型主要是AI for Industry(AI賦能產(chǎn)業(yè)),為煤礦、水泥、電力、金融、農(nóng)業(yè)等行業(yè)創(chuàng)造了更多產(chǎn)業(yè)價(jià)值,其中CV大模型早就有了許多用武之地。
比如在與能源公司合作的盤古礦山大模型案例中,礦井現(xiàn)場是一個(gè)40米長的采掘機(jī),寬度僅2米左右,傳統(tǒng)相機(jī)很難一下子捕捉到全部畫面,只能用圖中的九宮格視頻畫面。而通過5G+AI全景視頻拼接綜采畫面卷,傳輸?shù)降孛妫孛婀ぷ魅藛T將來可以實(shí)現(xiàn)地面控制機(jī)器進(jìn)行采礦,實(shí)現(xiàn)礦下無人、少人安全作業(yè)。
科大訊飛則是在深度神經(jīng)網(wǎng)絡(luò)算法方面擁有豐富經(jīng)驗(yàn),尤其在語音識別和圖文識別方面水平過硬,其訊飛火星的體驗(yàn)頁面,就包含語音合成、聽寫、翻譯、文字識別等功能。
人才之爭
艾瑞咨詢曾在報(bào)告《ChatGPT浪潮下,看中國大語言模型產(chǎn)業(yè)發(fā)展》中討論過中外大模型研發(fā)的差距,其中表示,“對百度等國內(nèi)大廠而言,則在數(shù)據(jù)、算力、工程化能力等關(guān)鍵要素上存在短板,短期內(nèi)難以對國外領(lǐng)先大模型實(shí)現(xiàn)趕超,為跟隨者角色,長期更需要國內(nèi)AI全產(chǎn)業(yè)鏈整體進(jìn)化?!?/p>
要補(bǔ)充短板,一個(gè)重要的因素,就是人才。因此,大廠也都紛紛行動(dòng)起來。
BOSS直聘上,百度、騰訊、阿里、螞蟻集團(tuán)等紛紛發(fā)布了相關(guān)崗位的招聘信息。其中,百度以25-40k/月招聘AI大模型算法工程師、20-40k/月招聘模型構(gòu)架工程師;螞蟻集團(tuán)以45-75k/月招聘深度學(xué)習(xí)大模型GPT工程師;阿里以40-70k/月招聘大模型訓(xùn)練及算法工程師;騰訊則以30-60k/月招聘大模型預(yù)訓(xùn)練方向的工程師... ...
部分大模型招聘信息。圖源:BOSS直聘
值得注意的是,這些崗位幾乎都在一日內(nèi)被回復(fù)了超過10次,負(fù)責(zé)招聘的聯(lián)絡(luò)人也幾乎都是“正在活躍”的狀態(tài)。由此可見,求職者對于大模型相關(guān)崗位充滿信心,且招聘者也正在如火如荼地爭奪人才。
而從脈脈發(fā)布的《AIGC?才趨勢報(bào)告》中可以看出,自O(shè)pen AI推出的2021年以來,對于AIGC相關(guān)的人才爭奪就已經(jīng)開始了。2021年1-2月,AIGC相關(guān)崗位招聘同比上升281.88%,而后的2022年和今年的1-2月,招聘數(shù)量分別保持了76.74%和31.3%的同比增幅。
圖源:脈脈《AIGC?才趨勢報(bào)告》
這些招聘中,純互聯(lián)網(wǎng)大廠占比超過33%,處于人才爭奪的主導(dǎo)位置。而且,大廠并不吝嗇給錢,圖像識別、深度學(xué)習(xí)、算法研究工程師的平均年薪超過了100萬元人民幣。
不過,在具體的崗位需求上,目前國內(nèi)大模型相關(guān)人才的供需出現(xiàn)了部分偏差。從招聘者的角度而言,大廠們最緊缺的是算法工程師、自然語言處理、算法研究員等技術(shù)人員;而從求職者角度而言,大家投遞最多的簡歷傾向于產(chǎn)品經(jīng)理、用戶運(yùn)營等后端崗位。這能從側(cè)面反應(yīng)兩個(gè)問題:其一,目前大模型技術(shù)相關(guān)人員仍是供不應(yīng)求;其二,目前大廠們對大模型的布局仍側(cè)重于技術(shù)研發(fā),而非市場推廣。
圖源:脈脈《AIGC?才趨勢報(bào)告》
此外,相較國外,目前國內(nèi)大模型人才的學(xué)術(shù)背景似乎也略遜一籌。比如,在AIGC相關(guān)人才的學(xué)歷背景中,本科和碩士占據(jù)了幾乎90%,博士生占比僅4%。相比之下,由科技情報(bào)分析機(jī)構(gòu)AMiner和智譜研究發(fā)布的《ChatGPT團(tuán)隊(duì)背景研究報(bào)告》顯示,ChatGPT研發(fā)團(tuán)隊(duì)中,本科、碩士和博士的占比分別為33%、30%、37%。
圖源:脈脈《AIGC?才趨勢報(bào)告》
前路很長
誠然,人才的爭奪只是第一步,對不少大廠來說,積極投入研發(fā)的最終意義是賺錢。而大模型目前的商業(yè)化分成了C端與B端兩個(gè)路徑方向——對于C端來說,以GPT為例,通過開源方式將用戶和數(shù)據(jù)引進(jìn)來,再逐漸轉(zhuǎn)化成訂閱制;而就B端而言,比如Open AI與微軟Azure的合作,間接實(shí)現(xiàn)“模型即服務(wù)”,小B開發(fā)者可以調(diào)用其大模型API。
商業(yè)模式上,ChatGPT已經(jīng)明確指向API、訂閱制和戰(zhàn)略合作(嵌入微軟Bing、Office等軟件)三種營收方式,且已在用戶數(shù)據(jù)積累、產(chǎn)品布局和生態(tài)建設(shè)層面充分領(lǐng)先;Google雖有意追趕,但由于聊天機(jī)器人這樣的產(chǎn)品形態(tài)對于其主營的搜索引擎業(yè)務(wù)的助益有限,因此在與搜索引擎結(jié)合方面較為審慎,更希望借助大模型能力開展“模型即服務(wù)”范式,開拓其當(dāng)前市占率較低的云服務(wù)業(yè)務(wù)的市場空間。
國內(nèi)大廠也幾乎是在這兩條路上摸索。比如百度的文心一言更傾向于C端市場的探索,而“文心千帆”產(chǎn)品則劍指B端市場,意圖進(jìn)一步帶動(dòng)云服務(wù)營收。
不過無論是靠哪一條“腿”走路,想要實(shí)現(xiàn)商業(yè)化,大模型產(chǎn)品仍需要解決幾個(gè)緊迫的問題。
比如,信息準(zhǔn)確性??萍夹袠I(yè)投資觀察員林允告訴價(jià)值星球:“大模型所輸出的內(nèi)容準(zhǔn)確性其實(shí)絕大部分取決于其底層數(shù)據(jù)的質(zhì)量。我自己在測試了國內(nèi)某廠推出的類GPT產(chǎn)品后,最大的感觸是,底層數(shù)據(jù)質(zhì)量還是有一定差距?!绷衷蔬€補(bǔ)充道,用中文訓(xùn)練模型相較于英文也是沒有語言優(yōu)勢的。
但是,消費(fèi)者不會(huì)體會(huì)研發(fā)者的難處,一旦產(chǎn)品開啟訂閱制,用戶就會(huì)對產(chǎn)品輸出的內(nèi)容要求極其嚴(yán)苛。免費(fèi)使用的時(shí)候,用戶還能將錯(cuò)誤反饋當(dāng)成吐槽的笑話,但收費(fèi)之后,這些錯(cuò)誤可能就成了投訴的理由。
除此之外,在目前大模型較多應(yīng)用的文字和圖形創(chuàng)作上,如何保證原創(chuàng)性也成了一個(gè)關(guān)鍵問題。一位AI從業(yè)者就表示,以AIGC為例,目前很多AIGC系統(tǒng)仍缺乏創(chuàng)造力,甚至不能獨(dú)立生成原創(chuàng)內(nèi)容,只能根據(jù)給定的模板或者指導(dǎo)生成相關(guān)內(nèi)容。而這可能會(huì)牽扯原創(chuàng)的道德問題,以及更實(shí)際的,涉及版權(quán)資金的問題。
最重要的是,大模型由于所需要的數(shù)據(jù)規(guī)模巨大,因此對算法、算力、數(shù)據(jù)存儲空間都有極大的要求,而這些不止是人才可以彌補(bǔ)的,還需要大量的資金。要知道,Open AI的成功也是微軟當(dāng)初用數(shù)十億美金堆出來的。巨大的資金需求,對大廠的研發(fā)決心也是一種考驗(yàn)。
但毋庸置疑的是,大模型已經(jīng)開始改造很多應(yīng)用場景。林允就表示,“以ChatGPT為例,它將會(huì)徹底改變?nèi)藗児ぷ鞯姆绞?,所以不論是搜索引擎為主的百度,還是發(fā)展云業(yè)務(wù)的阿里、騰訊、華為,大廠們對大模型的探索是無法阻擋的大勢所趨。只是進(jìn)展和成效如何,要邊走邊看?!?/p>
*文中林允為化名
責(zé)任編輯:
相關(guān)推薦
- (2023-05-15)大模型,開始“搶人”|世界即時(shí)看
- (2023-05-15)“穩(wěn)增長”主線下 如何鎖定基建板塊的投資機(jī)會(huì)?
- (2023-05-15)每日熱聞!易實(shí)精密:股東原配偶的任職信披存疑 募投項(xiàng)目施工單位信用評分墊底
- (2023-05-15)胡錫進(jìn):辦成了這件事讓中國獨(dú)秀于世界 沒有之一
- (2023-05-15)曼卡龍借國際化“貼金”收入九成來自浙江 毛利率畸高異于同行
- (2023-05-15)世界快看:咬唇妝怎么畫視頻教程_咬唇妝怎么畫
- (2023-05-15)每日速遞:廈門土壤和地下水環(huán)境迎來“全面體檢”
- (2023-05-15)2022年中國汽車制造業(yè)上市公司凈利潤排行榜TOP100
- (2023-05-15)1.4萬兵力參演!北約在愛沙尼亞舉行大規(guī)模軍演
- (2023-05-15)年度最吸金本科專業(yè)出爐,信息技術(shù)類包攬本科高薪專業(yè)前十
- (2023-05-15)鐘南山稱全國約有80%以上人群感染過新冠 感染后要及時(shí)用藥-天天快報(bào)
- (2023-05-15)環(huán)球即時(shí)看!主力復(fù)盤:27億搶籌能源金屬 14億封板天齊鋰業(yè)
- (2023-05-15)5月15日漲停復(fù)盤:學(xué)大教育9天5板 中礦資源漲停
- (2023-05-15)抄底!A股新一輪行情起點(diǎn)出現(xiàn)? 世界今日訊
- (2023-05-15)隨著農(nóng)產(chǎn)品價(jià)格上漲 種植意愿回升帶動(dòng)種業(yè)景氣抬升_天天播報(bào)
- (2023-05-15)顧客買肉餅咬下去發(fā)現(xiàn)全是活蛆,商家:賠償10元,網(wǎng)友怒了
- (2023-05-15)環(huán)球熱消息:2637萬!大連今年第2注大樂透一等獎(jiǎng)花落高新區(qū)
- (2023-05-15)任澤平建議推出五年內(nèi)燃油車禁售時(shí)間表 你怎么看?
- (2023-05-15)視點(diǎn)!766億資金爭奪20股:主力資金重點(diǎn)出擊7股
- (2023-05-15)天天速遞!A股三大指數(shù)集體走強(qiáng):創(chuàng)業(yè)板指漲逾2% 新能源與保險(xiǎn)股大漲
- (2023-05-15)冠石科技獨(dú)董任職信披半面妝 千萬元轉(zhuǎn)貸真實(shí)交易背景或成“空談”_新消息
- (2023-05-15)你一定要站在自己的世界里閃閃發(fā)光英文_環(huán)球新動(dòng)態(tài)
- (2023-05-15)環(huán)球最資訊丨全面注冊制投教問答 第6.1.27節(jié)
- (2023-05-15)當(dāng)前速訊:全面注冊制投教問答 第6.1.28節(jié)
- (2023-05-15)環(huán)球快看:全面注冊制投教問答 第6.1.29節(jié)
- (2023-05-15)天天快看點(diǎn)丨美疾控中心最新統(tǒng)計(jì):新冠疫情致全美近113萬人死亡
- (2023-05-15)郝劭文今日舉行婚禮曬現(xiàn)場照 釋小龍作為伴郎驚喜現(xiàn)身
- (2023-05-15)全球熱文:陳妍希曬與楊丞琳合照 稱對方是自己最溫暖最甜蜜的依靠
- (2023-05-15)14:53 滬深兩市成交額突破9000億元 當(dāng)前報(bào)道
- (2023-05-15)世界新資訊:15:01 國內(nèi)商品期貨多數(shù)收漲,鐵礦石漲逾4%
每日推薦
- ETF聯(lián)接基金是什么意思?ETF基金和ETF聯(lián)
- 貨幣基金的收益高嗎?貨幣基金一般年收益
- 基金賣出了怎么還有收益顯示?基金已經(jīng)贖
- 投資的基金買了幾天可以賣掉?基金入手多
- 基金終于回本了該不該贖回?基金終于回本
- 二月出境復(fù)飛航線超40條 節(jié)后部分機(jī)票價(jià)
- 重大事項(xiàng)變更!網(wǎng)易寶獲批增加注冊資本至
- 信達(dá)證券上市首日漲幅44%
- 總投資約486億元 北京今年首批50個(gè)重大
- 新年北京首月二手住宅網(wǎng)簽量再探底 價(jià)格
- 股價(jià)大漲 博云新材股東高創(chuàng)投擬趁機(jī)減持
- 2019華人歌曲音樂盛典在澳門舉行
- 喜迎十九大?歡度中秋節(jié)—傳統(tǒng)文化進(jìn)社區(qū)
- 突發(fā)!吳敏霞夫婦挑婚戒被曝光!兩百萬鉆
- 《鐘山說事》 熱點(diǎn)聚焦:胡鵬飛的最美鄉(xiāng)
- 湖南御福天益生物公司被指涉嫌傳銷進(jìn)行非
- 大同市城投公司劉建婷遭群眾舉報(bào)
- 魯能集團(tuán) “一帶一路”履責(zé)行動(dòng)暨“海南
圖片新聞
48小時(shí)頻道點(diǎn)擊排行
-
0
1大模型,開始“搶人”|世界即時(shí)看 -
0
2胡錫進(jìn):辦成了這件事讓中國獨(dú)秀于世 -
0
3世界快看:咬唇妝怎么畫視頻教程_咬 -
0
4每日速遞:廈門土壤和地下水環(huán)境迎來 -
0
52022年中國汽車制造業(yè)上市公司凈利潤 -
0
61.4萬兵力參演!北約在愛沙尼亞舉行 -
0
7顧客買肉餅咬下去發(fā)現(xiàn)全是活蛆,商家 -
0
8環(huán)球熱消息:2637萬!大連今年第2注 -
0
9你一定要站在自己的世界里閃閃發(fā)光英 -
0
10每日時(shí)訊!中國駐蒙特利爾總領(lǐng)館舉辦 -
0
11@媽媽,桃源高速兒女有話要對你說 -
0
12冰絲面料是滌綸還是錦綸(棉加滌綸是 -
0
13熱推薦:以預(yù)為先,以防為要 ——新 -
0
14天天最新:如果單位簽了勞動(dòng)合同公司 -
0
15天天快資訊丨4月PC端微軟Bing市場份 -
0
16【原耽雙男主小說推薦】txt -
0
17天天觀速訊丨甲骨文推出Oracle Data -
0
18世界最新:費(fèi)城出局,哈登下家2選1, -
0
19售價(jià)10萬以內(nèi) “電動(dòng)吉姆尼”寶駿悅 -
0
20斷軸!韓系豪華車捷尼賽思GV60上市兩