生成式AI掀起巨大聲勢,而它自身也不斷展現(xiàn)出越來越大潛力。比如讓AI自動設(shè)計芯片,或者讓AI給人看病。
為搶占領(lǐng)先地位,趨之若鶩的企業(yè)不僅使出渾身解數(shù),釋放自身技術(shù)力,AI模型也越做越大,以達到力大磚飛的效果,實現(xiàn)智能涌現(xiàn)(emergence)。科技部新一代人工智能發(fā)展研究中心的《中國人工智能大模型地圖研究報告》顯示,迄今為止,中國已發(fā)布79個10億參數(shù)規(guī)模以上的大模型,大模型之戰(zhàn)逐漸步入后半場,更多人開始關(guān)注大模型與實體產(chǎn)業(yè)的結(jié)合上,企業(yè)也接連展示其產(chǎn)品的應(yīng)用場景。但平心而論,原本使用傳統(tǒng)AI技術(shù)的應(yīng)用,真的需要使用大模型嗎,什么樣的大模型才是行業(yè)所需的?華為開發(fā)者大會2023(HDC.Cloud 2023 )上,華為云展示其在“AI for Industries”、盤古大模型方面的最新進展,并提出讓AI重塑千行百業(yè)。任何企業(yè)都不想在大模型熱潮中掉隊,你方唱罷我登場,近幾個月每隔幾天都會有一個大模型的新聞。市場輪轉(zhuǎn)下,企業(yè)已紛紛從搶占先機,上馬通用大模型,逐漸謀局落子,轉(zhuǎn)向行業(yè)大模型,盡顯自家產(chǎn)品實用性,其中不乏實機演示和方案展示。大模型之所以被大眾所熟知,是因為ChatGPT這樣to C的產(chǎn)品,讓人實實在在體會到技術(shù)的價值。實際上,大模型的關(guān)鍵不在于有多大,或是通用能力有多強,而在于能不能解決現(xiàn)有應(yīng)用的問題,只有立足應(yīng)用本身,重塑千行百業(yè),改善提升人們生活品質(zhì),才能被人所接受。縱觀全球,因算力成本高昂、信息泄露、政策監(jiān)管等挑戰(zhàn),大模型的to C商業(yè)化進程更為緩慢,大多企業(yè)選擇務(wù)實地面向to B端企業(yè)客戶落地,滿足特定行業(yè)場景所需要求。可以說,做行業(yè)大模型已成普遍共識。傳統(tǒng)小模型AI通常只能執(zhí)行特定任務(wù)或特定問題,對to B行業(yè)而言,大模型不僅可以將傳統(tǒng)系統(tǒng)信息串聯(lián)在一起,還可實現(xiàn)更為復(fù)雜的決策和規(guī)劃。但做行業(yè)大模型談何容易,許多想要應(yīng)用AI的企業(yè),最終都只能作罷。首先,企業(yè)業(yè)務(wù)場景復(fù)雜,且多數(shù)需定制化,要對文本、圖片、音頻、視頻、機理等多樣化任務(wù)進行處理,與之相悖的是,大多企業(yè)稀缺數(shù)據(jù)樣本。其次,大模型是燒錢的游戲,不僅要在訓(xùn)練階段使用千卡起步的大算力,還需技術(shù)力極高的專業(yè)AI應(yīng)用開發(fā)人才。最后,數(shù)據(jù)和知識是企業(yè)核心資產(chǎn),需保證企業(yè)數(shù)據(jù)的隱私安全及合規(guī)。專業(yè)的事,就應(yīng)該交給專業(yè)的人來做,大模型亦如此,而不是讓企業(yè)與去制造螺絲、軸承、齒輪這樣的基礎(chǔ)性工作。華為云作為早在2021年就發(fā)布盤古基礎(chǔ)大模型的企業(yè),在大模型領(lǐng)域絕非新手,彼時便以AI工業(yè)化為目標(biāo)。而到今天,華為云正式發(fā)布盤古3.0和昇騰AI云服務(wù),成為中國首個全棧自主的AI大模型,堅持AI for Industries方向,讓AI和各行各業(yè)深度結(jié)合。
就如華為常務(wù)董事、華為云CEO張平安發(fā)所提到的,盤古大模型不作詩、只做事,聚焦行業(yè)場景,致力于深耕政務(wù)、金融、制造、煤礦、鐵路、制藥、氣象等行業(yè)。事實上,大模型早已脫離講概念的階段,而是正在悄然改變生活中的一切。氣象與人類密不可分,而它也為我們的發(fā)展之路上帶來許多損害。就比如,每年,全球大約會生成80個臺風(fēng),其中影響西北太平洋和南海的大約有25個,平均有7個會登陸我國。2022年,臺風(fēng)災(zāi)害造成的直接經(jīng)濟損失54.2億元。傳統(tǒng)氣象預(yù)測多采用HPC高性能計算機計算,如要預(yù)測臺風(fēng)未來10天路徑,需在超級計算機上,利用超過3000個節(jié)點的超級計算機上花費數(shù)小時進行仿真。隨著算力增長趨勢和物理模型復(fù)雜化,傳統(tǒng)數(shù)值預(yù)報瓶頸凸顯。盤古氣象大模型則只需單機單卡,10秒內(nèi)就可完成一次氣象預(yù)測。它是全球首個精度超過傳統(tǒng)預(yù)報方式的AI模型,可在秒級時間內(nèi)完成一個臺風(fēng)未來10天的路徑,臺風(fēng)路徑預(yù)測準(zhǔn)確度世界第一,相比歐洲氣象局提升約20%。抗生素曾挽救無數(shù)人生命,但自1987年達托霉素被發(fā)現(xiàn)以后,人類已有近40年沒有發(fā)現(xiàn)新的抗生素。耐藥性不僅會威脅每個人的身體健康,還可能會導(dǎo)致到2030年GDP每年下降至少3.4萬億美元,使2400萬人陷入極端貧困。世界急需全新類別的抗生素,改變病人面對“超級耐藥菌”感染時無藥可用的局面。研究一款新藥談何容易,一直以來,新藥研發(fā)難逃“雙10定律”魔咒,即平均成本超過10億美元、研發(fā)周期大于10年。不止如此,這還是最佳的業(yè)態(tài),現(xiàn)實中一款新藥從研發(fā)到獲批上市,平均需要10年~15年時間,耗費超過26億美元,且臨床成功率不到10%。華為云盤古藥物分子大模型采用全新深度學(xué)習(xí)網(wǎng)絡(luò)架構(gòu),生成了1億個100%結(jié)構(gòu)新穎的類藥小分子庫,相比傳統(tǒng)方式,成藥性預(yù)測準(zhǔn)確性可提升20%。西安交通大學(xué)第一附屬醫(yī)院劉冰教授在新藥研發(fā)中采用基于華為云盤古藥物分子大模型打造的AI輔助藥物設(shè)計服務(wù),研發(fā)出一款超級抗菌藥Drug X(肉桂酰菌素),有望成為近40年來首個新靶點、新類別的抗生素,并將先導(dǎo)藥的研發(fā)周期從數(shù)年縮短至一個月,研發(fā)成本降低70%,打破醫(yī)藥界“雙十定律”。幽暗的礦山之下,是工人的人生。下井工人長期處于高危高壓環(huán)境,不僅被死亡陰影所困,更是伴隨著一生的傷病。但與之相悖的是,當(dāng)前300米井下仍需大量人員現(xiàn)場作業(yè),他們更需技術(shù)的人文關(guān)懷。AI就是保障井下作業(yè)安全的好手,能夠讓不確定的人工流程多一個好幫手。然而,要AI進入煤礦行業(yè)并沒有想象那樣簡單。井下作業(yè)環(huán)境惡劣,對圖像、視頻識別精度要求高。況且,礦山與礦山間差別大,現(xiàn)場作業(yè)情況復(fù)雜,模型不可能簡單復(fù)用。同時,煤礦行業(yè)缺乏高素質(zhì)的人工智能人才。盤古礦山大模型只需導(dǎo)入海量無標(biāo)注的礦山場景數(shù)據(jù)進行預(yù)訓(xùn)練,即可進行無監(jiān)督自主學(xué)習(xí),一個大模型就能覆蓋煤礦的采、掘、機、運、通、洗選等業(yè)務(wù)流程下的1000多個細分場景,能夠?qū)崿F(xiàn)全時段巡檢,幫助工作人員及時發(fā)現(xiàn)問題,避免因漏檢造成的安全事故,縮短停機時間,同時提升井下巡檢人員的工作效率。目前,它已在全國8個礦井規(guī)模使用。無數(shù)大中小城市因鐵路而串聯(lián),迄今為止,我國鐵路營業(yè)里程15.5萬公里,鐵路貨車超過100萬輛。隨著我國鐵路安全水平提升,很多故障已極少發(fā)生,多數(shù)人都沒有見過,但故障一旦發(fā)生通常都是大故障。比如搖枕心盤脫出,全國范圍內(nèi)只找到一張故障樣本。安全的背后是無數(shù)人的辛勞。受制于技術(shù)發(fā)展,當(dāng)前廣泛采用的TFDS(貨車運行故障動態(tài)圖像檢測系統(tǒng))仍采用人工方式進行故障識別。以某樞紐站5T檢測車間為例,日均檢車近800列4萬余輛,TFDS系統(tǒng)拍攝圖片280萬余張,列檢員每天需檢查大量極其類似的圖片,且需在5秒左右的時間及時發(fā)現(xiàn)細微的差別,找出列車存在的故障。通過盤古大模型,原來人工需要識別4000張圖片,現(xiàn)在僅需要復(fù)檢170多張圖片,工人勞動強度下降95.75%。實際應(yīng)用中,能精準(zhǔn)識別67種貨車430+種各類故障,重大異常故障100%識別,無故障圖片篩除率高達95%,超過客戶預(yù)期。這樣的例子不勝枚舉,事實上,每次使用一網(wǎng)通辦業(yè)務(wù),每次使用智能產(chǎn)品的背后,或許都是大模型的功勞,我們也一直在直接或間接地享受到技術(shù)升級所帶來的紅利。如今的大模型領(lǐng)域,依然熱得發(fā)燙,國內(nèi)選手上演了一出”百模大戰(zhàn)“,其中不乏實力強勁的互聯(lián)網(wǎng)大廠,那么盤古大模型又有什么差異化優(yōu)勢?首先,華為云在AI領(lǐng)域已有數(shù)百個項目,并堅持AI for Industries,結(jié)合自身超過30年行業(yè)積累經(jīng)驗及10余個行業(yè)軍團持續(xù)場景深耕,將行業(yè)客戶和伙伴沉淀的豐富的Know-how與大模型進行融合,讓大模型具備行業(yè)知識與經(jīng)驗。其次,盤古大模型除了學(xué)習(xí)大量通用知識外,還學(xué)習(xí)了10多個行業(yè)公開數(shù)據(jù),涵蓋金融、政務(wù)、氣象、醫(yī)療、健康、互聯(lián)網(wǎng)、教育、汽車、零售等。更為重要的是,盤古大模型從底層芯片到全流程平臺都實現(xiàn)了自主創(chuàng)新。要知道,AI熱潮中,GPU已成為炙手可熱的香餑餑,但在地緣政治摩擦和供貨短缺多重影響下,部署高性能計算卡只會困難重重,因此,自主創(chuàng)新已成行業(yè)普遍共識。回顧盤古大模型歷史,是不斷滿足行業(yè)需求的過程。2020年3月,田奇加入華為云后便開始組建團隊;2021年4月,盤古大模型正式對外發(fā)布,包括NLP大模型和CV大模型;2021年9月,華為云發(fā)布科學(xué)計算大模型和藥物分子大模型;2022年6月,華為云發(fā)布盤古礦山大模型;2022年11月,華為云發(fā)布氣象大模型。時間回到現(xiàn)在,華為云正式發(fā)布盤古大模型3.0,同時發(fā)布政務(wù)、金融、制造大模型。大模型在前一陣子異?;馃?,為什么華為云要選擇這個時間點公布盤古大模型的進展?事實上,華為云在面對產(chǎn)業(yè)新技術(shù)和新趨勢時,優(yōu)先考慮的都是行業(yè)需求,只有當(dāng)技術(shù)做得足夠成熟才會向市場推行新技術(shù)。而從盤古大模型3.0上來說,此次華為云更為明確了其產(chǎn)品在工業(yè)上的定位,整合了以往的大模型,重新梳理架構(gòu),并通過新的大模型把這張網(wǎng)拉的更大,以覆蓋到每一個行業(yè)。
華為輪值董事長胡厚崑在日前的2023世界人工智能大會上也強調(diào),人工智能的發(fā)展,關(guān)鍵是要“走深向?qū)崱保x能產(chǎn)業(yè)升級。當(dāng)前階段,華為在人工智能發(fā)展上有兩個著力點:第一,打造強有力的算力底座,支撐中國人工智能產(chǎn)業(yè)的發(fā)展。第二,從通用大模型到行業(yè)大模型,讓人工智能服務(wù)好千行百業(yè)、服務(wù)好科學(xué)研究。
盤古大模型3.0采用分層設(shè)計,包括5+N+X三層架構(gòu):5大L0層基礎(chǔ)大模型提供各種通用技能,N個L1層行業(yè)大模型幫助企業(yè)打造自己的大模型,海量L2層場景模型專注于具體應(yīng)用場景或特定業(yè)務(wù),為客戶提供開箱即用的模型服務(wù)。算力是大模型的食糧,訓(xùn)練過程中,盤古各個系列大模型幾乎都需要幾百張、甚至上千張昇騰芯片訓(xùn)練,昇騰AI云服務(wù)則是盤古大模型的底座,為它提供堅實的基礎(chǔ)。
華為云單集群達2000P Flops算力的昇騰AI云服務(wù)在烏蘭察布和貴安同時上線,采用天成液冷平臺的華為云數(shù)據(jù)中心能夠保障千卡訓(xùn)練30天長穩(wěn)率達到90%,斷點恢復(fù)時長不超過10分鐘。
“為了幫助全球客戶、伙伴、開發(fā)者訓(xùn)練和使用大模型,我們致力于為全球客戶打造世界AI另一極,為所有AI開發(fā)者提供新的選擇”,張平安如是說。
對很多企業(yè)來說,數(shù)據(jù)安全合規(guī)是首要考慮因素,盤古大模型除公有云部署模式,可進一步提供大模型云專區(qū),建立云專屬資源池供大模型訓(xùn)練和推理,確保數(shù)據(jù)安全合規(guī)。對于更嚴格數(shù)據(jù)本地化要求,還提供混合云部署,幫助客戶在自己的私有化HCS上訓(xùn)練大模型。一款產(chǎn)品,好用才是關(guān)鍵。華為云提供了易用可靠的大模型工具套件、匯聚海量多行業(yè)場景API的開天aPaaS,以及包含豐富優(yōu)質(zhì)課程和技術(shù)認證的大模型專屬社區(qū),以幫助開發(fā)者快速開發(fā)。誠然,技術(shù)本身是革命性的,但對盤古大模型進入千行百業(yè)這件事,仍然需要給它時間在行業(yè)中生根發(fā)芽。
正如AI四大天王之一的Andrew Ng所說,“很難想象哪一個大行業(yè)不會被人工智能改變。大行業(yè)包括醫(yī)療保健、教育、交通、零售、通訊和農(nóng)業(yè)。人工智能會在這些行業(yè)里發(fā)揮重大作用,這個走向非常明顯?!蔽磥?,每個行業(yè)或許都會由各個行業(yè)大模型所改變。
文章來源:虎嗅APP
特別策劃
【免責(zé)聲明:本文版權(quán)歸原作者所有。為尊重版權(quán),我們盡量標(biāo)注文章來源,若不愿被轉(zhuǎn)載或涉及侵權(quán),請及時通過在線客服和郵箱聯(lián)系,郵箱地址:wutongtai@wttai.com,我們將第一時間予以刪除】