生成式AI掀起巨大聲勢(shì),而它自身也不斷展現(xiàn)出越來(lái)越大潛力。比如讓AI自動(dòng)設(shè)計(jì)芯片,或者讓AI給人看病。
為搶占領(lǐng)先地位,趨之若鶩的企業(yè)不僅使出渾身解數(shù),釋放自身技術(shù)力,AI模型也越做越大,以達(dá)到力大磚飛的效果,實(shí)現(xiàn)智能涌現(xiàn)(emergence)。科技部新一代人工智能發(fā)展研究中心的《中國(guó)人工智能大模型地圖研究報(bào)告》顯示,迄今為止,中國(guó)已發(fā)布79個(gè)10億參數(shù)規(guī)模以上的大模型,大模型之戰(zhàn)逐漸步入后半場(chǎng),更多人開始關(guān)注大模型與實(shí)體產(chǎn)業(yè)的結(jié)合上,企業(yè)也接連展示其產(chǎn)品的應(yīng)用場(chǎng)景。但平心而論,原本使用傳統(tǒng)AI技術(shù)的應(yīng)用,真的需要使用大模型嗎,什么樣的大模型才是行業(yè)所需的?華為開發(fā)者大會(huì)2023(HDC.Cloud 2023 )上,華為云展示其在“AI for Industries”、盤古大模型方面的最新進(jìn)展,并提出讓AI重塑千行百業(yè)。任何企業(yè)都不想在大模型熱潮中掉隊(duì),你方唱罷我登場(chǎng),近幾個(gè)月每隔幾天都會(huì)有一個(gè)大模型的新聞。市場(chǎng)輪轉(zhuǎn)下,企業(yè)已紛紛從搶占先機(jī),上馬通用大模型,逐漸謀局落子,轉(zhuǎn)向行業(yè)大模型,盡顯自家產(chǎn)品實(shí)用性,其中不乏實(shí)機(jī)演示和方案展示。大模型之所以被大眾所熟知,是因?yàn)镃hatGPT這樣to C的產(chǎn)品,讓人實(shí)實(shí)在在體會(huì)到技術(shù)的價(jià)值。實(shí)際上,大模型的關(guān)鍵不在于有多大,或是通用能力有多強(qiáng),而在于能不能解決現(xiàn)有應(yīng)用的問(wèn)題,只有立足應(yīng)用本身,重塑千行百業(yè),改善提升人們生活品質(zhì),才能被人所接受。縱觀全球,因算力成本高昂、信息泄露、政策監(jiān)管等挑戰(zhàn),大模型的to C商業(yè)化進(jìn)程更為緩慢,大多企業(yè)選擇務(wù)實(shí)地面向to B端企業(yè)客戶落地,滿足特定行業(yè)場(chǎng)景所需要求。可以說(shuō),做行業(yè)大模型已成普遍共識(shí)。傳統(tǒng)小模型AI通常只能執(zhí)行特定任務(wù)或特定問(wèn)題,對(duì)to B行業(yè)而言,大模型不僅可以將傳統(tǒng)系統(tǒng)信息串聯(lián)在一起,還可實(shí)現(xiàn)更為復(fù)雜的決策和規(guī)劃。但做行業(yè)大模型談何容易,許多想要應(yīng)用AI的企業(yè),最終都只能作罷。首先,企業(yè)業(yè)務(wù)場(chǎng)景復(fù)雜,且多數(shù)需定制化,要對(duì)文本、圖片、音頻、視頻、機(jī)理等多樣化任務(wù)進(jìn)行處理,與之相悖的是,大多企業(yè)稀缺數(shù)據(jù)樣本。其次,大模型是燒錢的游戲,不僅要在訓(xùn)練階段使用千卡起步的大算力,還需技術(shù)力極高的專業(yè)AI應(yīng)用開發(fā)人才。最后,數(shù)據(jù)和知識(shí)是企業(yè)核心資產(chǎn),需保證企業(yè)數(shù)據(jù)的隱私安全及合規(guī)。專業(yè)的事,就應(yīng)該交給專業(yè)的人來(lái)做,大模型亦如此,而不是讓企業(yè)與去制造螺絲、軸承、齒輪這樣的基礎(chǔ)性工作。華為云作為早在2021年就發(fā)布盤古基礎(chǔ)大模型的企業(yè),在大模型領(lǐng)域絕非新手,彼時(shí)便以AI工業(yè)化為目標(biāo)。而到今天,華為云正式發(fā)布盤古3.0和昇騰AI云服務(wù),成為中國(guó)首個(gè)全棧自主的AI大模型,堅(jiān)持AI for Industries方向,讓AI和各行各業(yè)深度結(jié)合。
就如華為常務(wù)董事、華為云CEO張平安發(fā)所提到的,盤古大模型不作詩(shī)、只做事,聚焦行業(yè)場(chǎng)景,致力于深耕政務(wù)、金融、制造、煤礦、鐵路、制藥、氣象等行業(yè)。事實(shí)上,大模型早已脫離講概念的階段,而是正在悄然改變生活中的一切。氣象與人類密不可分,而它也為我們的發(fā)展之路上帶來(lái)許多損害。就比如,每年,全球大約會(huì)生成80個(gè)臺(tái)風(fēng),其中影響西北太平洋和南海的大約有25個(gè),平均有7個(gè)會(huì)登陸我國(guó)。2022年,臺(tái)風(fēng)災(zāi)害造成的直接經(jīng)濟(jì)損失54.2億元。傳統(tǒng)氣象預(yù)測(cè)多采用HPC高性能計(jì)算機(jī)計(jì)算,如要預(yù)測(cè)臺(tái)風(fēng)未來(lái)10天路徑,需在超級(jí)計(jì)算機(jī)上,利用超過(guò)3000個(gè)節(jié)點(diǎn)的超級(jí)計(jì)算機(jī)上花費(fèi)數(shù)小時(shí)進(jìn)行仿真。隨著算力增長(zhǎng)趨勢(shì)和物理模型復(fù)雜化,傳統(tǒng)數(shù)值預(yù)報(bào)瓶頸凸顯。盤古氣象大模型則只需單機(jī)單卡,10秒內(nèi)就可完成一次氣象預(yù)測(cè)。它是全球首個(gè)精度超過(guò)傳統(tǒng)預(yù)報(bào)方式的AI模型,可在秒級(jí)時(shí)間內(nèi)完成一個(gè)臺(tái)風(fēng)未來(lái)10天的路徑,臺(tái)風(fēng)路徑預(yù)測(cè)準(zhǔn)確度世界第一,相比歐洲氣象局提升約20%。抗生素曾挽救無(wú)數(shù)人生命,但自1987年達(dá)托霉素被發(fā)現(xiàn)以后,人類已有近40年沒(méi)有發(fā)現(xiàn)新的抗生素。耐藥性不僅會(huì)威脅每個(gè)人的身體健康,還可能會(huì)導(dǎo)致到2030年GDP每年下降至少3.4萬(wàn)億美元,使2400萬(wàn)人陷入極端貧困。世界急需全新類別的抗生素,改變病人面對(duì)“超級(jí)耐藥菌”感染時(shí)無(wú)藥可用的局面。研究一款新藥談何容易,一直以來(lái),新藥研發(fā)難逃“雙10定律”魔咒,即平均成本超過(guò)10億美元、研發(fā)周期大于10年。不止如此,這還是最佳的業(yè)態(tài),現(xiàn)實(shí)中一款新藥從研發(fā)到獲批上市,平均需要10年~15年時(shí)間,耗費(fèi)超過(guò)26億美元,且臨床成功率不到10%。華為云盤古藥物分子大模型采用全新深度學(xué)習(xí)網(wǎng)絡(luò)架構(gòu),生成了1億個(gè)100%結(jié)構(gòu)新穎的類藥小分子庫(kù),相比傳統(tǒng)方式,成藥性預(yù)測(cè)準(zhǔn)確性可提升20%。西安交通大學(xué)第一附屬醫(yī)院劉冰教授在新藥研發(fā)中采用基于華為云盤古藥物分子大模型打造的AI輔助藥物設(shè)計(jì)服務(wù),研發(fā)出一款超級(jí)抗菌藥Drug X(肉桂酰菌素),有望成為近40年來(lái)首個(gè)新靶點(diǎn)、新類別的抗生素,并將先導(dǎo)藥的研發(fā)周期從數(shù)年縮短至一個(gè)月,研發(fā)成本降低70%,打破醫(yī)藥界“雙十定律”。幽暗的礦山之下,是工人的人生。下井工人長(zhǎng)期處于高危高壓環(huán)境,不僅被死亡陰影所困,更是伴隨著一生的傷病。但與之相悖的是,當(dāng)前300米井下仍需大量人員現(xiàn)場(chǎng)作業(yè),他們更需技術(shù)的人文關(guān)懷。AI就是保障井下作業(yè)安全的好手,能夠讓不確定的人工流程多一個(gè)好幫手。然而,要AI進(jìn)入煤礦行業(yè)并沒(méi)有想象那樣簡(jiǎn)單。井下作業(yè)環(huán)境惡劣,對(duì)圖像、視頻識(shí)別精度要求高。況且,礦山與礦山間差別大,現(xiàn)場(chǎng)作業(yè)情況復(fù)雜,模型不可能簡(jiǎn)單復(fù)用。同時(shí),煤礦行業(yè)缺乏高素質(zhì)的人工智能人才。盤古礦山大模型只需導(dǎo)入海量無(wú)標(biāo)注的礦山場(chǎng)景數(shù)據(jù)進(jìn)行預(yù)訓(xùn)練,即可進(jìn)行無(wú)監(jiān)督自主學(xué)習(xí),一個(gè)大模型就能覆蓋煤礦的采、掘、機(jī)、運(yùn)、通、洗選等業(yè)務(wù)流程下的1000多個(gè)細(xì)分場(chǎng)景,能夠?qū)崿F(xiàn)全時(shí)段巡檢,幫助工作人員及時(shí)發(fā)現(xiàn)問(wèn)題,避免因漏檢造成的安全事故,縮短停機(jī)時(shí)間,同時(shí)提升井下巡檢人員的工作效率。目前,它已在全國(guó)8個(gè)礦井規(guī)模使用。無(wú)數(shù)大中小城市因鐵路而串聯(lián),迄今為止,我國(guó)鐵路營(yíng)業(yè)里程15.5萬(wàn)公里,鐵路貨車超過(guò)100萬(wàn)輛。隨著我國(guó)鐵路安全水平提升,很多故障已極少發(fā)生,多數(shù)人都沒(méi)有見過(guò),但故障一旦發(fā)生通常都是大故障。比如搖枕心盤脫出,全國(guó)范圍內(nèi)只找到一張故障樣本。安全的背后是無(wú)數(shù)人的辛勞。受制于技術(shù)發(fā)展,當(dāng)前廣泛采用的TFDS(貨車運(yùn)行故障動(dòng)態(tài)圖像檢測(cè)系統(tǒng))仍采用人工方式進(jìn)行故障識(shí)別。以某樞紐站5T檢測(cè)車間為例,日均檢車近800列4萬(wàn)余輛,TFDS系統(tǒng)拍攝圖片280萬(wàn)余張,列檢員每天需檢查大量極其類似的圖片,且需在5秒左右的時(shí)間及時(shí)發(fā)現(xiàn)細(xì)微的差別,找出列車存在的故障。通過(guò)盤古大模型,原來(lái)人工需要識(shí)別4000張圖片,現(xiàn)在僅需要復(fù)檢170多張圖片,工人勞動(dòng)強(qiáng)度下降95.75%。實(shí)際應(yīng)用中,能精準(zhǔn)識(shí)別67種貨車430+種各類故障,重大異常故障100%識(shí)別,無(wú)故障圖片篩除率高達(dá)95%,超過(guò)客戶預(yù)期。這樣的例子不勝枚舉,事實(shí)上,每次使用一網(wǎng)通辦業(yè)務(wù),每次使用智能產(chǎn)品的背后,或許都是大模型的功勞,我們也一直在直接或間接地享受到技術(shù)升級(jí)所帶來(lái)的紅利。如今的大模型領(lǐng)域,依然熱得發(fā)燙,國(guó)內(nèi)選手上演了一出”百模大戰(zhàn)“,其中不乏實(shí)力強(qiáng)勁的互聯(lián)網(wǎng)大廠,那么盤古大模型又有什么差異化優(yōu)勢(shì)?首先,華為云在AI領(lǐng)域已有數(shù)百個(gè)項(xiàng)目,并堅(jiān)持AI for Industries,結(jié)合自身超過(guò)30年行業(yè)積累經(jīng)驗(yàn)及10余個(gè)行業(yè)軍團(tuán)持續(xù)場(chǎng)景深耕,將行業(yè)客戶和伙伴沉淀的豐富的Know-how與大模型進(jìn)行融合,讓大模型具備行業(yè)知識(shí)與經(jīng)驗(yàn)。其次,盤古大模型除了學(xué)習(xí)大量通用知識(shí)外,還學(xué)習(xí)了10多個(gè)行業(yè)公開數(shù)據(jù),涵蓋金融、政務(wù)、氣象、醫(yī)療、健康、互聯(lián)網(wǎng)、教育、汽車、零售等。更為重要的是,盤古大模型從底層芯片到全流程平臺(tái)都實(shí)現(xiàn)了自主創(chuàng)新。要知道,AI熱潮中,GPU已成為炙手可熱的香餑餑,但在地緣政治摩擦和供貨短缺多重影響下,部署高性能計(jì)算卡只會(huì)困難重重,因此,自主創(chuàng)新已成行業(yè)普遍共識(shí)。回顧盤古大模型歷史,是不斷滿足行業(yè)需求的過(guò)程。2020年3月,田奇加入華為云后便開始組建團(tuán)隊(duì);2021年4月,盤古大模型正式對(duì)外發(fā)布,包括NLP大模型和CV大模型;2021年9月,華為云發(fā)布科學(xué)計(jì)算大模型和藥物分子大模型;2022年6月,華為云發(fā)布盤古礦山大模型;2022年11月,華為云發(fā)布?xì)庀蟠竽P汀?/section>時(shí)間回到現(xiàn)在,華為云正式發(fā)布盤古大模型3.0,同時(shí)發(fā)布政務(wù)、金融、制造大模型。大模型在前一陣子異常火熱,為什么華為云要選擇這個(gè)時(shí)間點(diǎn)公布盤古大模型的進(jìn)展?事實(shí)上,華為云在面對(duì)產(chǎn)業(yè)新技術(shù)和新趨勢(shì)時(shí),優(yōu)先考慮的都是行業(yè)需求,只有當(dāng)技術(shù)做得足夠成熟才會(huì)向市場(chǎng)推行新技術(shù)。而從盤古大模型3.0上來(lái)說(shuō),此次華為云更為明確了其產(chǎn)品在工業(yè)上的定位,整合了以往的大模型,重新梳理架構(gòu),并通過(guò)新的大模型把這張網(wǎng)拉的更大,以覆蓋到每一個(gè)行業(yè)。
華為輪值董事長(zhǎng)胡厚崑在日前的2023世界人工智能大會(huì)上也強(qiáng)調(diào),人工智能的發(fā)展,關(guān)鍵是要“走深向?qū)崱保x能產(chǎn)業(yè)升級(jí)。當(dāng)前階段,華為在人工智能發(fā)展上有兩個(gè)著力點(diǎn):第一,打造強(qiáng)有力的算力底座,支撐中國(guó)人工智能產(chǎn)業(yè)的發(fā)展。第二,從通用大模型到行業(yè)大模型,讓人工智能服務(wù)好千行百業(yè)、服務(wù)好科學(xué)研究。
盤古大模型3.0采用分層設(shè)計(jì),包括5+N+X三層架構(gòu):5大L0層基礎(chǔ)大模型提供各種通用技能,N個(gè)L1層行業(yè)大模型幫助企業(yè)打造自己的大模型,海量L2層場(chǎng)景模型專注于具體應(yīng)用場(chǎng)景或特定業(yè)務(wù),為客戶提供開箱即用的模型服務(wù)。算力是大模型的食糧,訓(xùn)練過(guò)程中,盤古各個(gè)系列大模型幾乎都需要幾百?gòu)垺⑸踔辽锨垥N騰芯片訓(xùn)練,昇騰AI云服務(wù)則是盤古大模型的底座,為它提供堅(jiān)實(shí)的基礎(chǔ)。
華為云單集群達(dá)2000P Flops算力的昇騰AI云服務(wù)在烏蘭察布和貴安同時(shí)上線,采用天成液冷平臺(tái)的華為云數(shù)據(jù)中心能夠保障千卡訓(xùn)練30天長(zhǎng)穩(wěn)率達(dá)到90%,斷點(diǎn)恢復(fù)時(shí)長(zhǎng)不超過(guò)10分鐘。
“為了幫助全球客戶、伙伴、開發(fā)者訓(xùn)練和使用大模型,我們致力于為全球客戶打造世界AI另一極,為所有AI開發(fā)者提供新的選擇”,張平安如是說(shuō)。
對(duì)很多企業(yè)來(lái)說(shuō),數(shù)據(jù)安全合規(guī)是首要考慮因素,盤古大模型除公有云部署模式,可進(jìn)一步提供大模型云專區(qū),建立云專屬資源池供大模型訓(xùn)練和推理,確保數(shù)據(jù)安全合規(guī)。對(duì)于更嚴(yán)格數(shù)據(jù)本地化要求,還提供混合云部署,幫助客戶在自己的私有化HCS上訓(xùn)練大模型。一款產(chǎn)品,好用才是關(guān)鍵。華為云提供了易用可靠的大模型工具套件、匯聚海量多行業(yè)場(chǎng)景API的開天aPaaS,以及包含豐富優(yōu)質(zhì)課程和技術(shù)認(rèn)證的大模型專屬社區(qū),以幫助開發(fā)者快速開發(fā)。誠(chéng)然,技術(shù)本身是革命性的,但對(duì)盤古大模型進(jìn)入千行百業(yè)這件事,仍然需要給它時(shí)間在行業(yè)中生根發(fā)芽。
正如AI四大天王之一的Andrew Ng所說(shuō),“很難想象哪一個(gè)大行業(yè)不會(huì)被人工智能改變。大行業(yè)包括醫(yī)療保健、教育、交通、零售、通訊和農(nóng)業(yè)。人工智能會(huì)在這些行業(yè)里發(fā)揮重大作用,這個(gè)走向非常明顯。”未來(lái),每個(gè)行業(yè)或許都會(huì)由各個(gè)行業(yè)大模型所改變。
文章來(lái)源:虎嗅APP
特別策劃
【免責(zé)聲明:本文版權(quán)歸原作者所有。為尊重版權(quán),我們盡量標(biāo)注文章來(lái)源,若不愿被轉(zhuǎn)載或涉及侵權(quán),請(qǐng)及時(shí)通過(guò)在線客服和郵箱聯(lián)系,郵箱地址:wutongtai@wttai.com,我們將第一時(shí)間予以刪除】