中國服裝智能制造聯盟專家組副組長
中國服裝協會產業專家委員會專家
東華大學教授 聞力生
我在“服裝制造業必須認知AI大模型及其應用”一文中敘述過,2024我國政府工作報告中提出的要開展“人工智能+”行動。我柤信隨著“人工智能+” 行動的到來,很多人工智能技術下的“新物種”很快會誕生,如AI Agent、人形機器人、無人駕駛汽車等等,這些“新物種”將很快會為我們自己所用、為加速制造業實現智能制造所用、為加速我國智能經濟的快速發展壯大所用。因此,當今不管你是企業還是企業中的員工,只有認知AI大模型,擁有自己的智能代理AI Agent,今后才能享受其生活服務和獲得從事職業的生存機會。那么什么是智能代理AI Agent呢?為什么我們非需要它不可呢?
說起智能體 Agent,我們不得不說幾年前美國加利福尼亞大學伯克利分校的斯圖爾特?羅素(Stuart Russell)教授和彼得?諾維格(Peter Norvig)所著的《人工智能:現代方法(第4版)》一書中提出的概念,書中闡述了“任何通過傳感器(sensor)感知環境(environment)并通過執行器(actuator)作用于該環境的事物都可以被視為智能體(agent)”,見圖一。
圖一 智能體概念
書中提出的這個智能體概念,是在眾多研究者對智能體的不斷研究和探索情況下總結出來的,現在在計算機和人工智能領域中得到了廣泛的應用,它已經成為人工智能領域的一個重要組成部分。
大家都知道,自從去年ChatGPT面世應用以來,雖然在應用中它具有強大的文本生成能力,但它的局限性也逐漸顯現,如:只能進行單輪對話,缺乏長期記憶和規劃能力,無法完成更多步驟推理和工具調用的復雜任務,也無法自主地解決問題。為了突破ChatGPT的局限性,AI Agent應運而生。
AI Agent的正確名稱是人工智能代理(Artificial Intelligence Agent),也可稱人工智能助理,它是一個能夠感知環境、進行決策和執行動作的智能實體,它不同于傳統的人工智能,它是一個復雜的AI系統,它能通過感知信息、處理信息、執行任務和輸出結果等步驟,實現從感知到行動的完整過程。AI Agent旨在理解、分析和響應人類輸入,像人類一樣執行任務、做出決策并與環境互動。它們可以是遵循預定義規則的簡單系統,也可以是根據經驗學習和適應的復雜、自主的實體;它們可以是基于軟件的實體,也可以是物理實體。
OpenAI公司對AI Agent是這樣定義的:以大語言模型LLM為大腦驅動,具有自主理解感知、規劃、記憶和使用工具的能力,能自動化執行完成復雜任務的系統,見圖二。
圖二 AI Agent定義
同樣,OpenAI公司的應用研發主管Lilian weng(翁莉蓮)也定義了基于LLM構建AI Agents的框架。她指出,AIAgent=LLM(大型語言模型)+記憶(Memory)+規劃技能(Planning)+工具使用(Tool Use),其中LLM柤當于智能體的大腦,而記憶、規劃和工具使用能力是關鍵組件。目前這個定義現在已成為大模型時代AI Agent的經典定義,見圖三。
前不久,人工智能著名學者、斯坦福大學教授吳恩達在紅杉資本的人工智能峰會(AI Ascent)上做了一次演講,他主要介紹了AI Agent的工作流,他說AI Agent智能體工作流將在今后推動人工智能取得巨大進步,甚至可能超過下一代AI基礎模型。他呼吁所有從事人工智能工作的人都要關注 AI 智能體工作流。他提出的AI Agent工作流四種設計模式包括:(1)檢查或稱反思(Reflection):通過讓AI模型自我檢查以提高代碼質量;(2)工具使用(Tool use):AI模型使用各種工具來執行操作、收集信息;(3)規劃(Planning):AI代理進行復雜的規劃算法,如規避失敗等;(4)多智能體協作(Multiagent collaboration):不同AI代理協作完成任務。吳恩達提出的AI Agent工作流四種設計模式不但推進了AI Agent的實際應用,而且向實踐通用人工智能AGI前進了一大步。①簡單反射Agents:這類 Agents 遵循條件-行動規則,直接對當前感知做出反應,而不依賴于對環境的內部模型。它們簡單高效,但因缺乏復雜環境適應性,其應用范圍受限;②基于模型的反射 Agents:與簡單反射 Agents 相比,這類 Agents 擁有一個內部世界模型,能夠追蹤并推斷出環境中不可直接感知的部分。它們結合當前感知和內部模型來做出決策,顯示出更高的適應性;③基于目標的 Agents:這些 Agents 不僅需要考慮當前狀態,還要考慮行為對未來的影響,既擁有明確的目標,也能基于實現這些目標的概率來做出選擇。它們適合于需要前瞻性規劃的復雜決策任務;④ 基于效用的 Agents:這類 Agents 使用效用函數來評估不同狀態,并力求最大化其性能。它們在存在多種可能操作或結果的情況下特別有用,能夠根據偏好做出最優決策;⑤學習 Agents:學習 Agents 能夠根據經驗自我改進,隨著時間的推移提高性能。它們在動態環境中尤其有效,能夠逐漸適應并發展出更優的策略;⑥多Agents系統(MAS):在 MAS 中,多個 Agents 協同工作,共同實現共同或各自的目標。這種系統適用于需要多方協調的復雜任務,如供應鏈管理;⑦分層Agents:分層 Agents 通過建立層級結構來管理和指導不同級別的任務。每個層級都有特定的職責,共同為實現整體目標而努力。這種結構適用于需要在不同層級上管理和執行任務的大型系統。①數據類智能助理:AI輔助做互聯網數據搜集與分析、市場研究,并提供交互可視化數據分析服務;②辦公類智能助理:基于自然語言交互提供知識檢索、任務執行等自動化功能,服務于員工大部分高頻工作場景;③生成類智能助理:利用AI進行編寫、繪畫、剪輯、編程等操作,多用于輔助員工創作生成;④營銷類智能助理:AI客服/AI主播等可以基于自然語言對話解決咨詢、營銷和服務問題AI Agent具有以下類型,即單個AI Agent、多個AI Agent和混合AI Agent(人機交互AI Agent)三種類型,見圖四:單個AI Agent代理側重于執行單一任務或一系列相關任務,且不需要與其他智能體進行交互。單個代理可以根據任務執行不同的操作,如需求分析、項目讀取、代碼生成等;多個AI Agent代理側重于智能體之間的互動(合作或競爭對抗)和信息共享,多個智能體協同工作,相互交流信息,共同完成更復雜的任務或目標。多個AI agent應用場景在軟件行業開發、制造業智能生產、企業管理等高度協同的工作中非常有幫助;混合AI Agent是人工智能系統和人類在一起共同參與決策過程,交互合作完成任務,強調的是人和機協作的重要性和互補性。在我們制造業領域大多使用混合智能體來完成復雜的專業制造工作。
圖四 AI Agent工作類型 (圖源:AI產品經理研習實踐)根據硅谷科技評論(svtr.ai)數據庫報道,近一年來,全球20多家智能代理(AI Agent)公司獲得知名機構投資。其中包括谷歌投資的Cognosys、Initialized Capital投資的Parcha AI、還有Mayfield、Benchmark投資金額高達3000萬美元的Sema4.ai,這家公司致力于構建智能代理來改變知識工作者與人工智能協作方式。在我國,創新工廠、云九資本、耀途資本等也在押注未來式智能、新旦智能等AI Agent初創公司。
研究人員認為將大語言模型 (LLM) 與 AI Agent 相結合是人工智能向前邁出的重要一步。這些增強的 Agent 現在可以處理信息、與其環境交互并執行多步驟操作,預示著解決任務能力的新時代的到來。根據數字眾生公眾號提出的大語言模型 LLM 與AI Agent相結合的業務工作流程步驟如下,見圖五:①用戶提出問題;②AI Agent基于預設的Prompt,將問題包裝之后送給LLM;③LLM返回給AI Agent結果和需要使用的工具;④AI Agent使用工具獲取必要信息;⑤工具返回給AI Agent獲取到的信息;⑥打包上下文發再次送給LLM;⑦LLM返回給AI Agent結果,AI Agent給用戶返回最終結。
2)智能代理AI Agent與機器人流程自動化RPARPA和AI Agent是兩種不同的技術,它們在制造領域中扮演著互補的角色。RPA技術利用軟件機器人或“機器人”來自動執行重復性業務流程,旨在模擬和整合現有的應用程序操作,實現自動化流程,減少人工干預,并提高工作效率。而AI Agent是一種能夠自主理解、規劃決策、執行復雜任務的智能體。它們具備感知環境、進行決策和執行動作的能力,類似于人類的記憶、邏輯分析能力、任務拆解能力和問題解決能力。兩者之間的主要區別在于它們解決問題的方法:①RPA是任務特定的,而AI Agent則具有更高的靈活性和自主性。②RPA專注于執行規則基礎的人類動作,而AI Agent則能夠通過感知信息、獨立思考來逐步完成給定目標。總的來說,RPA和AI Agent雖然都是制造領域自動化技術的重要組成部分,但它們各自側重的領域不同,RPA更適合處理重復性高、規則明確的任務,而AI Agent則更適合處理需要高度認知能力和自主性的復雜任務。隨著技術的發展,兩者的結合使用將為自動化領域帶來更多的可能性和效率提升。說得細一點AI Agent、 LLM和RPA這三者的區別可見表一。表一:AI Agent、大語言模型 LLM和RPA的區別
3)智能代理AI Agent與具身智能Embodied AI具身智能Embodied AI是一種強調智能體與其所處環境緊密互動的概念。它關注的是智能體如何通過感知和交互來理解并適應環境,從而做出決策并執行行動。具身智能強調智能體不僅要有處理信息的能力,還要有與環境進行實時互動的能力。這種智能體通常具備感知、認知、決策和行動的能力,能夠通過感知器和執行器與環境進行交互,并根據環境的變化做出相應的決策和行動。具身智能的概念在機器人學、人工智能和認知科學等領域都有廣泛的應用。智能代理AI Agent則是一種能夠模擬人類思維和行為,為用戶提供個性化和智能化服務的軟件程序。它通?;谌斯ぶ悄芗夹g,通過分析用戶的需求和行為模式,利用大數據、機器學習和自然語言處理等技術,幫助用戶進行信息檢索、任務執行、決策支持等操作。智能代理可以定期地收集信息或執行服務,而不需要人工干預,具有高度智能性和自主學習性。它可以根據用戶定義的準則,主動地通過智能化代理服務器為用戶搜集最感興趣的信息,并利用代理通信協議把加工過的信息按時推送給用戶。智能代理在各個領域都有廣泛的應用,如個人生活、商業服務以及專業服務等。總的來說,兩者都涉及到人工智能技術的應用,但側重點不同。具身智能更強調智能體與環境的實時互動和適應能力,而智能代理則更側重于模擬人類思維和行為,為用戶提供個性化服務。此外,具身智能通常涉及到硬件和軟件的結合,而智能代理則主要是一種軟件程序。在應用場景上,具身智能在機器人和自動化領域有更廣泛的應用,而智能代理則更多地應用于信息檢索、任務執行和決策支持等方面。
1)因為我們人類和智能代理AI Agent需要柤互協同工作當我們進入AI時代時,為了增強自己的知識和能力,人人都會有屬于自己的智能助理AI Agent,有了它,我們人類今后的工作或者需要的服務,只要我們設定目標任務和提供必要的資源(例如計算能力),然后讓AI Agent獨立地承擔大部分工作,我們人類最后只要對AI Agent工作進行監督和評估最終結果。這種工作模式充分體現了人類和智能代理的協同性、互動性、自主性和適應性,見圖六。
圖六 人與AI Agent協同工作
2)因為人類只有利用單個智能代理和多個智能代理組成不同形式架構才能解決服裝制造業目標任務等一切問題大家知道,多單個智能代理體架構是由一個語言模型驅動,并將獨立執行所有的推理、規劃和工具執行任務。多個智能代理體架構涉及兩個或更多的智能體,每個智能體可以使用相同的語言模型或一組不同的語言模型。智能體可以訪問相同的工具或不同的工具。每個智能體通常都有自己的角色任務。多智能體架構可以在任何復雜性級別上擁有各種組織。通常將它們分為垂直智能代理體架構和水平智能代理體架構兩個類型:在垂直架構智能代理體中,一個智能體充當領導者,其他協作智能體之間有明確的勞動分工,它們直接向領導者報告;水平架構智能代理體中,所有智能體都被視為平等的,并且是關于任務的一個組討論的一部分。智能體之間的通信發生在一個共享的線程中,每個智能體都可以看到其他智能體的所有消息。智能體還可以自愿完成特定任務或調用工具,這意味著它們不需要由領導智能代理體分配。水平架構通常用于需要協作、反饋和組討論以成功完成任務,見圖七。由此可知,在服裝制造業應用上,單個智能代理體系統可以處理靜態和簡單任務,而多個智能代理體系統則更適合應對動態和復雜的任務。多個智能代理系統的多樣性和自組織能力使其能夠適應各種不同環境和需求,提供更廣泛的解決方案和更多的應用選擇。這種差異使得兩種系統在不同的應用場景中都能發揮其獨特優勢。
圖七 單個與多個智能代理體架構
3)因為未來服裝制造企業的工作是虛擬員工AI Agent智能體與人類協同工作來完成的在服裝制造業人工智能代理AI Agent可以看作虛擬數字員工,因為AI Agent它擁有強大的推理和多模態能力,可以實現人機協同,為每個員工配備全場景、24小時不間斷的智能助理。在這一階段,數字員工將能夠全面覆蓋現有的業務場景,并自動化處理所有復雜業務。AI Agent的應用覆蓋了服裝制造業全鏈條:在研發設計領域,大模型通過優化設計過程提高研發效率;在生產制造領域,大模型拓展生產制造智能化應用的邊界;在經營管理領域,大模型基于助手模式提升經營管理水平;在產品服務領域,大模型基于交互能力推動產品和服務智能化,見圖八。
圖八 AI Agent在服裝制造業全環節的應用
在服裝制造企業虛擬員工AI Agent 智能體與人類協同工作可以在以下幾方面體現出來:①AI Agent 可以通過語音識別和自然語言處理技術,為操作工人提供實時的操作指導和支持;②AI Agent 能夠分析客戶數據,提供個性化的客戶服務和產品推薦,增強客戶滿意度;③AI Agent 可以協助工程師進行產品設計,提供創新的設計方案,縮短產品開發周期;④AI Agent 能夠為員工分析生產數據,優化生產流程,提高生產效率和資源利用率;⑤AI Agent 通過分析生產過程中的數據,可以優化工藝參數,提升產品質量和生產效率;⑥AI Agent 可以控制工業機器人執行精確的操作、組裝、輸送搬運等任務,提高生產效率和安全性;⑦通過分析市場趨勢和歷史數據,AI Agent 可以預測產品需求,為企業優化庫存水平,減少庫存成本;⑧AI Agent 能夠監控和分析能源使用情況,提出節能措施,降低能源成本;⑨利用計算機視覺技術,AI Agent 可以幫助人工進行自動檢測成衣產品缺陷,確保產品質量等等。4)因為一般服裝制造企業和員工開發AI Agent比較困難,通常使用AI Agent平臺服務來獲得制造企業在決定是否自己開發AI Agent服務還是借用平臺服務時,需要綜合考慮多個因素。首先,從成本角度來看,自己開發AI Agent服務可能需要投入大量的人力、物力和時間,包括技術研發、數據收集、模型訓練等。而借用平臺服務則可以降低這些成本,因為平臺方已經完成了這些基礎性的工作,制造企業只需要按照平臺提供的接口和規范進行集成和定制即可。其次,從技術和人才儲備來看,制造企業可能缺乏AI領域的專業人才和技術積累,自己開發AI Agent服務可能面臨技術難題和人才瓶頸。而借用平臺服務則可以充分利用平臺方的技術和人才優勢,快速實現智能化升級和轉型。此外,還需要考慮數據安全和隱私保護的問題。自己開發AI Agent服務可以更好地掌控數據安全和隱私保護,但也需要投入更多的精力和資源來保障。而借用平臺服務則需要確保平臺方能夠提供足夠的數據安全保障措施,并且需要仔細閱讀并理解平臺方的數據使用政策和隱私保護條款??傊?,從市場趨勢和未來發展來看,對于一般制造企業來說,借用平臺服務可能是一個更為快速、便捷和經濟的選擇,可以更快地實現智能化升級和轉型。我國有眾多AI Agent服務平臺,如阿里巴巴、騰訊、百度、京東、華為云、百川智能、聯匯科技、瀾碼科技、 科大訊飛、商湯科技、ChatDev(由清華大學、北京郵電大學、布朗大學聯合研究)、思必馳、字節跳動、曠世機器人、深蘭科技(上海)、 360集團、云從科技、智譜AI等等,其中以阿里巴巴集團旗下的釘釘智能移動辦公平臺,一直致力于為企業提供高效、智能的辦公解決方案。在AI Agent領域,釘釘憑借其在人工智能和大數據領域的深厚積累,推出了智能助理等創新產品,為企業提供了更加智能化、個性化的服務。2024年 4月19日,釘釘正式上線AI助理市場,釘釘AI助理市場正式上線,標志著釘釘全面智能化戰略的進一步深化,它已規劃首批推出的200多個AI助理,不遠將來還要推出一萬個AI助理,這不僅數量龐大,而且覆蓋了企業服務、行業應用、效率工具、財稅法務、教育學習、生活娛樂等多個領域,為用戶帶來了前所未有的智能化體驗,其釘釘AI助理服務平臺功能見圖九,企業和員工都可使用。
圖九 釘釘AI Agent服務平臺
1)我們要有這樣的思想準備,隨著AI Agent自主性的進一步加強,AI Agents 會發展成為更加專業化的代理,在制造業將替代多數專業工作和技能工作。從趨勢上看,大模型 Agents 取代人類的 90% 的專業工作很快會到來;在不遠的未來,AI Agents 會與更多的硬件產品融合(不僅限于具身智能和人形機器人),那就有可能完全取代人類工作,因此我們無論是企業還是個體,在這個新時代,我們要學習新知識、掌握新技能,以應對 AI Agent帶來的挑戰和機遇。2)智能體AI Agent的核心特征在于其自主性,即根據環境變化與任務需求自主作出決策;其學習能力使智能體能夠從經驗中持續優化行為策略,提升適應性和問題解決能力;其環境適應性則確保智能體能在各種復雜、不確定的環境中保持高效運作。這些特性使得AI Agent成為復雜系統中不可或缺的獨立決策單元。而多智體系統由多個智能體組成,通過明確的角色分工、靈活的組織結構和高效的交互機制,形成一個能夠共享信息、協調行動、共同達成目標的群體智能體整體。3)目前,AI Agent系統的研究仍面臨一些挑戰和局限性。評估標準的不一致性、現實應用場景的適應性、以及語言模型的內在偏差是當前研究中需要重點關注的問題。未來的研究可能會集中在建立更加全面和客觀的評估體系上,提高AI Agent系統在真實世界場景中的可靠性和穩健性(Robust),并探索減少系統偏差的有效方法。盡管當前的AI Agent系統尚未完全成熟,但它們在處理推理、規劃和工具使用等方面的能力已經超越了傳統的靜態語言模型。隨著技術的持續進步,預計AI Agent將在更多的領域中發揮關鍵作用,成為推動AI應用發展的重要環節。4)隨著深度學習、強化學習等技術的發展,Agent 的能力將得到進一步提升,其感知、決策和學習能力將更加強大。這將使它們能夠在更復雜的環境中執行任務,甚至在某些方面超越人類的能力;其次,Agent 的應用領域將進一步擴大,特別是在制造業需要高度自動化和智能化的領域,Agent 將成為不可或缺的工具;最后,Agent 的社會影響或將更加深遠,可能改變我們的工作方式、生活方式甚至思維方式。同時,這也將引發一系列的社會、倫理和法律問題,需要我們進行深入的研究和探討。但不管怎么說,我非常認同比爾·蓋茨在最近發表一篇文章中指出的:“5年內AI Agent將大行其道,每個用戶都將擁有一個專屬的AI Agent”。
2024年6月稿于上海
來源:中國服裝協會
【免責聲明:本文版權歸原作者所有。為尊重版權,我們盡量標注文章來源,若不愿被轉載或涉及侵權,請及時通過在線客服和郵箱聯系,郵箱地址:wutongtai@wttai.com,我們將第一時間予以刪除】