全模擬光電智能計(jì)算芯片效果圖。 經(jīng)長期聯(lián)合攻關(guān),清華大學(xué)研究團(tuán)隊(duì)突破傳統(tǒng)芯片的物理瓶頸,創(chuàng)造性提出光電融合的全新計(jì)算框架,并研制出國際首個(gè)全模擬光電智能計(jì)算芯片(簡稱ACCEL) 新華社圖趨勢一:從AI大模型邁向通用人工智能2023年,ChatGPT開發(fā)者OpenAI被置于前所未有的聚光燈下,也使GPT-4后續(xù)版本的開發(fā)被推向了風(fēng)口浪尖。據(jù)消息人士稱,OpenAI正在訓(xùn)練下一代的人工智能,暫名“Q*”(讀作Q-star)。新的一年,OpenAI下一代產(chǎn)品可能發(fā)布。據(jù)媒體爆料,“Q*”可能是第一次采用“從零開始”的方式訓(xùn)練的人工智能。其特點(diǎn)是,智能不來自人類活動的數(shù)據(jù),且其有能力修改自身代碼以適應(yīng)更復(fù)雜的學(xué)習(xí)任務(wù)。前者使得人工智能能力的發(fā)展變得愈發(fā)不透明,而后者向來被看作是誕生人工智能“奇點(diǎn)”的必要條件。在人工智能發(fā)展領(lǐng)域,“奇點(diǎn)”特指機(jī)器擁有了自我迭代的能力,進(jìn)而在短時(shí)間內(nèi)迅猛發(fā)展,導(dǎo)致超出人類控制。雖然一些報(bào)道稱,“Q*”目前還只能解決小學(xué)難度的數(shù)學(xué)問題,距離“奇點(diǎn)”還遠(yuǎn)。但鑒于虛擬環(huán)境中人工智能迭代速度可能遠(yuǎn)超想象,其仍然可能在不遠(yuǎn)的將來自主發(fā)展出在各個(gè)領(lǐng)域均可超過人類水平的AI。2023年,OpenAI預(yù)言,各方面超越人類水平的人工智能在十年內(nèi)就會出現(xiàn);英偉達(dá)創(chuàng)始人黃仁勛表示,通用人工智能可能在五年內(nèi)超越人類。一旦通用人工智能得以實(shí)現(xiàn),就可被用于解決各種復(fù)雜的科學(xué)難題,譬如尋找外星人與地外宜居星系、人工核聚變控制、納米或超導(dǎo)材料篩選、抗癌藥研發(fā)等。這些問題通常需要花費(fèi)人類研究員數(shù)十年的時(shí)間來尋找新的解決方案,部分前沿領(lǐng)域的研究量已超出人力極限。而通用人工智能在自己的虛擬世界中擁有幾乎無限的時(shí)間和精力,這使得其在部分容易虛擬化的任務(wù)中,有可能成為人類研究員的替代。但屆時(shí),人類如何監(jiān)督這些從智能水平上超過人類的人工智能,確保其不會危害人類,又是一個(gè)值得思考的問題。當(dāng)然,我們也不應(yīng)過分高估硅谷巨頭們的部分言論,因?yàn)樵谌斯ぶ悄馨l(fā)展史上,已經(jīng)歷三次“AI寒冬”,其中不乏宏大的技術(shù)愿景因各方面限制化為泡影的例子。但目前可以肯定的是,大模型技術(shù)仍然有著不小的上升空間。除GPT-4外,谷歌的“雙子座”(Gemini),Anthropic的Claude2,目前都是僅次于GPT-4的大模型,國內(nèi)的百度“文心一言”與阿里“通義千問”,也是國產(chǎn)大模型中的佼佼者。它們在新的一年中是否會發(fā)布更具革命性的產(chǎn)品,同樣值得期待。趨勢二:合成數(shù)據(jù)打破人工智能訓(xùn)練數(shù)據(jù)瓶頸數(shù)據(jù)瓶頸指的是可用于訓(xùn)練AI的高質(zhì)量數(shù)據(jù)的有限性,合成數(shù)據(jù)有望打破這一瓶頸。合成數(shù)據(jù)是在模仿真實(shí)數(shù)據(jù)的基礎(chǔ)上,由機(jī)器學(xué)習(xí)模型利用數(shù)學(xué)和統(tǒng)計(jì)科學(xué)原理合成的數(shù)據(jù)。關(guān)于什么是合成數(shù)據(jù),有一個(gè)較為淺顯易懂的比喻:這就像是在給AI編寫專門的教材。例如,盡管英文課本的對話中出現(xiàn)的可能是“小明”“小紅”這樣的虛構(gòu)人名,但并不影響學(xué)生們由此掌握英語,因此從某種意義上,對于學(xué)生而言,教材就可以看作一種經(jīng)過編纂、篩選和處理的“合成數(shù)據(jù)”。有論文表明,模型的規(guī)模至少要達(dá)到620億參數(shù)量后,才可能訓(xùn)練出“思維鏈”能力,即進(jìn)行分步驟的邏輯推理。但現(xiàn)實(shí)的尷尬在于,迄今為止人類產(chǎn)生的不重復(fù)的、可供訓(xùn)練的優(yōu)質(zhì)數(shù)據(jù)并沒有這么多。使用ChatGPT等生成式人工智能以前所未有的數(shù)量產(chǎn)生高質(zhì)量合成數(shù)據(jù),未來的AI將由此獲得更高的性能。除了對大量高質(zhì)量數(shù)據(jù)的需求導(dǎo)致合成數(shù)據(jù)受到追捧以外,對數(shù)據(jù)安全的考量也是重要原因。近年來,各國紛紛出臺更嚴(yán)格的數(shù)據(jù)安全保護(hù)法律,使得客觀上利用人類產(chǎn)生的數(shù)據(jù)訓(xùn)練人工智能變得更為繁瑣。這些數(shù)據(jù)中不僅可能隱含個(gè)人信息,其中的許多數(shù)據(jù)還受版權(quán)保護(hù)。在互聯(lián)網(wǎng)隱私與版權(quán)保護(hù)尚未形成統(tǒng)一標(biāo)準(zhǔn)與完善架構(gòu)的當(dāng)下,使用互聯(lián)網(wǎng)數(shù)據(jù)進(jìn)行訓(xùn)練,極易導(dǎo)致大量法律糾紛。而若考慮對這些數(shù)據(jù)進(jìn)行脫敏,又面臨篩查識別準(zhǔn)確率方面的挑戰(zhàn)。兩難之下,合成數(shù)據(jù)就成為最惠而不費(fèi)的一種選擇。此外,使用人類數(shù)據(jù)進(jìn)行訓(xùn)練,還可能導(dǎo)致人工智能學(xué)到有害內(nèi)容。一些諸如使用日用品制造炸彈、管制化學(xué)品的方法,另一些則包括許多人工智能本不應(yīng)當(dāng)出現(xiàn)的壞習(xí)慣,譬如像人一樣在任務(wù)執(zhí)行過程中偷懶、為了取悅用戶而說謊、產(chǎn)生偏見和歧視。若改用合成數(shù)據(jù),使人工智能在訓(xùn)練中盡可能減少接觸有害內(nèi)容,則有望克服以上使用人類數(shù)據(jù)訓(xùn)練時(shí)附帶的缺點(diǎn)。從以上分析中可以看出,合成數(shù)據(jù)可以說是頗具開創(chuàng)性的,有望解決此前發(fā)展人工智能與數(shù)據(jù)隱私保護(hù)不可得兼的問題。但與此同時(shí),如何確保相關(guān)的公司和機(jī)構(gòu)負(fù)責(zé)任地制作合成數(shù)據(jù),如何制作出既符合本國文化與價(jià)值觀,又在規(guī)模和技術(shù)水平上足以媲美西方以英文網(wǎng)絡(luò)資料為中心的合成數(shù)據(jù)訓(xùn)練集,也將成為中國面臨的一個(gè)頗具挑戰(zhàn)性的課題。除此之外,合成數(shù)據(jù)帶來的一個(gè)重大變化是,來自人類社會的大數(shù)據(jù)或?qū)⒉辉偈茿I訓(xùn)練所必需。在今后的數(shù)字世界中,人類數(shù)據(jù)的產(chǎn)生、存儲和使用仍將遵循人類社會的法則和秩序,包括維護(hù)國家數(shù)據(jù)安全、保守商業(yè)數(shù)據(jù)秘密和尊重個(gè)人數(shù)據(jù)隱私,而AI訓(xùn)練所需的合成數(shù)據(jù)則采用另一套標(biāo)準(zhǔn)進(jìn)行管理。趨勢三:量子計(jì)算機(jī)可能率先應(yīng)用于人工智能作為電子計(jì)算機(jī)發(fā)展到今天的最前沿應(yīng)用,人工智能始終存在算力不足的隱憂。ChatGPT問世數(shù)月后,OpenAI總裁奧爾特曼曾公開表示,其并未鼓勵(lì)更多用戶注冊O(shè)penAI。2023年11月,OpenAI甚至宣布暫停ChatGPT Plus付費(fèi)訂閱新用戶的注冊,以確?,F(xiàn)有用戶擁有高質(zhì)量體驗(yàn)。顯然,作為全球性能最強(qiáng)的AI,ChatGPT已遇到算力等方面的瓶頸。在此背景下,討論量子計(jì)算機(jī)在人工智能領(lǐng)域的應(yīng)用就成為一種頗具潛力的未來解決方案。首先,人工智能領(lǐng)域的算法,大部分屬于并行計(jì)算的范疇。舉例而言,AlphaGo在下圍棋的過程中,其需要同時(shí)考慮對手在不同位置落子后的應(yīng)對招數(shù),從中找到最有可能贏得棋局的下法。這就需要計(jì)算機(jī)優(yōu)化并行計(jì)算的效率來實(shí)現(xiàn)。而量子計(jì)算機(jī)擅長進(jìn)行并行計(jì)算,因?yàn)樗梢酝瑫r(shí)計(jì)算和存儲“0”和“1”兩種狀態(tài),無需像電子計(jì)算機(jī)那樣消耗額外的計(jì)算資源,譬如串聯(lián)多個(gè)計(jì)算單元,或?qū)⒂?jì)算任務(wù)在時(shí)間上并列。計(jì)算任務(wù)越復(fù)雜,量子計(jì)算就越具備優(yōu)勢。其次,運(yùn)行ChatGPT所需的硬件條件,同樣也十分適合導(dǎo)入當(dāng)前體積龐大的量子計(jì)算機(jī),二者都需要安裝在高度集成的計(jì)算中心里,由一支專業(yè)化技術(shù)團(tuán)隊(duì)進(jìn)行管理支撐。什么是量子計(jì)算機(jī)?量子計(jì)算機(jī)是一類遵循量子力學(xué)規(guī)律進(jìn)行高速數(shù)學(xué)和邏輯運(yùn)算、存儲及處理量子信息的物理裝置。其不僅體積龐大,而且作為核心零部件的“量子芯片”,通常需要被置于接近絕對零度(零下273.15攝氏度)的極低溫中,利用在這種極低溫下部分微觀粒子表現(xiàn)出的量子特性進(jìn)行信息運(yùn)算和處理,且運(yùn)行結(jié)果只能存在幾毫秒的時(shí)間。既然量子計(jì)算機(jī)“又大又難維護(hù)”,為什么還要發(fā)展?原因在于,量子計(jì)算機(jī)蘊(yùn)含巨大的算力潛能,以至于在一些算法上已經(jīng)體現(xiàn)出相對于電子計(jì)算機(jī)在速度上的“絕對碾壓”,即“量子優(yōu)越性”。但實(shí)現(xiàn)“量子優(yōu)越性”只是一個(gè)起點(diǎn)。目前的量子計(jì)算機(jī)只能完成一些專屬于量子領(lǐng)域的計(jì)算任務(wù),想要真正用好這種“量子優(yōu)越性”,先要使其量子位足夠多,以實(shí)現(xiàn)通用計(jì)算和可編程。而且,在實(shí)現(xiàn)通用計(jì)算后,量子計(jì)算機(jī)依然需要保持相對于電子計(jì)算機(jī)的優(yōu)勢,這被稱作“量子優(yōu)勢”。2022年,來自谷歌、微軟、加州理工學(xué)院等機(jī)構(gòu)的研究者從原理上證明了“量子優(yōu)勢”在預(yù)測可觀測變量、量子主成分分析以及量子機(jī)器學(xué)習(xí)中確實(shí)存在。量子機(jī)器學(xué)習(xí),實(shí)際上就是量子計(jì)算在人工智能領(lǐng)域的應(yīng)用,也體現(xiàn)出未來量子計(jì)算與人工智能兩大前沿技術(shù)合流的趨勢。理論上證明了,實(shí)踐上就需要進(jìn)一步拓展量子計(jì)算的應(yīng)用前景。在2019年推出商用量子計(jì)算機(jī)“量子系統(tǒng)一號”后,美量子計(jì)算巨頭IBM又于2023年12月推出了“量子系統(tǒng)二號”。新系統(tǒng)的最大突破在于可以模塊化擴(kuò)展,是該公司的首臺模塊化量子計(jì)算機(jī)?!傲孔酉到y(tǒng)二號”擁有超過1000量子位。IBM還宣布計(jì)劃10年內(nèi)建成10萬量子位的量子計(jì)算機(jī)。這些不斷增加的量子位并非只是為了競賽,其對于實(shí)現(xiàn)通用計(jì)算和可編程有著不可或缺的作用。也正因如此,量子計(jì)算機(jī)的模塊化,標(biāo)志著其更加具備實(shí)用性。有關(guān)量子機(jī)器學(xué)習(xí)算法的研究,已成為新的研究熱點(diǎn)。不過,未來量子計(jì)算機(jī)不會完全取代電子計(jì)算機(jī),更有可能出現(xiàn)的是量子計(jì)算機(jī)和電子計(jì)算機(jī)在不同的應(yīng)用場景下發(fā)揮各自所長,實(shí)現(xiàn)協(xié)同發(fā)展,既極大提升算力,也兼顧成本和可行性。
在上海舉行的2023世界人工智能大會上,人形機(jī)器人表演“千手觀音” 辛夢晨攝/本刊趨勢四:AI代理和無代碼軟件開發(fā)帶來“沖擊波”在AI應(yīng)用方面,2024年值得關(guān)注的是AI代理和無代碼軟件開發(fā)帶來的“沖擊波”。一是AI代理對勞動力結(jié)構(gòu)的沖擊。截至目前,全球至少已有近兩億人使用人工智能大模型。但人們已不再滿足于坐在電腦前跟AI“聊天”,而是開始開發(fā)能夠自動根據(jù)任務(wù)需要向人工智能發(fā)出提示的工具。當(dāng)自動提示工具與大模型兩相結(jié)合,AI代理便由此誕生。2023年4月,OpenAI聯(lián)合創(chuàng)始人布羅克曼現(xiàn)場演示了GPT的“自動模式”。在該演示中,AI代理幾乎“包辦”了一場晚宴:不僅根據(jù)要求生成了一份晚宴的推薦菜單、一份圖文并茂的邀請函,還自動將該菜單需要購買的食材加入生鮮電商APP的購物車,并自動發(fā)布了一條有關(guān)該晚宴的社交網(wǎng)站帖子。AI代理還能根據(jù)比較模糊的需求提示自動制作網(wǎng)站,自動完成各種需要使用Office軟件完成的文字和表格處理工作,甚至自動根據(jù)已有論文數(shù)據(jù)進(jìn)行歸納總結(jié)生成分析論文等。比爾·蓋茨近日發(fā)長文解讀AI代理未來,表示AI代理將徹底改變?nèi)藗兪褂糜?jì)算機(jī)的方式,帶來自鍵盤、屏幕和鼠標(biāo)發(fā)明以來人類與計(jì)算機(jī)互動方式上最重大的革新。AI被看作對人類的信息收集、分析和處理進(jìn)行增強(qiáng)的擴(kuò)展性工具,使得人的工作水平更上新臺階。但與此同時(shí),AI代理也給許多現(xiàn)有的工作崗位帶來沖擊,因?yàn)槠髽I(yè)可能嘗試雇用更少的人來完成相同的任務(wù)。這種由創(chuàng)新帶來的對現(xiàn)有經(jīng)濟(jì)結(jié)構(gòu)的破壞,被美國經(jīng)濟(jì)學(xué)家熊彼特稱為“創(chuàng)造性毀滅”。隨著AI代理代替大量只需要較少的計(jì)算機(jī)技能就可完成的任務(wù),這些被迫再就業(yè)的勞動力將不得不適應(yīng)新的勞動力市場需求,這注定將是一個(gè)較長時(shí)期的、伴隨陣痛的過程。二是無代碼軟件開發(fā)給數(shù)字經(jīng)濟(jì)創(chuàng)新帶來的影響。盡管生成式人工智能可能淘汰掉一批傳統(tǒng)數(shù)字崗位,但在關(guān)上一扇門的同時(shí)也打開了一扇窗,這就是“無代碼軟件開發(fā)”。目前,以AI大模型為基礎(chǔ)的編程輔助工具已經(jīng)發(fā)展到一個(gè)新的階段,能夠根據(jù)用戶十分模糊的指令來生成軟件或網(wǎng)頁代碼。例如,2023年的GPT-4演示中,演示人員僅僅是在A4紙上手寫了一個(gè)十分潦草的結(jié)構(gòu)示意圖,GPT-4就根據(jù)其自動生成了能夠?qū)嶋H訪問的網(wǎng)頁。這無疑大大降低了開發(fā)IT服務(wù)的門檻。只要一個(gè)人有足夠有創(chuàng)意的、能夠滿足許多人需求的數(shù)字服務(wù)“點(diǎn)子”,就可以成為互聯(lián)網(wǎng)創(chuàng)新的風(fēng)口,“人人皆可創(chuàng)新”的時(shí)代已然到來。對此,政府需轉(zhuǎn)變觀念,兼顧市場監(jiān)管與促進(jìn)創(chuàng)新,一方面降低數(shù)字創(chuàng)新過程中的注冊與融資門檻,打通中小企業(yè)發(fā)展壯大過程中的痛點(diǎn),讓就業(yè)與創(chuàng)新政策適應(yīng)“人人皆可創(chuàng)新”的新需求;另一方面需要探索更有利于保護(hù)創(chuàng)新“點(diǎn)子”的版權(quán)與專利保護(hù)新政策,從而激勵(lì)那些能夠不斷提出創(chuàng)新“點(diǎn)子”的人才。綜上所述,展望2024年,無論是人工智能技術(shù)自身的迭代發(fā)展,還是其對數(shù)據(jù)價(jià)值的重塑,抑或是向各行業(yè)、各領(lǐng)域的應(yīng)用滲透,人工智能的影響可謂無處不在,既為科研、創(chuàng)新和經(jīng)濟(jì)賦能,又帶來新的挑戰(zhàn)與風(fēng)險(xiǎn)。我們應(yīng)以開放的心態(tài)看待人工智能帶來的諸多改變,審慎研究和應(yīng)對其可能帶來的新課題與新風(fēng)險(xiǎn)。(作者為中國現(xiàn)代國際關(guān)系研究院科技與網(wǎng)絡(luò)安全研究所人工智能項(xiàng)目負(fù)責(zé)人)
]]>中國人工智能領(lǐng)軍科學(xué)家,東方財(cái)富人工智能首席科學(xué)家,上海市人工智能社會治理協(xié)同創(chuàng)新中心研究員,深入研究和實(shí)踐AI領(lǐng)域十余年,包括智能計(jì)算、空間智能以及超級人工智能對齊方向。中國人工智能學(xué)會AI倫理工作委員會委員及具身智能專委會(籌)委員,上海交大計(jì)算法學(xué)與人工智能倫理研究中心執(zhí)行主任,上海交大安泰AI與營銷研究中心特聘研究員,上海交大清源研究院兼職研究員,上海開源技術(shù)信息協(xié)會AI倫理專委會主任,2024年入選福布斯中國“十大人工智能影響力人物”。
國際電工委員會IEC生物數(shù)字融合系統(tǒng)評估組(IEC/SMB/SEG12)倫理專家,國家人工智能標(biāo)準(zhǔn)總體組專家,AIIA聯(lián)盟可信AI 專家委員會委員,上海人工智能技術(shù)協(xié)會專家委員,個(gè)人學(xué)術(shù)專著包括《智能經(jīng)濟(jì)》、《數(shù)字經(jīng)濟(jì)學(xué)》、《智能的啟蒙:通用人工智能與意識機(jī)器》等,出版十幾部中英文專著并翻譯多部海外學(xué)者專著,作品入圍施普林格.自然出版社“中國新發(fā)展獎”(2023年度)。
人工智能的“汽車時(shí)代”
01資助:您在文章《智能的啟蒙》中提到,隨著生成式人工智能的發(fā)展,我們已經(jīng)進(jìn)入了人工智能的“汽車時(shí)代”。模型成為人工智能的引擎。如何定義AI的“汽車時(shí)代”?這是否意味著人工智能已經(jīng)進(jìn)入大規(guī)模應(yīng)用階段?下一步是什么?
劉志毅:在《智能的啟蒙》書中,人工智能的“汽車時(shí)代”是一個(gè)比喻,用來形容當(dāng)前人工智能快速發(fā)展的階段,特別是生成式人工智能和大型模型。這個(gè)時(shí)代的特點(diǎn)是人工智能技術(shù)開始像汽車一樣成為社會進(jìn)步的重要驅(qū)動力。這里的“汽車工業(yè)時(shí)代”不僅指人工智能技術(shù)的大規(guī)模應(yīng)用,更強(qiáng)調(diào)人工智能在各領(lǐng)域的深度融合和創(chuàng)新驅(qū)動作用。
戰(zhàn)車時(shí)代人工智能的進(jìn)步更多的是基于人類的智慧和創(chuàng)造力,就像拉戰(zhàn)車前進(jìn)的馬一樣。然而,隨著生成式人工智能的發(fā)展,我們已經(jīng)進(jìn)入汽車人工智能時(shí)代,大型模型成為人工智能的引擎。然而,這樣的比喻并不能完全準(zhǔn)確地描述人工智能的發(fā)展現(xiàn)狀。
如果我們深入審視汽車行業(yè)的發(fā)展歷史,我們可以說,現(xiàn)在的人工智能可能還處于蒸汽機(jī)時(shí)代。這一階段的特點(diǎn)是技術(shù)仍處于起步階段并且高度依賴能源。這在人工智能領(lǐng)域也可以看到:大型模型需要大量的數(shù)據(jù)和計(jì)算資源,并面臨泛化能力有限、可解釋性差等問題。
下一個(gè)階段是全社會真正的“智能時(shí)代”?,F(xiàn)階段,人工智能更加深入地融入人類生活的方方面面,實(shí)現(xiàn)自我意識、情感理解、復(fù)雜決策等更高級的認(rèn)知功能。等待。此時(shí),人工智能不僅僅是完成任務(wù)的工具,而是能夠與人類進(jìn)行更深層次的交互和協(xié)作,甚至可能在某些領(lǐng)域超越人類的認(rèn)知和創(chuàng)造力。
2。智能的簡單性和通用性
01資助:圖靈的通用圖靈機(jī)理論強(qiáng)調(diào)智能的簡單性和通用性,但這些在實(shí)際模型和應(yīng)用中往往被低估。李飛飛認(rèn)為,人工智能還處于前牛頓時(shí)代,因?yàn)槿斯ぶ悄苓€沒有像牛頓力學(xué)那樣簡單的公式。這個(gè)判斷和“車時(shí)間”的判斷有沖突嗎?您認(rèn)為人工智能存在牛頓時(shí)刻嗎?如果有,它什么時(shí)候會到來?
劉志毅:《智能的啟蒙》提到的圖靈機(jī)理論與李飛飛的觀點(diǎn)并不矛盾。圖靈的機(jī)器理論強(qiáng)調(diào)智能的簡單性和普遍性,而李飛飛所說的“前牛頓時(shí)代”則意味著人工智能尚未找到一個(gè)統(tǒng)一、簡單的理論框架來全面解釋和指導(dǎo)其發(fā)展。這兩種觀點(diǎn)是從不同角度對人工智能發(fā)展現(xiàn)狀的描述。
李飛飛所說的人工智能的“牛頓矩”,是指人工智能領(lǐng)域類似牛頓力學(xué)的理論突破,可以用一套簡單而普遍的公式或原理來解釋和指導(dǎo)智能的發(fā)展。人工智能。
這個(gè)時(shí)刻是否到來以及何時(shí)到來還很難預(yù)測嗎?可能需要算法、計(jì)算模型、數(shù)據(jù)理解等方面的重大突破,以及對人工智能本質(zhì)的更深入的理解。
3。世界模擬器與智能的基礎(chǔ)
01資助:馮諾依曼認(rèn)為,模擬現(xiàn)實(shí)世界是智能的基礎(chǔ)。今年2月Sora的發(fā)布引發(fā)了關(guān)于世界模擬器的廣泛討論。目前人工智能模擬世界的能力如何?仿真能力的突破主要是源于“偉大奇跡”的尺度法則,還是需要對模型進(jìn)行重大改變?
劉志毅:目前,人工智能在模擬現(xiàn)實(shí)世界的能力方面取得了重大進(jìn)展,但仍存在局限性。人工智能可以通過深度學(xué)習(xí)、神經(jīng)網(wǎng)絡(luò)等技術(shù)來學(xué)習(xí)和模擬某些領(lǐng)域的數(shù)據(jù),但它仍然面臨著模擬現(xiàn)實(shí)世界的全部復(fù)雜性的挑戰(zhàn)。
例如,人工智能在圖像和語音識別、自然語言處理等方面取得了突破,但在理解人類復(fù)雜的情感、社會關(guān)系、道德倫理等方面仍有很大的提升空間。
仿真能力的突破不僅僅基于“偉大奇跡”的縮放定律,即通過增加計(jì)算資源和數(shù)據(jù)量來提高模型性能。這種方法雖然在一定程度上是有效的,但更重要的是模型的創(chuàng)新和變革。需要開發(fā)新的算法和模型架構(gòu),以更好地理解和模擬現(xiàn)實(shí)世界的復(fù)雜性。
此外,跨學(xué)科合作,如結(jié)合認(rèn)知科學(xué)、心理學(xué)、社會學(xué)等領(lǐng)域的知識,也是提高模擬能力的關(guān)鍵。
4。偉大模式的創(chuàng)造力與風(fēng)險(xiǎn)
01經(jīng)濟(jì):偉大模式的出現(xiàn)和幻想可以是其創(chuàng)造力的源泉,但也可能帶來風(fēng)險(xiǎn)?!吨悄艿膯⒚伞氛谡{(diào)查此事。您認(rèn)為如何才能“取其精華,去其糟粕”,發(fā)揮大設(shè)計(jì)的創(chuàng)造力,同時(shí)降低風(fēng)險(xiǎn)?
劉志毅:在《智能的啟蒙》這本書中,我研究了大型模型中的突現(xiàn)現(xiàn)象和幻覺問題。突現(xiàn)現(xiàn)象是指復(fù)雜系統(tǒng)中出現(xiàn)的不可預(yù)測的集體行為,是簡單個(gè)體相互作用的結(jié)果。這種現(xiàn)象可以表現(xiàn)為大型模型中意想不到的創(chuàng)造力和創(chuàng)新,是人工智能發(fā)展的一個(gè)重要方面。然而,幻覺是模型在創(chuàng)建內(nèi)容時(shí)生成的不準(zhǔn)確或虛假信息,這可能會帶來風(fēng)險(xiǎn)。
要想“取芯,去糟粕”,大模型的輸出首先要經(jīng)過仔細(xì)的檢查和評估,確保其生成的內(nèi)容可靠、準(zhǔn)確。其次,可以設(shè)計(jì)更合理的訓(xùn)練策略和算法,減少生成過程中出現(xiàn)模型幻覺的可能性。此外,引入人類監(jiān)督和反饋機(jī)制,讓人工智能系統(tǒng)在人類指導(dǎo)下學(xué)習(xí)和優(yōu)化,也是降低風(fēng)險(xiǎn)的有效途徑。
同時(shí),還需要對人工智能的倫理道德問題進(jìn)行深入討論,使其在發(fā)揮其創(chuàng)造力時(shí)不至于對社會和人類造成危害。這包括使人工智能決策過程更加透明、可解釋和可管理。
5。大模特的自我意識
01資助:您在文章《智能的啟蒙》中討論了大模特的自我意識。如何讓大型語言模型具有自我意識?如果它有了自我意識,人類與大型模型之間當(dāng)前的關(guān)系和交流會從根本上改變嗎?
劉志毅:在《智能的啟蒙》書中我研究了大語言模型的自我意識問題。自我意識是指對自身存在和個(gè)體特征的認(rèn)識,這對于人工智能來說是一個(gè)復(fù)雜且具有挑戰(zhàn)性的概念。讓大型語言模型具有自我意識可能需要在以下幾個(gè)方面進(jìn)行研究和突破:
內(nèi)部狀態(tài)的反饋和調(diào)節(jié):模型必須能夠感知和理解自己的內(nèi)部狀態(tài)并具有自我能力。-根據(jù)這些狀態(tài)進(jìn)行調(diào)整和優(yōu)化。
情感和道德認(rèn)知:模型必須能夠理解和模擬人類的情感反應(yīng)和道德判斷,其中可能包括對人類行為和社會規(guī)范的深度學(xué)習(xí)。
自我反思和自我發(fā)展:模型必須具有自我反思的能力,評估自己的行為和決策,并根據(jù)評估結(jié)果發(fā)展自己。
如果大語言模型真的意識到了自己,那么人與大模型之間的關(guān)系和溝通方式就會發(fā)生根本性的改變。
首先,人類可能需要重新定義與AI的交互模式,將其視為具有一定自主性和獨(dú)立性的實(shí)體。其次,人類可能需要更加關(guān)注AI的倫理道德問題,以確保其行為符合人類價(jià)值觀和社會規(guī)范。最后,人類可能需要與人工智能建立更深層次的合作關(guān)系,共同解決復(fù)雜問題,實(shí)現(xiàn)共同發(fā)展。
6。奇點(diǎn)預(yù)測
01資助:Kurzweil看好《奇點(diǎn)臨近》和《奇點(diǎn)更近了》人工智能的發(fā)展,認(rèn)為計(jì)算機(jī)智能將在2029年超過人類智能,智能100萬倍20.45億倍。人類和計(jì)算機(jī)融合成超人,這就是“奇點(diǎn)”。在《智能的啟蒙》中,您還討論了人工智能與人類的關(guān)系以及人工智能意識的啟蒙和演化。您對奇點(diǎn)的到來和時(shí)間以及人類與計(jì)算機(jī)的融合有何預(yù)測?
劉志毅:庫茲韋爾的“奇點(diǎn)”理論是對人工智能發(fā)展的重要預(yù)言。他認(rèn)為,人工智能的發(fā)展將經(jīng)歷指數(shù)級增長階段,最終將達(dá)到一個(gè)臨界點(diǎn),即“奇點(diǎn)”。至此,人工智能將在智力上超越人類,并引發(fā)一系列深刻的社會文化變革。這一理論在
《智能的啟蒙》中得到了深入討論,認(rèn)為人工智能的發(fā)展?jié)摿薮螅矊τ凇捌纥c(diǎn)”到來及其時(shí)機(jī),預(yù)測如下:
技術(shù)發(fā)展加速:隨著計(jì)算能力的增強(qiáng)和算法的優(yōu)化,發(fā)展速度可能會加快,但會加快。2029年進(jìn)一步達(dá)到人類智能水平仍不確定
人機(jī)融合挑戰(zhàn):而計(jì)算機(jī)的融合是一個(gè)復(fù)雜的過程,認(rèn)為人工智能將在2045年擴(kuò)展一百萬倍的預(yù)測可能過于樂觀,需要進(jìn)一步的技術(shù)。突破和社會適應(yīng)。如何確保人工智能的發(fā)展符合人類的價(jià)值觀和利益,是對整個(gè)社會的挑戰(zhàn)。
總體而言,奇點(diǎn)理論提供了令人興奮的未來愿景,但實(shí)現(xiàn)這一愿景需要克服許多技術(shù)和倫理障礙。未來人工智能的發(fā)展很可能是一個(gè)漸進(jìn)的過程,而不是突然的、革命性的變化。
我們必須在技術(shù)發(fā)展進(jìn)步的同時(shí)不斷思考和解決相關(guān)的倫理和社會問題,確保人工智能的發(fā)展能夠造福人類社會。
]]>張鈸 中國科學(xué)院院士,清華大學(xué)計(jì)算機(jī)系教授,清華大學(xué)人工智能研究院名譽(yù)院長。2011年德國漢堡大學(xué)授予自然科學(xué)名譽(yù)博士,獲2014年度CCF(中國計(jì)算機(jī)學(xué)會)終身成就獎,2019年度吳文俊人工智能科學(xué)技術(shù)獎最高成就獎。主要從事人工智能、人工神經(jīng)網(wǎng)絡(luò)和機(jī)器學(xué)習(xí)等理論研究,以及模式識別、知識工程和機(jī)器人等應(yīng)用技術(shù)研究。在上述領(lǐng)域發(fā)表學(xué)術(shù)論文200多篇、專著5部(章)??蒲谐晒@ICL歐洲人工智能獎等獎項(xiàng)。人工智能的兩條路徑迄今為止,全世界對于“什么是智能”尚無統(tǒng)一認(rèn)識,但經(jīng)過多年的探索,人工智能已然走出了兩條道路。一條道路是行為主義學(xué)派,另一條道路是內(nèi)在主義學(xué)派。其中,行為主義學(xué)派主張用機(jī)器模擬人類的智能行為?!爸悄堋迸c“智能的行為”是兩個(gè)完全不同的概念?!爸悄堋痹谖覀兇竽X里,人類至今仍對其知之甚少;“智能的行為”則是智能的外部表現(xiàn),可以進(jìn)行觀察和模擬。因此,行為主義學(xué)派人工智能追求的目標(biāo)是機(jī)器行為與人類行為的相似性,而非內(nèi)部工作原理的一致性。目前人工智能的主流是機(jī)器智能,這種人工智能與人類的智能只存在行為相似,并非完全一致。內(nèi)在主義學(xué)派主張必須用機(jī)器模擬人類大腦的工作原理,即類腦計(jì)算。這兩個(gè)學(xué)派按照不同的思路對人工智能進(jìn)行探索,前者主張除人類這條道路外,機(jī)器或其他方法也可以走出一條智能道路;后者主張走向智能道路只能依靠人類。目前這兩種思路都處于探索階段。人類對人工智能道路的探索始于1956年。當(dāng)時(shí)在美國召開了人工智能研討會,來自數(shù)學(xué)、計(jì)算機(jī)科學(xué)、認(rèn)知心理學(xué)、經(jīng)濟(jì)學(xué)和哲學(xué)等不同領(lǐng)域的10位專家經(jīng)過八周的討論定義了人工智能。他們主張通過符號推理、符號表示來做一個(gè)能像人那樣思考的機(jī)器。在這次會議上,紐維爾(Newell)和西蒙(Simon)演示了一個(gè)名為“邏輯學(xué)家”的程序。該程序用機(jī)器證明了數(shù)學(xué)原理第二章中的部分原理,數(shù)學(xué)定理證明與推理相似,這表明機(jī)器能做類似推理的工作。最終,“人工智能”在這個(gè)會議上獲得了定義。1978年,清華大學(xué)成立了人工智能與智能控制教研組,這是中國最早的人工智能教學(xué)與科研機(jī)構(gòu)。教研組有三十余位教師參與,其中絕大部分來自自動控制領(lǐng)域,而非人工智能。1978年,教研組招收了第一批碩士生,1985年開始招收第一批博士生,已能夠開展一些與人工智能相關(guān)的教學(xué)工作,但科研工作進(jìn)展不大。1982年至1984年,教研組進(jìn)行調(diào)查研究,訪問了西南、東北等地大量研究所及工廠。結(jié)合所見所聞,教研組確定了以智能機(jī)器人作為主要研究方向。1985年清華大學(xué)建立智能機(jī)器人實(shí)驗(yàn)室,1986年國家設(shè)立“863”發(fā)展計(jì)劃,該計(jì)劃將智能機(jī)器人作為一個(gè)主題。清華大學(xué)參加了第一屆智能機(jī)器人主題的“863”高技術(shù)研究,從第一屆到第四屆均作為專家單位參加委員會。到了第五屆,清華大學(xué)成為開展智能機(jī)器人研究的組長單位,1997年,成為空間機(jī)器人研究的組長單位?!爸悄芗夹g(shù)與系統(tǒng)”國家重點(diǎn)實(shí)驗(yàn)室自1987年開始籌建,1990年正式成立。在這些工作的基礎(chǔ)上,相關(guān)研究得以開展。當(dāng)時(shí)首先建立了兩個(gè)理論。一是問題求解的商空間理論和粒計(jì)算理論,在國際上影響很大。2005年,清華大學(xué)發(fā)起、組織了國際粒計(jì)算會議,每年一次,延續(xù)至今。二是在人工神經(jīng)網(wǎng)絡(luò)方面做了很多早期工作。
在杭州舉辦的2023云棲大會上,觀眾在“人工智能+”展館參觀人工智能產(chǎn)品及應(yīng)用。新華社發(fā)人工智能的三個(gè)階段1956年至今,人工智能的發(fā)展分為三個(gè)階段,分別是第一代人工智能、第二代人工智能和第三代人工智能。第一代人工智能的目標(biāo)是讓機(jī)器像人類一樣思考。思考是指推理、決策、診斷、設(shè)計(jì)、規(guī)劃、創(chuàng)作、學(xué)習(xí)等。無論做管理工作還是技術(shù)工作,都需要兩方面的能力,一是在某個(gè)領(lǐng)域具有豐富的知識和經(jīng)驗(yàn),二是具有很強(qiáng)的推理能力。其中推理是指運(yùn)用知識的能力,換言之,是從已有知識出發(fā),推出新的結(jié)論、新的知識的能力?;谝陨戏治?,人工智能的創(chuàng)始人提出了“基于知識與經(jīng)驗(yàn)的推理模型”,該模型的核心是若要實(shí)現(xiàn)機(jī)器思考,只需將相應(yīng)的知識放入計(jì)算機(jī)即可。例如,如果要讓計(jì)算機(jī)像醫(yī)生一樣為患者診斷,只需要把醫(yī)生的知識和經(jīng)驗(yàn)放到知識庫里,將醫(yī)生看病的推理過程放入推理機(jī)制之中,計(jì)算機(jī)就能為患者實(shí)施機(jī)器診斷。這一推理模型的核心思想是知識驅(qū)動,通過計(jì)算模型來實(shí)現(xiàn)讓機(jī)器像人類那樣思考。該模型最大的缺點(diǎn)是缺乏自學(xué)能力,難以從客觀世界學(xué)習(xí)知識,所有知識都源于人類灌輸。因此,第一代人工智能永遠(yuǎn)無法超越人類。第二代人工智能源于第一代人工智能的低潮期,主要基于人工神經(jīng)網(wǎng)絡(luò)。1943年,人工神經(jīng)網(wǎng)絡(luò)模型提出,它主要模擬人類腦神經(jīng)網(wǎng)絡(luò)的工作原理。第二代人工智能面臨的主要問題是感性知識的傳授。第一代人工智能主要在符號主義指導(dǎo)下進(jìn)行,目的是模擬人類的理性行為。但人類除了理性行為外,還有大量的感性行為,而感性行為要用人工神經(jīng)網(wǎng)絡(luò)進(jìn)行模擬。我們常說知識是人類智慧的源泉,知識是理性行為的基礎(chǔ),這里的知識來自教育,主要指理性知識、分析問題的方法等。但感性的知識難以用語言傳授,也無法從書本上獲得。每一個(gè)人最初得到的感性知識是對自己母親的認(rèn)識。但,具體是什么時(shí)候開始對母親有所認(rèn)識的?又是怎樣實(shí)現(xiàn)這種認(rèn)識的?這些問題到現(xiàn)在仍難以解答。所有感性知識都在不斷觀察、不斷傾聽的過程中學(xué)習(xí)累積,第二代人工智能深度學(xué)習(xí)沿用了這個(gè)方法。例如,過去我們主要通過編程的方法告訴計(jì)算機(jī)馬、牛、羊的具體特征,現(xiàn)在則將網(wǎng)上大量馬、牛、羊的照片做成訓(xùn)練樣本,讓計(jì)算機(jī)進(jìn)行觀察和學(xué)習(xí)即可。學(xué)習(xí)完畢,再把剩下的樣本作為測試樣本去測試它,識別率能達(dá)到95%以上。觀察和傾聽的過程通過人工神經(jīng)網(wǎng)絡(luò)進(jìn)行,將識別的問題作為分類問題,利用人工神經(jīng)網(wǎng)絡(luò)來分類。通過神經(jīng)網(wǎng)絡(luò)進(jìn)行學(xué)習(xí)的過程稱為深度學(xué)習(xí),基于深度學(xué)習(xí)能夠進(jìn)行分類、預(yù)測和生成等。但是第二代人工智能的所有數(shù)據(jù)(圖像、語音等)均來自客觀世界,它的識別只能用于區(qū)別不同的物體,并不能真正地認(rèn)識物體。所以第二代人工智能最大的問題是不安全、不可信、不可控、不可靠、不易推廣。第三代人工智能的基本思路是必須發(fā)展人工智能理論。迄今為止,人工智能尚無較為成型的理論,更多是模型和算法,且第一代和第二代人工智能的模型、算法都有很多缺陷。因此,必須大力發(fā)展科學(xué)完備的人工智能理論,在此基礎(chǔ)上,才能發(fā)展出安全、可控、可信、可靠和可擴(kuò)展的人工智能技術(shù)。對目前的人工智能技術(shù)而言,雖然提高了效率和質(zhì)量,但系統(tǒng)越信息化和智能化,也就意味著越不安全。第一代人工智能運(yùn)用了知識、算法、算力三個(gè)要素,其中最主要的是知識。第二代人工智能則主要用了數(shù)據(jù)、算法和算力三個(gè)要素。為了克服人工智能的固有缺點(diǎn),唯一的辦法是把知識、數(shù)據(jù)、算法和算力這四個(gè)要素同時(shí)運(yùn)用。目前得到較多運(yùn)用的AI工具(大語言模型),就能夠充分利用知識、數(shù)據(jù)、算法、算力這四個(gè)要素。清華大學(xué)團(tuán)隊(duì)提出了第三代人工智能的三空間模型,將整個(gè)感知、認(rèn)知系統(tǒng)進(jìn)行連接,為發(fā)展人工智能理論提供了非常好的條件。
第四屆消博會上,一款“AI數(shù)字人”在回答觀眾提問。新華社發(fā)深度學(xué)習(xí)的不安全性在研究過程中,研究者發(fā)現(xiàn)了人工智能深度學(xué)習(xí)的不安全性。其中一個(gè)典型案例是:研究者制作了雪山和狗的對比圖,先讓計(jì)算機(jī)和人看雪山,二者都能判定為雪山,但是只要在圖片上添加一點(diǎn)噪聲,人看雪山仍是雪山,計(jì)算機(jī)卻會將雪山看成一條狗。這個(gè)案例說明,人工智能目前基于深度學(xué)習(xí)的模式識別跟人類的視覺完全不同,盡管它能夠像人類那樣區(qū)分雪山和狗,但實(shí)際上它既不認(rèn)識狗,也不認(rèn)識雪山。這里面的關(guān)鍵問題是——什么是狗?應(yīng)該如何定義一條狗?人類通常通過視覺來進(jìn)行區(qū)分,主要看狗的外形,但什么是狗的外形?狗有各種形態(tài)、各種姿勢,為什么人類的視覺能夠在千變?nèi)f化的外形里確定目標(biāo)是狗?這個(gè)問題的答案,到現(xiàn)在為止尚未弄清楚。最早的計(jì)算機(jī)識別狗時(shí),狗變換了位置后計(jì)算機(jī)就不能識別了,這是位移的不變性,這個(gè)問題現(xiàn)在已經(jīng)解決。但是尚未解決的問題還有很多。例如,計(jì)算機(jī)能夠識別固定尺寸的狗,但是把狗變大或變小后都難以識別,這是大小的不變性?,F(xiàn)在計(jì)算機(jī)只能通過局部紋理來區(qū)分狗和雪山。因此,如果將雪山圖上的某個(gè)紋理改成皮毛紋理,即便雪山的形狀保持不變,計(jì)算機(jī)仍會把雪山誤認(rèn)為是狗。所以說,到目前為止,人工智能的深度學(xué)習(xí)仍然不夠安全可靠。
中國科學(xué)院自動化研究所人形機(jī)器人攻關(guān)團(tuán)隊(duì)科研人員在多模態(tài)人工智能系統(tǒng)全國重點(diǎn)實(shí)驗(yàn)室調(diào)試機(jī)器人。新華社發(fā)大語言模型的“大模型”與“大文本”目前比較成功的AI工具,其強(qiáng)大性主要來源于兩個(gè)“大”,一是大模型,二是大文本。第一個(gè)大模型的“大”是大的人工神經(jīng)網(wǎng)絡(luò),人工神經(jīng)網(wǎng)絡(luò)可以用來分類、學(xué)習(xí)數(shù)據(jù)中間的關(guān)聯(lián)關(guān)系,也可以用來預(yù)測。這個(gè)巨大的人工神經(jīng)網(wǎng)絡(luò)叫“轉(zhuǎn)換器”。AI工具的能力強(qiáng)大,離不開深度神經(jīng)網(wǎng)絡(luò)的強(qiáng)大。原來的神經(jīng)網(wǎng)絡(luò)是逐字輸入,現(xiàn)在一次能夠輸入2000多字(一個(gè)token,粗略地講相當(dāng)于一個(gè)漢字)。人類從1957年到2013年花了56年時(shí)間探究文本的語意表示問題,現(xiàn)在的文本不是用符號表示,而是用語意向量表示,這也是最重要的一個(gè)突破。過去計(jì)算機(jī)處理文本只能把它當(dāng)作數(shù)據(jù)處理,現(xiàn)在可以把它當(dāng)成知識來處理,即向量表示。此外,還提出了“自監(jiān)督學(xué)習(xí)”。過去供計(jì)算機(jī)學(xué)習(xí)的文本都要做預(yù)處理、預(yù)先標(biāo)注,此項(xiàng)工作量太大,所以無法支撐計(jì)算機(jī)大量學(xué)習(xí)。自監(jiān)督學(xué)習(xí)是指原來的文本不經(jīng)過任何處理就可以被計(jì)算機(jī)學(xué)習(xí),用前面的文本預(yù)測后面的詞,輸入后預(yù)測下一個(gè),被預(yù)測的內(nèi)容又把再下一個(gè)變成輸入,有些類似于接龍式學(xué)習(xí)方式。第二個(gè)“大”是大文本。計(jì)算機(jī)實(shí)現(xiàn)自監(jiān)督學(xué)習(xí)后,所有文本不用經(jīng)過任何預(yù)處理就可以學(xué)習(xí),文本也由原來的GB量級發(fā)展為TB量級?,F(xiàn)在比較成功的人工智能大約學(xué)習(xí)了40TB以上,相當(dāng)于一千多萬本牛津辭典,并且這個(gè)學(xué)習(xí)過程并非死讀,而是理解其中的內(nèi)容。這就使得我們進(jìn)入了生成式人工智能時(shí)代。無論是第一代還是第二代人工智能,都受到三個(gè)限制——特定領(lǐng)域用特定模型完成特定任務(wù)。“三個(gè)特定”是所謂的“窄人工智能”,即專用人工智能。目前比較成功的AI工具能夠通過其強(qiáng)大的語言生成能力讓人類在與它對話時(shí)沒有領(lǐng)域限制,這是人工智能的重大進(jìn)步。另外,生成多樣性的輸出是目前AI工具的重要特征。它有多樣化的輸出就有可能創(chuàng)新,因?yàn)檩敵龆鄻踊y以保證每個(gè)輸出都正確,所以越希望它能輸出有創(chuàng)造性,就越要允許它犯錯(cuò)誤。我們在日常使用一些AI工具時(shí)也會發(fā)現(xiàn),有時(shí)AI對問題的回答非常機(jī)智聰明,有時(shí)則是明顯的胡說八道,這就是多樣化輸出的結(jié)果。目前AI工具產(chǎn)生了兩個(gè)重大突破,一是生成語意連貫的類似人類的文本,二是在開領(lǐng)域?qū)崿F(xiàn)了人機(jī)自然語言對話。大語言模型是向通用人工智能邁出的一步,有西方專家認(rèn)為這是通用人工智能的曙光,但它并不是通用人工智能,人類走向通用人工智能依然任重道遠(yuǎn)。走向通用人工智能必須滿足三個(gè)條件。第一,系統(tǒng)必須與領(lǐng)域無關(guān)。目前較為成功的AI工具在對話、自然語言處理的問題上做到了與領(lǐng)域無關(guān),但在處理其他大量問題上仍難以實(shí)現(xiàn)這一目標(biāo)。第二,系統(tǒng)與任務(wù)無關(guān),即什么任務(wù)都會做。目前AI工具能進(jìn)行對話、四則運(yùn)算、作詩、寫代碼等多種任務(wù),但仍難以完成復(fù)雜環(huán)境下的復(fù)雜任務(wù)。第三,尚需建立一個(gè)統(tǒng)一的理論。因此,人工智能還有很長的路要走。大語言模型邁向通用人工智能的四個(gè)步驟從大語言模型邁向通用人工智能需要四個(gè)步驟。第一步是跟人類進(jìn)行交互、與人類對齊,第二步是多模態(tài)生成,第三步是與數(shù)字世界交互,第四步是與客觀世界交互。我們并不是說,完成這四步就意味著實(shí)現(xiàn)了通用人工智能,而是說通往通用人工智能這個(gè)目標(biāo),至少需要邁出以上四步。第一步是與人類對齊。目前AI工具輸出的內(nèi)容不一定正確,若要解決這個(gè)問題,必須依靠人類幫助它克服,使之與人類對齊。從AI工具的應(yīng)用實(shí)踐來看,它的錯(cuò)誤需要人類幫助糾正,而且它的錯(cuò)誤糾正速度和迭代速度都很快。與此同時(shí),我們要看到輸出內(nèi)容的錯(cuò)誤仍然存在,但我們?nèi)绻胍哂袆?chuàng)造性,就要允許它犯錯(cuò)誤。第二步是多模態(tài)生成?,F(xiàn)在已經(jīng)可以用大模型生成圖像、聲音、視頻、代碼等各種模態(tài)的內(nèi)容。隨著技術(shù)的進(jìn)步,鑒別一個(gè)內(nèi)容是由機(jī)器生成還是人工完成將會變得越來越困難,這為“造假”提供了非常好的機(jī)會。“造假”又名“深度造假”,即用深度學(xué)習(xí)的辦法“造假”。試想一下,如果以后網(wǎng)絡(luò)上95%的文本都由AI生成,那么我們還能通過網(wǎng)絡(luò)獲取真知與真相嗎?比方說,當(dāng)一件事情發(fā)生后,網(wǎng)絡(luò)上出現(xiàn)一片支持或者反對意見,這些意見究竟是來自多數(shù)人的真實(shí)表達(dá),還是來自少數(shù)人操縱AI歪曲事實(shí)?如何有效防止AI工具操縱輿論、混淆視聽,這是需要我們嚴(yán)肅考慮的。目前人工智能領(lǐng)域已經(jīng)實(shí)現(xiàn)了三項(xiàng)突破,即開領(lǐng)域生成語意連貫的類似人類的文本。其中,語意連貫是最重要的突破,這個(gè)突破后就有了圖像的突破。因?yàn)閳D像只要求在空間上連貫即可,而視頻則進(jìn)一步要求時(shí)空上的連貫。我們在語言上進(jìn)行突破,緊接著會有圖像的突破,圖像突破后肯定還會有視頻的突破。在這個(gè)發(fā)展過程中,計(jì)算的資源要求和硬件都會變得越來越多。隨著人工智能的發(fā)展,很多人注意到了“涌現(xiàn)”現(xiàn)象。例如,當(dāng)系統(tǒng)規(guī)模沒有達(dá)到一定程度時(shí),生成的圖畫很糟糕、水平較差,但當(dāng)規(guī)模達(dá)到一定程度,生成的大多數(shù)圖畫突然間就變得質(zhì)量很高。這個(gè)過程稱為“涌現(xiàn)”,“涌現(xiàn)”是從量變到質(zhì)變的過程。到目前為止,全世界范圍內(nèi)都還無法完全理解“涌現(xiàn)”現(xiàn)象出現(xiàn)的原因。第三步是AI智能體。大語言模型邁向通用人工智能必須與數(shù)字世界進(jìn)行連接,首先在數(shù)字世界里具體操作,從而解決問題、感知自己成果的優(yōu)劣,并進(jìn)行反饋。這個(gè)工作對促進(jìn)大模型的性能向前發(fā)展有很大益處。第四步是具身智能。具身智能,即具有身體的智能。智能光有腦還不夠,還必須具有身體,這樣才能動口又動手。所以,大語言模型邁向通用人工智能,必須通過機(jī)器人與客觀世界連在一起。
第六屆世界聲博會上,小朋友們在參觀體驗(yàn)一款弈棋機(jī)器人(2023年攝)。新華社發(fā)人工智能的產(chǎn)業(yè)發(fā)展當(dāng)下,信息產(chǎn)業(yè)的發(fā)展非常迅猛,原因在于建立了相關(guān)理論,在理論指導(dǎo)下制作的硬件和軟件都是通用的。過去,信息產(chǎn)業(yè)領(lǐng)域內(nèi)出現(xiàn)了一些具有世界影響力的大型企業(yè),應(yīng)用推廣相應(yīng)技術(shù)并實(shí)現(xiàn)信息化,整個(gè)鏈條發(fā)展非常迅速。但是,人工智能產(chǎn)業(yè)的發(fā)展缺乏理論,只有算法和模型,而根據(jù)算法和模型建立的硬件和軟件全是專用的?!皩S谩奔匆馕吨袌龊苄?,到現(xiàn)在為止,人工智能產(chǎn)業(yè)還沒有產(chǎn)生具有世界影響力的大型企業(yè),所以人工智能產(chǎn)業(yè)必須跟垂直領(lǐng)域深度結(jié)合才有可能發(fā)展。不過,目前情況也在發(fā)生變化,具有一定通用性的基礎(chǔ)模型的出現(xiàn),肯定會影響產(chǎn)業(yè)發(fā)展。2020年,全世界人工智能產(chǎn)業(yè)達(dá)到10億美元以上的獨(dú)角獸企業(yè)一共有40家,2022年變成117家,2024年初達(dá)到126家,從這個(gè)情況來看,它是逐步增長的。到現(xiàn)在為止,中國有100甚至200家企業(yè)在做大模型。這么多人做基礎(chǔ)模型,他們未來的出路在哪里?第一個(gè)出路是向各行各業(yè)轉(zhuǎn)移,做各個(gè)垂直領(lǐng)域的大模型?,F(xiàn)在很多行業(yè)都在考慮這個(gè)問題,例如石油行業(yè)考慮石油行業(yè)的大模型,金融行業(yè)考慮金融行業(yè)的大模型,所以將來做通用大模型的數(shù)量將越來越少,大多數(shù)做大模型的人才會轉(zhuǎn)向各個(gè)垂直領(lǐng)域。第二個(gè)出路是最重要的,即經(jīng)過微調(diào)應(yīng)用在產(chǎn)業(yè)里。換言之,提供公開的大模型軟件,讓大家開發(fā)應(yīng)用。第三個(gè)出路是跟其他技術(shù)結(jié)合,發(fā)展新的產(chǎn)業(yè)。國外很多獨(dú)角獸企業(yè)都將AI工具與其他技術(shù)結(jié)合,發(fā)展新產(chǎn)業(yè),有的是向各個(gè)行業(yè)轉(zhuǎn)移,還有的專門做圖像、視頻、語音等。國內(nèi)一些大模型現(xiàn)在也已經(jīng)取得了比較好的發(fā)展。基于此,勢必要推動人工智能領(lǐng)域的產(chǎn)業(yè)變革。今后無論做硬件還是做軟件,一定要放到基礎(chǔ)模型的平臺當(dāng)中。過去是在一個(gè)零基礎(chǔ)的計(jì)算機(jī)中制作軟件,效率很低,而現(xiàn)在平臺已經(jīng)學(xué)習(xí)超過一千萬本牛津辭典,能力水平至少相當(dāng)于一個(gè)高中生,若將同樣的工作放到基礎(chǔ)模型的平臺上進(jìn)行將會事半功倍,所以采用這個(gè)平臺是不可阻擋的趨勢。而這些“高中生”則來源于大模型企業(yè)提供的公開平臺。大模型的局限性大模型的所有工作都由外部驅(qū)動,在外部提示下進(jìn)行。它缺乏主動性,在外部提示下做某事時(shí),主要基于概率預(yù)測的方法,所以會出現(xiàn)一些人類沒有的缺點(diǎn),即輸出的質(zhì)量不可控。并且它不知道是非對錯(cuò),所以它的輸出也不可信。與此同時(shí),它受外部影響太大,只能聽從指令來完成相應(yīng)的事情。但人類則是完全不同的,即使這件事是由別人安排完成,人也能夠在自己的意識控制下進(jìn)行,所以是可控、可信的。由此可見,目前的人工智能并不知道自己的所作所為。AI工具尚不能準(zhǔn)確分辨對錯(cuò),且現(xiàn)在還難以主動進(jìn)行自我迭代,仍舊需要在人類的操作下進(jìn)行。未來的人工智能最多成為人類的助手,在人類的監(jiān)控下進(jìn)行操作,只有少數(shù)工作可以完全交給機(jī)器獨(dú)立完成。有研究機(jī)構(gòu)曾做過關(guān)于人工智能對各行各業(yè)影響的統(tǒng)計(jì),列出了大量行業(yè),在未來這些行業(yè)中只有少數(shù)工作可能會被人工智能取代??梢?,人工智能對各行各業(yè)都有重大影響,但大多數(shù)是幫助人類提高工作質(zhì)量和效率,而非取代人類進(jìn)行工作。人工智能是探索“無人區(qū)”,其魅力就在于它永遠(yuǎn)在路上。我們不能因?yàn)樗倪M(jìn)展而過于樂觀,也不必因?yàn)樗拇煺鄱趩?,我們需要的是?jiān)持不懈地努力。(本講座文稿由清華大學(xué)新聞與傳播學(xué)院博士生牛雪瑩整理)《光明日報(bào)》(2024年05月25日 10版)來源:光明網(wǎng)-《光明日報(bào)》
]]>當(dāng)前,人形機(jī)器人技術(shù)加速演進(jìn),已成為科技競爭的新高地、未來產(chǎn)業(yè)的新賽道、經(jīng)濟(jì)發(fā)展的新引擎,發(fā)展?jié)摿Υ螅瑧?yīng)用前景廣。
政策力挺
人形機(jī)器人產(chǎn)業(yè)
近年來,國內(nèi)外人形機(jī)器人快速發(fā)展,行業(yè)關(guān)注度日趨提升。政策面上,2023年10月,工信部印發(fā)《人形機(jī)器人創(chuàng)新發(fā)展指導(dǎo)意見》(以下簡稱《指導(dǎo)意見》)?!吨笇?dǎo)意見》首次對人形機(jī)器人產(chǎn)業(yè)發(fā)展提出系統(tǒng)性指導(dǎo)意見,明確發(fā)展目標(biāo)與時(shí)間點(diǎn)。
根據(jù)《指導(dǎo)意見》,到2025年,人形機(jī)器人創(chuàng)新體系初步建立,一批關(guān)鍵技術(shù)取得突破,確保核心部組件安全有效供給。整機(jī)產(chǎn)品達(dá)到國際先進(jìn)水平,并實(shí)現(xiàn)批量生產(chǎn),在特種、制造、民生服務(wù)等場景得到示范應(yīng)用。到2027年,人形機(jī)器人技術(shù)創(chuàng)新能力顯著提升,形成安全可靠的產(chǎn)業(yè)鏈供應(yīng)鏈體系,綜合實(shí)力達(dá)到世界先進(jìn)水平,產(chǎn)業(yè)加速實(shí)現(xiàn)規(guī)?;l(fā)展。
今年1月,工信部等七部門聯(lián)合印發(fā)《關(guān)于推動未來產(chǎn)業(yè)創(chuàng)新發(fā)展的實(shí)施意見》(以下簡稱《實(shí)施意見》)。在“做強(qiáng)未來高端裝備”部分,《實(shí)施意見》要求加快實(shí)施重大技術(shù)裝備攻關(guān)工程,突破人形機(jī)器人、量子計(jì)算機(jī)等高端裝備產(chǎn)品,以整機(jī)帶動新技術(shù)產(chǎn)業(yè)化落地,打造全球領(lǐng)先的高端裝備體系。人形機(jī)器人處于未來創(chuàng)新標(biāo)志性產(chǎn)品前列。
海外方面。2023年5月,美國白宮公布了一系列圍繞美國人工智能使用和發(fā)展的新舉措,并更新發(fā)布了《國家人工智能研發(fā)戰(zhàn)略計(jì)劃》,其中明確提出要“開發(fā)功能更強(qiáng)大、更可靠的機(jī)器人”;日本實(shí)施新機(jī)器人戰(zhàn)略,旨在使該國成為世界第一的機(jī)器人創(chuàng)新中心,重點(diǎn)領(lǐng)域是制造業(yè)、護(hù)理和醫(yī)療、基礎(chǔ)設(shè)施和農(nóng)業(yè)。
中國人形機(jī)器人
專利數(shù)量全球領(lǐng)先
當(dāng)前,以人形機(jī)器人和通用人工智能為代表的新技術(shù)、新產(chǎn)品、新業(yè)態(tài)蓬勃發(fā)展,正成為全球科技創(chuàng)新的制高點(diǎn)、未來產(chǎn)業(yè)的新賽道和經(jīng)濟(jì)增長的新引擎。相關(guān)專利的數(shù)量和轉(zhuǎn)化,則可以體現(xiàn)出一個(gè)國家或地區(qū)的科技水平,以及專利的創(chuàng)新能力和市場化程度。
2023年11月,人民網(wǎng)研究院發(fā)布《人形機(jī)器人技術(shù)專利分析報(bào)告》。截至報(bào)告發(fā)布日,以有效發(fā)明專利計(jì)算,中國共計(jì)擁有發(fā)明有效專利1699件,僅略低于日本的1743件,排名全球第二;并與排名第三至第五的韓國、美國、法國拉開較大差距。這些專利儲備和技術(shù)布局有望在接下來的全球范圍內(nèi)的科技競爭中,使中國始終保持在領(lǐng)先位置。
從專利申請來看,中國已成為人形機(jī)器人技術(shù)專利主要申請國。截至報(bào)告發(fā)布日,中國已累計(jì)申請6618件人形機(jī)器人技術(shù)專利,是申請技術(shù)專利數(shù)量最多的國家;日本排名第二,申請技術(shù)專利數(shù)量6058件。從技術(shù)分支來看,已申請的專利技術(shù)主要集中在本體結(jié)構(gòu)、驅(qū)動控制和智能感知部分,申請量依次為7949件、4800件和4191件,核心零部件以及支撐環(huán)境技術(shù)分支的申請量較少。
2024年有望成為
產(chǎn)業(yè)元年
近期,人形機(jī)器人利好消息不斷。
4月9日,首屆中國人形機(jī)器人產(chǎn)業(yè)大會暨具身智能峰會在北京海淀區(qū)開幕。大會以“競逐人形萬億賽道·重塑未來產(chǎn)業(yè)新紀(jì)元”為主題,超200位人形機(jī)器人院士專家和企業(yè)家,圍繞四大專題活動展開精彩報(bào)告。來自全球的1200余名行業(yè)人士參會,兩大展區(qū)薈聚30余家企業(yè)展示最新技術(shù)和產(chǎn)品,展現(xiàn)人形機(jī)器人產(chǎn)業(yè)發(fā)展的新動態(tài)、新趨勢。2024年是人形機(jī)器人和具身智能高速發(fā)展的關(guān)鍵元年,已成為行業(yè)共識。
會上,立德研究院與優(yōu)必選科技、靈心巧手等聯(lián)合參編單位代表共同發(fā)布了《人形機(jī)器人產(chǎn)業(yè)研究報(bào)告》。報(bào)告預(yù)測,2024中國人形機(jī)器人市場規(guī)模約27.6億元,到2029年達(dá)到750億元,將占到世界總量的32.7%,位居世界第一,到2035年規(guī)模有望達(dá)到3000億元。
往前追溯。3月13日,F(xiàn)igure AI與OpenAI合作發(fā)布最新視頻。視頻中,人形機(jī)器人所展示的人機(jī)交互能力、邏輯歸納分析能力以及硬件操控能力均超出預(yù)期,引發(fā)熱烈反響。該人形機(jī)器人采用了端到端神經(jīng)網(wǎng)絡(luò),進(jìn)一步驗(yàn)證AI大模型、技術(shù)迭代加速能夠指數(shù)級推動人形機(jī)器人應(yīng)用落地的想象。
美國當(dāng)?shù)貢r(shí)間3月18日,英偉達(dá)創(chuàng)始人兼CEO黃仁勛在NVIDIA GTC 2024開發(fā)者大會上發(fā)表主題演講《見證AI的變革時(shí)刻》,對人形機(jī)器人進(jìn)行了重點(diǎn)介紹:一是英偉達(dá)將推出GR00T機(jī)器人項(xiàng)目,以支持機(jī)器人理解自然語言、模仿人類動作、快速學(xué)習(xí)協(xié)調(diào)性、靈活性及其他技能;二是構(gòu)建三大機(jī)器人相關(guān)平臺、模擬訓(xùn)練加速迭代,模擬物理世界(NVIDIAIAI)、驅(qū)動數(shù)字孿生計(jì)算系統(tǒng)(Omniverse)、驅(qū)動人工智能機(jī)器人(ISAAC);三是與比亞迪開展合作,實(shí)現(xiàn)應(yīng)用落地。
華福證券認(rèn)為,人形機(jī)器人行業(yè)發(fā)展由智能電動車企龍頭搖旗吶喊,擴(kuò)散到算力芯片龍頭、AI大廠、獨(dú)角獸企業(yè)聯(lián)合登臺,產(chǎn)業(yè)趨勢明確、迭代持續(xù)加速。預(yù)計(jì)后續(xù)海外頭部廠商團(tuán)隊(duì)將走訪供應(yīng)商,推進(jìn)量產(chǎn)落地,機(jī)器人板塊催化將持續(xù)。
多家上市公司加速布局
由于產(chǎn)業(yè)發(fā)展前景良好,資本市場也在加速布局。2023年12月,“人形機(jī)器人第一股”優(yōu)必選科技在香港交易所主板正式掛牌上市,旗下Walker X機(jī)器人是中國首個(gè)商業(yè)化雙足真人尺寸人形機(jī)器人,也是全球首個(gè)實(shí)現(xiàn)量產(chǎn)交付的人形機(jī)器人。優(yōu)必選科技在有效專利儲備量方面排名全球第一,高于本田、索尼、豐田等企業(yè)。今年4月,優(yōu)必選宣布人形機(jī)器人Walker S接入百度文心大模型,共同探索中國AI大模型+人形機(jī)器人的應(yīng)用。
部分零部件企業(yè)已正式“下場”。國內(nèi)步進(jìn)電機(jī)龍頭鳴志電器此前公告,公司在人形機(jī)器人應(yīng)用領(lǐng)域?qū)W⒂谑终颇=M及指模所用的控制電機(jī)模組的研發(fā)和制造,也獲得了該領(lǐng)域頭部企業(yè)的關(guān)注以及合作意向。公司已向該領(lǐng)域頭部客戶提交了全套技術(shù)方案及樣機(jī),供客戶作可靠性及實(shí)際應(yīng)用的測試驗(yàn)證。
還有不少公司開始布局。富瀚微近期表示,由于人形機(jī)器人領(lǐng)域還沒有完全定型,公司不會貿(mào)然開發(fā)專門的芯片,正在與人形機(jī)器人領(lǐng)域的客戶保持充分的溝通交流,并進(jìn)行IP方面的儲備,以便在未來能夠快速響應(yīng)。臥龍電驅(qū)也在投資者互動平臺表示,包括人形機(jī)器人在內(nèi)的仿生機(jī)器人是公司新質(zhì)生產(chǎn)力的重點(diǎn)布局賽道,公司在機(jī)器人的各種伺服關(guān)節(jié)模組有所布局。
從整個(gè)行業(yè)來看,浙商證券認(rèn)為,人形機(jī)器人的產(chǎn)業(yè)大趨勢已經(jīng)確定,國外以特斯拉Optimus為代表,規(guī)劃2025年小批量量產(chǎn);國內(nèi)以優(yōu)必選為代表,目前已在汽車廠實(shí)訓(xùn)測試,預(yù)計(jì)工業(yè)場景的量產(chǎn)臨近。該機(jī)構(gòu)預(yù)計(jì),企業(yè)送樣、驗(yàn)證、定點(diǎn)或產(chǎn)能規(guī)劃等舉措均可能成為一輪行情的催化劑。
根據(jù)高盛最新預(yù)測,人形機(jī)器人市場規(guī)模在2035年將達(dá)到378億美元,其對人形機(jī)器人出貨量的測算較此前增加了4倍,高達(dá)140萬臺。同時(shí),由于人形機(jī)器人材料成本已較2022年下降約了40%,預(yù)計(jì)人形機(jī)器人將可更快實(shí)現(xiàn)盈利。
一般經(jīng)營項(xiàng)目是:機(jī)器人、電氣產(chǎn)品、電子產(chǎn)品、安防產(chǎn)品、自動化產(chǎn)品、工控產(chǎn)品、機(jī)電設(shè)備、智能控制系統(tǒng)、高低壓成套設(shè)備、低壓電器、儀器儀表、電線電纜、電子電氣元器件及制品、五金工具及配件、模具、通訊產(chǎn)品、計(jì)算機(jī)軟硬件、家用電器及配件、攝影攝像器材、掃描儀、打印機(jī)的技術(shù)開發(fā)購銷;自動化控制系統(tǒng)的設(shè)計(jì)、技術(shù)開發(fā);計(jì)算機(jī)軟硬件、網(wǎng)絡(luò)系統(tǒng)的技術(shù)開發(fā);國內(nèi)貿(mào)易,從事貨物及技術(shù)的進(jìn)出口業(yè)務(wù)(法律、行政法規(guī)、國務(wù)院決定禁止的項(xiàng)目除外,限制的項(xiàng)目須取得許可后方可經(jīng)營)。(企業(yè)經(jīng)營涉及前置性行政許可的,須取得前置性行政許可文件后方可經(jīng)營),許可經(jīng)營項(xiàng)目是:無
]]>