6月19日,騰訊云在國(guó)家科技傳播中心召開行業(yè)大模型及智能應(yīng)用技術(shù)峰會(huì),首次公布騰訊云行業(yè)大模型研發(fā)進(jìn)展,依托騰訊云TI平臺(tái)打造行業(yè)大模型精選商店,為客戶提供MaaS(Model-as-a-Service)一站式服務(wù),助力客戶構(gòu)建專屬大模型及智能應(yīng)用。
峰會(huì)上,騰訊云副總裁、騰訊云智能負(fù)責(zé)人、優(yōu)圖實(shí)驗(yàn)室負(fù)責(zé)人吳運(yùn)聲發(fā)表《騰訊云MaaS,打造一站式行業(yè)大模型精選商店》的主題演講,分享了騰訊云在行業(yè)大模型方面的技術(shù)方案,以及產(chǎn)業(yè)客戶實(shí)踐、行業(yè)大模型標(biāo)準(zhǔn)體系構(gòu)建的進(jìn)展。
(相關(guān)資料圖)
騰訊云副總裁、騰訊云智能負(fù)責(zé)人、優(yōu)圖實(shí)驗(yàn)室負(fù)責(zé)人 吳運(yùn)聲
吳運(yùn)聲認(rèn)為,大模型驅(qū)動(dòng)“智慧涌現(xiàn)”,產(chǎn)業(yè)場(chǎng)景已成為最佳練兵場(chǎng),在智能問(wèn)答、內(nèi)容創(chuàng)作、智能決策、智能風(fēng)控等很多業(yè)務(wù)場(chǎng)景,具有非常廣泛的應(yīng)用價(jià)值。騰訊云希望為客戶和伙伴打造一站式的行業(yè)大模型精選商店,加速大模型在產(chǎn)業(yè)領(lǐng)域的創(chuàng)新實(shí)踐。
企業(yè)在應(yīng)用大模型時(shí),常常面臨計(jì)算資源少、數(shù)據(jù)質(zhì)量差、投入成本高、專業(yè)經(jīng)驗(yàn)少等挑戰(zhàn),吳運(yùn)聲表示,騰訊云將通過(guò)TI平臺(tái),面向客戶全面輸出MaaS能力,可以滿足客戶模型預(yù)訓(xùn)練、模型精調(diào)、智能應(yīng)用開發(fā)等多樣化需求,讓客戶可根據(jù)自身業(yè)務(wù)場(chǎng)景需求,定制不同參數(shù)、不同規(guī)格的專屬模型。
峰會(huì)現(xiàn)場(chǎng),吳運(yùn)聲展示了文旅客服大模型場(chǎng)景的精調(diào)過(guò)程及效果。通過(guò)加入文旅行業(yè)垂直場(chǎng)景數(shù)據(jù)、接入文旅客戶API接口后,模型不僅可以為用戶制訂細(xì)致的旅行攻略,提供非常人性化的服務(wù)體驗(yàn),也讓智能客服系統(tǒng),實(shí)現(xiàn)服務(wù)商業(yè)化的閉環(huán)。而未來(lái)隨著更多高質(zhì)量數(shù)據(jù)的增加,模型的精調(diào)效果還會(huì)更好。
目前,騰訊云已經(jīng)攜手傳媒、文旅、金融、政務(wù)、教育等行業(yè)的頭部企業(yè),在十余個(gè)行業(yè)探索了超50個(gè)行業(yè)大模型的應(yīng)用解決方案。
以下為演講全文:
尊敬的各位嘉賓、媒體朋友們,大家下午好!
我是騰訊的吳運(yùn)聲,今天我的分享主題是《騰訊云MaaS,打造一站式行業(yè)大模型精選商店》。這是我們的定位,也是我們努力的方向。
依托騰訊云的高性能計(jì)算、行業(yè)大模型能力,以及我們多年深耕產(chǎn)業(yè)互聯(lián)網(wǎng)積累的行業(yè)經(jīng)驗(yàn),我們希望為客戶和伙伴,打造一站式的行業(yè)大模型精選商店,加速大模型在產(chǎn)業(yè)領(lǐng)域的創(chuàng)新實(shí)踐。
大模型驅(qū)動(dòng)“智慧涌現(xiàn)”,產(chǎn)業(yè)場(chǎng)景已成為最佳練兵場(chǎng),在智能問(wèn)答、內(nèi)容創(chuàng)作、智能決策、智能風(fēng)控等很多業(yè)務(wù)場(chǎng)景,具有非常廣泛的應(yīng)用價(jià)值。那么,如何將大模型快速應(yīng)用到自己的業(yè)務(wù)場(chǎng)景中?怎么才能在新一輪技術(shù)浪潮中不掉隊(duì)?
最近半年多的時(shí)間里,我們收到了非常多來(lái)自客戶的問(wèn)詢。對(duì)于很多企業(yè)而言,想要用好大模型,確實(shí)面臨不少挑戰(zhàn)。
第一,是計(jì)算資源少。大模型的訓(xùn)練和推理對(duì)計(jì)算資源和存儲(chǔ)資源有很高的需求,對(duì)很多客戶來(lái)說(shuō)門檻太高。
第二,數(shù)據(jù)質(zhì)量差。構(gòu)建大模型是成本極高的系統(tǒng)工程,大模型需要大量的高質(zhì)量數(shù)據(jù)進(jìn)行訓(xùn)練,數(shù)據(jù)還必須經(jīng)過(guò)清洗和預(yù)處理。數(shù)據(jù)質(zhì)量差,會(huì)導(dǎo)致模型的效果和效率無(wú)法得到保障。
第三,投入成本高。為確保業(yè)務(wù)使用的效果需要投入大量的數(shù)據(jù)、計(jì)算資源來(lái)訓(xùn)練,還需要持續(xù)的調(diào)試和優(yōu)化。
第四,專業(yè)經(jīng)驗(yàn)少。大模型的部署需要考慮到計(jì)算資源、網(wǎng)絡(luò)帶寬等多個(gè)方面的問(wèn)題,大模型的開發(fā)和落地需要很多的技術(shù)和人力資源。此外,安全、合規(guī),也是企業(yè)需要考慮的關(guān)鍵因素。
那么,如何解決產(chǎn)業(yè)客戶落地大模型,所面臨的成本、數(shù)據(jù)、安全等一系列問(wèn)題呢?依托騰訊云大模型高性能計(jì)算集群和行業(yè)大模型能力,我們通過(guò)騰訊云TI平臺(tái),面向客戶全面輸出MaaS能力,可以滿足客戶模型預(yù)訓(xùn)練、模型精調(diào)、智能應(yīng)用開發(fā)等多樣化需求。
騰訊云TI平臺(tái)行業(yè)大模型精調(diào)解決方案,具備完整大模型精調(diào)工具鏈,支持客戶加入自己獨(dú)有的場(chǎng)景數(shù)據(jù),進(jìn)行精調(diào)訓(xùn)練,客戶可根據(jù)自身業(yè)務(wù)場(chǎng)景需求,定制不同參數(shù)、不同規(guī)格的專屬模型。
實(shí)際上,在過(guò)去一段時(shí)間里,我們已經(jīng)攜手一些行業(yè)頭部企業(yè),探索了多個(gè)行業(yè)大模型的應(yīng)用場(chǎng)景。通過(guò)演示,我們可以看到在文旅客服大模型場(chǎng)景中,模型不僅給到了不同檔次的酒店推薦、介紹,甚至可以直接提供預(yù)訂鏈接。給用戶提供了非常人性化的服務(wù)體驗(yàn),也讓智能客服系統(tǒng),實(shí)現(xiàn)服務(wù)商業(yè)化的閉環(huán)。
當(dāng)然,現(xiàn)在這個(gè)效果,仍有很大提升空間,未來(lái)隨著更多高質(zhì)量數(shù)據(jù)的增加,相信效果會(huì)更好。行業(yè)大模型有望重塑企業(yè)生產(chǎn)力、提升市場(chǎng)競(jìng)爭(zhēng)力。
騰訊云TI平臺(tái)行業(yè)大模型精調(diào)解決方案,具備四大優(yōu)勢(shì),包括高質(zhì)量的行業(yè)大模型、完善的平臺(tái)工具、成熟的流程方法、全面配套服務(wù),可以為客戶提供從模型選擇、到落地部署的一站式服務(wù)。
首先,基于騰訊云多年深耕產(chǎn)業(yè)互聯(lián)網(wǎng)的經(jīng)驗(yàn),騰訊云TI平臺(tái)內(nèi)置了多個(gè)高質(zhì)量行業(yè)大模型,涵蓋金融、傳媒、文旅、政務(wù)、工業(yè)等多個(gè)行業(yè)場(chǎng)景,同時(shí)開放支持客戶多模型訓(xùn)練任務(wù),滿足個(gè)性化需求。比如針對(duì)客服等場(chǎng)景中的“對(duì)話問(wèn)答”、“相似問(wèn)生成”等任務(wù),有較好的優(yōu)化,使用時(shí)僅需少量訓(xùn)練數(shù)據(jù),便可達(dá)到較好的精調(diào)效果。
其次,TI-ONE平臺(tái)提供完善的大模型工具鏈,包括數(shù)據(jù)標(biāo)注、訓(xùn)練、評(píng)估、測(cè)試和部署等全套工具,同時(shí)具備強(qiáng)大的多機(jī)多卡訓(xùn)練加速能力,客戶可快速在TI-ONE平臺(tái)上進(jìn)行一站式的大模型精調(diào)。
其中,大模型訓(xùn)練,算力是基礎(chǔ)。騰訊云在大模型算力方面擁有領(lǐng)先優(yōu)勢(shì)。早在今年4月,騰訊云便發(fā)布了面向大模型訓(xùn)練的新一代HCC高性能計(jì)算集群,采用最新一代騰訊云星星海自研服務(wù)器,結(jié)合多層加速的高性能存儲(chǔ)系統(tǒng),具備3.2Tbps業(yè)界最高互聯(lián)帶寬,算力性能提升3倍。
全新升級(jí)框架加速能力太極Angel,可以提供更優(yōu)的訓(xùn)練和推理加速能力。在傳統(tǒng)CV、NLP算法模型的基礎(chǔ)上,新增了對(duì)大模型的訓(xùn)練和推理加速能力,通過(guò)異步調(diào)度優(yōu)化、顯存優(yōu)化、計(jì)算優(yōu)化等方式,相比行業(yè)常用方案性能提升超過(guò)30%。
同時(shí),支持更適合AI運(yùn)算的向量數(shù)據(jù)庫(kù),將幫助高效處理圖像、音頻和文本等非結(jié)構(gòu)化數(shù)據(jù),支持日處理千億級(jí)的檢索,將為客戶模型訓(xùn)練提供充沛動(dòng)力。
針對(duì)成本高、落地難的問(wèn)題,騰訊云TI平臺(tái)實(shí)現(xiàn)針對(duì)行業(yè)場(chǎng)景的低成本落地。在少量算力的基礎(chǔ)上,提升特定任務(wù)的效果,比如智能客服場(chǎng)景,訓(xùn)練性能可提升10倍,訓(xùn)練成本下降90%。
我們沉淀了行業(yè)大模型全生命周期一體化的完整方法論,覆蓋“模型選型-訓(xùn)練共建-部署應(yīng)用”全流程,保障客戶需求的順利交付。
在配套服務(wù)方面,騰訊云提供本地化的訓(xùn)練、落地及陪跑優(yōu)化服務(wù),為客戶掃清落地障礙;針對(duì)客戶需求,提供私有化部署、公有云托管多種靈活部署方案,助力企業(yè)快速創(chuàng)建和部署AI應(yīng)用。
大模型的應(yīng)用,安全、合規(guī)是前提,騰訊云在這方面有成熟的技術(shù)積累和經(jīng)驗(yàn)。在問(wèn)題側(cè)、模型側(cè)、答案?jìng)?cè)三個(gè)層面進(jìn)行敏感信息的過(guò)濾和規(guī)避,讓最終的答案符合安全、規(guī)范的要求。同時(shí),依托騰訊多年的安全經(jīng)驗(yàn)和天御風(fēng)控能力,提供AIGC全鏈路內(nèi)容合規(guī)解決方案,確保大模型可信、可靠、可用。
行業(yè)大模型與AI助手的結(jié)合,可以快速提升“對(duì)話理解”和“智能問(wèn)答”能力。比如,在學(xué)習(xí)了汽車場(chǎng)景的數(shù)據(jù)后,車載語(yǔ)音助手可根據(jù)車輛狀態(tài)、用戶狀態(tài)、歷史數(shù)據(jù)等信息,做主動(dòng)觸達(dá)和場(chǎng)景運(yùn)營(yíng),提供更人性化的場(chǎng)景服務(wù)。
前段時(shí)間,我們推出了騰訊云數(shù)智人工廠,內(nèi)置超過(guò)10個(gè)AI算法模型。騰訊云MaaS能力,可以讓數(shù)智人分身復(fù)刻縮短至24小時(shí),大幅降低成本。
在文旅領(lǐng)域,我們聯(lián)合一家線上旅游OTA公司,共同探索了文旅行業(yè)大模型的應(yīng)用。其傳統(tǒng)智能客服需要人工進(jìn)行對(duì)話配置,知識(shí)維護(hù)量大、耗時(shí)長(zhǎng),且涉及訂單等復(fù)雜業(yè)務(wù)場(chǎng)景,在無(wú)配置的情況下,無(wú)法通過(guò)機(jī)器人閉環(huán)解決問(wèn)題。精調(diào)后的客戶專屬模型,無(wú)需配置對(duì)話流程,即可實(shí)現(xiàn)端到端解決業(yè)務(wù)問(wèn)題。提升任務(wù)完成率,降低整體成本。
在金融領(lǐng)域,我們探索了OCR大模型,在銀行單據(jù)處理場(chǎng)景中的應(yīng)用。傳統(tǒng)的OCR深度學(xué)習(xí)模型不具備閱讀理解和推理能力、模型指標(biāo)上限低,不同場(chǎng)景下模型能力無(wú)法復(fù)制,定制成本高。我們聯(lián)合一家頭部銀行,基于OCR大模型,上線了4類票據(jù)的自動(dòng)化識(shí)別流程,信息錄入準(zhǔn)確率提升50%。
在行業(yè)大模型標(biāo)準(zhǔn)體系方面,我們正在聯(lián)合中國(guó)信通院,共同構(gòu)建行業(yè)大模型的標(biāo)準(zhǔn)體系及能力架構(gòu),包括1套ILMOps方法論、60多項(xiàng)能力建設(shè)指標(biāo)。這個(gè)標(biāo)準(zhǔn)體系覆蓋多個(gè)行業(yè),涵蓋模型行業(yè)能力、模型工程化性能、模型算力網(wǎng)絡(luò)、模型安全可靠等方面。