(資料圖片)
近期業(yè)界傳言的“醫(yī)渡科技正研發(fā)醫(yī)療大模型”在7月3日得到了證實,醫(yī)渡科技(02158)首席技術官、首席人工智能科學家閆峻在該公司2023財年業(yè)績發(fā)布會上確認了這一消息。
閆峻表示,公司在大語言模型的訓練和面向場景的調(diào)優(yōu)上早有布局,也做了很大投入。醫(yī)渡科技的“醫(yī)療智能大腦“YiduCore一直在自然語言處理領域深耕,語言模型的訓練也一直是其中很重要的組成部分。從整個技術鏈來看,大語言模型并非新鮮事物,未來的大模型訓練數(shù)據(jù)規(guī)模更大,并且要針對一些特定場景進行調(diào)優(yōu),這樣才能解決很多的實際問題。
大語言模型的訓練和調(diào)優(yōu)對數(shù)據(jù)、算力和算法以及工程都有著極高的要求。在數(shù)據(jù)層面,醫(yī)渡科技正在注入更多的專業(yè)知識型數(shù)據(jù)。相比之前,公司對這些知識型數(shù)據(jù)的表達方式做了很多精細化加工與處理,并使用了課程學習等手段。在計算資源上,公司也重點增強了算力,用以支持從之前幾億參數(shù),到幾十億參數(shù)乃至幾百億參數(shù)的模型。
閆峻還介紹到,醫(yī)療健康垂直領域與開放領域有著很大的不同。對于醫(yī)療健康垂直領域而言,其下游任務相對比較明確,因此參數(shù)規(guī)模和要解決下游任務上存在一個性價比的平衡點。
在以傳統(tǒng)方法為基礎的模型算法和工程經(jīng)驗上,醫(yī)渡科技已有大量積累。在模型規(guī)模放大的過程中,公司還在持續(xù)針對下游任務調(diào)優(yōu)投入大量精力。
閆峻強調(diào),由于醫(yī)療健康領域的嚴肅性,在這一垂直領域的大模型訓練過程中,對于專業(yè)性和信息安全等多方面要求都非常高,需要從業(yè)者心懷敬畏并以謹慎的態(tài)度去提供服務。
比如,在眾多開放領域遇到的問題,機器提供的答案能夠達到70-80分便可達到應用水平;但對于醫(yī)療健康領域而言,下游任務要求足夠的專業(yè)性和模型的精準度,而且要同時確保信息安全,做到95分甚至更高才能達到真正的應用水平。因此,需要更多的時間補充知識及測試調(diào)優(yōu)。
智通財經(jīng)APP了解到,醫(yī)渡科技將于近期在適當?shù)臅r間針對部分目標場景推出小范圍邀請測試,所涉及場景將包括內(nèi)部生產(chǎn)效率提升,面向當前業(yè)務產(chǎn)品的智能化升級,以及提供對患者的新服務能力,也不排除對行業(yè)中的科研及商業(yè)機構(gòu)開放提供專業(yè)醫(yī)療垂直領域大模型服務的可能。