北京大學申請中文醫學大語言模型訓練方法及裝置專利,提高大語言模型在醫學領域回答的準確度

金融界 2024 年 8 月 20 日消息,天眼查知識產權信息顯示,北京大學,北京六元空間信息科技有限責任公司申請一項名爲“中文醫學大語言模型訓練方法及裝置“,公開號 CN202410949277.2 ,申請日期爲 2024 年 7 月。

專利摘要顯示,本申請公開了一種中文醫學大語言模型訓練方法及裝置,涉及自然語言處理技術領域,所述的方法包括:通過醫學文本對預設大語言模型進行預學習訓練,使得大語言模型在語義層面上理解專業醫學知識。根據開源中文醫學考試數據集對預訓練後的模型進行監督微調訓練,從而降低計算複雜度和內存需求,這使得在保持模型性能的同時,能夠在有限的計算資源下進行高效的微調。最後根據構建的知識圖譜和強化學習數據集進行知識反饋的強化學習,有助於解決監督微調後由於模型過度擬合而出現的“幻覺”現象,從而將大語言模型的輸出與相關的專業醫學知識進行充分對齊,提高大語言模型在醫學領域回答的準確度。

本文源自:金融界

作者:情報員