焦點科技申請多模態融合專利,能有效解決低級語義特徵難以直接判定目標類別導致的檢測困難問題

金融界2024年6月4日消息,天眼查知識產權信息顯示,焦點科技股份有限公司申請一項名爲“一種基於多模態融合的菸草相關產品識別方法“,公開號CN202311362657.8,申請日期爲2023年10月。

專利摘要顯示,本發明公開了一種基於多模態融合的菸草相關產品識別方法,包括使用預訓練的多模態模型對輸入圖像進行語義描述,得到圖像的文本描述;統計文本描述中的高頻詞,確定菸草相關產品圖像的常見敏感詞;利用敏感詞進行初步篩選,過濾掉非菸草相關圖像;使用菸草相關產品數據集建立目標檢測模型,將篩選後的圖像輸入該檢測模型,對候選圖像進行分類判斷,識別出違規的菸草推廣圖像。本發明通過集成多模態信息,充分利用圖像的語義描述對目標進行初步篩選,能夠有效解決低級語義特徵難以直接判定目標類別導致的檢測困難問題。整體方法集成了多模態理解和目標檢測兩個模塊,利用兩者的互補提高了菸草相關產品識別的準確率。

本文源自:金融界

作者:情報員