中文字幕在线视频第一页,黄色毛片在线看,日本爱爱网站,亚洲系列中文字幕一区二区

您當(dāng)前的位置是:  首頁 > 資訊 > 國內(nèi) >
 首頁 > 資訊 > 國內(nèi) >

思必馳在中文文本相似度計算任務(wù)上的探索與進展

2020-12-17 10:43:50   作者:   來源:CTI論壇   評論:0  點擊:


  文本相似度計算旨在識別兩段文本在語義上是否相似,是自然語言處理領(lǐng)域的一個重要研究方向,其在智能問答、信息檢索等領(lǐng)域都發(fā)揮重要作用,具有很高的商業(yè)價值。
  近期,思必馳知識服務(wù)團隊在中文文本相似度計算方向投入研究,并取得階段性成果:
  1)在第十四屆全國知識圖譜與語義計算大會(CCKS: China Conference on Knowledge Graph and Semantic Computing)[1]上發(fā)表相關(guān)論文一篇《Neural Fusion Model for Chinese Semantic Matching》。
  該會議是國內(nèi)知識圖譜、語義技術(shù)、鏈接數(shù)據(jù)等領(lǐng)域的核心學(xué)術(shù)會議,聚集了知識表示、自然語言理解、知識獲取、智能問答、鏈接數(shù)據(jù)、圖數(shù)據(jù)庫、圖計算、自動推理等相關(guān)技術(shù)領(lǐng)域的和研究人員的學(xué)者和研究人員。
  2)在“千言數(shù)據(jù)集:文本相似度”評測[2]中取得階段性進展。該評測的文本相似度數(shù)據(jù)集包括公開的三個文本相似度數(shù)據(jù)集,分別為哈工大(深圳)LCQMC、BQCorpus和谷歌的PAWS-X(中文)。目前,思必馳知識服務(wù)團隊在三個數(shù)據(jù)集上均暫列第一。
  針對中文文本相似度計算的魯棒性和泛化性問題,思必馳知識服務(wù)團隊在以下幾個方面開展了技術(shù)研究:
  1)針對中文特點的字、詞融合編碼器;
  2)基于預(yù)訓(xùn)練模型的領(lǐng)域自適應(yīng)訓(xùn)練;
  3)目標(biāo)應(yīng)用領(lǐng)域?qū)虻亩嚯A段模型微調(diào)。
  相關(guān)技術(shù)實現(xiàn)在上述公開評測中得到了應(yīng)用和驗證。
  語言智能常被稱為人工智能皇冠上的一顆明珠。在未來,思必馳知識服務(wù)團隊將繼續(xù)深耕認(rèn)知智能領(lǐng)域,在面向通用領(lǐng)域的文本相似度計算基礎(chǔ)上,打造領(lǐng)域自適應(yīng)的文本相似度計算系統(tǒng),推動文本相似度在垂直領(lǐng)域的應(yīng)用和發(fā)展。
  參考文獻:
  [1]第十四屆全國知識圖譜與語義計算大會(CCKS: China Conference on Knowledge Graph and Semantic Computing)
  http://sigkg.cn/ccks2020/
  [2]千言數(shù)據(jù)集:閱讀理解公開評測
  https://aistudio.baidu.com/aistudio/competition/detail/45
【免責(zé)聲明】本文僅代表作者本人觀點,與CTI論壇無關(guān)。CTI論壇對文中陳述、觀點判斷保持中立,不對所包含內(nèi)容的準(zhǔn)確性、可靠性或完整性提供任何明示或暗示的保證。請讀者僅作參考,并請自行承擔(dān)全部責(zé)任。

專題

CTI論壇會員企業(yè)

紫云| 合阳县| 临潭县| 南安市| 顺平县| 龙游县| 普安县| 苍溪县| 康定县| 三台县| 美姑县| 兴国县| 定州市| 昭觉县| 广元市| 崇州市| 股票| 郓城县| 高阳县| 白城市| 清丰县| 同德县| 拜城县| 玉龙| 安多县| 马尔康县| 河津市| 军事| 禹城市| 巴彦淖尔市| 宣化县| 潢川县| 泗水县| 凉城县| 通许县| 蒙阴县| 海南省| 连州市| 华安县| 昂仁县| 柳河县|