查文獻、讀文獻,是做科研的一項基本工作。據(jù)統(tǒng)計,科研人員花費在查找和消化科技資料上的時間約占全部科研時間的51%。有沒有一種可能,將文獻變成一個知識庫或者數(shù)據(jù)庫,用人工智能方法減輕科研人員查找與閱讀文獻的“負擔(dān)”?5月30日,在2023中關(guān)村論壇“人工智能驅(qū)動的科學(xué)研究論壇”上,基于大語言模型+向量數(shù)據(jù)庫的文獻知識庫——Science Navigator(以下簡稱文獻知識庫)正式發(fā)布。
這是一項讓科研人員通過對話提問的方式進行文獻檢索、閱讀、分析及管理的科研成果。該成果由北京科學(xué)智能研究院、中國科學(xué)院計算機網(wǎng)絡(luò)信息中心、墨奇科技聯(lián)合研發(fā)。
“從最早眼查手翻的‘查閱式’檢索,到后來基于搜索引擎以及互聯(lián)網(wǎng)的‘搜索式’檢索,再到現(xiàn)在人工智能技術(shù)的跨越式發(fā)展,我們首次看到大語言模型在理解問題和問答能力上接近人類智能的水平?!蹦婵萍几笨偛妹献匡w表示,文獻知識庫的發(fā)布,恰好趕上了檢索模式進入對話時代的發(fā)展趨勢。
“文獻知識庫的性能優(yōu)勢,可以用‘多、快、好、省’4個字來形容。”孟卓飛介紹,“多”體現(xiàn)在“多模態(tài)、多模型、多數(shù)據(jù)”;“快”指的是“查詢快、導(dǎo)入快、迭代快”;“好”體現(xiàn)在“數(shù)據(jù)更實時、引用更可靠、理解更專業(yè)”;“省”則是通過極致的系統(tǒng)優(yōu)化與自研向量算法,讓數(shù)據(jù)的運算成本明顯降低。
文獻知識庫的發(fā)展方向,是將更多實驗數(shù)據(jù)納入向量數(shù)據(jù)庫。屆時,科學(xué)實驗涉及的設(shè)計原理、實驗方式,實驗結(jié)論以及結(jié)論背后對應(yīng)的思考都可以作為查詢的目標(biāo)。孟卓飛表示,借助大模型和向量數(shù)據(jù)庫,科研人員提出方向性問題,機器將完成拆解問題、提出質(zhì)疑、設(shè)計實驗、模擬實驗等一套流程,甚至可以根據(jù)結(jié)果進行問題的反思推導(dǎo)與迭代,進一步釋放科研人員的時間精力,以投身解決關(guān)鍵問題與創(chuàng)新思考。(記者何亮)
北疆新聞:內(nèi)蒙古自治區(qū)重點新聞網(wǎng)站(客戶端),內(nèi)蒙古出版集團新華報業(yè)中心旗下國家互聯(lián)網(wǎng)新聞信息采編發(fā)布服務(wù)一類資質(zhì)網(wǎng)站(客戶端)。
北疆新聞版權(quán)與免責(zé)聲明:
一、凡本站中注明“來源:北疆新聞”的所有文字、圖片和音視頻,版權(quán)均屬北疆新聞所有,轉(zhuǎn)載時必須注明“來源:北疆新聞”,并附上原文鏈接。
二、凡來源非北疆新聞的新聞(作品)只代表本網(wǎng)傳播該消息,并不代表贊同其觀點。
如因作品內(nèi)容、版權(quán)和其它問題需要同本網(wǎng)聯(lián)系的,請在見網(wǎng)后30日內(nèi)進行,聯(lián)系郵箱:bjwmaster@163.com。
版權(quán)聲明:北疆新聞版權(quán)所有,未經(jīng)書面授權(quán),不得轉(zhuǎn)載或建立鏡像,違者依法必究。 本站違法和不良信息舉報電話:15648148811蒙ICP備16001043號-1
Copyright © 2016- 北疆新聞網(wǎng) All Rights Reserved互聯(lián)網(wǎng)新聞信息服務(wù)許可證:15120200009-1蒙公網(wǎng)安備:15010502001245