查文獻(xiàn)、讀文獻(xiàn),是做科研的一項(xiàng)基本工作。據(jù)統(tǒng)計(jì),科研人員花費(fèi)在查找和消化科技資料上的時(shí)間約占全部科研時(shí)間的51%。有沒有一種可能,將文獻(xiàn)變成一個(gè)知識(shí)庫或者數(shù)據(jù)庫,用人工智能方法減輕科研人員查找與閱讀文獻(xiàn)的“負(fù)擔(dān)”?5月30日,在2023中關(guān)村論壇“人工智能驅(qū)動(dòng)的科學(xué)研究論壇”上,基于大語言模型+向量數(shù)據(jù)庫的文獻(xiàn)知識(shí)庫——Science Navigator(以下簡稱文獻(xiàn)知識(shí)庫)正式發(fā)布。
這是一項(xiàng)讓科研人員通過對(duì)話提問的方式進(jìn)行文獻(xiàn)檢索、閱讀、分析及管理的科研成果。該成果由北京科學(xué)智能研究院、中國科學(xué)院計(jì)算機(jī)網(wǎng)絡(luò)信息中心、墨奇科技聯(lián)合研發(fā)。
“從最早眼查手翻的‘查閱式’檢索,到后來基于搜索引擎以及互聯(lián)網(wǎng)的‘搜索式’檢索,再到現(xiàn)在人工智能技術(shù)的跨越式發(fā)展,我們首次看到大語言模型在理解問題和問答能力上接近人類智能的水平。”墨奇科技副總裁孟卓飛表示,文獻(xiàn)知識(shí)庫的發(fā)布,恰好趕上了檢索模式進(jìn)入對(duì)話時(shí)代的發(fā)展趨勢(shì)。
“文獻(xiàn)知識(shí)庫的性能優(yōu)勢(shì),可以用‘多、快、好、省’4個(gè)字來形容。”孟卓飛介紹,“多”體現(xiàn)在“多模態(tài)、多模型、多數(shù)據(jù)”;“快”指的是“查詢快、導(dǎo)入快、迭代快”;“好”體現(xiàn)在“數(shù)據(jù)更實(shí)時(shí)、引用更可靠、理解更專業(yè)”;“省”則是通過極致的系統(tǒng)優(yōu)化與自研向量算法,讓數(shù)據(jù)的運(yùn)算成本明顯降低。
文獻(xiàn)知識(shí)庫的發(fā)展方向,是將更多實(shí)驗(yàn)數(shù)據(jù)納入向量數(shù)據(jù)庫。屆時(shí),科學(xué)實(shí)驗(yàn)涉及的設(shè)計(jì)原理、實(shí)驗(yàn)方式,實(shí)驗(yàn)結(jié)論以及結(jié)論背后對(duì)應(yīng)的思考都可以作為查詢的目標(biāo)。孟卓飛表示,借助大模型和向量數(shù)據(jù)庫,科研人員提出方向性問題,機(jī)器將完成拆解問題、提出質(zhì)疑、設(shè)計(jì)實(shí)驗(yàn)、模擬實(shí)驗(yàn)等一套流程,甚至可以根據(jù)結(jié)果進(jìn)行問題的反思推導(dǎo)與迭代,進(jìn)一步釋放科研人員的時(shí)間精力,以投身解決關(guān)鍵問題與創(chuàng)新思考。(記者何亮)
北疆新聞:內(nèi)蒙古自治區(qū)重點(diǎn)新聞網(wǎng)站(客戶端),內(nèi)蒙古出版集團(tuán)新華報(bào)業(yè)中心旗下國家互聯(lián)網(wǎng)新聞信息采編發(fā)布服務(wù)一類資質(zhì)網(wǎng)站(客戶端)。
北疆新聞版權(quán)與免責(zé)聲明:
一、凡本站中注明“來源:北疆新聞”的所有文字、圖片和音視頻,版權(quán)均屬北疆新聞所有,轉(zhuǎn)載時(shí)必須注明“來源:北疆新聞”,并附上原文鏈接。
二、凡來源非北疆新聞的新聞(作品)只代表本網(wǎng)傳播該消息,并不代表贊同其觀點(diǎn)。
如因作品內(nèi)容、版權(quán)和其它問題需要同本網(wǎng)聯(lián)系的,請(qǐng)?jiān)谝娋W(wǎng)后30日內(nèi)進(jìn)行,聯(lián)系郵箱:bjwmaster@163.com。
版權(quán)聲明:北疆新聞版權(quán)所有,未經(jīng)書面授權(quán),不得轉(zhuǎn)載或建立鏡像,違者依法必究。 本站違法和不良信息舉報(bào)電話:15648148811蒙ICP備16001043號(hào)-1
Copyright © 2016- 北疆新聞網(wǎng) All Rights Reserved互聯(lián)網(wǎng)新聞信息服務(wù)許可證:15120200009-1蒙公網(wǎng)安備:15010502001245