當(dāng)前,互聯(lián)網(wǎng)搜索引擎中出現(xiàn)了越來越多的人工智能(AI)聊天機(jī)器人,如谷歌的Bard、微軟的Bing等。這似乎將要改變科學(xué)搜索引擎。
據(jù)《自然》報(bào)道,8月1日,荷蘭出版業(yè)巨頭愛思唯爾向其Scopus數(shù)據(jù)庫的部分用戶發(fā)布了一個(gè)基于ChatGPT的AI界面。當(dāng)天,英國數(shù)字科學(xué)公司(Digital Science)也宣布為其Dimensions數(shù)據(jù)庫的AI大語言模型(LLM)進(jìn)行封閉試驗(yàn)。美國科睿唯安公司還試圖將LLM納入其Web of Science數(shù)據(jù)庫。
(資料圖)
用于科學(xué)搜索的LLM并不是什么新鮮事物,Elicit、Scite和Consensus等初創(chuàng)公司已經(jīng)推出了此類AI系統(tǒng),即依靠免費(fèi)的科學(xué)數(shù)據(jù)庫或通過與出版商合作的方式訪問付費(fèi)的研究論文,從而幫助總結(jié)某個(gè)領(lǐng)域的發(fā)現(xiàn)或識(shí)別頂尖研究。
現(xiàn)在,擁有大型科學(xué)數(shù)據(jù)庫的公司也加入其中。
愛思唯爾作為試點(diǎn)推出了名為Scopus AI的聊天機(jī)器人。負(fù)責(zé)該工具開發(fā)的Maxim Khan說,作為一個(gè)輕便、有趣的工具,Scopus AI旨在幫助研究人員快速獲得不熟悉的研究主題的摘要,其使用LLM GPT-3.5版本可以獲得一段關(guān)于該研究主題的流暢總結(jié)、引用的參考文獻(xiàn)以及需要進(jìn)一步探索的問題。
但學(xué)者對(duì)LLM的擔(dān)憂是,它們是不可靠的。LLM只是通過輸出文本上看似合理的詞語來工作,輸出的內(nèi)容可能包含事實(shí)錯(cuò)誤和偏見,甚至還會(huì)編造出不存在的參考文獻(xiàn)。
因此,Scopus AI只能通過參考5至10篇研究摘要來生成答案。愛思唯爾還限制Scopus AI僅搜索2018年后發(fā)表的文章,以獲取最近的論文,并指示其在回復(fù)中適當(dāng)引用摘要,以避免不安全或惡意的查詢。這雖然不能完全避免錯(cuò)誤,但可以最大限度減少錯(cuò)誤。
那么,用戶是否會(huì)將機(jī)器人生成的段落復(fù)制粘貼到論文中,從而對(duì)內(nèi)容進(jìn)行抄襲?Khan表示,這是有可能的。不過,愛思唯爾通過“指導(dǎo)意見”來解決這一問題,要求研究人員負(fù)責(zé)任地使用摘要。資助者和出版商也發(fā)布了類似的指導(dǎo)意見,要求公開透明地披露LLM是否用于撰寫論文或進(jìn)行同行評(píng)審,或者在某些情況下聲明不應(yīng)該使用LLM。
目前,Scopus AI僅向約1.5萬名用戶推送。愛思唯爾表示,該工具預(yù)計(jì)將于2024年初全面開放。
Dimensions數(shù)據(jù)庫引入AI助手同樣只針對(duì)選定的測(cè)試者。在用戶輸入問題后,搜索引擎首先檢索相關(guān)文章,然后開放的AI GPT模型圍繞已檢索到的排名靠前的摘要生成摘要段落。Dimensions還使用LLM提供了相關(guān)論文的更多細(xì)節(jié),包括研究結(jié)果的簡短總結(jié)。
數(shù)字科學(xué)公司首席產(chǎn)品官Christian Herzog說,公司希望在今年底前在更廣泛的范圍內(nèi)發(fā)布該工具,目前正在與科學(xué)家、資助者和其他使用Dimensions的人合作,測(cè)試LLM在哪些方面可能有用。他說:“這關(guān)乎逐漸適應(yīng)一項(xiàng)新技術(shù)并信任它?!保ㄎ臉窐罚?/p>