在信息急劇增長的時代,科研工作者們往往面臨著海量的文獻資料和繁瑣的數(shù)據(jù)處理任務(wù)。為了幫助大家更高效地進行水科學(xué)領(lǐng)域的研究,北京大學(xué)環(huán)境科學(xué)與工程學(xué)院基于百度文心大模型推出了全新的水科學(xué)研究助手——WaterScholar!它基于強大的文獻數(shù)據(jù)庫和檢索增強技術(shù) RAG,讓您輕松查詢文獻、梳理引言、總結(jié)內(nèi)容、回答問題,現(xiàn)已在星河社區(qū)上線,歡迎相關(guān)領(lǐng)域?qū)I(yè)人士與高校師生體驗!
01
響應(yīng)科研需求,創(chuàng)新科技助力
水科學(xué)作為一門綜合性學(xué)科,涉及水文水循環(huán)、給排水、水環(huán)境化學(xué)、水污染控制、水生態(tài)修復(fù)與保護、水系統(tǒng)可持續(xù)管理、氣候變化等研究領(lǐng)域,與泥沙、礦物質(zhì)、鹽類、有機質(zhì)、溶解性氣體、重金屬、化學(xué)污染物、蛋白質(zhì)、藻類、浮游動物、魚類、鳥類、水生植被等物質(zhì)或生命體關(guān)系密切,其研究內(nèi)容廣泛而復(fù)雜,發(fā)表的相關(guān)文獻累積已超過1500萬篇,并且每年正在以超百萬量級的速度增長。
水科學(xué)研究領(lǐng)域?qū)φ泶罅康目蒲形墨I的需求愈發(fā)強烈,然而,傳統(tǒng)的文獻檢索和信息整理方式往往耗時耗力,難以滿足深入挖掘潛在信息、梳理前沿進展、探索問題新方案等日益增長的需求。水科學(xué)研究范式亟需拓展,尤其是文獻梳理、知識學(xué)習(xí)以及科研輔助。
因此,北京大學(xué)環(huán)境科學(xué)與工程學(xué)院劉永教授研究組攜手百度 AI,推出水科學(xué)研究助手WaterScholar,旨在通過智能化的方式,簡化科研流程,提高研究效率,讓科研工作者們能夠更專注于研究本身,發(fā)掘更多有價值的科研成果。
02
輕松上手,知識速成
WaterScholar 基于飛槳星河社區(qū)(AI Studio)平臺開發(fā),底層大模型為文心大模型。目前階段實現(xiàn)的主要功能為查詢水相關(guān)領(lǐng)域文獻、圍繞關(guān)鍵詞撰寫引言、總結(jié)概括簡化內(nèi)容、根據(jù)文獻回答問題,希望能為對水科學(xué)研究領(lǐng)域感興趣的用戶提供幫助,包括研究人員、學(xué)生、工程師等。
■ 功能1:查詢水相關(guān)領(lǐng)域文獻
功能描述: 根據(jù)提供的關(guān)鍵詞信息在數(shù)據(jù)庫中檢索相關(guān)的文獻信息,并生成相應(yīng)的文本文件;
返回結(jié)果:返回查詢到的文獻內(nèi)容、下載鏈接和提示信息。
■ 功能2:圍繞關(guān)鍵詞撰寫引言
功能描述:根據(jù)傳入的關(guān)鍵詞撰寫水科學(xué)領(lǐng)域的英文引言,引言長度在800-1200詞之間,內(nèi)容包括研究問題的重要性、相關(guān)研究進展、存在的問題或不足、以及將要開展的研究內(nèi)容;
返回結(jié)果: 返回撰寫好的英文引言內(nèi)容和提示信息。
■ 功能3:總結(jié)概括簡化內(nèi)容
功能描述: 根據(jù)傳入的文獻摘要內(nèi)容進行總結(jié),并去除無關(guān)信息,返回簡要介紹;
返回結(jié)果:返回總結(jié)后的文獻摘要內(nèi)容和提示信息。
■ 功能4:根據(jù)文獻回答問題
功能描述: 根據(jù)文檔內(nèi)容回答提供的問題;
返回結(jié)果:返回根據(jù)文檔內(nèi)容回答問題的結(jié)果和提示信息。
03
技術(shù)方案:文獻數(shù)據(jù)庫+RAG
智能處理更高效
WaterScholar 的強大功能得益于其背后的兩大核心:文獻數(shù)據(jù)庫和 RAG 技術(shù)。首先,數(shù)據(jù)庫基于在線文獻數(shù)據(jù)集(英文),獲取到水科學(xué)領(lǐng)域的關(guān)鍵文獻清單。其中文獻來自于水科學(xué)領(lǐng)域數(shù)千種學(xué)術(shù)期刊和會議,數(shù)量超過300萬篇,信息包含題目、摘要、作者、時間、研究對象、研究問題與方法等。通過語義相似性匹配等智能搜索算法從文獻摘要信息中快速準確地找到與用戶關(guān)鍵詞相關(guān)的文獻列表,處理為可下載的文件鏈接。鏈接分為兩部分:文獻清單與文獻摘要,提供豐富的研究素材,用戶可下載文件并在本地閱讀與使用。其次,RAG(Retrieval-Augmented Generation)是一種將檢索技術(shù)與語言生成技術(shù)相結(jié)合的創(chuàng)新方法,旨在提高搜索結(jié)果的準確性和多樣性,實現(xiàn)對文獻內(nèi)容的深度理解和智能處理。它能夠自動提取文獻中的關(guān)鍵信息,生成高質(zhì)量的引言和總結(jié),并根據(jù)用戶的需求提供有針對性的回答,提高了工作效率,降低人為因素導(dǎo)致的誤差和遺漏。
WaterScholar 充分發(fā)揮了北大環(huán)境學(xué)院在專業(yè)領(lǐng)域的資源優(yōu)勢和百度文心大模型的技術(shù)優(yōu)勢。首先,文心大模型的解析調(diào)度模塊可根據(jù)用戶輸入確定是否使用工具 API 及解析參數(shù)取值,并發(fā)出啟用服務(wù)命令;WaterScholar 收到請求后提取 API 需要的參數(shù),完成文獻查詢、結(jié)果處理、文件生成等功能,并將其摘要緩存在服務(wù)器端;工具服務(wù)完成處理后,以 json 格式返回由摘要緩存、用戶需求、prompt 模板形成的數(shù)據(jù);文心大模型匯總結(jié)果并按要求智能生成答案。
04
團隊介紹
劉永
北京大學(xué)教授、環(huán)境科學(xué)與工程學(xué)院院長
國家環(huán)境保護河流全物質(zhì)通量重點實驗室副主任
主要研究方向為湖泊-流域過程與調(diào)控,主持國家水專項、973計劃青年項目等,發(fā)表 SCI 論文150余篇,出版第1作者專著5部;獲中國青年科技獎、中國生態(tài)環(huán)境十大科技進展等,兼任教育部科技委委員、Limnology and Oceanography 副主編等。
蔣青松
北京大學(xué)環(huán)境科學(xué)與工程學(xué)院助理研究員
主要研究方向為流域科學(xué)與機器學(xué)習(xí)算法,發(fā)表論文17篇,以第一作者申請授權(quán)軟件著作權(quán)6項,出版專著2部;獲國家青年自然科學(xué)基金項目資助。
05
常見問題解答,讓您更放心使用
為了讓大家更好地使用 WaterScholar,整理一些常見的問題和解答:
■ Q1: WaterScholar 與相似產(chǎn)品有何不同?
本項目開展的 WaterScholar 將更加聚焦于水體研究領(lǐng)域,雖然涉及眾多自然學(xué)科,但主體圍繞水體進行知識問答或引言梳理,提供更加專業(yè)性的事實依據(jù)和知識生成服務(wù)。
■ Q2: 文獻如何實現(xiàn)匹配與排序?
目前 WaterScholar 通過后端程序?qū)崿F(xiàn)云端數(shù)據(jù)庫的訪問,根據(jù)用戶查詢文獻時輸入的關(guān)鍵詞與數(shù)據(jù)庫中的文獻摘要計算文本相似性,按照相似性得分高低排序,并返回前20篇文獻。
■ Q3: 文獻來源是否真實可靠?
文獻全部來自于 SCI 數(shù)據(jù)庫,保留了含有摘要的300余百萬篇文獻,信息來源真實可靠;包含的信息還包括年份、題目、作者、DOI 鏈接、期刊、關(guān)鍵詞、引用數(shù)、研究領(lǐng)域等。
■ Q4: WaterScholar是否支持多種語言?
目前,WaterScholar 主要支持中文和英文,其中查詢文獻時建議使用英文關(guān)鍵詞進行檢索,使專業(yè)術(shù)語的語義匹配更準確;后續(xù)逐步增加對其他語言的支持。
■ Q5: 我是否可以修改生成的提示詞?
生寫一段質(zhì)量較好的答案需要復(fù)雜的提示詞,包括對文字長短、內(nèi)容要點、格式等方面的約束。目前已經(jīng)在工具中準備了必要的提示詞,但用戶可以明確提出自己重點關(guān)心的問題,大模型據(jù)此關(guān)鍵要點進行引言梳理。
■ Q6: WaterScholar 生成的引言和總結(jié)是否可以直接用于論文?
WaterScholar 生成的引言和總結(jié)是基于文獻內(nèi)容的智能提取和整理,可以作為論文的參考素材。但建議您在使用前進行修改和完善,以確保符合論文的專業(yè)要求和風(fēng)格。
■ Q7: 使用 WaterScholar 是否免費,訪問需要國外 VPN?
WaterScholar 完全免費,在國內(nèi)聯(lián)網(wǎng)條件下直接使用即可。
■ Q8: 如何提交使用反饋意見?
可進入問卷星(https://www.wjx.cn/vm/t2VFw02.aspx),完成問卷需花費一分鐘左右,感謝您提出寶貴意見!
06
未來優(yōu)化升級計劃
隨著人工智能技術(shù)發(fā)展和科研需求的不斷變化,該項目將在北大環(huán)境學(xué)院以及相關(guān)領(lǐng)域推廣試用,持續(xù)優(yōu)化 WaterScholar 的功能與性能。主要計劃如下:
(1)完善文獻數(shù)據(jù)庫,補充中文期刊文獻數(shù)據(jù),增加更多的學(xué)術(shù)資源和數(shù)據(jù)支持;
(2)緊跟技術(shù)發(fā)展,增加大語言模型對長文本的支持能力;
(3)加強 RAG 技術(shù)的研究和應(yīng)用,將目前的段落級別匹配提升為語句級別識別,提高智能處理的準確性和效率;
(4)升級 WaterScholar 為 AI Agent 模式,增加數(shù)據(jù)分析、多角色交互、調(diào)用外部工具等功能;
(5)優(yōu)化工具訪問速度。
相信 WaterScholar 將成為水科學(xué)研究領(lǐng)域不可或缺的重要工具,為科研工作者們提供更加便捷、高效的服務(wù)。誠邀廣大科研工作者們前來體驗 WaterScholar 的魅力,攜手推動水科學(xué)研究的進一步發(fā)展!請前往星河社區(qū)平臺使用,開啟您的智能科研之旅吧!
原標題:校企合作!基于文心大模型共建水科學(xué)研究助手WaterScholar