2億篇論文免費看!「微軟學術」停用,OpenAlex要(yào / yāo)接班
新智元報道(dào)
編輯:David 時(shí)光
【新智元導讀】爲(wéi / wèi)了(le/liǎo)接替已下線的(de)「微軟學術搜索」,大(dà)型免費學術索引 OpenAlex 已于(yú)今年年初正式上(shàng)線,它涵蓋 2 億篇科學文獻,易學易用,完全免費,網站将于(yú) 2 月上(shàng)線。
最近,大(dà)型免費學術資源索引 OpenAlex 宣布上(shàng)線,該索引包含超過 2 億份科學文獻。
這(zhè)個(gè)資源索引服務名爲(wéi / wèi) OpenAlex,源自古代埃及亞曆山大(dà)圖書館館名。
創始人(rén)表示,該索引對出(chū)版物來(lái)源、作者信息和(hé / huò)研究主題進行編目,旨在(zài)繪制這(zhè)些數據點之(zhī)間的(de)聯系,以(yǐ)創建一(yī / yì /yí)個(gè)全面的(de)、相互關聯的(de)全球研究系統數據庫。
去年 5 月,微軟宣布将于(yú)當年年底關閉學術搜索知識圖譜(MAG) ,讓一(yī / yì /yí)些學者和(hé / huò)其他(tā)使用其數據進行研究和(hé / huò)開發的(de)人(rén)感到(dào)擔憂。
爲(wéi / wèi)應對 MAG 的(de)下線,位于(yú)加拿大(dà)溫哥華的(de)非營利性學術服務公司 OurResearch 利用倫敦慈善機構 Arcadia Fund 提供的(de) 450 萬美元的(de)一(yī / yì /yí)部分,創建了(le/liǎo)這(zhè)項「偉大(dà)工程」。
今年 1 月 3 日推出(chū)的(de)這(zhè)個(gè)免費學術索引數據庫,功能上(shàng)與微軟的(de) Academic Graph (MAG) 類似,MAG 是(shì) Scopus、Dimensions 和(hé / huò) Web of Science 等學術訂閱平台的(de)免費替代品,已于(yú) 2021 年底停止運營。
據悉,該索引當前通過可執行複雜搜索的(de)應用程序編程接口或 API 訪問。
微軟「學術圖譜」接班人(rén)
無論是(shì)研究人(rén)員,還是(shì)開發者,都需要(yào / yāo)大(dà)量查閱論文、專著等學術成果。近年來(lái),越來(lái)越多的(de)人(rén)開始繞過學術出(chū)版商的(de)「付費牆」,通過多種手段免費獲取學術資源。
作爲(wéi / wèi)微軟 MAG 的(de)替代品,此前 OpenAlex 一(yī / yì /yí)直在(zài)從 MAG 獲得論文、作者和(hé / huò)其他(tā)數據實體。在(zài) MAG 正式停止運營後,OpenAlex 開始自己從互聯網收集更多新内容。
目前 OpenAlex 已經發布新的(de) REST API 。與之(zhī)前下載安裝的(de)方式相比,可以(yǐ)更快、更簡單地(dì / de)訪問 OpenAlex 數據庫,無需賬戶和(hé / huò)令牌,完全免費。
目前,通過 API 可以(yǐ)獲取單一(yī / yì /yí)實體、實體列表和(hé / huò)實體組。
OpenAlex 數據集描述了(le/liǎo) 5 類學術實體以(yǐ)及這(zhè)些實際之(zhī)間的(de)聯系。每類實體分别對應其目标:
成果:包括論文、書籍、數據集等,會引用其他(tā)成果
作者:做出(chū)成果的(de)人(rén)
出(chū)處:刊載成果的(de)期刊或資源庫
機構:(通過作者)與成果相關的(de)大(dà)學或其他(tā)組織
概念:以(yǐ)話題方式對成果進行标簽
OpenAlex 表示,探索 OpenAlex 數據集的(de)最簡單方法是(shì)通過 Web 界面,無需編寫代碼即可探索 OpenAlex。不(bù)過目前網站開發尚未完成,預計在(zài)今年 2 月上(shàng)線。
盡管 MAG 已停用,但作爲(wéi / wèi)其繼任者和(hé / huò)替代,OpenAlex 将繼續維護 MAG 格式至今年 7 月 2 日,從 2022 年 7 月起,OpenAlex 将不(bù)再支持 MAG 格式。
由于(yú)目前尚處于(yú)早期開發階段,各項功能尚待進一(yī / yì /yí)步完善,OpenAlex 将每日單個(gè)用戶調用數量限制在(zài) 10 萬次以(yǐ)下。
OpenAlex 三大(dà)優勢
在(zài)綜合比較各種數據庫之(zhī)後,小編發現,OpenAlex 具有明顯的(de)三大(dà)優勢,這(zhè)将帶給用戶美好的(de)體驗。
海量數據,覆蓋面超 MAG
OurResearch 的(de)聯合創始人(rén)賈森·普裏姆(Jason Priem)表示,「OpenAlex 的(de)創立是(shì)爲(wéi / wèi)了(le/liǎo)實現與其他(tā)幾個(gè)數據庫互聯互通,使其覆蓋更加廣泛全面。」
與某個(gè)單一(yī / yì /yí)數據庫相比,OpenAlex 擁有更加開放的(de)獲取覆蓋面,它擁有來(lái)自 Wikidata 标識符、MAG 、ORCID、Crossref、ROR、Unpaywall 等數據資源。
普裏姆表示,「我們不(bù)僅可以(yǐ)給用戶提供文章的(de)免費版本,還可以(yǐ)告訴你該文章的(de)授權和(hé / huò)不(bù)同版本。」
簡單易用,20 分鍾就(jiù)會
「OpenAlex 是(shì)在(zài)用一(yī / yì /yí)種聰明的(de)方式,将大(dà)量的(de)數據庫整合在(zài)一(yī / yì /yí)起。」歐弗頓公司(Overton)的(de)創始人(rén)尤安·阿迪(Euan Adie)說(shuō)。
歐弗頓是(shì)家總部位于(yú)倫敦的(de)公司,主要(yào / yāo)用于(yú)跟蹤政策文件的(de)引用。過去,歐弗頓公司從不(bù)同的(de)來(lái)源獲取數據,包括 MAG、ORCID、Crossref,也(yě)直接向個(gè)人(rén)獲取。
現在(zài),歐弗頓隻使用 OpenAlex,寄希望于(yú)檢索過程更加便捷,簡單設置讓人(rén)容易學會。
「我隻需要(yào / yāo) 20 分鍾就(jiù)會使用 OpenAlex,而(ér)對比 MAG 卻要(yào / yāo)3-4 天。」阿迪說(shuō)。
「我花了(le/liǎo)大(dà)約 2 小時(shí)就(jiù)學會了(le/liǎo) OpenAlex,而(ér)開始用 MAG 卻要(yào / yāo)一(yī / yì /yí)周。」另一(yī / yì /yí)位使用者 Roar Bakken Stovner 說(shuō)。
Stovner 認爲(wéi / wèi),對于(yú)更精通計算機的(de)人(rén)來(lái)說(shuō),MAG 可能不(bù)算難,而(ér)對于(yú)那些想要(yào / yāo)自己嘗試開發小項目的(de)人(rén)來(lái)說(shuō),OpenAlex 将更容易開始。
不(bù)用登錄,完全免費
OpenAlex 的(de)底層代碼在(zài) CC0 版權許可下可以(yǐ)免費獲得,任何人(rén)都可以(yǐ)在(zài)其上(shàng)進行開發。
因此,賈森·普裏姆(Jason Priem)表示,OpenAlex 每兩周更新一(yī / yì /yí)次,比 MAG 更向前邁進了(le/liǎo)一(yī / yì /yí)步。
假如,哪一(yī / yì /yí)天 OpenAlex 停止運行,那麽,任何人(rén)都可以(yǐ)從接着 Priem 停下的(de)進度繼續開發,而(ér)不(bù)必從頭開始搭建數據庫。
此前,MAG 的(de)用戶必須登錄系統,并支付少量費用,才可以(yǐ)下載。而(ér) OpenAlex 可以(yǐ)免費使用。
普裏姆表示,這(zhè)要(yào / yāo)感謝 Amazon Web Services 的(de)贊助,不(bù)需要(yào / yāo)注冊或登錄,這(zhè)使得使用過程更加友好。
不(bù)過,OpenAlex 可能會考慮爲(wéi / wèi)那些想要(yào / yāo)超快訪問的(de)用戶,推出(chū)付費高級版本。
但,免費的(de)版本總是(shì)可用的(de)。
參考資料:
https://www.nature.com/articles/d41586-022-00138-y
https://www.nature.com/articles/d41586-022-00103-9
https://docs.openalex.org/