三人團隊打造的學術搜索引擎,直接拿下 SOTA!
号稱搜索結果相關性平均比谷歌學術高 5 倍,能搜索超 1 億個研究對象,還不依賴 LLM。
更重要的是:免費,學生黨狂喜!
先來看一波使用效果,輸入搜索關鍵詞,隻需 350 毫秒," 啪 " 得一下高度相關文獻就列出來了:
還能再一鍵篩選出可查看 PDF 的文件。
從年份、引用次數,到出版類型、具體期刊,都能設定一鍵過濾:
搜索出來的論文,點擊題目即可預覽,支持一鍵複制常見學術引用格式:
這個新搜索引擎名叫Lumina,據說目前已處理了超 30 萬次查詢,支持 24 種語言。
爲了和谷歌學術等傳統學術搜索引擎做比較,開發團隊還專門搞了個基準測試,代碼庫也已開源放了出來,測試結果 Lumina 搜索結果的相關性拿下 SOTA。
開發者發推文叫闆谷歌:
我們三個人花幾個月就做出來了,比谷歌的好。
AI 3D 模拟引擎 Ego 聯合創始人兼 CTO、前 Meta 研究員看過後表示閉眼沖:
強烈推薦大家試一試。
還有不少學者表示好使:
搜索相關性最高高 11 倍
如開頭所述,爲了測試 Lumina 的性能,研究團隊開源了一個基準測試。
使用 GPT-4 作爲 " 評判員 ",重點比較了 Lumina Base(基礎搜索模式)、Lumina Recursive(遞歸搜索模式)、Semantic Scholar 和谷歌學術搜索結果的相關性和精确度。
直接檢測評估了每個搜索引擎的前 10 個搜索結果,對比如下:
在基礎搜索模式下(Lumina Base),Lumina 搜索結果的相關性比谷歌學術高 4.8 倍,比 Semantic Scholar 高 8 倍,評估基于生成的約 2470 個查詢數據集。
Lumina 在遞歸搜索模式下,搜索結果相關性進一步提升,比谷歌學術高 6.8 倍,比 Semantic Scholar 高 11.3 倍,同樣基于 2470 個查詢數據集。
此外,Lumina 在每次檢索中都能穩定提供 2-3 個高度相關結果,相比之下,谷歌學術隻有 50% 的檢索能提供 1 個高度相關的結果,Semantic Scholar 則僅有 30% 的檢索能達到這一标準。
換句話說,Lumina 可以找到原本很難找到的研究成果。
團隊還表示,使用 Lumina API 和一個簡單的遞歸腳本,可以使相關性比谷歌學術高 11 倍,Lumina API 即将發布。
除了基本的檢索,Lumina 還提供AI 概述功能。
比如用 " 機器學習 " 關鍵詞搜索,它就會引用檢索出來的論文總結介紹機器學習:
點擊 AI 概述中有下劃線的關鍵詞,就會觸發對該關鍵詞的進一步檢索:
AI 概述下方還有對搜索論文研究成果圖表的彙總:
三人團隊打造
Lumina 背後是一個僅有三人的開發團隊,已獲 YC 投資。
聯合創始人兼 CEO Mehul Chadda,本科畢業于美國威斯康星大學麥迪遜分校材料工程專業,前高精度科學儀器公司 CAMECA 制造工程師,負責過原子探針研發工作。
聯合創始人兼 CTO Akhilesh Sharma,本科畢業于美國伊利諾伊大學香槟分校完成機械工程專業,之前是社交媒體平台 Postpress 的聯合創始人和技術主管,也曾擔任美國技術咨詢公司 Neudesic 雲技術相關顧問。
聯合創始人 Ishaan Kapoor,加州大學洛杉矶分校統計學畢業,對深度學習、線性代數和大語言模型感興趣。
除了這次上新的學術搜索引擎,之前團隊還做了一個 AI 論文解讀工具——Lumina-chat。
點擊 Lumina 主頁右上角的 "Legacy System" 即可跳轉使用。
打開後是這樣嬸兒的,可以上傳 PDF 與 AI 交互進行論文解讀:
感興趣的童鞋可以試試~
https://lumina.sh/c5bbe32b-4fb7-476a-81aa-fe269f67f283
參考鏈接:
[ 1 ] https://x.com/lumina_ai_inc/status/1823810207576941047?s=46&t=iTysI4vQLQqCNJjSmBODPw
[ 2 ] https://x.com/Ishaank1999
[ 3 ] https://x.com/notakhilesh99
[ 4 ] https://x.com/bada_aaya