2018.04.11 Wed |
新しい論文検索エンジン「Dimensions」
最近のOpen Access(誰でも閲覧できる)のオンラインジャーナルの数の増加や、中国などでの研究人口の増加、査読なしでのpreprintでの論文公開などを背景として、日々出版される論文数は、膨大な数になっています。たとえばガンの分野では、年間の論文数は10万件を越えます。
Nature、Cell、Scienceといった主要なトップジャーナル(とその姉妹紙)だけでも、毎週数百本もの論文が出版され、たとえ一つの狭い分野でも最新の情報にキャッチアップするのは容易ではありません。
毎週出版される論文の題名やAbstractを見るだけでもかなりの時間をもっていかれます。
別に最新事情にキャッチアップしたからと言って良い論文出版につながるかというと必ずしもそういうわけでもなく、モチベーション低下などにより、むしろ逆効果だったりしますが、他の人の論文をReviewしたり、授業で生徒に教えるときなど、最新事情に精通していることを求められる時があります。
ですので、良かれ悪かれ、各分野の専門家は、各分野の最新事情に精通している必要があります。
各分野の最新事情に精通するには、各学会でいろいろな人と話すことや人の発表を聞くことや、出版される論文を読むことが良く行われます。
最近は、異分野融合が進んできており、他分野の論文に目を通す必要も出てきています。たとえばガンの診断に関する記事が、医学・生命科学の分野のジャーナルでなく、AIの分野のジャーナルで出版されるというようなことが多々あります。
他分野の技術を使うことで、自分の分野において突破口が開けることもあるので、他分野の研究成果を知っておくことは重要です。
しかし、他の分野となってくるとそもそも分野の数が多く、どれに着目すればよいのかわかりません。
普通は、Impact Factor(ジャーナルに掲載された各論文の被引用回数の平均)が高いジャーナルに載っている論文に着目したり、Impact Factor(論文の被引用回数)を使って、各論文の重要度を知ってどの論文を読むべきかを決めますが、出版されたばかりの論文では、どれもImpact Factor(論文の被引用回数)が0なので、どれが重要なのかわかりません。
今までは、Faculty of 1000( https://f1000.com/ )というサービスで、各国から選ばれた各分野の専門家が毎月のおすすめ論文を見つけて評価をシェアするといった流れがありました(正確には現在進行形であります)が、有料ということもありそれほど広くは広まっていないように感じています。
現在では、各論文がTwitterでどれほどシェアされているか、Facebookでどれほどシェアされているか、どれくらいFaculty of 1000でReviewされているか、BlogやNewsでどれほど取り上げられているか、Mendeley( https://www.mendeley.com/ )という論文管理・閲覧アプリでbookmarkされるかといった情報を総合して、Altmetricというスコアが作られ、まだ出版されたばかりで被引用回数がほぼ0の論文のimpactを測ることが行われています(教員ポストなどで参照される学術的な評価指標としては使われていないと思いますが)。
他分野にまたがって重要な論文を検索した際に、この、Altmetricというスコアとスコアの生成過程で使用する情報、さらにDimensions Badgeというスコア、目的の論文を引用している論文や研究資金の出所を表示するようなUIにした論文検索アプリとして、「Dimensions」というものが作られました。
「Dimensions」https://www.dimensions.ai/
僕もまだDimensionsの全体像は、把握できていないのですが、コアとなる論文検索エンジンアプリ以外にも、各種APIを提供しているみたいです。軽く触れますと、、
・Dimensions API:検索・集約・クラスタリングなどを行う。
・Open Dimensions Metrics API and Dimensions Badges:イノベーションと発見を促進するため、DimensionsメトリクスAPIとディメンションバッジを公開して非商用で利用できるようにしている。
などがwebsiteの説明に書いてあります。
https://www.dimensions.ai/info/learn-more/
もう少し、Dimensionsがどのようなものなのか、ReadCubeのメルマガで送られてきた文書を和訳しておきます。
ーーーー
・出版物と関連する助成金、特許、臨床試験、著者、引用、分析などの間で9千を超える出版物、全文検索、40億のリンク(contextual links)がある。
・既存のReadCube資格情報(credentials)を使用してDimensionsにログインし、ワンクリックでReadCubeライブラリに論文を追加できる。
・雑音を除去するための高度なフィルタとメトリックの助けを借りて、最新の文献を検索して見つけることができる。
・最新動向を監視する:カスタム検索とフィルタリングを作成して維持して、作業している研究分野をより正確に特定することができる。
・ボタンをクリックするだけで、Open Accessのコンテンツを読むことができる。さらに、ReadCubeライブラリに追加するオプションもある。
・あなたのimpactとあなたの同輩のimpactの理解:引用データとaltmetricsは、出版された仕事の学問的および広範な影響を追跡し、展示するのに有用な指標を提供する。
・新しい機会と協力者を特定する:ネットワークをトレースして、関心のある分野で働いている人々を特定し、特定の研究がどこから資金提供を受けていかを特定する。
ーーーーーー
それでは、実際に「Dimensions」のFree Appを使って論文検索してみましょう。
https://app.dimensions.ai/discover/publication
まずここ↑にアクセスします。
何を検索しても良いですが、以前本ブログで取り上げた、
Automatic chemical design using a data-driven continuous representation of molecules
https://arxiv.org/pdf/1610.02415v1.pdf
を検索してみたいと思います。
「Dimensions」の検索ボックスに
「Automatic chemical design using a data-driven continuous representation of molecules」
と入力してみましょう。
すると以下のような結果が出てきます。
真ん中の一番上に今回検索した論文が出てきているのが分かるかと思います。
Citationが8
Altmetricが396であることがわかります。
それでは、この論文の名前をクリックしてみましょう。
以下のような画面になります。
左上から、
論文題名
著者名と所属
要旨
があります。
右には、
Dimensions BadgeとAltmetricがありますね。
まずは、Dimensions Badgeを見てみましょう。右上のDimensions Badgeのロゴをクリックしてください。ちなみにDimensions Badgeは、Dimensionsが提供する独自評価指標です。民間などからの資金(funding)、学術的outputs, 政策(policy), 特許、公的な資金(grants)から作成される指標みたいですが、個人的にはそれほど詳しく内容把握していません。
これを下の方にスクロールしていくと、
「It is too early to compare the number of citations this publication has received so far to other publications in the same field. Dimensions can usually start to do this two years after publication.」と出てきます。まだ適切に評価できないとのことです。
次に、Citing research categoriesタブをクリックすると、どの分野からの引用が多いかを知ることができます。
それでは、Altmetricのロゴがある二つ前の画面に戻ってください。
次に、Altmetricのロゴ(中心に396とあるカラフルなもの)をクリックしてみてください。
以下のような画面が出てくると思います。
これを下へスクロールしていきましょう。
Twitterでこの論文のリンクがつぶやかれた回数とその場所(国)がヒートマップで出力されているのが分かります。
次に真ん中上の、Mendeley Readers タブをクリックしてみましょう。
論文管理・閲覧ソフトMendeleyでどの国の人が何回ブックマークしたか、その人たちは、学生なのか、研究者なのかがわかります。
次は、Attention Score in Contextタブをクリックしてみましょう。
4つのスコア、
・ALL RESEARCH OUTPUTS:17,637位 /9,655,615位
・OUTPUTS FROM ACS CENTRAL SCIENCE:2位/459位
・OUTPUTS OF SIMILAR AGE:1,300位/257,094位
・OUTPUTS OF SIMILAR AGE FROM ACS CENTRAL SCIENCE:1位/46位
がでてきます。どれもかなり良いようです。
現在上の画面では、Summaryタブがアクティブになっていますが、今度は、Newsタブを見てみましょう。
この論文を取り上げている、News記事を見ることができます。
News記事はリンクになっており、それぞれクリックすればその記事に飛べます。
次に、Twitterタブをクリックしてみましょう。
誰が具体的にどんな内容でつぶやいているのかが分かりますね。
残念ながら、無料アカウントでは、4つまでしかTweetを見れないみたいなので、有料アカウントに移行するか、自分で、PythonかRなどで、TwitterAPIをたたく必要があるかと思います。
また、特筆すべき点として、ReadCubeとの連携があり、あとでよく読みたいものなど、以下の画面で、
「Add to Library」ボタンを押すことで、論文を論文管理・Readerアプリである、ReadCubeへ登録することができます。
それでは、最後に、最初に検索して出てきた画面(すぐ上にある、右にDimension BadgeとAltmetricがある画面)を下にスクロールしていきます。
まず、今回の論文「が」引用した論文の参考文献(Publication references)がでてきます。
それぞれに、CitationとAltmetricがついていて便利ですね。
その次に「公的資金による援助(Supporting grants)」について、期間と金額がでてきます。
いちいち論文をダウンロードすることなく細かい情報が分かるので。人によっては便利でしょう。
そして、最後に今回の論文「を」引用している論文がでてきます。
これもいちいち調べる必要なく、またAltmetricが出ているので便利ですね。
ということで、一通り「Dimensions」の解説を終えました。
より詳しく知りたい方は、
この2分動画をご覧ください。
鈴木瑞人
東京大学大学院新領域創成科学研究科メディカルゲノム専攻 博士課程
株式会社パッパーレ 代表取締役(https://www.pappare.co.jp/)
NPO法人Bizjapan テクノロジー部門BizXチームリーダー(http://bizjapan.org/en/)
実践的機械学習勉強会 代表( https://0f1304e65103e294f80c0307ba.doorkeeper.jp/ )