論文自動生成プログラムSCIgen(2)

先日のエントリ
論文自動生成プログラムSCIgen
の続き。


SCIgenという論文自動生成プログラムが2005年に開発されて以降、
このプログラムによって自動生成された論文が、査読付きの学会に複数採択されている、という内容を書いたけれど、
そのことを指摘した論文のPDFファイルが公開されていた。


Duplicate and Fake Publications in the Scientific Literature:
How many SCIgen papers in Computer Science?
http://hal.archives-ouvertes.fr/docs/00/71/35/55/PDF/0-FakeDetectionSci-Perso.pdf


タイトルは、なんともわかりやすい。
コンピュータサイエンスの分野で、SCIgenによって生成された論文はいくつ存在するか?」
ということで、具体的な検証方法と、その結果が示されている。


今回の調査で、IEEEの査読付き学会に採択された論文の中で、少なくとも85編の論文がSCIgenによって生成されたものであるとわかったらしい。
それらについての記述が興味深かったので紹介してみる。

・85編の論文は、24の学会に採択されていた。少なくとも24の学会がSCIgenによるニセ論文を見抜けなかった。
・89人の著者が、これらの論文に関わっていた。そのうち63人は1つの論文だけに関わっていたが、中には8編の論文に関わっていた者もいる。
・著者の所属する大学は全部で16大学であったが、そのうちの1つの大学が、全体の4分の1のニセ論文に関わっていた。


与えられた文章が、人間が作成したものか、プログラムで自動生成したものかどうかを判定するWebサービス
http://montana.informatics.indiana.edu/cgi-bin/fsi/fsi.cgi


架空の研究者 Ike Antkare の h-index 操作に関する記述
http://paperdetection.blogspot.jp/2010/08/fake-h-index.html


架空の研究者 Ike Antkare の論文リスト
http://membres-lig.imag.fr/labbe/Publi/IkeAntkare/Ike_AntKare_index.html


オリジナルのSCIgenの別バージョンも作られていて、物理学の論文を自動生成する「SCIgen-Physics」なるものが存在する。
こちらは、より高度な数式を自動生成する(下図)



IBM 奇跡の“ワトソン”プロジェクト: 人工知能はクイズ王の夢をみる

IBM 奇跡の“ワトソン”プロジェクト: 人工知能はクイズ王の夢をみる