論文自動生成プログラムSCIgen(2)
先日のエントリ
論文自動生成プログラムSCIgen
の続き。
SCIgenという論文自動生成プログラムが2005年に開発されて以降、
このプログラムによって自動生成された論文が、査読付きの学会に複数採択されている、という内容を書いたけれど、
そのことを指摘した論文のPDFファイルが公開されていた。
Duplicate and Fake Publications in the Scientific Literature:
How many SCIgen papers in Computer Science?
http://hal.archives-ouvertes.fr/docs/00/71/35/55/PDF/0-FakeDetectionSci-Perso.pdf
タイトルは、なんともわかりやすい。
「コンピュータサイエンスの分野で、SCIgenによって生成された論文はいくつ存在するか?」
ということで、具体的な検証方法と、その結果が示されている。
今回の調査で、IEEEの査読付き学会に採択された論文の中で、少なくとも85編の論文がSCIgenによって生成されたものであるとわかったらしい。
それらについての記述が興味深かったので紹介してみる。
・85編の論文は、24の学会に採択されていた。少なくとも24の学会がSCIgenによるニセ論文を見抜けなかった。
・89人の著者が、これらの論文に関わっていた。そのうち63人は1つの論文だけに関わっていたが、中には8編の論文に関わっていた者もいる。
・著者の所属する大学は全部で16大学であったが、そのうちの1つの大学が、全体の4分の1のニセ論文に関わっていた。
与えられた文章が、人間が作成したものか、プログラムで自動生成したものかどうかを判定するWebサービス。
http://montana.informatics.indiana.edu/cgi-bin/fsi/fsi.cgi
架空の研究者 Ike Antkare の h-index 操作に関する記述
http://paperdetection.blogspot.jp/2010/08/fake-h-index.html
架空の研究者 Ike Antkare の論文リスト
http://membres-lig.imag.fr/labbe/Publi/IkeAntkare/Ike_AntKare_index.html
オリジナルのSCIgenの別バージョンも作られていて、物理学の論文を自動生成する「SCIgen-Physics」なるものが存在する。
こちらは、より高度な数式を自動生成する(下図)
IBM 奇跡の“ワトソン”プロジェクト: 人工知能はクイズ王の夢をみる
- 作者: スティーヴン・ベイカー,金山博・武田浩一(日本IBM東京基礎研究所),土屋 政雄
- 出版社/メーカー: 早川書房
- 発売日: 2011/08/25
- メディア: 単行本
- 購入: 2人 クリック: 55回
- この商品を含むブログ (27件) を見る
2045年問題 コンピュータが人類を超える日 (廣済堂新書)
- 作者: 松田卓也
- 出版社/メーカー: 廣済堂出版
- 発売日: 2012/12/22
- メディア: 新書
- クリック: 3回
- この商品を含むブログ (21件) を見る