Eamonn Keogh のチュートリアル

Eamonn KeoghKDD 2009のチュートリアル"How to do good research, get it published in SIGKDD and get it cited!"を読んでみた。
これは表題のとおり、良い研究はいかにして行われるか、そしてどのような論文がKDDで採択されるかを解説したチュートリアルである。著者自身、部分時系列クラスタリングにおいて、K-means法のクラスタ中心が入力時系列にほぼ無関係に正弦波パターンとなることを実験的に示し、当該分野における従来の研究成果を大きく覆した著名な研究者である(これについて詳しく知りたい方はIBMの井手剛さんの「部分時系列クラスタリングの理論的基礎」という論文を参照のこと)。

このチュートリアルを読んで自分が衝撃を受けたのは、ある国際会議のベストペーパーを引用している多くの論文で、そのベストペーパーの誤った記述を何の検証もなしにそのまま引用し、提案する手法の仮定として採用してしまったという事例であった。

他にも色々な具体例を挙げてあり、これから自分が研究をしていくうえで既存の研究を自分の手で再実験することの重要性を感じた。

以下の論文は著者が挙げている参考文献である。時間ができたら読もうと思っている。

Voodoo Correlations in Social Neuroscience. Vul, E, Harris, C, Winkielman, P & Pashler, H.. Perspectives on Psychological Science.

Why most Published Research Findings are False. J.P. Ioannidis. PLoS Med 2 (2005), p. e124.

Publication Bias: The “File-Drawer Problem” in Scientific Inference. Scargle, J. D. (2000), Journal for Scientific Exploration 14 (1): 91–106

Classifier Technology and the Illusion of Progress. Hand, D. J. Statistical Science 2006, Vol. 21, No. 1, 1-15

Everything you know about Dynamic Time Warping is Wrong. Ratanamahatana, C. A. and Keogh. E. (2004). TDM 04

Magical thinking in data mining: lessons from CoIL challenge 2000 Charles Elkan

How Many Scientists Fabricate and Falsify Research? A Systematic Review andMeta-Analysis of Survey Data. Fanelli D, 2009 PLoS ONE4(5)