データサイエンスだけでは変えられない『機械脳の時代』

機械脳の時代――データサイエンスは戦略・組織・仕事をどう変えるのか?
 この本を読んだキッカケは、書店で新着書を眺めていて、書名に目が止まったからである。AIでも人工知能でもなく、「機械脳」である、と。機械学習、AI関連の本かと思い、立ち読みでペラペラみると、事例が結構触れられていそうで、これからの機械学習、AI活用の指針を得るために読んでみた。
 内容としては、データサイエンスを戦略・組織・仕事に使うためのアドバイスというか注意点というか、そんな内容であった。材料開発に使う場合の事例は当然出ては来ないが、あるある、といったことや、機械学習、データサイエンスを活用する上での注意点が学べ、なるほどという点もあり参考になった。
 
 そのあるあるの1つに、データがあるのだから何かできないか?と言われることが本書でも述べられていた。機械学習・AI関連のシンポジウムに参加してみても、そういったことはいろいろなところで言われているのだな、というのがわかる。
 
 だが、そのデータがある、というのが曲者だ。自社のこれまでの(データの)蓄積、自社製品のデータこそが財産だ。それを活かしてこそ競合に対する優位性が・・・うんぬんかんぬん・・・となるわけだが、じゃあ、データを頂ければすぐにやってみます。どこにありますか?誰に聞けばわかりますか?となると、いやー、いろんなところに残っているはずだ。と、こうなるわけだ。それこそ、実験ノートや各自のエクセルファイルレベルでね。こういった(すぐに)使えないデータは死蔵データであるとか、ダークデータと言われたりするそうだ。データが(どこかに)あったって、使えないんじゃないのと同じだ。データを集約したり、ゴミをとったりするのはデータサイエンスの分野では必ずぶつかることで、データクリーニングだとかデータクレンジングだとかいわれたりする。ここが一番人手がかかったりして律速になるのはよくあることだ。そこにコストも人でもかけずに(どこかに散らばっている)データがあるんだから、何かやれ、というのも困りものです。
 どこかの部署やチームレベルでAI・データサイエンスを推進しても、他部署やチームとの連携がスムーズに行くとは限らないし、むしろそうではない実感がある。これからデータサイエンスは技術者の読み書き算盤だ、という人もいるが、それくらい全社員的に共通知識、認識のもとで進められるところが強くなるだろうな。

 適宜読み返し、材料開発にデータサイエンスを活用する上での注意としたい。