近年、テクノロジーの発展により今まで見えていなかったデータ(ビッグデータ)を収集できるようになりました。
このビッグデータにより、今まで感覚でしか測ることができなかった人間の行動心理を数字として表すことが可能となります。
Iot、AIなどまだ遠い近未来の話だと思っていましたが、よくよく考えると身近なところでもどんどん導入されつつあります。
例えば、スマートグリッド、POSシステム(電子マネー)、amazon dush、siri、ECにおけるレコメンド機能など普段何気なく使っているものでも、Iot端末として、またはAIの制御により、実はかなりのデータをexportし、そのデータをもとにサービスの改善が行われています。
データサイエンティストはそうやって蓄積されたビッグデータをビジネスの意思決定に活かす職業です。
私はこの職業をつい最近知りましたが、データ分析を生業とする以上目指すべき職であることに間違いはありません。
というわけで、データサイエンティストに必要なスキルをまとめてみました。
データサイエンティストに求められる素養
●高度な数学的素養(データサイエンス力)
●プログラミングスキル(データエンジニアリング力)
●マーケティング・金融工学などの経営知識にも精通(ビジネス力)
データをビジネスに活かすということで、単純にシステムやデータベースに精通しているだけでも、高度なプログラミングを組めるだけでも、またはビジネスの経験が豊富なだけでもだめなようです。全体を見通せる総合力を身につけなければなりません。ただし、ITスキルの習得は多大な時間を必要とするため、一般的にIT専門職経験者の方が優位性があるようです。
データサイエンティストに求められる具体的なスキル
データベースやOS、プログラミングについてかなり幅広い知識と経験が必要なようです。私自身、ITスキルが高いわけではないので勉強しつつですが、ど定番のLinux・SQL、R・Pythonの学習過程やトラブルシューティングは当ブログでも取り上げる予定です。
IT系スキル
RDBMS、SQL、Hadoop、JAVA、HDFS、MapReduce、Hive、pig、Linuxに関する知識・経験
R、Python、Perlなどのプログラミング言語の使用経験
分析系スキル
SAS、SPSS、BIなどの分析ツール知識・使用経験
データサイエンティストの作業プロセス
①ビジネスを理解する
最終的にどういったビジネスにデータを貢献させたいかあらかじめ営業部や事業者にヒアリングを行う必要があります。
②データを理解する
データがどういったつくりになっているか、どういった方法で収集されたデータなのかをデータ管理者にヒアリングを行う必要があります。
③データを準備する
データを処理可能な状態にし、必要な対象データを選択、整理、正規化しデータ分析に適した状態に加工します。
④モデリングを行う
クラスタリング、判別分析、回帰分析、決定木などのモデリング手法を使用し、データを分別、可視化することにより具体的な方向性を決定します。
⑤モデルを評価する
施策案が実際のビジネスにどのような影響を及ぼし目標に近づくことができるのかシミュレーションを行い、施策案を実行するか否かを決定します。必要があれば修正を加えます。
⑥モデルをビジネスに取り入れる
実際に施策案をビジネスに導入します。評価段階で検証済みですが、モニターを続け以上事態に対応できるようにします。
コメント