ビッグデータと言えば、統計
いろいろな統計量を見て、経営者にデータからこういうことがわかりますよ!
と提言するかと思いますが、説得力を増すためにはやはりデータが重要ですよね。
根拠がないといけませんから。
データに裏付けられなと説得力がないですからね。
こちらはコロナの世界感染者推移を時系列で動画にしたものです。
「自動化」も大事ですが、「可視化」もデータサイエンティストにとっては大事です。
コロナ感染者データは非常に扱いやすいデータで各種機関などが公表してくれているので、今回はそのデータセットを使ってみました。
2番煎じですが、これに近いことはどうやってやるのだろうと。
GitHubを見ながら作ってみました。
GitHubって何?
ja.wikipedia.org
引用:
https://ja.wikipedia.org/wiki/GitHub
開発者向けコミニティのことで、リポジトリをforkできたりします。
ソースコードを公開したり、拝借してきたりできます。
自分のパソコンを重たくはしたくなかったので、forkです。
cloneっていうのが自分のローカルリポジトリにコピーすることですね。
ネット上で使えそうなソースを探すのもいいですが、基本的にGit上にはきちんとドキュメントとしてもとまったものが多いので便利です。
みなさん二次配布を前提に作ってくれていますからね。