はじめに
これは、「富士通クラウドテクノロジーズ Advent Calendar 2019」の15日目の記事です。
昨日は@e10personaさんの 「青空文庫の作品の感情レーダーチャートを作ってみた」でした。
感情、可視化、小説、など自分の興味範囲ズバリのところの話でびっくりでした。
自己紹介
@yoshitsugumiです。 12月1日付で富士通クラウドテクノロジーズ株式会社に転職しました。前職ではSIやってました。
配属先はデータを価値に変えるビジネスを行なっているDATA DESIGN部です。ロールとしては主にエンジニア(エンジニアリング+データサイエンス)ですが、五月雨的にプロデューサー(事業開発、営業)ロールをとっていく予定です。
私ごとですが4-11月で育児休業を取得しておりビジネスの世界にまだ戻りきれていません。そして仕事はじめ早々子供の病気により保育園登園不可となり2日おやすみ、その他端末、アカウント設定などに時間を費やし、仕事のスタートダッシュがきれていない感がヤバめです。
本題
の前に…。
書く内容がまとまらず右往左往してました。15日の朝には更新しておく方が良かったかと後から思ったけど時すでに遅し。結果的にタイトルにある「病児保育施設の需要と供給の実態を可視化しようとして失敗した話」を書きましたが、途中書こうと思って断念したことを残しておきます。
やろうとしたことと、やめた理由
-
AI関連の用語をまとめる
→機械学習とか統計とかデータビジュアライゼーションとか自然言語処理とか。その辺の用語をまとめようと思ったけど「どうやってまとめて可視化しようか?」と考え出してドツボにはまってやめました。
-
経営、投資に役立つ情報をOpendataから見つける
→先行事例を探して見てでなんとなく終わる。 -
何かの文章からMecabで名詞や形容詞を抽出し、word2Vecで分散表現にしてTensorboardで可視化する
→これは青空文庫を入力にやってみたんですが、いい感じの見せ方がわからず記事化を断念。有名な「king - man + woman = queen」みたいなこともやってみました。 - 助成金の用途の可視化
→助成金の仕組みがわからず断念。「xx助成金」みたいなのがいっぱいあるし、厚生労働省がやってるのか各自治体がやっているのかわからず。そして統計的なものが見つけられませんでした。e-stat見たんですけど、調べ方が悪いのだろうか。
結局
「助成金」を調べようかと思ったのはこの記事がきっかけです。
助成金の用途は調べきれなかったので、前から触ってみたかったTableauを使って病児保育の実態的なものを可視化してみようと思い作業してみました。この時点で目的不在です;
入力
指定都市以外の状況を都道府県の方にまとめてあるように見えますが、どうまとめたか書いてある記述が見つけられず本当のところは不明です。
加工、ツール
PDFのテキストをコピーしてきてエディタで置換したりウニャウニャしました。
可視化ツールは先に述べた通りtableau(タブロー)です。14日の試用期間があったので無料で使わせてもらいました。
結果
H29の病児保育 年間利用延べ人数/実施箇所合計をグラフにしました。
雰囲気西日本の方が数値が大きいです。私が住んでいる川崎も大きい。
数値が大きいということは、施設あたりの利用者数が多い≒混んでいる(か1施設の規模が大きい)ということ。か?
改善点
っていうか、そもそも何をしたいのかを明確にすべきでしょう。
今回はとりあえず見つけた病児施設関連の統計をグラフ化しただけです。そういうのは往往にして何も語ってきません。利用人数は実績なので需要の代替にはならないでしょうし。
普通に考えると「利用したい人(需要)に対して十分な量の病児施設(供給)があるかどうか」が気になると思うのでそのために必要なデータを集めるべきです。
具体的にはこれらがあると上記分析ができると思います。(指定都市別の子供の人数が見つけられる気がしないので県別に見る方がいいかと思い以下としました)
やれよって感じだと思うんですが、年度を合わせたり写真からデータを取ってきたり、病児施設の収容可能人数ってどうやって取ってくるねんとか考えてここでギブです。
気づき
データの収集、加工がやたら面倒です。よく言われるしわかってるつもりだったんですが一朝一夕にできる気がしませんでした。
また、私は「目的が大事」と思っていて、データの可視化でもそれはそうで、でもそれとは別に「手段の引き出し」も同じくらい大事だなと感じました。
やろうとしたことに書いた諦めたことたちは、自分の手段(スキル+知識)の引き出しがあればパパッとまとめられた気がしますが、手段を探し探しやってわからなくなって詰まって時間がなくなってしまいました。
手段と目的は上下関係があるものではなく補完するものなんだと。それはうちの部でいえばエンジニアとプランナーの関係性なんではなかろうかと。そう思いました。
仕事頑張ります。
さいごに
次は@herietさんで「第二回技術書同人誌博覧会の話を書くかも」とのことです。