データを可視化して分かりやすく伝えたい。私がデータアナリストを志すきっかけでした。地図と国のオープンデータは、世に散らばる玉石混合のデータの中でも信用できる方だと思っています。余談ですがGoogleの社名は「googol」(10の100乗)が由来だそうです。日本での「無量大数」(10の68乗)より大きいですね。
もとから完全なデータはないし、分析過程もバイアスが入るので正しい答えにはならない。期待された答えに寄せていくこともできてしまう。P値が有意になるまで実験を繰り返すとか…。データを意思決定の指針(Data-driven)にするのではなく、データを参考にした(Data-informed)包括的な分析を心がけています。
国勢調査による人口を地図に表示する
佐賀県(日本の南側に位置する九州地域内にある県)の県庁所在地・佐賀市の人口を単純に地図化。地方はデータわけがざっくりなので、俯瞰すると中心地の地区がつぶれます。もっと小地域で鉄道通ってて人口も多いとこにすべきだった…。反省。
©OpenStreetMap contributors
使用データ
- 統計地理情報システム 境界データ:小地域 / 国勢調査 / 2020年 / 小地域(基本単位区)(JGD2000) / 世界測地系平面直角座標系・Shapefile / 佐賀県
- 色定義:白(0)- 紺(607)/人
- 背景:OpenStreetMap
- ツール:QGIS Desktop 3.30
QJISメモ(備忘)
- 地物(feature)=幾何属性(geometry)+主題属性(attribute)
- GIS属性テーブル内レコード(1行)=一つの地物
- テーブルの各列=フィールド、テーブルの各行=レコード
- 文字コード(日本語の文字化けを防ぐ)=「Shift-JIS」or「UTF-8」
【手順】
◆色の設定
- レイヤプロパティ>シンボロジタブ>単一定義から連続値による定義へ
- 値(Value)> 基準にしたいフィールド(ここではJINKO)
- 凡例の色を変える > カラーランプ右の下向き三角メニュー
◆地図にスケールバーや方位記号を表示
ビューメニューの地図整飾から適宜
◆国勢調査の境界データ:四つのファイル
- ダウンロードはZIP、シェープファイル(ESRI Shapefile)ベクタファイル形式
- 「.dbf」「.prj」「.shp」「.shx」
********
I want to visualise data and communicate it in an easy-to-understand way. This is what made me want to become a data analyst.The data in the world is a mixture of wheat and chaff. I think maps and national open data are more reliable.
By the way, the name Google comes from the numerical unit 'googol' (10 to the hundredth power). It's bigger than the Japanese expression for the largest number, the 'immeasurable great number' (10 to the 68th power).
No data is perfect from the start, and the analysis process will not give the right answer because of bias; unfortunately, it is also possible to get closer to the expected answer, e.g. by repeating the experiment until the p-value is significant.
We try to do a comprehensive analysis that refers back to the data, rather than using the data as the basis for a decision.
View the census population on a map
A simple map of the population of Saga City, the prefectural capital of Saga Prefecture (a prefecture in the Kyushu region of southern Japan). The data is roughly divided into rural areas, so if you look down, the central area district collapses.
Perhaps I should have chosen a smaller area with a railway and a larger population. My bad.
(The map is at the beginning of the article)
0コメント