GSIデータセット-06(軌道)


概要

 このデータは、機械学習に用いることを想定して、地上画素寸法20cmで撮影された空中写真のRGB各8ビット3チャンネル画像を対象として、軌道が写っている画素を黄色(RGB:#FFFF00)でラベリングしたものです。機械学習に用いるため、各データは元画像(オリジナル画像)とラベリング画像の2枚のペアで構成され、ファイル名によって各ペアを識別することができます。

画像の仕様

 画像サイズは、572ピクセル×572ピクセルのものと、286ピクセル×286ピクセルのものの2種類があります。いずれの画像も、各チャンネルのビット深度は8ビット、画像形式はPNG形式です。
 2023年3月22日時点でダウンロード可能な画像は、572ピクセル×572ピクセルのもの2000ペア、286ピクセル×286ピクセルのもの10000ペアとなっています。

作成方法

 基本的な作成方法は、地上画素寸法20cmの設計で撮影された空中写真画像から572ピクセル×572ピクセルの範囲を切り出してオリジナル画像とし、それを複製したラベリング画像に対して、軌道のうち、レールとレールの間が写っていると判断される画素を黄色に塗りつぶした画像とし、572ピクセル×572ピクセルの1ペアのデータを作成します。
 次に、572ピクセル×572ピクセルのオリジナル画像、ラベリング画像それぞれを4分割し、286ピクセル×286ピクセルの画像4枚を作成します。さらに572ピクセル×572ピクセルの画像全体を286ピクセル×286ピクセルに縮小して5枚目を作成し、286ピクセル×286ピクセルのオリジナル画像とラベリング画像5ペアとします。286ピクセル×286ピクセルの画像は、ある程度のスケーリング(地上画素寸法が40cm程度まで大きくなった場合)にも対応できると考えられます。
 ほとんどの画像は、国土地理院が測量成果閲覧用に使用しているJPG形式の画像から切り出されており、ごく少数の画像が測量成果の画像から直接切り出されています。

 使用した空中写真画像の対象地区は、2007年度から2018年度の地上画素寸法20cm撮影地区として撮影された地区で、原則として2007年から2019年までに撮影されています。また、デジタル航空カメラによって撮影された画像を使用しており、2019年度以降に計画された撮影地区の画像や、フィルム式の航空カメラによって撮影されデジタル化された画像は含まれていません。

 誤抽出を低減するために、軌道が写っていないFALSE画像も含んでいます。

 また、本データセットの特徴は、オルソ画像ではなく空中写真の生画像を対象画像として使用している点にあります。そのため、ラベリング画像の作成は、必要に応じて簡易立体視を行いながら人間の手によって行われています。

 本データによる学習済モデルの抽出性能は、572ピクセル×572ピクセルの1~2000番までを使用し、90度、180度、270度に回転させた画像も追加したモデルでF=0.723でした。

ラベリング対象としての軌道の定義

 軌道には、「普通鉄道」「地下鉄地上部」「路面鉄道」「特殊軌道」を含みますが、「モノレール」「鋼索鉄道」「索道」は含みません。軌道のうち、車両の走行に用いられる相対する2本(3本のレールによって構成される軌道の場合は、最も外側のレール。車両の走行に用いられない脱線防止用のガードレールや集電用の第三軌条は含みません)のレールに挟まれた領域をラベリング対象としています。軌間は問いません。ガントレット区間、アプト式の区間はラベリング対象ですが、本データには含まれていません。
 鉄道車両やホームの屋根などによって遮蔽された区間、トンネルや雪覆いなどで遮蔽された区間はラベリング対象としていません。廃線や休止中の区間、遊戯用に敷設されたと思われるものも相対するレールが確認できる区間はラベリング対象としている一方、運行中の区間や側線であっても雑草などによってレールが覆われていたり、舗装路面に敷設されていたり、建物などの影によって、相対するレールが確認できない区間は、ラベリングを行っていない場合があります。

サンプル画像

 こちらにサンプル画像を示します。このサンプルは、本データセットの572ピクセル×572ピクセルの画像のうち1147番を表示したものです。このように、ラベリング画像は、軌道が写っている画素を黄色に着色した画像となっています。

オリジナル画像のサンプルラベリング画像のサンプル
オリジナル画像ラベリング画像

ダウンロード

 本データセットは、オリジナル画像(orgフォルダに格納されています)、ラベリング画像(valフォルダに格納されています)で構成されており、次のリンクからダウンロードできます。拡張子.zipと.tar.gzは梱包方式が違うだけで含まれるデータは同じです。

出典表示

 本データは、国土地理院コンテンツ利用規約の下で使用できます。研究発表等に用いる場合は、次のように出典を表示してください。

国土地理院(2023):CNNによる軌道抽出のための教師画像データ,国土地理院技術資料 H1-No.28.