GSIデータセット-38(プラットホーム)


概要

 このデータは、機械学習に用いることを想定して、地上画素寸法20cmで撮影された空中写真のRGB各8ビット3チャンネル画像を対象として、プラットホームが写っている画素を黄色(RGB:#FFFF00)でラベリングしたものです。機械学習に用いるため、各データは元画像(オリジナル画像)とラベリング画像の2枚のペアで構成され、ファイル名によって各ペアを識別することができます。

画像の仕様

 画像サイズは、572ピクセル×572ピクセルのものと、286ピクセル×286ピクセルのものの2種類があります。いずれの画像も、各チャンネルのビット深度は8ビット、画像形式はPNG形式です。
 2023年3月28日時点でダウンロード可能な画像は、572ピクセル×572ピクセルのもの2200ペア、286ピクセル×286ピクセルのもの11000ペアとなっています。

作成方法

 基本的な作成方法は、地上画素寸法20cmの設計で撮影された空中写真画像から572ピクセル×572ピクセルの範囲を切り出してオリジナル画像とし、それを複製したラベリング画像に対して、プラットホームが写っていると判断される画素を黄色に塗りつぶした画像とし、572ピクセル×572ピクセルの1ペアのデータを作成します。
 次に、572ピクセル×572ピクセルのオリジナル画像、ラベリング画像それぞれを4分割し、286ピクセル×286ピクセルの画像4枚を作成します。さらに572ピクセル×572ピクセルの画像全体を286ピクセル×286ピクセルに縮小して5枚目を作成し、286ピクセル×286ピクセルのオリジナル画像とラベリング画像5ペアとします。286ピクセル×286ピクセルの画像は、ある程度のスケーリング(地上画素寸法が40cm程度まで大きくなった場合)にも対応できると考えられます。
 ほとんどの画像は、国土地理院が測量成果閲覧用に使用しているJPG形式の画像から切り出されており、ごく少数の画像が測量成果の画像から直接切り出されています。

 使用した空中写真画像の対象地区は、2007年度から2018年度の地上画素寸法20cm撮影地区として撮影された地区で、原則として2007年から2019年までに撮影されています。また、デジタル航空カメラによって撮影された画像を使用しており、2019年度以降に計画された撮影地区の画像や、フィルム式の航空カメラによって撮影されデジタル化された画像は含まれていません。

 誤抽出を低減するために、プラットホームが写っていないFALSE画像も含んでいます。プラットホーム上に屋根が設置されている部分は、プラットホームとしてのラベリングは行っていません。また、プラットホームが橋上の駅舎やコンコースなどで遮蔽されている箇所もラベリングは行っていません。

 また、本データセットの特徴は、オルソ画像ではなく空中写真の生画像を対象画像として使用している点にあります。そのため、ラベリング画像の作成は、必要に応じて簡易立体視を行いながら人間の手によって行われています。

 本データによる学習済モデルの抽出性能は、572ピクセル×572ピクセルの1~2050番までを使用し、90度、180度、270度に回転させた画像も追加したモデルでF=0.674でした。

サンプル画像

 こちらにサンプル画像を示します。このサンプルは、本データセットの572ピクセル×572ピクセルの画像のうち16番を表示したものです。このように、ラベリング画像は、プラットホームが写っている画素を黄色に着色した画像となっています。

オリジナル画像のサンプルラベリング画像のサンプル
オリジナル画像ラベリング画像

ダウンロード

 本データセットは、オリジナル画像(orgフォルダに格納されています)、ラベリング画像(valフォルダに格納されています)で構成されており、次のリンクからダウンロードできます。拡張子.zipと.tar.gzは梱包方式が違うだけで含まれるデータは同じです。

出典表示

 本データは、国土地理院コンテンツ利用規約の下で使用できます。研究発表等に用いる場合は、次のように出典を表示してください。

国土地理院(2023):CNNによるプラットホーム抽出のための教師画像データ,国土地理院技術資料 H1-No.31.