2016年6月5日日曜日

「Facial Keypoints Detection-Submission Instructions」翻訳してみた(Kaggleの顔キーポイント発見チュートリアルのデータ提出方法について)

Facial Keypoints Detection(顔のキーポイント発見)

Submission Instructions(データの提出方法)

元記事:https://www.kaggle.com/c/facial-keypoints-detection/details/submission-instructions

 
データページから「submissionFileFormat.csv 」をダウンロードしてください。ファイルには発見に必要な場所のリストが含まれています。(データページの翻訳については http://techinfo4dog.blogspot.jp/2016/06/facial-keypoints-detectionget-datakaggle.html )
(※訳注:データページにsubmissionFileFormat.csvはない? フォーマットとしては、データページの IdLookupTable.csvか。Locationはデータが無いけど。)
提出ファイルの列
  • Row Id: 行ID。各行に対してのinteger型ID。
  • Image Id: 画像ID。各画像に対してのinteger型のID。テストセットには1783個の画像がある。
  • Feature Name: 特徴名。顔のキーポイントを記載してある。左の目の中心x、y、口の下唇中心x、y(left_eye_center_x, left_eye_center_y, mouth_bottom_center_lip_x, nose_tip_y)など。
  • Location: 場所。各特性に対するx、y。ここを予測します。

提出ファイル

各画像に対して30の特性(15の顔のキーポイントに対してx、y)すべてを予測する必要がありません。いくつかのイメージは30より少なめで良いです。submissionFileFormat.csvファイルを見てください。フォーマットは以下の通りです。
RowId,ImageId,FeatureName,Location
1,1,left_eye_center_x,?
2,1,left_eye_center_y,?
3,1,right_eye_center_x,?
4,1,right_eye_center_y,?
etc...



****以下、翻訳時点での記事コピー(元記事:https://www.kaggle.com/c/facial-keypoints-detection/details/submission-instructions)*****



Please download the file submissionFileFormat.csv from the data page. This file lists the points whose locations need to be detected.
Submission File Columns
  • Row Id: integer id for the row
  • Image Id: integer id for the image. There are 1783 images in the test set.
  • Feature Name: string identifying the facial keypoint, e.g., left_eye_center_x, left_eye_center_y, mouth_bottom_center_lip_x, nose_tip_y
  • Location: x- or y-coordinate of the specified feature. This is the value to be predicted.

Submission file

Note that you will not be detecting all 30 features (x and y coordinates for 15 facial keypoints) for each image. Some images require fewer keypoints to be detected. Please see the file submissionFileFormat.csv for details. The format looks like this:
RowId,ImageId,FeatureName,Location
1,1,left_eye_center_x,?
2,1,left_eye_center_y,?
3,1,right_eye_center_x,?
4,1,right_eye_center_y,?
etc...

「Facial Keypoints Detection-Get the Data」翻訳してみた(Kaggleの顔キーポイント発見チュートリアルのデータについて)

Facial Keypoints Detection(顔のキーポイント発見)

元記事:https://www.kaggle.com/c/facial-keypoints-detection/data



データファイル

ファイル名ファイルのフォーマット
training.zip (60.10 mb)
test.zip (15.99 mb)
SampleSubmission.csv (201.08 kb)
IdLookupTable.csv (842.51 kb)
 訳注:ファイルのフォーマット部分をクリックすると、ダウンロード前にコンペのルールに従うことを確認するダイアログが表示されるので、確認し、「I understand and accept」をクリックする。



各予測キーポイントは(x、y)の実際の値のペアをピクセル表記で表現されています。15のキーポイントがあり、顔の下記部分を表現しています。
left_eye_center, right_eye_center, left_eye_inner_corner, left_eye_outer_corner, right_eye_inner_corner, right_eye_outer_corner, left_eyebrow_inner_end, left_eyebrow_outer_end, right_eyebrow_inner_end, right_eyebrow_outer_end, nose_tip, mouth_left_corner, mouth_right_corner, mouth_center_top_lip, mouth_center_bottom_lip(左目中央、右目中央、左の目頭、左の目尻、右の目頭、右の目尻、左の眉内側端、左の眉外端、右の眉内側端、右の眉外端、鼻端、口の左端、口の右端、口の中心上唇、口の中心下唇)。
左、右は、被験者の視点からの表現です。
いくつかの例で、対象のキーポイントの場所が欠けています。かけた部分はcsv内で2つのカンマの間に値がありません。
 (訳注:training.csv内7050行目など、値が結構欠けている。)

データファイルの最終フィールドとして画像が与えられます。イメージは96×96ピクセルで、行順で、0から255の数値として与えられます。
Data files
  • training.csv: 7049 個の訓練用データ。各列は15のキーポイントと行順のピクセルリストとしての画像データを含む。(訳注:FeatureName(left_eye_……とか)30個のパラメータカンマ区切り、Imageはスペース区切りの大量の数字(96*96分)。7049行分で、各行にIDは無い。FeatureName部分は値が無いものもある。)
 


  • test.csv: 1783個のテスト画像。各行はイメージIDと、行順のピクセルリストとしての画像データを含む。 (訳注:1列目に連番(1~1783)、2列目はスペース区切りで数値データがたくさん(96*96分)。)

  • submissionFileFormat.csv: 27124個の予想用キーポイント。各行はRowId, ImageId, FeatureName, Location。FeatureNameは "left_eye_center_x," "right_eyebrow_outer_end_y,"など。Locationは予想する必要がある。
  • 訳注:SampleSubmission.csv:RowID、Locationの2列。RowIDは連番で1-27124まで。Locationはすべてゼロ。




  • 訳注:IdLookupTable.csv 。RowIDは1から27124.ImageIDは1から1783.RowIDが30個でImageIDが+1される。FeatureNameが30種類、各ImageIDに割り振られている計算。Location欄はからっぽ。RowIDから、ImageIDとFeatureNameに変換できるわけですね。FeatureNameは「左目中央、右目中央、左の目頭、左の目尻、右の目頭、右の目尻、左の眉内側端、左の眉外端、右の眉内側端、右の眉外端、鼻端、口の左端、口の右端、口の中心上唇、口の中心下唇」でそれぞれx、y。

 




****以下、翻訳時点での記事コピー(元記事:https://www.kaggle.com/c/facial-keypoints-detection/data)*****


Data Files

File NameAvailable Formats
training.zip (60.10 mb)
test.zip (15.99 mb)
SampleSubmission.csv (201.08 kb)
IdLookupTable.csv (842.51 kb)
Each predicted keypoint is specified by an (x,y) real-valued pair in the space of pixel indices. There are 15 keypoints, which represent the following elements of the face:
left_eye_center, right_eye_center, left_eye_inner_corner, left_eye_outer_corner, right_eye_inner_corner, right_eye_outer_corner, left_eyebrow_inner_end, left_eyebrow_outer_end, right_eyebrow_inner_end, right_eyebrow_outer_end, nose_tip, mouth_left_corner, mouth_right_corner, mouth_center_top_lip, mouth_center_bottom_lip
Left and right here refers to the point of view of the subject.
In some examples, some of the target keypoint positions are misssing (encoded as missing entries in the csv, i.e., with nothing between two commas).
The input image is given in the last field of the data files, and consists of a list of pixels (ordered by row), as integers in (0,255). The images are 96x96 pixels.
Data files
  • training.csv: list of training 7049 images. Each row contains the (x,y) coordinates for 15 keypoints, and image data as row-ordered list of pixels.
  • test.csv: list of 1783 test images. Each row contains ImageId and image data as row-ordered list of pixels
  • submissionFileFormat.csv: list of 27124 keypoints to predict. Each row contains a RowId, ImageId, FeatureName, Location. FeatureName are "left_eye_center_x," "right_eyebrow_outer_end_y," etc. Location is what you need to predict.