2016年3月29日火曜日

「Predict survival on the Titanic using Excel, Python, R & Random Forests」翻訳してみた(Kaggleのタイタニック号沈没生存グループ予測チュートリアル)

Predict survival on the Titanic using Excel, Python, R & Random Forests
(Excel、Phtyon、R、Random Forestsを用いてタイタニックの生存者を予測する)

元記事:https://www.kaggle.com/c/titanic


Kaggleスクリプトの、もっとも良い練習コードやタイタニックのデータセットを図式化したものを探す場合はこちら(https://www.kaggle.com/c/titanic/forums/t/13390/introducing-kaggle-scripts)。
コンペに直接送る場合、データをダウンロードしたりローカルに環境を作る必要はありません。

英国郵船タイタニック号の沈没は、歴史上の最も忌まわしい沈没事件の一つです。1912年4月15日、処女航海の途中で、タイタニックは氷山にぶつかり、2224人の客やクルーのうち1502人が死亡しました。この世間をあっと言わせた悲劇は世界中に衝撃を与え、船舶の安全性向上策の実施へとつながりました。
難破でこれほど多くの命が失われた一つの理由として、救命艇の数が客やクルーの人数に対して十分ではなかったことが挙げられます。
沈みゆく船から生き延びるのに運の要素はありますが、あるグループはほかのグループより生存率が高くなっています。そのグループとは女性、子供、上流階級、です。
このチャレンジで、Kaggleはあなたにどのような人々がより生き残りやすかったかを分析していただきます。特に、この悲劇を生き延びた客の予測に、機械学習のツールを適用していただくことを望んでいます。
このKaggleの「入門」コンペは、データサイエンティストや機械学習の経験があまりない人々に向けた典型的な入門として提供しています。データは高度に構造化されており、Excel、Python、Pythonのpandas、PythonのRandom Forest(サイドバーのリンク参照)向けに複雑性を増したチュートリアルを準備しています。Rを使ったチュートリアルへのリンクも準備しています。フォーラムはご自由にお使いください。誰かが同じように悩んでいるかもしれませんし。
 
機械学習は初めての場合。
このタイタニックチュートリアルを入門として使うのをおすすめします。
Rのモデルがほしい場合、DataCamp(https://www.datacamp.com/?utm_source=kaggle-ml-launch&utm_medium=blog&utm_campaign=kaggle-ml-launch)によるチュートリアル(https://www.datacamp.com/courses/kaggle-tutorial-on-machine-learing-the-sinking-of-the-titanic)をご参照ください。
Pythonについて学びたい場合、Dataquest(https://www.dataquest.io/)によるチュートリアル(https://www.dataquest.io/course/kaggle-competitions)をご参照ください。

 

****以下、翻訳時点での記事コピー(元記事:https://www.kaggle.com/c/titanic)*****


See best practice code and explore visualizations of the Titanic dataset on Kaggle Scripts. Submit directly to the competition, no data download or local environment needed!
The sinking of the RMS Titanic is one of the most infamous shipwrecks in history.  On April 15, 1912, during her maiden voyage, the Titanic sank after colliding with an iceberg, killing 1502 out of 2224 passengers and crew. This sensational tragedy shocked the international community and led to better safety regulations for ships.
One of the reasons that the shipwreck led to such loss of life was that there were not enough lifeboats for the passengers and crew. Although there was some element of luck involved in surviving the sinking, some groups of people were more likely to survive than others, such as women, children, and the upper-class.
In this challenge, we ask you to complete the analysis of what sorts of people were likely to survive. In particular, we ask you to apply the tools of machine learning to predict which passengers survived the tragedy.
This Kaggle "Getting Started" Competition provides an ideal starting place for people who may not have a lot of experience in data science and machine learning. The data is highly structured, and we provide tutorials of increasing complexity for using Excel, Python, pandas in Python, and a Random Forest in Python (see links in the sidebar). We also have links to tutorials using R instead. Please use the forums freely and as much as you like. There is no such thing as a stupid question; we guarantee someone else will be wondering the same thing!
New to machine learning?
We recommend getting started with this either of these free, interactive Titanic tutorials:
Want to model in R? Check out this tutorial by DataCamp
Prefer to learn Python? Get started with this tutorial by Dataquest.
 

0 件のコメント:

コメントを投稿