
「Titanic: Machine Learning from Disaster-Information-Rules」翻訳してみた((Kaggleのタイタニック号沈没生存グループ予測チュートリアル))

Titanic: Machine Learning from Disaster


Competition Rules

  • 参加者一人に対して1つのアカウントです

  • 他の参加者にコードやデータを秘密にしてはいけません


  • チームの合併

  • チームリーダはチームを合併することができます。合併するためには、合計投稿数が合併日として許可されている日以下であることが必要です。最大数は、一日あたりの投稿数に、コンペが開催されてからの日数を乗じたものです。
  • チーム制限

  • 投稿制限



開始日: 9/28/2012 9:13:33 PM UTC
合併の最終ライン: なし
最初の投稿の最終ライン: なし
終了日: 12/31/2016 11:59:00 PM UTC


  •   ****以下、翻訳時点での記事コピー(元記事:https://www.kaggle.com/c/titanic/rules)*****


「Titanic: Machine Learning from Disaster-Information-Evaluation」翻訳してみた(Kaggleのタイタニック号沈没生存グループ予測チュートリアル)

Titanic: Machine Learning from Disaster



史実に基づくデータセットを「トレーニングセット」と「テストセット」の2つに分けています。トレーニングセットでは、各船客に対する生死(ground truth)を提供します。このセットを使って、テストセットの予測をするためのモデルを生成してください。
テストセットの各船客に対して、彼らが沈没から生き残ったかどうかを、死亡は0、生存は1として予測する必要があります。モデルのスコアは、 正しく予測できた割合です。
Kaggleのleaderboardの構成要素には、おおやけにしているものと、秘密にしているものとがあります。 テストセットに対する予測の50%はおおやけにしているほうのleaderboardにランダムに掲載されます。(すべての利用者とも、50%です。)おおやけにされたほうのスコアは、leaderboardに表示されます。コンテストの終わりに、最終勝者を決めるために残りの50%を明らかにします。これはleaderboardに対して過学習を予防する効果があります。

「Predict survival on the Titanic using Excel, Python, R & Random Forests」翻訳してみた(Kaggleのタイタニック号沈没生存グループ予測チュートリアル)

Predict survival on the Titanic using Excel, Python, R & Random Forests
(Excel、Phtyon、R、Random Forestsを用いてタイタニックの生存者を予測する)



このKaggleの「入門」コンペは、データサイエンティストや機械学習の経験があまりない人々に向けた典型的な入門として提供しています。データは高度に構造化されており、Excel、Python、Pythonのpandas、PythonのRandom Forest(サイドバーのリンク参照)向けに複雑性を増したチュートリアルを準備しています。Rを使ったチュートリアルへのリンクも準備しています。フォーラムはご自由にお使いください。誰かが同じように悩んでいるかもしれませんし。



See best practice code and explore visualizations of the Titanic dataset on Kaggle Scripts. Submit directly to the competition, no data download or local environment needed!
The sinking of the RMS Titanic is one of the most infamous shipwrecks in history.  On April 15, 1912, during her maiden voyage, the Titanic sank after colliding with an iceberg, killing 1502 out of 2224 passengers and crew. This sensational tragedy shocked the international community and led to better safety regulations for ships.
One of the reasons that the shipwreck led to such loss of life was that there were not enough lifeboats for the passengers and crew. Although there was some element of luck involved in surviving the sinking, some groups of people were more likely to survive than others, such as women, children, and the upper-class.
In this challenge, we ask you to complete the analysis of what sorts of people were likely to survive. In particular, we ask you to apply the tools of machine learning to predict which passengers survived the tragedy.
This Kaggle "Getting Started" Competition provides an ideal starting place for people who may not have a lot of experience in data science and machine learning. The data is highly structured, and we provide tutorials of increasing complexity for using Excel, Python, pandas in Python, and a Random Forest in Python (see links in the sidebar). We also have links to tutorials using R instead. Please use the forums freely and as much as you like. There is no such thing as a stupid question; we guarantee someone else will be wondering the same thing!
New to machine learning?
We recommend getting started with this either of these free, interactive Titanic tutorials:
Want to model in R? Check out this tutorial by DataCamp
Prefer to learn Python? Get started with this tutorial by Dataquest.


