Giter Club home page Giter Club logo

kaggle-homecredit's People

Contributors

nyanp avatar

Stargazers

 avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar

Watchers

 avatar  avatar  avatar

kaggle-homecredit's Issues

過去の支払い履歴をカテゴリ変数化

  • 過去12ヶ月の支払いした/しないを12bitで表現し、そのままカテゴリ変数化するかtarget encoding

pos/credit/bureauそれぞれで実施できる。また、

  • 支払いが遅延したかどうか
  • リボ払いで買い物したかどうか
    などのバリエーションが作れる

ローン間の同期をみる

返済遅延月にクレジットを借りているなど、特にDPDを起こしている月のアクションに注目

ローン金額系でkmeans

ローンにもいくつかの種類があり、分割回数や金額が似ているものは似た傾向があるかも。
元の次元が小さいので、prevと組み合わせないと効果が薄いかも

DPDの1階微分/2階微分

#33 と近いアイデア。以下の2つの行動を区別したい。

  • 連続して延滞を続け、ある時点で一気に支払った場合
    • DPDは毎月の支払ごとに1か月分積みあがっていく。
    • →1階微分は30day、2階微分は0day.
  • 毎月遅延しながら支払っている場合
    • DPDは累積せず、毎月近い値を中心にばらつく。
    • →1階微分が0

PrevからInstall.DPDを予測

  • Prevのローン情報+Appricationのユーザー情報から、InstallでDPDが起きるかどうかを予測するモデルを作る
  • 学習したモデルでApplicationのDPDを予測したものを特徴量に加える

アクティブの定義を変えてみる(12->6)

「アクティブなローン」を「最後のMonthly StatusがActiveで、かつ直近12か月に更新があったもの」と定義しているが、これを直近6か月に変えてみる

(仮説)testはtrainより後のデータ

  • 同一ユーザーと思われる申し込みの組がtrain/testに複数観測されるが、いずれもtestの方が100日以上後
  • AMT_CREDITとAMT_ANNUITYの比率の分布が、train/test間でズレている
    • 期間の違いによる金利の差を反映している?
  • その他、train/testで明確にデータの分布が違う
    • Adversarial ValidationでAUCが0.98くらい出る

どの申し込みも直近8年(2922days)分のデータだけ使われているようなので、train/testで集計期間が変わる訳では無い

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.