【新企画】中古車の相場を統計処理して適正価格と買取価格を求めてみます。

さてさて、少し前にカーセンサーWEBサービスが終了してしまい、せっかくネタにしていた中古車情報が書けなくなっていたわけですが。
実はあれから、APIではない方法で中古車情報を仕入れるべく、Pythonのプログラムを仕込んでおりまして。

とは言っても、以前と同じことをしていたのでは芸がなく、せっかくなのでデータを統計処理して適正価格的なものを一覧表にしたら面白いかなって思いつき。
さらに、どうせなら販売価格だけではなく、買取価格もそんな感じで出せたら面白いかなということに自分の中でなり。

そんなこんなでようやく公開できる程度には出来上がったので、ぼちぼち公開していこうと思います。


方法についてですが、WEB上から取得できる情報を元に、年数と走行距離で重回帰分析をし、それで得た数式(回帰式)で年数と走行距離のマトリクスを埋めていくというものです。

車種はある程度絞り込んでいますので(ex.320d MスポやらC200 AMGラインやら)、装備品に大きな差は出ないと思います。
また、分析対象は修復歴なしに限定していますが、色や車検については考慮してません。
ただし、色については人気色ほど中古車の数も多いことから、どちらかというと人気色よりの数値が出ていると思います。

つまり、ここで示す価格や買取金額はあくまで目安であり、人気色以外であればもう少し低くなるでしょうし、サンルーフなどのパッケージに含まれていないオプションが付いていれば高くなるということです。

なお、中古車情報についてはリアルタイムではなく、昨日時点のものを深夜に取り込んでいますので、1日遅れのデータとなります。
ちなみに、深夜に取り込むのはサーバーに最も負荷がかからない時間帯にするためであり、一応気を遣っていますってことで。

講釈はこの辺にして、早速見てみましょうか。

まずは、我が愛車 BMW 3シリーズセダン 320d Mスポーツの中古車価格についての一覧です。

単位:万円
走行距離 2018 2017 2016 2015 2014 2013 2012
0.5万km 343 320 298 276 253 231 208
1.0万km 337 314 292 269 247 225 202
1.5万km 331 308 286 263 241 218 196
2.0万km 324 302 280 257 235 212 190
2.5万km 318 296 274 251 229 206 184
3.0万km 312 290 267 245 223 200 178
3.5万km 306 284 261 239 216 194 172
4.0万km 300 278 255 233 210 188 165
4.5万km 294 271 249 227 204 182 159
5.0万km 288 265 243 220 198 176 153
6.0万km 276 253 231 208 186 163 141
7.0万km 263 241 218 196 174 151 129
8.0万km 251 229 206 184 161 139 116
9.0万km 239 216 194 171 149 127 104

随分と価格がこなれてきていますね。
マイF30dMは2013年式で4.5万kmくらいなので、182万円ですか。。
まあ4年半前に購入したときは267万円だったから、妥当っちゃ妥当ですけどね。


お次は、買取相場も見てみましょう。
なんとなく、C200 AMGライン(4マチック除く)です。

単位:万円
走行距離 2019 2018 2017 2016 2015 2014
0.5万km 244 227 210 193 176 159
1.0万km 241 224 207 190 173 156
1.5万km 237 221 204 187 170 153
2.0万km 234 217 200 183 166 150
2.5万km 231 214 197 180 163 146
3.0万km 228 211 194 177 160 143
3.5万km 225 208 191 174 157 140
4.0万km 221 204 187 170 154 137
4.5万km 218 201 184 167 150 133
5.0万km 215 198 181 164 147 130
6.0万km 208 191 174 157 141 124
7.0万km 202 185 168 151 134 117
8.0万km 195 178 161 144 128 111
9.0万km 189 172 155 138 121 104


同じDセグでも、やっぱりCクラスの方がリセールがいいですね。
まあ、現行と先代の差もありますが。

ただ、2019年式で0.5万kmのデータは少し精度が微妙かもしれません。
この辺は追々パラメータなんかを調整していきたいと思います。


ちなみに、統計処理という性質上、ある程度データが豊富にあることが必要です。
また、データに偏りがあっても上手くいきません。
なので、ある程度年式が経っていて、中古車のタマ数もそれなりにあるものでないとなかなか精度が出にくいということになります。

その精度を判断するのに用いられるのが決定係数というものなのですが、上記2つの分析においてはいずれも0.8くらいを出していたので問題ないでしょう。

その一方で、発売からそれほど年数がたっていないものは精度が出ません。
実際に G20 320i Mスポーツ(タマ数はそれなりにある)で試してみましたが、決定係数が0.1~0.2と極めて低かったので、この場合は当てにできません。

なので、公開するデータについては、最低でも決定係数0.5以上、できれば0.8以上あるものにしようかと。


というわけで、新たなネタのタネも仕込み終えたので。
ぼちぼち、さぼった分を取り戻していこうと思いますw


んでは!


【追記@2021/02/22 5:30】
ふと、C200 AMGラインの年式が2019までになっていることに違和感を抱いたのですが(チェック不足すみません)、2019後半以降はローレウスエディションに置き換わっていたんですね。
実質的に同じ車種でありながら、こうやって地味に変えてくれるおかげで、検索文(SQL文)をその都度書かなきゃいけないことになるという。。
本当は完全自動化にしたいんですが、私の腕じゃ当分難しいかな。
ま、それほどの手間ではないので、その都度SQL文(WHERE句)を書いていこうと思います。

LihatTutupKomentar