最近脑洞大开,想要设计一个二值分类器:输入妹子的照片、以及年龄、家乡、性格等相关信息;然后以此为依据设计一个二值分类器,判断妹子是不是适合自己。应该使用什么样的分类算法?
时间长了,你会发现这些分类不重要,最关键的是有(1)还是没有(0)。
曾经有人把一群女生的照片放在网上让汉纸们评分。后来,这个网站叫非死不可。
我觉得这里面最难的是,拿到原始数据。楼主都能拿到数据,还判断个毛,直接上了。
应该这么写。 struc Meizi { string name; bool woman; ... } bool IsSuitable (Meizi &meizi) { if (meizi.woman) return true; return false; } 有妹子就不错了,甚至 bool IsSuitable (Meizi &meizi) { return true; }
tag:身高 体重 长相 三围? 其实只要简单的分两类:眼瞎的和眼不瞎的。 眼瞎的早看上别人了,眼不瞎的看不上自己。
逻辑回归就行,自动给不同的特征分配不同权重,增大了主要特征的权重。你只要做好数据标注,把你喜欢类型标出来。非监督的话用聚类算法,特征点的选择看自己。
BTW:判断妹子适不适合自己不应该是分类问题,这涉及你自身属性和妹子属性,这类似广告预估算法,可以看做一个CTR预估模型,把你们两相似度及交叉作为特征用logistic回归预测。
只要把妹子改成书、电影、音乐、或者菜……推荐系统已经有了
适合你的一大把。能不能追到才是关键。