AIと共存する②

つづきで、素性についてもう少し、人間でも自然とどのような素性が性別分けに重要か(判断として対象としやすいか否か)まず「身長」は男性と女性を見分ける場合には参考になりますが男女ともに背の高さにはバラつきがあり見分ける決定的な判断にはならない。

対して「骨格」は、ホルモンの影響で男性と女性の生物学的特徴が表れやすく見分けるに比較的参考になるはず。確かに、例えば女性に比べ男性の背中の筋肉は厚く、痛点は少ないとかありますね。

ここまでくると素性の扱いがなんとなくわかってきました。「声質」も比較的男女の区分には参考になりそう。

「髪型」「服装」は、見分ける要因にはなりにくいですね。

機械学習では大量のデータの中から傾向として表れているものを素性として用いる。個々の素性に対して重みつける数値として表現する。仮に男性の特徴が強く出るものは正の値、女性の特徴が強く出るものは負の値とし重みとなる数値を設定したとする。

身長:1 骨格:3 声質:-3 髪型:-2 服装:2

Aさん 身長180×1 骨格3000×3  声質300×-3  髪型5×-2  服装1×2

Bさん 身長150×1 骨格1800×3  声質400×-3  髪型60×-2  服装1×2

身長であれば高さ、骨格であれば骨重、声質であれば声の周波数、髪の長さ、服装については両性ともはくデニム系は1、スカートは-1と定義する。

「分類対象の人が持つ属性」×「素性が持つ重みづけられた数値」その掛け合わせた全体の和によって男性らしさ女性らしさを求めることができる。

Aさんは、総数8272 Bさんは、4232

男性の特徴を強く表していれば素性と重みの掛け合わせの和の数値は大きな値を示し、反対に女性の特徴を強く表していれば和の数値は小さな値を示す。男性と女性の双方の属性を持っていればその中間値となるわけですね。

この数値の大小で機会は男性か女性かを自動で分類できるようになる。

なるほど、了解。でも機械も100%の判断となると、、、

コメント