神经网络告诉我，谁是世界上最「美」的人？

640?wx_fmt=gif&wxfrom=5&wx_lazy=1

「魔镜魔镜告诉我，谁是世界上最美的女人？」这句伴随童年的话也有现实版哦～神经网络可以预测人脸颜值，这方面也出现了不少研究。今年年初华南理工大学的研究者发布论文，并公开了数据集 SCUT-FBP5500。本文作者 Dima Shulga「复现」了该论文，并用自己的照片做了试验。

数月前，华南理工大学发布了关于「颜值预测」的论文和数据集，数据集包括 5500 人，每人按颜值魅力打分，分值在 1 到 5 分之间。

论文地址：https://arxiv.org/abs/1801.06345
数据集地址：https://github.com/HCIILAB/SCUT-FBP5500-Database-Release

640?wx_fmt=png&wxfrom=5&wx_lazy=1

数据集中还有很多名人。Julia Robert 的这张照片得到了 3.78 的平均分：

640?wx_fmt=png

以色列名模 Bar Refaeli 这张照片得分 3.7：

640?wx_fmt=png

似乎分也不高嘛，但是 3.7 的得分意味着比数据集中大约 80% 的人要好看。

数据集作者利用该数据集训练多个模型，尝试根据人脸照片预测这个人的魅力。

本文我将复现他们的结果，还要看一下我的吸引力怎么样～

原始论文实现了很多不同模型，包括具备人工制作特征的经典 ML 模型和 3 个深度学习模型：AlexNet、ResNet18、ResNext50。

我想尽可能简单地呈现（不想从头实现和训练整个 resnet 网络），于是打算通过精调现有模型来执行该工作。keras 中有一个模块叫做 applications，包含不同预训练模型。其中一个是 resnet50。不幸的是，keras.applications 中没有 ResNet18、ResNext50，因此我无法完全复现该研究，不过使用 resnet50 复现程度应该很接近。

from keras.applications import ResNet50

ResNet 是微软开发的深度卷积神经网络，曾赢得 2015 ImageNet 竞赛冠军。

我们在 keras 中初始化 resnet50 模型时，使用 ResNet50 架构创建了一个模型，同时下载了在 ImageNet 数据集上训练好的权重。

论文作者没有提到他们训练模型的具体细节，因此我尽力去做。我想移除最后一层（softmax 层），添加一个没有激活函数的 Dense 层，来执行回归。

resnet = ResNet50(include_top=False, pooling=’avg’)
model = Sequential()
model.add(resnet)
model.add(Dense(1))
model.layers[0].trainable = False
print model.summary()
# Output:
  Layer (type)                 Output Shape              Param #    ================================================================= resnet50 (Model)             (None, 2048)              23587712   _________________________________________________________________ dense_1 (Dense)              (None, 1)                 2049       ================================================================= Total params: 23,589,761 
Trainable params: 23,536,641 
Non-trainable params: 53,120

你可以看到，我先使第一层（resnet 模型）不可训练，这样我只需要训练 2049 个参数，而不是 23,589,761 个。

我计划训练最后的 Dense 层，然后使用较小的学习率训练整个网络。

model.compile(loss='mean_squared_error', optimizer=Adam())
model.fit(batch_size=32, x=train_X, y=train_Y, epochs=30)

之后，我改变第一层的状态使之可训练，编译并拟合模型，来进行另外 30 个 epoch。

这里，train_X 是照片，即 numpy 形态数组 (350, 350, 3)，train_Y 是标注图像的得分。

结果

该论文使用 2 种技术训练模型：5-fold 交叉验证、60%-40% 的训练集-测试集分割。论文作者使用皮尔逊相关系数（PC）、平均绝对误差（MAE）和均方根差（RMSE）对结果进行衡量。5-fold 交叉验证的结果如下：

640?wx_fmt=png

60%-40% 的训练集-测试集分割结果如下：

640?wx_fmt=png

我将使用 80%-20% 的训练集-测试集分割，类似执行他们的交叉验证的 1-fold。结果如下：

RMSE: 0.301799791952313 
MAE: 0.2333630505619627 
PC: 0.9012570266136678

相当不错。此外，查看分数散点图和直方图很方便：

640?wx_fmt=png

原始分数分布（正态）：

640?wx_fmt=png

预测分数分布（正态）：

640?wx_fmt=png

结果看起来不错。现在我们来看下这个深度神经网络给我打几分吧。我一开始用了这张照片：

640?wx_fmt=png

得分 2.85，我只比该数据集中 52% 的人好看……不得不说有点失望，我原本以为结果比这好，于是我决定再试试。

我拍了很多照片，最终有一张得了 3.15 分，这意味着我比该数据集中 64% 的人更好看～

640?wx_fmt=png

好多了～老实讲我还是想得更高分～ :)

最后说明一下，我使用 Google Colaboratory 构建和调整模型，它提供 Python notebook，可以免费使用 GPU！

论文：SCUT-FBP5500: A Diverse Benchmark Dataset for Multi-Paradigm Facial Beauty Prediction

640?wx_fmt=png

论文链接：https://arxiv.org/abs/1801.06345

编译：机器之心

参与：路、刘晓坤

640?wx_fmt=png

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.mzph.cn/news/303812.shtml

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

神经网络告诉我，谁是世界上最「美」的人？

相关文章

开源推荐：.Net Core3.1 + EF Core + LayUI 封装的MVC版后台管理系统

android中文api(85)——HorizontalScrollView

linux 连接wifi wpa2,RHEL等Linux系统使用wpa_supplicant以WPA-PSK/WPA2-PSK连接WIFI

如何在 C# 中使用只读的 Collections

操作系统和数据库的知识梳理(思维导图)

令人难以理解的软件工程师：几千行代码能搞定的为什么要写几万行？

如何从 dump 文件中提取出 C# 源代码？

通信开源linux,Linux环境进程间通信

真人拳皇项目Alpha阶段的回顾——史经浩

在栈中压入一个字符串c语言,面试题 31：栈的压入、弹出序列

谈谈对IOC及DI的理解与思考

关于perl和shell的参数传递

NET问答：如何理解 IEnumerableT 和 IQueryableT

c语言实现字母转化为unicode码,用C语言实现中文到unicode码的转换

终于有人把云计算、大数据和人工智能讲明白了！

c语言程序设计新编教程答案钱雪忠,新编C语言程序设计教程

***指定网站

聊一聊如何在.NET Core中使用Nacos 2.0

c语言格式字符If,C语言所有语句格式 C语言中的的if语句共有多少种格式？

听说你刚转了Java？准备转回.NET吧！