我正在执行机器学习任务,其中验证拆分似乎存在数据泄漏。如果我调整拆分,它会移动过度拟合的类的数量。X_train = resize_images(X_train, (51...
我正在执行机器学习任务,其中验证拆分似乎存在数据泄漏。如果我调整拆分,它会移动过度拟合的类的数量。
X_train = 调整图像大小(X_train,(512, 512))
y_train = label_enc.transform(y_train)n_classes = len(list(label_enc.classes_))
X_train = np.asarray(X_train)
X_train,y_train = add_extra_dim(X_train,y_train,n_classes)
模型=构建模型()
模型.拟合(X_train,y_train,epochs=50,validation_split = 0.25,回调=[回调])
def build_model():模型 = ATCNet(形状=(100,100,1),n_classes=n_classes)
top3 = tf.keras.metrics.TopKCategoricalAccuracy(k=3, name="top3")
top5 = tf.keras.metrics.TopKCategoricalAccuracy(k=5, name="top5")
model.compile(optimizer=Adam(),
loss='categorical_crossentropy',
metrics=['accuracy', top3, top5])
return model
[[在 此处输入图片描述 在此处输入图片 描述]( https://i.sstatic.net/nS2vvCJP.png )]( https://i.sstatic.net/oCSLgoA4.png )
我已经测试过,没有任何数据泄漏。
我已经将问题隔离到验证拆分中,但我找不到任何关于如何修复它或我做错什么的信息