Яндекс ничего не думает. Нейросеть тупо производит математические действия над значениями пикселов изображения - вообще не пытаясь понять смысл этого изображения. И по результатам этих расчётов, наиболее вероятной категорией является категория "растения".
Нейросеть в принципе не может понять, что на картинке есть глаза, нос, щёки, уши, чёлка, нашейный платок... А по внешнему контуру - вполне себе лилия. Вот и отправляется в растения.