для того, чтобы ручками написать ассемблерный код, который будет работать быстрее того, что сгенерирует современный компилятор с оптимизациями, нужно много чего знать и уметь большинство диванных оптимизаторов знают и умеют куда меньше необходимого, так что когда они пытаются перемудрить умных дядек, разрабатывающих компиляторы, получается неважно так что ответ на этот вопрос скорее "нет", чем "да"
даже если это так... сколько "легко читаемого" кода на С написать нужно и сколько "непонятных" наборов букв и цифр на ассемблере? просто понимать нужно -- что и где применяется можно и микроскопом гвозди забивать...