>
>
Много ядер хорошо, а быстрый жесткий ди…

Евгений Рыжков
Статей: 125

Много ядер хорошо, а быстрый жесткий диск тоже хорошо

Занимаясь разработкой анализатора кода PVS-Studio, мы большое внимание уделяем повышению производительности инструмента. Подобные решения работают достаточно медленно, поэтому программисту даже на мощной машине приходится иногда скучать, ожидая завершения анализа. Анализатор PVS-Studio использует возможности многоядерных процессоров, что позволяет повысить скорость анализа проекта в несколько раз по сравнению с одноядерными системами. Тем не менее, оказалось, что дисковая подсистема также может оказывать существенно влияние на скорость выполнения анализа.

У нас есть база регрессионных тестов из примерно 30 приложений (более 90 проектов) - это исходные коды, которые проверяются анализатором PVS-Studio в автоматическом режиме. Проверка всех этих кодов в версии анализатора для Visual Studio 2008 занимает около двух часов. Используемая машина: процессор с двумя ядрами, четыре гигабайта оперативной памяти и SATA RAID-система (RAID 0). В той же машине еще установлен старый IDE жесткий диск, который никак не использовался, но вынуть из машины его все не было повода.

Однажды по некоторой причине тесты были перенесены с SATA RAID на IDE диск. А после этого переноса мы долго думали, почему тесты стали выполнятся вместо двух часов - четыре! Дело в том, что этот момент совпал с серьезными правками в продукте, и, казалось, что эти правки и приводят к такому сильному падению производительности. Однако вскоре мы вспомнили о смене жесткого диска, и проблема решилась сама собой.

Какое отношение имеет жесткий диск к анализатору кода? Самое прямое. В процессе работы анализатора создаются препроцессированные файлы всех исходных кодов, и анализатор работает уже с ними. Мы посчитали объем препроцессированных файлов в наших тестах в версии для Visual Studio 2008. Он оказался около 7 гигабайт. Естественно чтение/запись такого объема на старом IDE диске вызывает существенное падение производительности.

Вывод прост: при компиляции, а уж тем более при работе с анализаторами кода храните исходные тексты на быстром SATA диске, а еще лучше используйте RAID массив. И работать станет намного приятнее.