Причина, по которой эта заметка появилась в том, что многие считают, что анализатор PVS-Studio основан на Clang. Это не так. Хотел кратко изложить информацию, о том, почему в составе дистрибутива PVS-Studio находится компилятор Clang и для чего он используется.
Анализатор PVS-Studio основан на открытой библиотеке OpenC++. Правда, от содержимого этой библиотеки сейчас мало что осталось. Код разбора текста программы существенно переписан. Например, была добавлена поддержка языка Си, Си++11, поддержаны нестандартные расширения языка различных компиляторов и так далее.
Причина, по которой за основу была взята библиотека OpenC++, а не компилятор Clang очень проста. Когда мы начинали, ни про какой Clang ничего не было известно. В то время проект Clang только зарождался. Позднее мы узнали об этом проекте, но всё равно он не подходил нам, так как изначально он был ориентирован на мир Linux.
Если бы мы начинали разработку статического анализатора сейчас, мы бы непременно выбрали Clang. Однако у нас нет планов переходить на него. Да, в этом случае мы получим более качественный механизм для разбора кода. Однако PVS-Studio и сейчас неплохо разбирает код. Исключение составляют сложные шаблоны. Однако в сложных шаблонах почти нечего искать или непонятно, как выдать разумное диагностическое сообщение. Поэтому, качество анализа практически не зависит от полноты разбора шаблонов.
Таким образом, если мы будем переходить на Clang, то потратим на это не менее 1 года времени и при этом почти не улучшим анализ кода. Конечно, эта интересная программистская задача, но совершенно нерациональное действие с коммерческой точки зрения. Так как мы совмещаем в себе как программистов, так и менеджеров, то приходится останавливать в себе порывы сделать всё идеально с технической точки зрения. Лучше за этот год мы реализуем новую сотню диагностик.
Хотя, как вы теперь знаете, мы не используем Clang для разбора кода, он входит в дистрибутив. Дело в том, что в библиотеке OpenC++ не было препроцессора. Нет его и у нас. Изначально для препроцессирования мы использовали компилятор Visual C++ (cl.exe). Это хорошее и простое решение, за одним исключением. Механизмов препероцессирования в Visual C++ видимо два. Один – быстрый. Он используется при компиляции. Другой – медленный, который позволяет создавать препроцессипрованные *.i файлы. Зачем так сделано, я не знаю. Главное то, что нам приходится использовать медленную версию. Это существенно замедляет скорость анализа. Часто препроцессирование файла занимает больше времени, чем анализ.
Был найден альтернативный путь генерации *.i файлов. Оказалось препроцессор в Clang работает очень быстро и вполне способен обрабатывать заголовочные файлы, входящие в состав Visual C++. Способен почти всегда. Хотя заявлена полная совместимость, на практике её конечно нет. Однако это не беда. Если не удаётся использовать Clang, в настройках можно указать использовать надёжный, хотя и медленный Visual C++ (cl.exe).
Примечание. По умолчанию, PVS-Studio делает следующее. В начале, пытается препроцессировать файл, используя Clang. Если не получается, то используется Visual C++. Для пользователя это практически незаметно и он может даже не догадываться что происходит. Например, Clang может не обработать 5% файлов. Придётся дополнительно запускать cl.exe для обработки этих оставшихся файлов. Однако, не смотря на эту лишнюю работу, скорость анализа намного больше, чем если бы всегда использовался cl.exe.
Некоторые считают, что PVS-Studio основан на Clang, так как у них пересекаются некоторые диагностические возможности. Да, некоторые пересекаются, но совершенно по другим причинам:
1. Некоторые идеи лежат на поверхности. Одни и те же диагностические правила могут быть реализованы независимыми командами в разных инструментах. Причем почти одинаковым образом.
2. Команда разработчиков Clang берет некоторые из идей, реализованные в PVS-Studio и наоборот. Это началось после статьи "PVS-Studio vs Clang".
Надеюсь, я прояснил вопросы, связанные с взаимодействием PVS-Studio и Clang. Если Вам интересно подробнее узнать, какие ошибки умеет находить PVS-Studio, то предлагаю познакомиться с вот этой коллекцией найденных дефектов в некоторых Open Source проектах.
P.S. Приглашаю в twitter, где мы регулярно публикуем ссылки на статьи по программированию на языке C/C++ и смежным темам.