>
>
Проверка Linux-приложений с помощью PVS…

Евгений Рыжков
Статей: 125

Проверка Linux-приложений с помощью PVS-Studio на Windows

Совсем недавно мы выпустили новый программный продукт PVS-Studio, который объединил в себе два наших анализатора Viva64 и VivaMP. Еще когда анализатор Viva64, предназначенный для разработчиков 64-битных приложений, был отдельным продуктом, иногда к нам обращались люди с вопросом: "Есть ли версия Viva64 для Linux?". И хотя создать такую версию возможно (в рамках разработки специализированного решения для конкретного заказчика), сейчас Linux-версии анализатора кода не существует.

Однако иногда проверить код Linux-приложения на корректность работы в 64-битном Linux окружении можно на Windows-системе. Именно над такой возможностью сейчас работают наши инженеры. В этой заметке я расскажу о том, как это будет работать.

Операционные системы Windows и Linux с точки зрения разработки 64-битных приложений отличаются используемой моделью данных. Это соотношение между размерами основных типов данных на конкретной системе. В 64-битной версии Windows используется модель данных LLP64. В такой модели данных типы имеют следующие размеры: int - 32 бита, long - 32 бита, long long - 64 бита, size_t - 64 бита, указатель - 64 бита. В 64-битной версии Linux используется модель данных LP64. В ней размеры типов данных следующие: int - 32 бита, long - 64 бита, long long - 64 бита, size_t - 64 бита, указатель - 64 бита. В 64-битных Linux и Windows системах, также различаются такие типы, как long double, но это не существенно в рамках данного обсуждения. Как видно, основное отличие состоит в размере типа long - на 64-битной Windows-системе он 32 бита, а на 64-битной Linux-системе - 64 бита.

По умолчанию анализатор кода Viva64 (а теперь и PVS-Studio) будучи предназначенным для работы в Windows среде ориентирован на модель данных LLP64. Грубо говоря, это означает, что он ищет некорректное совместное использование size_t-типов и int-типов. Для проверки кода на корректность в 64-битном Linux-окружении надо также еще искать и некорректное совместное использование long-типов и int-типов.

Возможность поиска некорректного совместного использования long-типов мы и планируем добавить в новую версию PVS-Studio 3.10. Это будет специальный режим работы, так называемый "Linux-like mode". В нем анализатор 64-битных проблем будет работать так, как он работал бы в Linux-окружении. Это позволит частично проверять с помощью PVS-Studio на Windows-системе в среде Visual Studio код приложений, которые работают на Linux.

Итак, для того, чтобы проверить 64-битное Linux-приложение вам надо будет иметь его компилирующуюся в Visual Studio версию. То есть подобная проверка вполне разумна для кросс-платформенных приложений, которые собираются и в Windows, и в Linux.

Конечно же, проверка приложения на корректность 64-битного кода в режиме имитации Linux-окружения не может считаться полной и гарантировать работоспособность в реальном Linux-мире. Также возможно возникновение дополнительных ложных срабатываний. Однако в ряде случаев данный вариант проверки позволит найти с помощью PVS-Studio большое количество ошибок, которые проявят себя на 64-битных Linux-системах.

Проблемным местом, прежде всего, в таком подходе являются участки кода, которые не собираются под Windows. Например, это могут быть интерфейсные части программы. Проверить их на Windows не удастся, так как нельзя их собрать. Но, например, ядро программы, которое работает и на Windows, и на Linux вполне можно проверить.

Также следует учитывать, что в режиме Linux-подобной модели данных проверяется только пользовательский код. Код, включенные в системные include-файлы на Windows все равно будет такой, как при модели памяти LLP64. Ведь все файлы перед анализом обрабатываются препроцессором, а он, конечно же, ничего не знает про модель LP64.

Чтобы лучше продемонстрировать особенности использования PVS-Studio в "Linux-like mode" приведем несколько примеров.

void foo(ptrdiff_t delta);
int i = -2;
unsigned k = 1;
foo(i + k);

Приведенный код, будет потенциально опасен как для Winodws, так и для Linux систем. Некорректный результат возникает при неявном расширении фактического аргумента, имеющего значение 0xFFFFFFFF типа unsigned, до типа ptrdiff_t. В данном случае предупреждение будет выдано вне зависимости от используемого режима.

void *ptr;
long np = (long)(ptr);

Данный код, диагностируемый как ошибочный в 64-битных Windows программах, будет считаться корректным для 64-битных Linux систем.

Следующий пример наоборот демонстрирует код, корректный для Windows систем, но некорректный для Linux:

long array[4] = { 1, 2, 3, 4 };
enum ENumbers { ZERO, ONE, TWO, THREE, FOUR };
int *intPtr = (int *)(array);
cout << intPtr[1] << endl;

Поскольку размер int и long в 64-битных Linux системах не совпадают, то анализатор выдаст соответствующее диагностическое сообщение.

Последние два примера демонстрируют ограничение нового режима работы:

#ifdef _WINDOWS
  typedef long MY_SIGNED_32;
#else //Linux
  typedef int MY_SIGNED_32;
#endif

В подобных ситуациях, поскольку препроцессор выберет ветку "typedef long MY_SIGNED_32;" все конструкции кода, где будет использоваться тип MY_SIGNED_32 будут некорректно диагностироваться с токи зрения Linux систем.

А можно привести и еще более простой пример, когда не будет проанализирован код, который требуется:

#ifdef LINUX_64
   // Здесь много кода
#endif

Несмотря на перечисленные ограничения, возможность работы и с традиционной моделью данных для Windows LLP64, и с традиционной для Linux моделью LP64 расширяет область применения нашего анализатора кода. Важно лишь понимать, как эта опция работает, что она может обеспечить, а чего не может.

По умолчанию новый режим будет выключен, и пользователи, для которых работа в Linux-окружении не актуальна, могут не обращать на него внимание.