Есть разные метрики, используемые в программировании, в том числе и для оценки качества кода. Одна из них – это плотность ошибок. Казалось бы, с ней можно уж точно сказать, какой код качественный, а какой нет. Или нельзя?
Плотность ошибок в коде подсчитать довольно просто. Надо взять количество ошибок и поделить его на количество строк кода. Например, если в коде на 100 строк будет 6 ошибки, то плотность ошибок составляет 6/100=0.06. Конечно, это довольно плохой код, на уровне лабораторной работы начинающего студента.
При использовании статического анализа кода возникает желание пользоваться такой метрикой. Например, если статический анализатор выдал 10 сообщений на 1000 строк кода – говорит ли это что-либо о качестве проверяемого кода? К сожалению не так много как хотелось. И вот почему.
Рассмотрим простой пример, где есть два потенциальных переполнения буфера:
int _tmain(int argc, _TCHAR* argv[]) {
char buf[4];
printf("Enter your name: ");
scanf("%s", buf);
printf("Name: %s\n", buf);
printf("Enter your surname: ");
scanf("%s", buf);
printf("Surname: %s\n", buf);
return 0;
}
Переполнения буфера возможны (и, скорее всего, будут) в строках с scanf. Плотность ошибок в коде: 2/10=0.2.
Однако если чтение вынести в единую функцию, то "ошибок" станет меньше – всего одна:
void my_scanf(char buf[]) {
scanf("%s", buf);
}
int _tmain(int argc, _TCHAR* argv[]) {
char buf[4];
printf("Enter your name: ");
my_scanf(buf);
printf("Name: %s\n", buf);
printf("Enter your surname: ");
my_scanf(buf);
printf("Surname: %s\n", buf);
return 0;
}
Хотя программа надежнее не стала, плотность ошибок получилась меньше почти в два раза: 1/13= 0.08! При этом в программе как было два потенциальных переполнения буфера, так и остались.
Конечно, это не значит, что такая метрика как плотность ошибок бесполезна. В больших объемах кода такой эффект будет скомпенсирован. Однако надо понимать, что относиться к такой метрике следует внимательно.