Количество строк кода — часто используемая единица измерения объёма и сложности программного проекта. Она применяется как для прогноза трудозатрат при планировании проекта и оценке сроков на стадии разработки, так и для оценки производительности труда после завершения проекта.
Существуют две широко используемые методики подсчёта строк: подсчёт количества "физических" строк и подсчёт количества "логических" строк. Следует учесть, что эти термины не являются точно определёнными, и нюансы их значений могут быть различны в конкретных случаях. В общем случае количество "физических" строк обычно равно количеству строк исходных текстов программы, включая комментарии, и, возможно, даже пустые строки. При подсчёте "логических строк" делается попытка подсчёта исполнимых выражений (операторов, функций и т.д.), однако определения таких выражений отличаются у различных языков программирования.
Отсюда вытекают плюсы и минусы обоих подходов: количество "физических" строк проще определить, но оно сильно зависит от стиля кодирования и форматирования исходного текста; "логические" строки не имеют такого недостатка, зато их количество довольно тяжело подсчитать.
Рассмотрим следующий код:
for (i=0; i<100; ++i) printf("%d bottles of beer on the wall\n");
// How many LOCs are here?
В данном случае получается, что в коде содержится две физические строки кода, две логические строки кода (оператор цикла for и оператор вызова функции printf) и строка комментария.
Если поменять форматирование кода, то получим уже пять физических строк кода, но при этом останутся те же две логических строки кода и строка комментария:
for (i=0; i<100; ++i)
{
printf("%d bottles of beer on the wall\n ");
}
// How many LOCs are here?
Количество строк кода, очевидно, ассоциируется со сложностью системы: чем больше кода, тем она сложнее. Для примера, ядро операционной системы Windows NT 3.1 оценивается в 4-5 миллионов строк кода, а уже Windows XP — в 45 миллионов. Количество строк кода в ядре Linux версии 2.6 равняется 5.6 миллионам, а версии 3.6 — уже 15.9 миллионам.
А вот с качеством и надёжностью всё не так однозначно. В реальном мире все программы содержат ошибки, и, скорее всего, чем больше программа, тем больше ошибок. Это довольно очевидное утверждение, если ввести коэффициент "количество ошибок/количество кода" (даже если он будет постоянным), абсолютное число ошибок будет возрастать вместе с ростом программы. А интуиция подсказывает, что при увеличении кода число будет увеличиваться из-за возрастающей сложности системы. И не только интуиция (см. график "типичная плотность ошибок"). На подобных соображениях основываются такие принципы разработки, как KISS, DRY, и SOLID. Также можно привести красноречивую цитату классика Э. Дейкстры: "Простота — основа надежности". А также отрывок его работы "Плоды непонимания":
...Ещё некоторые говорят о программировании как о производственном процессе и измеряют "производительность программиста", основываясь на "произведенном количестве строк кода". Таким образом, они подходят к этому числу с неправильной стороны: всегда нужно понимать его как "затраченное количество строк кода".
Таким образом, с увеличением количества строк кода программы растет её сложность, и, как следствие, количество ошибок. К сожалению (а может, и к счастью), технический прогресс неизбежен и системы будут продолжать усложняться, требуя всё больше ресурсов для поиска и исправления ошибок (и, разумеется, в процессе исправления также будут добавляться и новые ошибки). Так что использование методики статического анализа и специальных инструментов может помочь в уменьшении количества ошибок и увеличении эффективности всего процесса разработки.
Список источников
0