Количество строк кода (Lines of code)
- Физические и логические строки
- Пример расчета
- Количество строк и характеристики программы
- Итог
- Библиографический список
Количество строк кода - часто используемая единица измерения объема и сложности программного проекта. Она применяется также для прогноза трудозатрат при планировании проекта и оценке сроков на стадии разработки, так и для оценки производительности труда после завершения проекта.
Физические и логические строки
Существуют две широко используемые методики подсчета строк: подсчет количества "физических" строк и подсчет количества "логических" строк. Следует учесть, что эти термины не являются точно определенными, и нюансы их значений могут быть различны в конкретных случаях. В общем случае, количество "физических" строк обычно равно количеству строк исходных текстов программы, включая комментарии, и, возможно, даже пустые строки. При подсчете "логических строк" делается попытка подсчета исполнимых выражений (операторов, функций и т.д.), однако определения таких выражений отличаются у различных языков программирования.
Отсюда вытекают плюсы и минусы обоих подходов: количество "физических" строк проще определить, но оно сильно зависит от стиля кодирования и форматирования исходного текста; "логические" строки не имеют такого недостатка, зато их количество довольно тяжело подсчитать.
Пример расчета
Рассмотрим следующий код:
for (i=0; i<100; ++i) printf("%d bottles of beer on the wall\n");
//How many LOCs is here?
В данном случае получается, что в коде содержится 2 физические строки кода, 2 логические строки кода (оператор цикла for и оператор вызова функции printf) и 1 строка комментария.
Если поменять форматирование кода:
for (i=0; i<100; ++i)
{
printf("%d bottles of beer on the wall\n ");
}
//How many LOCs is here?
то получим уже 5 физических строк кода, но при этом останутся те же 2 логических строки кода и 1 строка комментария.
Количество строк и характеристики программы
Количество строк кода, очевидно, ассоциируется со сложностью системы - чем больше кода, тем она сложнее. Для примера, ядро операционной системы Windows NT 3.1 оценивается в 4-5 миллионов строк кода, а уже Windows XP - 45 миллионов. Количество строк кода в ядре Linux версии 2.6 равняется 5.6 миллионов, а версии 3.6 - уже 15.9 миллионов.
А вот с качеством и надежностью все не так однозначно. В реальном мире все программы содержат ошибки, и скорее всего, чем больше программа, тем больше ошибок. Это довольно очевидное утверждения, если ввести коэффициент "количество ошибок/количество кода" - даже если он будет постоянным, абсолютное число ошибок будет возрастать вместе с ростом программы. А интуиция подсказывает, что при увеличении кода число будет увеличиваться из-за возрастающей сложностью системы (Э. Таненбаум). И не только интуиция (см. график "типичная плотность ошибок"). На подобных соображениях основываются такие принципы разработки, как KISS, DRY, и SOLID. Также можно привести красноречивую цитату классика Э. Дейкстры - "простота - основа надежности", а также отрывок его работы "Плоды непонимания":
...Еще некоторые говорят о программировании как о производственном процессе и измеряют "производительность программиста", основываясь на "произведенном количестве строк кода". Таким образом, они подходят к этому числу с неправильной стороны: всегда нужно понимать его как "затраченное количество строк кода".
Итог
Таким образом, с увеличением количества строк кода программы растет её сложность, и как следствие, количество ошибок. К сожалению (а может, и к счастью), технический прогресс неизбежен и системы будут продолжать усложняться, требуя все больше ресурсов для поиска и исправления ошибок (и, разумеется, в процессе исправления также будут добавляться и новые ошибки), так что использование методики статического анализа и специальных инструментов может помочь в уменьшении количества ошибок и увеличении эффективности всего процесса разработки.
Библиографический список
- Э. Дейкстра. Плоды непонимания / Fruits of Misunderstanding.
- Э. Таненбаум. Современные операционные системы.
- Wikipedia. Source lines of code.
- David A. Wheeler. More Than a Gigabuck: Estimating GNU/Linux's Size.
0