Баги (Bugs) – это жаргонное название программной ошибки. Ошибкой можно назвать любое недокументированное поведение программы. Однако багами принято называть ошибки, обнаруженные уже на этапе выполнения программы, а не на этапах проектирования, кодирования или отладки.
История возникновения этого термина связана с испытаниями вычислительной машины 'Mark II' 9 сентября 1947 года, когда между контактов электромеханического реле попал мотылек. Извлеченное насекомое было вклеено в технический дневник и рядом сделана надпись "First actual case of bug being found".
Баги могут возникать непосредственно при программировании или из-за ошибок компиляторов. Так же ошибки могут оказаться не в вашем коде, а в сторонних библиотеках, используемых приложением. Случаются ошибки и из-за неправильного использования библиотек. Ошибки компиляторов чаще всего возникают из-за некорректной оптимизации различных конструкций языка программирования. Впрочем, это крайне редкие случаи. Как правило, те ошибки, в которых программист винит компилятор, при детальном рассмотрении оказываются его собственными ошибками (см. заметку "Во всём виноват компилятор").
Чаще всего, для поиска места в коде, где находится баг, используются специальные утилиты - отладки программ (жаргонное название – дебагеры). Они позволяют посмотреть значения переменных, регистров процессора и другие параметры, влияющие на ход выполнения программы и многие другие необходимые параметры. Есть и другие способы, такие как статический или динамический анализ.
Многие программные ошибки могут не проявляться сами по себе, но используются для преднамеренного взлома систем. Например, наиболее известные баги – это переполнение буфера или переполнение целочисленной переменной. Такая ошибка в системной программе может позволить выполнить пользовательское приложение с привилегиями администратора. Избежать появления подобных ошибок можно вводя дополнительную проверку входных данных.
Часто возникает иллюзия, что само по себе изделие, в котором используется программное обеспечение, надежнее аналогичного, но без программ. Несколько следующих примеров смогут опровергнуть такую точку зрения. Это совсем не так. Разработать надежную цифровую систему ничуть не легче аналоговой системы.
Программные ошибки могут привести к многомилионным потерям или человеческим жертвам. Этому есть много примеров. Так запуск ракеты-носителя "Ариан 5" закончился взрывом. Причиной этому послужило несколько факторов: использование модуля навигационной системы от "Ариан 4", который не был рассчитан на входные значения перегрузки, возникшие при запуске. В навигационной системе использовался программный модуль, выполнявший перевод значений с плавающей точкой в целочисленный 16-битный формат. Именно там и возникло переполнение переменной. Свою роль и сыграло требование на 80% максимальную загрузку процессора, из-за которой были исключены из проверки на возможное переполнение переменные, ставшие причиной переполнения. Самое парадоксальное, что вызвавший отказ модуль уже был не нужен. Данные от него требовались в течение первых 7 секунд полета и это время они были корректны. Авария из-за переполнения случилась на 37 секунде.
В 1985-87 годах 6 человек получили смертельную дозу радиации из-за программной ошибки в медицинском ускорителе Therac-25. Программные ошибки были и в предыдущих версиях ускорителя, но там была предусмотрена механическая защита от переоблучения и никто не получал смертельных доз. Одна из главных программных ошибок заключалась в возникающем состоянии гонки при вводе исходных данных для сеанса лечения.
Можно сказать, что оба этих инцидента возникли из-за повторного использования программных модулей, содержащих ошибки, от предыдущих моделей. Так же недостаточное тестирование программного обеспечения модулей, входящих в их состав, сыграло решающую роль. Для таких ответственных систем это просто недопустимо. Последствий этих катастроф можно было избежать, если все проявившиеся дефекты были бы выявлены на ранних этапах разработки и тестирования.
Однако заветная мечта о том, что программа может быть совсем без ошибок далека от реальности. Одних из способов что-то с этим сделать в системах представляющих опасность, это разделить ошибки на критичные и некритичные. От критических ошибок можно страховаться аппаратными механизмами, дублированием узлов и другими способами.
Также следует помнить, что только комплексное тестирование и повышение качества программного обеспечения сможет предотвратить появление большинства компьютерных ошибок. Нет одного или двух методов, которые обеспечат высочайшее качество программного обеспечения.
0