SHA-1

SHA-1
SHA-1
Разработчики	NSA совместно с NIST
Создан	1995
Опубликован	1995
Предшественник	SHA-0[вд]
Преемник	SHA-2
Размер хеша	160 бит
Число раундов	80
Тип	хеш-функция

Secure Hash Algorithm 1 — алгоритм криптографического хеширования. Описан в RFC 3174. Для входного сообщения произвольной длины (максимум $2^{64}-1$ бит, что примерно равно 2 эксабайта) алгоритм генерирует 160-битное (20 байт) хеш-значение, называемое также дайджестом сообщения, которое обычно отображается как шестнадцатеричное число длиной в 40 цифр. Используется во многих криптографических приложениях и протоколах. Также рекомендован в качестве основного для государственных учреждений в США. Принципы, положенные в основу SHA-1, аналогичны тем, которые использовались Рональдом Ривестом при проектировании MD4.

История

В 1993 году NSA совместно с NIST разработали алгоритм безопасного хеширования (сейчас известный как SHA-0) (опубликован в документе FIPS PUB 180) для стандарта безопасного хеширования. Однако вскоре NSA отозвало данную версию, сославшись на обнаруженную ими ошибку, которая так и не была раскрыта, и заменило его исправленной версией, опубликованной в 1995 году в документе FIPS PUB 180-1. Эта версия и считается тем, что называют SHA-1. Позже, на конференции CRYPTO в 1998 году два французских исследователя представили атаку на алгоритм SHA-0, которая не работала на алгоритме SHA-1. Возможно, это и была ошибка, открытая NSA.

Описание алгоритма

Одна итерация алгоритма SHA1

SHA-1 реализует хеш-функцию, построенную на идее функции сжатия. Входами функции сжатия являются блок сообщения длиной 512 бит и выход предыдущего блока сообщения. Выход представляет собой значение всех хеш-блоков до этого момента. Иными словами, хеш-блок $M_{i}$ равен $h_{i}=f(M_{i},h_{i-1})$ . Хеш-значением всего сообщения является выход последнего блока.

Инициализация

Исходное сообщение разбивается на блоки по 512 бит в каждом. Последний блок дополняется до длины, кратной 512 бит. Сначала добавляется 1 (бит), а потом — нули, чтобы длина блока стала равной 512 — 64 = 448 бит. В оставшиеся 64 бита записывается длина исходного сообщения в битах (в big-endian формате). Если последний блок имеет длину более 447, но менее 512 бит, то дополнение выполняется следующим образом: сначала добавляется 1 (бит), затем — нули вплоть до конца 512-битного блока; после этого создается ещё один 512-битный блок, который заполняется вплоть до 448 бит нулями, после чего в оставшиеся 64 бита записывается длина исходного сообщения в битах (в big-endian формате). Дополнение последнего блока осуществляется всегда, даже если сообщение уже имеет нужную длину.

Инициализируются пять 32-битовых переменных.

A = 0x67452301
B = 0xEFCDAB89
C = 0x98BADCFE
D = 0x10325476
E = 0xC3D2E1F0

Определяются четыре нелинейные операции и четыре константы.

$F_{t}(m,l,k)=(m\wedge l)\vee (\neg {m}\wedge k)$	$K_{t}$ = 0x5A827999	0≤t≤19
$F_{t}(m,l,k)=m\oplus l\oplus k$	$K_{t}$ = 0x6ED9EBA1	20≤t≤39
$F_{t}(m,l,k)=(m\wedge l)\vee (m\wedge k)\vee (l\wedge k)$	$K_{t}$ = 0x8F1BBCDC	40≤t≤59
$F_{t}(m,l,k)=m\oplus l\oplus k$	$K_{t}$ = 0xCA62C1D6	60≤t≤79

Главный цикл

Главный цикл итеративно обрабатывает каждый 512-битный блок. В начале каждого цикла вводятся переменные a, b, c, d, e, которые инициализируются значениями A, B, C, D, E, соответственно. Блок сообщения преобразуется из 16 32-битовых слов $M_{i}$ в 80 32-битовых слов $W_{j}$ по следующему правилу:

 $W_{t}=M_{t}$                                       при 0≤t≤15

 $W_{t}$  = ( $W_{t}$ _-3  $\oplus$   $W_{t}$ _-8  $\oplus$   $W_{t}$ _-14  $\oplus$   $W_{t}$ _-16) << 1     при 16≤t≤79

, где «<<» — это циклический сдвиг влево.

для  $t$  от 0 до 79 

	temp = (a<<5) +  $F_{t}$ (b,c,d) + e +  $W_{t}+K_{t}$    

	e = d 

	d = c 

	c = b<<30                                

	b = a 

	a = temp

, где «+» — сложение беззнаковых 32-битных целых чисел с отбрасыванием избытка (33-го бита).

После этого к A, B, C, D, E прибавляются значения a, b, c, d, e, соответственно. Начинается следующая итерация.

Итоговым значением будет объединение пяти 32-битовых слов (A, B, C, D, E) в одно 160-битное хеш-значение.

Псевдокод SHA-1

Псевдокод алгоритма SHA-1 следующий:

 Замечание: Все используемые переменные 32 бита.

Инициализация переменных:
h0 = 0x67452301
h1 = 0xEFCDAB89
h2 = 0x98BADCFE
h3 = 0x10325476
h4 = 0xC3D2E1F0

Предварительная обработка:
Присоединяем бит '1' к сообщению
Присоединяем k битов '0', где k наименьшее число ≥ 0 такое, что длина получившегося сообщения
(в битах) сравнима по модулю  512 с 448 (length mod 512 == 448)
Добавляем длину исходного сообщения (до предварительной обработки) как целое 64-битное
Big-endian число, в битах.

В процессе сообщение разбивается последовательно по 512 бит:
for перебираем все такие части
    разбиваем этот кусок на 16 частей, слов по 32-бита (big-endian) w[i], 0 <= i <= 15

    16 слов по 32-бита дополняются до 80 32-битовых слов:
    for i from 16 to 79
        w[i] = (w[i-3] xor w[i-8] xor w[i-14] xor w[i-16]) циклический сдвиг влево 1

    Инициализация хеш-значений этой части:
    a = h0
    b = h1
    c = h2
    d = h3
    e = h4

    Основной цикл:
    for i from 0 to 79
        if 0 ≤ i ≤ 19 then
            f = (b and c) or ((not b) and d)
            k = 0x5A827999
        else if 20 ≤ i ≤ 39 then
            f = b xor c xor d
            k = 0x6ED9EBA1
        else if 40 ≤ i ≤ 59 then
            f = (b and c) or (b and d) or (c and d)
            k = 0x8F1BBCDC
        else if 60 ≤ i ≤ 79 then
            f = b xor c xor d
            k = 0xCA62C1D6

        temp = (a leftrotate 5) + f + e + k + w[i]
        e = d
        d = c
        c = b leftrotate 30
        b = a
        a = temp

    Добавляем хеш-значение этой части к результату:
    h0 = h0 + a
    h1 = h1 + b 
    h2 = h2 + c
    h3 = h3 + d
    h4 = h4 + e

Итоговое хеш-значение(h0, h1, h2, h3, h4 должны быть преобразованы к big-endian):
digest = hash = h0 append h1 append h2 append h3 append h4

Вместо оригинальной формулировки FIPS PUB 180-1 приведены следующие эквивалентные выражения и могут быть использованы на компьютере f в главном цикле:

(0  ≤ i ≤ 19): f = d xor (b and (c xor d))                (альтернатива 1)
(0  ≤ i ≤ 19): f = (b and c) xor ((not b) and d)          (альтернатива 2)
(0  ≤ i ≤ 19): f = (b and c) + ((not b) and d)            (альтернатива 3)
 
(40 ≤ i ≤ 59): f = (b and c) or (d and (b or c))          (альтернатива 1)
(40 ≤ i ≤ 59): f = (b and c) or (d and (b xor c))         (альтернатива 2)
(40 ≤ i ≤ 59): f = (b and c) + (d and (b xor c))          (альтернатива 3)
(40 ≤ i ≤ 59): f = (b and c) xor (b and d) xor (c and d)  (альтернатива 4)

Примеры

Ниже приведены примеры хешей SHA-1. Для всех сообщений подразумевается использование кодировки UTF-8.

Хеш панграммы на русском:

SHA-1("В чащах юга жил бы цитрус? Да, но фальшивый экземпляр!")
  = 9e32295f 8225803b b6d5fdfc c0674616 a4413c1b

Хеш панграммы на английском:

SHA-1("The quick brown fox jumps over the lazy dog") 
  = 2fd4e1c6 7a2d28fc ed849ee1 bb76e739 1b93eb12

SHA-1("sha")
  = d8f45903 20e1343a 915b6394 170650a8 f35d6926

Небольшое изменение исходного текста (одна буква в верхнем регистре) приводит к сильному изменению самого хеша. Это происходит вследствие лавинного эффекта.

SHA-1("Sha") 
  = ba79baeb 9f10896a 46ae7471 5271b7f5 86e74640

Даже для пустой строки вычисляется нетривиальное хеш-значение.

SHA-1("") 
  = da39a3ee 5e6b4b0d 3255bfef 95601890 afd80709

Криптоанализ

Криптоанализ хеш-функций направлен на исследование уязвимости для различного вида атак. Основные из них:

нахождение коллизий — ситуация, когда двум различным исходным сообщениям соответствует одно и то же хеш-значение.
нахождение прообраза — исходного сообщения — по его хешу.

При решении методом «грубой силы»:

первая задача требует в среднем 2^160/2 = 2⁸⁰ операций, если использовать атаку Дней рождения.
вторая требует 2¹⁶⁰ операций.

От устойчивости хеш-функции к нахождению коллизий зависит безопасность электронной цифровой подписи с использованием данного хеш-алгоритма. От устойчивости к нахождению прообраза зависит безопасность хранения хешей паролей для целей аутентификации.

В январе 2005 года Винсент Рэймен и Элизабет Освальд опубликовали сообщение об атаке на усечённую версию SHA-1 (53 раунда вместо 80), которая позволяет находить коллизии меньше, чем за 2⁸⁰ операций.

В феврале 2005 года Сяоюнь Ван, Ицюнь Лиза Инь и Хунбо Юй (Xiaoyun Wang, Yiqun Lisa Yin, Hongbo Yu) представили атаку на полноценный SHA-1, которая требует менее 2⁶⁹ операций.

О методе авторы пишут:

Мы представляем набор стратегий и соответствующих методик, которые могут быть использованы для устранения некоторых важных препятствий в поиске коллизий в SHA-1. Сначала мы ищем близкие к коллизии дифференциальные пути, которые имеют небольшой «вес Хамминга» в «векторе помех», где каждый бит представляет 6-шаговую локальную коллизию. Потом мы соответствующим образом корректируем дифференциальный путь из первого этапа до другого приемлемого дифференциального пути, чтобы избежать неприемлемых последовательных и усеченных коллизий. В конце концов мы преобразуем два одноблоковых близких к коллизии дифференциальных пути в один двухблоковый коллизионный путь с удвоенной вычислительной сложностью.^[1]

Оригинальный текст (англ.)

We introduce a set of strategies and corresponding techniques that can be used to remove some major obstacles in collision search for SHA-1. Firstly, we look for a near-collision differential path which has low Hamming weight in the "disturbance vector" where each 1-bit represents a 6-step local collision. Secondly, we suitably adjust the differential path in the first round to another possible differential path so as to avoid impossible consecutive local collisions and truncated local collisions. Thirdly, we transform two one-block near-collision differential paths into a twoblock collision differential path with twice the search complexity.

Также они заявляют:

В частности, наш анализ основан на оригинальной дифференциальной атаке на SHA-0, «near-collision» атаке на SHA-0, мультиблоковой методике, а также методике модификации исходного сообщения, использованных при атаках поиска коллизий на HAVAL-128, MD4, RIPEMD и MD5.

Оригинальный текст (англ.)

In particular, our analysis is built upon the original differential attack on SHA-0, the near collision attack on SHA-0, the multi-block collision techniques, as well as the message modification techniques used in the collision search attacks on HAVAL-128, MD4, RIPEMD and MD5.

Статья с описанием алгоритма была опубликована в августе 2005 года на конференции CRYPTO.

В этой же статье авторы опубликовали атаку на усечённый SHA-1 (58 раундов), которая позволяет находить коллизии за 2³³ операций.

В августе 2005 года на CRYPTO 2005 эти же специалисты представили улучшенную версию атаки на полноценный SHA-1, с вычислительной сложностью в 2⁶³ операций. В декабре 2007 года детали этого улучшения были проверены Мартином Кохраном.

Кристоф де Каньер и Кристиан Рехберг позже представили усовершенствованную версию атаки на SHA-1, за что были удостоены награды за лучшую статью на конференции ASIACRYPT 2006. Ими была представлена двухблоковая коллизия на 64-раундовый алгоритм с вычислительной сложностью около 2³⁵ операций.^[2]

Существует масштабный исследовательский проект, стартовавший в технологическом университете австрийского города Грац, который : «… использует компьютеры, соединенные через Интернет, для проведения исследований в области криптоанализа. Вы можете поучаствовать в проекте, загрузив и запустив бесплатную программу на своем компьютере.»^[3]

Бурт Калински, глава исследовательского отдела в «лаборатории RSA», предсказывает, что первая атака по нахождению прообраза будет успешно осуществлена в ближайшие 5—10 лет.

Ввиду того, что теоретические атаки на SHA-1 оказались успешными, NIST планирует полностью отказаться от использования SHA-1 в цифровых подписях.^[4]

Из-за блочной и итеративной структуры алгоритмов, а также отсутствия специальной обработки в конце хеширования, все хеш-функции семейства SHA уязвимы для атак удлинением сообщения и коллизиям при частичном хешировании сообщения.^[5] Эти атаки позволяют подделывать сообщения, подписанные только хешем — $SHA(message||key)$ или $SHA(key||message)$ — путём удлинения сообщения и пересчёту хеша без знания значения ключа. Простейшим исправлением, позволяющим защититься от этих атак, является двойное хеширование — $SHA_{d}(message)=SHA(SHA(0^{b}||message))$ ( $0^{b}$ — блок нулей той же длины, что и блок хеш-функции).

2 ноября 2007 года NIST анонсировал конкурс по разработке нового алгоритма SHA-3, который продлился до 2012 года.^[6]

SHAppening

8 октября 2015 Marc Stevens, Pierre Karpman, и Thomas Peyrin опубликовали атаку на функцию сжатия алгоритма SHA-1, которая требует всего 2⁵⁷ вычислений.

Реальный взлом: SHAttered (нахождение коллизий)

23 февраля 2017 года специалисты из Google и CWI объявили о практическом взломе алгоритма, опубликовав 2 PDF-файла с одинаковой контрольной суммой SHA-1. Это потребовало перебора $9\times 10^{18}$ вариантов, что заняло бы 110 лет на 1 GPU^[7].

Сравнение SHA-1 с другими алгоритмами

Сравнение с MD5

И MD5, и SHA-1 являются, по сути, улучшенными продолжениями MD4.

Сходства:

Четыре этапа.
Каждое действие прибавляется к ранее полученному результату.
Размер блока обработки, равный 512 бит.
Оба алгоритма выполняют сложение по модулю 2³², они рассчитаны на 32-битную архитектуру.

Различия:

В SHA-1 на четвёртом этапе используется та же функция f, что и на втором этапе.
В MD5 в каждом действии используется уникальная прибавляемая константа. В SHA-1 константы используются повторно для каждой из четырёх групп.
В SHA-1 добавлена пятая переменная.
SHA-1 использует циклический код исправления ошибок.
В MD5 четыре сдвига, используемые на каждом этапе, отличаются от значений, используемых на предыдущих этапах. В SHA на каждом этапе используется постоянное значение сдвига.
В MD5 — четыре различных элементарных логических функции, в SHA-1 — три.
В MD5 длина дайджеста составляет 128 бит, в SHA-1 — 160 бит.
SHA-1 содержит больше раундов (80 вместо 64) и выполняется на 160-битном буфере по сравнению со 128-битным буфером MD5. Таким образом, SHA-1 должен выполняться приблизительно на 25 % медленнее, чем MD5 на той же аппаратуре.

Брюс Шнайер делает следующий вывод : «SHA-1 — это MD4 с добавлением расширяющего преобразования, дополнительного этапа и улучшенным лавинным эффектом. MD5 — это MD4 с улучшенным битовым хешированием, дополнительным этапом и улучшенным лавинным эффектом.»

Сравнение с ГОСТ Р 34.11-94

Ряд отличительных особенностей ГОСТ Р 34.11-94:

При обработке блоков используются преобразования по алгоритму ГОСТ 28147—89;
Обрабатывается блок длиной 256 бит, и выходное значение тоже имеет длину 256 бит.
Применены меры борьбы против поиска коллизий, основанном на неполноте последнего блока.
Обработка блоков происходит по алгоритму шифрования ГОСТ 28147—89, который содержит преобразования на S-блоках, что существенно осложняет применение метода дифференциального криптоанализа к поиску коллизий алгоритма ГОСТ Р 34.11-94. Это существенный плюс по сравнению с SHA-1.
Теоретическая криптостойкость ГОСТ Р 34.11-94 равна 2¹²⁸, что во много раз превосходит 2⁸⁰для SHA-1.

Сравнение с другими SHA

В таблице «промежуточный размер хеша» означает «размер внутренней хеш-суммы» после каждой итерации.

Вариации алгоритма		Размер выходного хеша (бит)	Промежуточный размер хеша (бит)	Размер блока (бит)	Максимальная длина входного сообщения (бит)	Размер слова (бит)	Количество раундов	Используемые операции	Найденные коллизии
SHA-0		160	160	512	2⁶⁴ − 1	32	80	+,and, or, xor, rotl	Есть
SHA-1		160	160	512	2⁶⁴ − 1	32	80	+,and, or, xor, rotl	2⁵² операций
SHA-2	SHA-256/224	256/224	256	512	2⁶⁴ − 1	32	64	+,and, or, xor, shr, rotr	Нет
SHA-2	SHA-512/384	512/384	512	1024	2¹²⁸ − 1	64	80	+,and, or, xor, shr, rotr	Нет

Использование

Хеш-функции используются в системах контроля версий, системах электронной подписи, а также для построения кодов аутентификации.

SHA-1 является наиболее распространенным из всего семейства SHA^[англ.] и применяется в различных широко распространенных криптографических приложениях и алгоритмах.

SHA-1 используется в следующих приложениях:

S/MIME — дайджесты сообщений.
SSL — дайджесты сообщений.
IPSec — для алгоритма проверки целостности в соединении «точка-точка».
SSH — для проверки целостности переданных данных.
PGP — для создания электронной цифровой подписи.
Git — для идентификации каждого объекта по SHA-1-хешу от хранимой в объекте информации.
Mercurial — для идентификации ревизий
BitTorrent — для проверки целостности загружаемых данных.

SHA-1 является основой блочного шифра SHACAL.

Отказ от использования

Компания Google давно выразила своё недоверие SHA-1, особенно для использования этой функции для подписи сертификатов TLS. Ещё в 2014 году, вскоре после публикации работы Марка Стивенса, группа разработчиков Chrome объявила о постепенном отказе от использования SHA-1.

С 25 апреля 2016 года Яндекс Почта перестала поддерживать старые почтовые программы, использующие SHA-1^[8].

Примечания

↑ Finding Collisions in the Full SHA-1 (англ.). — Статья китайских исследователей о взломе SHA-1. Архивировано из оригинала 23 августа 2011 года.
↑ Finding SHA-1 Characteristics: General Results and Applications (англ.). Дата обращения: 4 октября 2017. Архивировано 26 июля 2008 года.
↑ SHA-1 Collision Search Graz (англ.). — Исследовательский проект технологического университета Граца. Архивировано 7 ноября 2008 года.
↑ NIST Comments on Cryptanalytic Attacks on SHA-1 (англ.). — Официальный комментарий NIST по поводу атак на SHA-1. Архивировано из оригинала 13 октября 2012 года.
↑ Niels Ferguson, Bruce Schneier, and Tadayoshi Kohno, Cryptography Engineering (англ.). Архивировано из оригинала 13 октября 2012 года., John Wiley & Sons, 2010. ISBN 978-0-470-47424-2
↑ NIST Hash Competition (англ.). — Конкурс на разработку SHA-3. Архивировано из оригинала 13 октября 2012 года.
↑ Первый способ генерации коллизий для SHA-1 (неопр.). Дата обращения: 9 марта 2017. Архивировано 10 марта 2017 года.
↑ Обновление почтовых программ — Почта — Яндекс.Помощь (неопр.). yandex.ru. Дата обращения: 7 апреля 2016. Архивировано 20 апреля 2016 года.

Литература

Шнайер Б. Прикладная криптография. Протоколы, алгоритмы, исходные тексты на языке Си = Applied Cryptography. Protocols, Algorithms and Source Code in C. — М.: Триумф, 2002. — 816 с. — 3000 экз. — ISBN 5-89392-055-4.
Нильс Фергюсон, Брюс Шнайер. Практическая криптография = Practical Cryptography: Designing and Implementing Secure Cryptographic Systems. — М. : Диалектика, 2004. — 432 с. — 3000 экз. — ISBN 5-8459-0733-0, ISBN 0-4712-2357-3.

Ссылки

RFC 3174 (англ.)
Обзор SHA-1 от Консорциума Всемирной паутины Архивная копия от 4 марта 2005 на Wayback Machine (англ.)
Взлом SHA-1 Архивная копия от 5 мая 2017 на Wayback Machine (англ.)
Доклад о взломе SHA1 (англ.)
Брюс Шнайер о взломе SHA Архивировано 1 декабря 2012 года. (англ.)
Последствия удачных атак на SHA-1 Архивная копия от 26 декабря 2008 на Wayback Machine (англ.)

[1] Finding Collisions in the Full SHA-1 (англ.). — Статья китайских исследователей о взломе SHA-1. Архивировано из оригинала 23 августа 2011 года.

[2] Finding SHA-1 Characteristics: General Results and Applications (англ.). Дата обращения: 4 октября 2017. Архивировано 26 июля 2008 года.

[3] SHA-1 Collision Search Graz (англ.). — Исследовательский проект технологического университета Граца. Архивировано 7 ноября 2008 года.

[4] NIST Comments on Cryptanalytic Attacks on SHA-1 (англ.). — Официальный комментарий NIST по поводу атак на SHA-1. Архивировано из оригинала 13 октября 2012 года.

[5] Niels Ferguson, Bruce Schneier, and Tadayoshi Kohno, Cryptography Engineering (англ.). Архивировано из оригинала 13 октября 2012 года., John Wiley & Sons, 2010. ISBN 978-0-470-47424-2

[6] NIST Hash Competition (англ.). — Конкурс на разработку SHA-3. Архивировано из оригинала 13 октября 2012 года.

[7] Первый способ генерации коллизий для SHA-1 (неопр.). Дата обращения: 9 марта 2017. Архивировано 10 марта 2017 года.

[8] Обновление почтовых программ — Почта — Яндекс.Помощь (неопр.). yandex.ru. Дата обращения: 7 апреля 2016. Архивировано 20 апреля 2016 года.

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]