|              Branch data     Line data    Source code 
       1                 :             : // Copyright (c) 2017-present The Bitcoin Core developers
       2                 :             : // Distributed under the MIT software license, see the accompanying
       3                 :             : // file COPYING or http://www.opensource.org/licenses/mit-license.php.
       4                 :             : 
       5                 :             : // Based on the public domain implementation 'merged' by D. J. Bernstein
       6                 :             : // See https://cr.yp.to/chacha.html.
       7                 :             : 
       8                 :             : #include <crypto/common.h>
       9                 :             : #include <crypto/chacha20.h>
      10                 :             : #include <support/cleanse.h>
      11                 :             : #include <span.h>
      12                 :             : 
      13                 :             : #include <algorithm>
      14                 :             : #include <bit>
      15                 :             : #include <cstring>
      16                 :             : 
      17                 :             : #define QUARTERROUND(a,b,c,d) \
      18                 :             :   a += b; d = std::rotl(d ^ a, 16); \
      19                 :             :   c += d; b = std::rotl(b ^ c, 12); \
      20                 :             :   a += b; d = std::rotl(d ^ a, 8); \
      21                 :             :   c += d; b = std::rotl(b ^ c, 7);
      22                 :             : 
      23                 :             : #define REPEAT10(a) do { {a}; {a}; {a}; {a}; {a}; {a}; {a}; {a}; {a}; {a}; } while(0)
      24                 :             : 
      25                 :     6214059 : void ChaCha20Aligned::SetKey(std::span<const std::byte> key) noexcept
      26                 :             : {
      27         [ -  + ]:     6214059 :     assert(key.size() == KEYLEN);
      28                 :     6214059 :     input[0] = ReadLE32(key.data() + 0);
      29                 :     6214059 :     input[1] = ReadLE32(key.data() + 4);
      30                 :     6214059 :     input[2] = ReadLE32(key.data() + 8);
      31                 :     6214059 :     input[3] = ReadLE32(key.data() + 12);
      32                 :     6214059 :     input[4] = ReadLE32(key.data() + 16);
      33                 :     6214059 :     input[5] = ReadLE32(key.data() + 20);
      34                 :     6214059 :     input[6] = ReadLE32(key.data() + 24);
      35                 :     6214059 :     input[7] = ReadLE32(key.data() + 28);
      36                 :     6214059 :     input[8] = 0;
      37                 :     6214059 :     input[9] = 0;
      38                 :     6214059 :     input[10] = 0;
      39                 :     6214059 :     input[11] = 0;
      40                 :     6214059 : }
      41                 :             : 
      42                 :     3473432 : ChaCha20Aligned::~ChaCha20Aligned()
      43                 :             : {
      44                 :     3473432 :     memory_cleanse(input, sizeof(input));
      45                 :     3473432 : }
      46                 :             : 
      47                 :     3473430 : ChaCha20Aligned::ChaCha20Aligned(std::span<const std::byte> key) noexcept
      48                 :             : {
      49                 :     3473430 :     SetKey(key);
      50                 :     3473430 : }
      51                 :             : 
      52                 :     2047041 : void ChaCha20Aligned::Seek(Nonce96 nonce, uint32_t block_counter) noexcept
      53                 :             : {
      54                 :     2047041 :     input[8] = block_counter;
      55                 :     2047041 :     input[9] = nonce.first;
      56                 :     2047041 :     input[10] = nonce.second;
      57                 :     2047041 :     input[11] = nonce.second >> 32;
      58                 :     2047041 : }
      59                 :             : 
      60                 :     9382163 : inline void ChaCha20Aligned::Keystream(std::span<std::byte> output) noexcept
      61                 :             : {
      62         [ -  + ]:     9382163 :     std::byte* c = output.data();
      63         [ -  + ]:     9382163 :     size_t blocks = output.size() / BLOCKLEN;
      64         [ -  + ]:     9382163 :     assert(blocks * BLOCKLEN == output.size());
      65                 :             : 
      66                 :     9382163 :     uint32_t x0, x1, x2, x3, x4, x5, x6, x7, x8, x9, x10, x11, x12, x13, x14, x15;
      67                 :     9382163 :     uint32_t j4, j5, j6, j7, j8, j9, j10, j11, j12, j13, j14, j15;
      68                 :             : 
      69         [ +  - ]:     9382163 :     if (!blocks) return;
      70                 :             : 
      71                 :     9382163 :     j4 = input[0];
      72                 :     9382163 :     j5 = input[1];
      73                 :     9382163 :     j6 = input[2];
      74                 :     9382163 :     j7 = input[3];
      75                 :     9382163 :     j8 = input[4];
      76                 :     9382163 :     j9 = input[5];
      77                 :     9382163 :     j10 = input[6];
      78                 :     9382163 :     j11 = input[7];
      79                 :     9382163 :     j12 = input[8];
      80                 :     9382163 :     j13 = input[9];
      81                 :     9382163 :     j14 = input[10];
      82                 :     9382163 :     j15 = input[11];
      83                 :             : 
      84                 :    14772023 :     for (;;) {
      85                 :    12077093 :         x0 = 0x61707865;
      86                 :    12077093 :         x1 = 0x3320646e;
      87                 :    12077093 :         x2 = 0x79622d32;
      88                 :    12077093 :         x3 = 0x6b206574;
      89                 :    12077093 :         x4 = j4;
      90                 :    12077093 :         x5 = j5;
      91                 :    12077093 :         x6 = j6;
      92                 :    12077093 :         x7 = j7;
      93                 :    12077093 :         x8 = j8;
      94                 :    12077093 :         x9 = j9;
      95                 :    12077093 :         x10 = j10;
      96                 :    12077093 :         x11 = j11;
      97                 :    12077093 :         x12 = j12;
      98                 :    12077093 :         x13 = j13;
      99                 :    12077093 :         x14 = j14;
     100                 :    12077093 :         x15 = j15;
     101                 :             : 
     102                 :             :         // The 20 inner ChaCha20 rounds are unrolled here for performance.
     103         [ +  + ]:    12077093 :         REPEAT10(
     104                 :             :             QUARTERROUND( x0, x4, x8,x12);
     105                 :             :             QUARTERROUND( x1, x5, x9,x13);
     106                 :             :             QUARTERROUND( x2, x6,x10,x14);
     107                 :             :             QUARTERROUND( x3, x7,x11,x15);
     108                 :             :             QUARTERROUND( x0, x5,x10,x15);
     109                 :             :             QUARTERROUND( x1, x6,x11,x12);
     110                 :             :             QUARTERROUND( x2, x7, x8,x13);
     111                 :             :             QUARTERROUND( x3, x4, x9,x14);
     112                 :             :         );
     113                 :             : 
     114                 :    12077093 :         x0 += 0x61707865;
     115                 :    12077093 :         x1 += 0x3320646e;
     116                 :    12077093 :         x2 += 0x79622d32;
     117                 :    12077093 :         x3 += 0x6b206574;
     118                 :    12077093 :         x4 += j4;
     119                 :    12077093 :         x5 += j5;
     120                 :    12077093 :         x6 += j6;
     121                 :    12077093 :         x7 += j7;
     122                 :    12077093 :         x8 += j8;
     123                 :    12077093 :         x9 += j9;
     124                 :    12077093 :         x10 += j10;
     125                 :    12077093 :         x11 += j11;
     126                 :    12077093 :         x12 += j12;
     127                 :    12077093 :         x13 += j13;
     128                 :    12077093 :         x14 += j14;
     129                 :    12077093 :         x15 += j15;
     130                 :             : 
     131                 :    12077093 :         ++j12;
     132         [ +  + ]:    12077093 :         if (!j12) ++j13;
     133                 :             : 
     134                 :    12077093 :         WriteLE32(c + 0, x0);
     135                 :    12077093 :         WriteLE32(c + 4, x1);
     136                 :    12077093 :         WriteLE32(c + 8, x2);
     137                 :    12077093 :         WriteLE32(c + 12, x3);
     138                 :    12077093 :         WriteLE32(c + 16, x4);
     139                 :    12077093 :         WriteLE32(c + 20, x5);
     140                 :    12077093 :         WriteLE32(c + 24, x6);
     141                 :    12077093 :         WriteLE32(c + 28, x7);
     142                 :    12077093 :         WriteLE32(c + 32, x8);
     143                 :    12077093 :         WriteLE32(c + 36, x9);
     144                 :    12077093 :         WriteLE32(c + 40, x10);
     145                 :    12077093 :         WriteLE32(c + 44, x11);
     146                 :    12077093 :         WriteLE32(c + 48, x12);
     147                 :    12077093 :         WriteLE32(c + 52, x13);
     148                 :    12077093 :         WriteLE32(c + 56, x14);
     149                 :    12077093 :         WriteLE32(c + 60, x15);
     150                 :             : 
     151         [ +  + ]:    12077093 :         if (blocks == 1) {
     152                 :     9382163 :             input[8] = j12;
     153                 :     9382163 :             input[9] = j13;
     154                 :     9382163 :             return;
     155                 :             :         }
     156                 :     2694930 :         blocks -= 1;
     157                 :     2694930 :         c += BLOCKLEN;
     158                 :             :     }
     159                 :             : }
     160                 :             : 
     161                 :       92936 : inline void ChaCha20Aligned::Crypt(std::span<const std::byte> in_bytes, std::span<std::byte> out_bytes) noexcept
     162                 :             : {
     163         [ -  + ]:       92936 :     assert(in_bytes.size() == out_bytes.size());
     164         [ -  + ]:       92936 :     const std::byte* m = in_bytes.data();
     165                 :       92936 :     std::byte* c = out_bytes.data();
     166         [ -  + ]:       92936 :     size_t blocks = out_bytes.size() / BLOCKLEN;
     167         [ -  + ]:       92936 :     assert(blocks * BLOCKLEN == out_bytes.size());
     168                 :             : 
     169                 :       92936 :     uint32_t x0, x1, x2, x3, x4, x5, x6, x7, x8, x9, x10, x11, x12, x13, x14, x15;
     170                 :       92936 :     uint32_t j4, j5, j6, j7, j8, j9, j10, j11, j12, j13, j14, j15;
     171                 :             : 
     172         [ +  - ]:       92936 :     if (!blocks) return;
     173                 :             : 
     174                 :       92936 :     j4 = input[0];
     175                 :       92936 :     j5 = input[1];
     176                 :       92936 :     j6 = input[2];
     177                 :       92936 :     j7 = input[3];
     178                 :       92936 :     j8 = input[4];
     179                 :       92936 :     j9 = input[5];
     180                 :       92936 :     j10 = input[6];
     181                 :       92936 :     j11 = input[7];
     182                 :       92936 :     j12 = input[8];
     183                 :       92936 :     j13 = input[9];
     184                 :       92936 :     j14 = input[10];
     185                 :       92936 :     j15 = input[11];
     186                 :             : 
     187                 :    11077478 :     for (;;) {
     188                 :     5585207 :         x0 = 0x61707865;
     189                 :     5585207 :         x1 = 0x3320646e;
     190                 :     5585207 :         x2 = 0x79622d32;
     191                 :     5585207 :         x3 = 0x6b206574;
     192                 :     5585207 :         x4 = j4;
     193                 :     5585207 :         x5 = j5;
     194                 :     5585207 :         x6 = j6;
     195                 :     5585207 :         x7 = j7;
     196                 :     5585207 :         x8 = j8;
     197                 :     5585207 :         x9 = j9;
     198                 :     5585207 :         x10 = j10;
     199                 :     5585207 :         x11 = j11;
     200                 :     5585207 :         x12 = j12;
     201                 :     5585207 :         x13 = j13;
     202                 :     5585207 :         x14 = j14;
     203                 :     5585207 :         x15 = j15;
     204                 :             : 
     205                 :             :         // The 20 inner ChaCha20 rounds are unrolled here for performance.
     206         [ -  + ]:     5585207 :         REPEAT10(
     207                 :             :             QUARTERROUND( x0, x4, x8,x12);
     208                 :             :             QUARTERROUND( x1, x5, x9,x13);
     209                 :             :             QUARTERROUND( x2, x6,x10,x14);
     210                 :             :             QUARTERROUND( x3, x7,x11,x15);
     211                 :             :             QUARTERROUND( x0, x5,x10,x15);
     212                 :             :             QUARTERROUND( x1, x6,x11,x12);
     213                 :             :             QUARTERROUND( x2, x7, x8,x13);
     214                 :             :             QUARTERROUND( x3, x4, x9,x14);
     215                 :             :         );
     216                 :             : 
     217                 :     5585207 :         x0 += 0x61707865;
     218                 :     5585207 :         x1 += 0x3320646e;
     219                 :     5585207 :         x2 += 0x79622d32;
     220                 :     5585207 :         x3 += 0x6b206574;
     221                 :     5585207 :         x4 += j4;
     222                 :     5585207 :         x5 += j5;
     223                 :     5585207 :         x6 += j6;
     224                 :     5585207 :         x7 += j7;
     225                 :     5585207 :         x8 += j8;
     226                 :     5585207 :         x9 += j9;
     227                 :     5585207 :         x10 += j10;
     228                 :     5585207 :         x11 += j11;
     229                 :     5585207 :         x12 += j12;
     230                 :     5585207 :         x13 += j13;
     231                 :     5585207 :         x14 += j14;
     232                 :     5585207 :         x15 += j15;
     233                 :             : 
     234         [ -  + ]:     5585207 :         x0 ^= ReadLE32(m + 0);
     235                 :     5585207 :         x1 ^= ReadLE32(m + 4);
     236                 :     5585207 :         x2 ^= ReadLE32(m + 8);
     237                 :     5585207 :         x3 ^= ReadLE32(m + 12);
     238                 :     5585207 :         x4 ^= ReadLE32(m + 16);
     239                 :     5585207 :         x5 ^= ReadLE32(m + 20);
     240                 :     5585207 :         x6 ^= ReadLE32(m + 24);
     241                 :     5585207 :         x7 ^= ReadLE32(m + 28);
     242                 :     5585207 :         x8 ^= ReadLE32(m + 32);
     243                 :     5585207 :         x9 ^= ReadLE32(m + 36);
     244                 :     5585207 :         x10 ^= ReadLE32(m + 40);
     245                 :     5585207 :         x11 ^= ReadLE32(m + 44);
     246                 :     5585207 :         x12 ^= ReadLE32(m + 48);
     247                 :     5585207 :         x13 ^= ReadLE32(m + 52);
     248                 :     5585207 :         x14 ^= ReadLE32(m + 56);
     249                 :     5585207 :         x15 ^= ReadLE32(m + 60);
     250                 :             : 
     251                 :     5585207 :         ++j12;
     252         [ -  + ]:     5585207 :         if (!j12) ++j13;
     253                 :             : 
     254                 :     5585207 :         WriteLE32(c + 0, x0);
     255                 :     5585207 :         WriteLE32(c + 4, x1);
     256                 :     5585207 :         WriteLE32(c + 8, x2);
     257                 :     5585207 :         WriteLE32(c + 12, x3);
     258                 :     5585207 :         WriteLE32(c + 16, x4);
     259                 :     5585207 :         WriteLE32(c + 20, x5);
     260                 :     5585207 :         WriteLE32(c + 24, x6);
     261                 :     5585207 :         WriteLE32(c + 28, x7);
     262                 :     5585207 :         WriteLE32(c + 32, x8);
     263                 :     5585207 :         WriteLE32(c + 36, x9);
     264                 :     5585207 :         WriteLE32(c + 40, x10);
     265                 :     5585207 :         WriteLE32(c + 44, x11);
     266                 :     5585207 :         WriteLE32(c + 48, x12);
     267                 :     5585207 :         WriteLE32(c + 52, x13);
     268                 :     5585207 :         WriteLE32(c + 56, x14);
     269                 :     5585207 :         WriteLE32(c + 60, x15);
     270                 :             : 
     271         [ +  + ]:     5585207 :         if (blocks == 1) {
     272                 :       92936 :             input[8] = j12;
     273                 :       92936 :             input[9] = j13;
     274                 :       92936 :             return;
     275                 :             :         }
     276                 :     5492271 :         blocks -= 1;
     277                 :     5492271 :         c += BLOCKLEN;
     278                 :     5492271 :         m += BLOCKLEN;
     279                 :             :     }
     280                 :             : }
     281                 :             : 
     282                 :    36836169 : void ChaCha20::Keystream(std::span<std::byte> out) noexcept
     283                 :             : {
     284         [ +  + ]:    36836169 :     if (out.empty()) return;
     285         [ +  + ]:    36835968 :     if (m_bufleft) {
     286         [ +  + ]:    28321801 :         unsigned reuse = std::min<size_t>(m_bufleft, out.size());
     287                 :    28321801 :         std::copy(m_buffer.end() - m_bufleft, m_buffer.end() - m_bufleft + reuse, out.begin());
     288                 :    28321801 :         m_bufleft -= reuse;
     289                 :    28321801 :         out = out.subspan(reuse);
     290                 :             :     }
     291         [ +  + ]:    36835968 :     if (out.size() >= m_aligned.BLOCKLEN) {
     292                 :     1424337 :         size_t blocks = out.size() / m_aligned.BLOCKLEN;
     293                 :     1424337 :         m_aligned.Keystream(out.first(blocks * m_aligned.BLOCKLEN));
     294                 :     1424337 :         out = out.subspan(blocks * m_aligned.BLOCKLEN);
     295                 :             :     }
     296         [ +  + ]:    36835968 :     if (!out.empty()) {
     297                 :     7674509 :         m_aligned.Keystream(m_buffer);
     298                 :     7674509 :         std::copy(m_buffer.begin(), m_buffer.begin() + out.size(), out.begin());
     299                 :     7674509 :         m_bufleft = m_aligned.BLOCKLEN - out.size();
     300                 :             :     }
     301                 :             : }
     302                 :             : 
     303                 :     1699273 : void ChaCha20::Crypt(std::span<const std::byte> input, std::span<std::byte> output) noexcept
     304                 :             : {
     305         [ -  + ]:     1699273 :     assert(input.size() == output.size());
     306                 :             : 
     307         [ +  + ]:     1699273 :     if (!input.size()) return;
     308         [ +  + ]:      445611 :     if (m_bufleft) {
     309         [ +  + ]:      279522 :         unsigned reuse = std::min<size_t>(m_bufleft, input.size());
     310         [ +  + ]:     7626865 :         for (unsigned i = 0; i < reuse; i++) {
     311                 :     7347343 :             output[i] = input[i] ^ m_buffer[m_aligned.BLOCKLEN - m_bufleft + i];
     312                 :             :         }
     313                 :      279522 :         m_bufleft -= reuse;
     314                 :      279522 :         output = output.subspan(reuse);
     315                 :      279522 :         input = input.subspan(reuse);
     316                 :             :     }
     317         [ +  + ]:      445611 :     if (input.size() >= m_aligned.BLOCKLEN) {
     318                 :       92936 :         size_t blocks = input.size() / m_aligned.BLOCKLEN;
     319                 :       92936 :         m_aligned.Crypt(input.first(blocks * m_aligned.BLOCKLEN), output.first(blocks * m_aligned.BLOCKLEN));
     320                 :       92936 :         output = output.subspan(blocks * m_aligned.BLOCKLEN);
     321                 :       92936 :         input = input.subspan(blocks * m_aligned.BLOCKLEN);
     322                 :             :     }
     323         [ +  + ]:      445611 :     if (!input.empty()) {
     324                 :      269587 :         m_aligned.Keystream(m_buffer);
     325         [ +  + ]:     3700778 :         for (unsigned i = 0; i < input.size(); i++) {
     326                 :     3431191 :             output[i] = input[i] ^ m_buffer[i];
     327                 :             :         }
     328                 :      269587 :         m_bufleft = m_aligned.BLOCKLEN - input.size();
     329                 :             :     }
     330                 :             : }
     331                 :             : 
     332                 :     3459702 : ChaCha20::~ChaCha20()
     333                 :             : {
     334                 :     3459702 :     memory_cleanse(m_buffer.data(), m_buffer.size());
     335                 :     3459702 : }
     336                 :             : 
     337                 :     2740629 : void ChaCha20::SetKey(std::span<const std::byte> key) noexcept
     338                 :             : {
     339                 :     2740629 :     m_aligned.SetKey(key);
     340                 :     2740629 :     m_bufleft = 0;
     341                 :     2740629 :     memory_cleanse(m_buffer.data(), m_buffer.size());
     342                 :     2740629 : }
     343                 :             : 
     344                 :         823 : FSChaCha20::FSChaCha20(std::span<const std::byte> key, uint32_t rekey_interval) noexcept :
     345                 :         823 :     m_chacha20(key), m_rekey_interval(rekey_interval)
     346                 :             : {
     347         [ -  + ]:         823 :     assert(key.size() == KEYLEN);
     348                 :         823 : }
     349                 :             : 
     350                 :      168175 : void FSChaCha20::Crypt(std::span<const std::byte> input, std::span<std::byte> output) noexcept
     351                 :             : {
     352         [ -  + ]:      168175 :     assert(input.size() == output.size());
     353                 :             : 
     354                 :             :     // Invoke internal stream cipher for actual encryption/decryption.
     355                 :      168175 :     m_chacha20.Crypt(input, output);
     356                 :             : 
     357                 :             :     // Rekey after m_rekey_interval encryptions/decryptions.
     358         [ +  + ]:      168175 :     if (++m_chunk_counter == m_rekey_interval) {
     359                 :             :         // Get new key from the stream cipher.
     360                 :         634 :         std::byte new_key[KEYLEN];
     361                 :         634 :         m_chacha20.Keystream(new_key);
     362                 :             :         // Update its key.
     363                 :         634 :         m_chacha20.SetKey(new_key);
     364                 :             :         // Wipe the key (a copy remains inside m_chacha20, where it'll be wiped on the next rekey
     365                 :             :         // or on destruction).
     366                 :         634 :         memory_cleanse(new_key, sizeof(new_key));
     367                 :             :         // Set the nonce for the new section of output.
     368                 :         634 :         m_chacha20.Seek({0, ++m_rekey_counter}, 0);
     369                 :             :         // Reset the chunk counter.
     370                 :         634 :         m_chunk_counter = 0;
     371                 :             :     }
     372                 :      168175 : }
         |