Branch data Line data Source code
1 : : // Copyright (c) 2017-present The Bitcoin Core developers
2 : : // Distributed under the MIT software license, see the accompanying
3 : : // file COPYING or http://www.opensource.org/licenses/mit-license.php.
4 : :
5 : : // Based on the public domain implementation 'merged' by D. J. Bernstein
6 : : // See https://cr.yp.to/chacha.html.
7 : :
8 : : #include <crypto/common.h>
9 : : #include <crypto/chacha20.h>
10 : : #include <support/cleanse.h>
11 : : #include <span.h>
12 : :
13 : : #include <algorithm>
14 : : #include <bit>
15 : : #include <string.h>
16 : :
17 : : #define QUARTERROUND(a,b,c,d) \
18 : : a += b; d = std::rotl(d ^ a, 16); \
19 : : c += d; b = std::rotl(b ^ c, 12); \
20 : : a += b; d = std::rotl(d ^ a, 8); \
21 : : c += d; b = std::rotl(b ^ c, 7);
22 : :
23 : : #define REPEAT10(a) do { {a}; {a}; {a}; {a}; {a}; {a}; {a}; {a}; {a}; {a}; } while(0)
24 : :
25 : 42044733 : void ChaCha20Aligned::SetKey(Span<const std::byte> key) noexcept
26 : : {
27 [ - + ]: 42044733 : assert(key.size() == KEYLEN);
28 : 42044733 : input[0] = ReadLE32(key.data() + 0);
29 : 42044733 : input[1] = ReadLE32(key.data() + 4);
30 : 42044733 : input[2] = ReadLE32(key.data() + 8);
31 : 42044733 : input[3] = ReadLE32(key.data() + 12);
32 : 42044733 : input[4] = ReadLE32(key.data() + 16);
33 : 42044733 : input[5] = ReadLE32(key.data() + 20);
34 : 42044733 : input[6] = ReadLE32(key.data() + 24);
35 : 42044733 : input[7] = ReadLE32(key.data() + 28);
36 : 42044733 : input[8] = 0;
37 : 42044733 : input[9] = 0;
38 : 42044733 : input[10] = 0;
39 : 42044733 : input[11] = 0;
40 : 42044733 : }
41 : :
42 : 20974459 : ChaCha20Aligned::~ChaCha20Aligned()
43 : : {
44 : 20974459 : memory_cleanse(input, sizeof(input));
45 : 20974459 : }
46 : :
47 : 20974459 : ChaCha20Aligned::ChaCha20Aligned(Span<const std::byte> key) noexcept
48 : : {
49 : 20974459 : SetKey(key);
50 : 20974459 : }
51 : :
52 : 22847193 : void ChaCha20Aligned::Seek(Nonce96 nonce, uint32_t block_counter) noexcept
53 : : {
54 : 22847193 : input[8] = block_counter;
55 : 22847193 : input[9] = nonce.first;
56 : 22847193 : input[10] = nonce.second;
57 : 22847193 : input[11] = nonce.second >> 32;
58 : 22847193 : }
59 : :
60 : 55955964 : inline void ChaCha20Aligned::Keystream(Span<std::byte> output) noexcept
61 : : {
62 [ - + ]: 55955964 : std::byte* c = output.data();
63 [ - + ]: 55955964 : size_t blocks = output.size() / BLOCKLEN;
64 [ - + ]: 55955964 : assert(blocks * BLOCKLEN == output.size());
65 : :
66 : 55955964 : uint32_t x0, x1, x2, x3, x4, x5, x6, x7, x8, x9, x10, x11, x12, x13, x14, x15;
67 : 55955964 : uint32_t j4, j5, j6, j7, j8, j9, j10, j11, j12, j13, j14, j15;
68 : :
69 [ + - ]: 55955964 : if (!blocks) return;
70 : :
71 : 55955964 : j4 = input[0];
72 : 55955964 : j5 = input[1];
73 : 55955964 : j6 = input[2];
74 : 55955964 : j7 = input[3];
75 : 55955964 : j8 = input[4];
76 : 55955964 : j9 = input[5];
77 : 55955964 : j10 = input[6];
78 : 55955964 : j11 = input[7];
79 : 55955964 : j12 = input[8];
80 : 55955964 : j13 = input[9];
81 : 55955964 : j14 = input[10];
82 : 55955964 : j15 = input[11];
83 : :
84 : 90917584 : for (;;) {
85 : 73436774 : x0 = 0x61707865;
86 : 73436774 : x1 = 0x3320646e;
87 : 73436774 : x2 = 0x79622d32;
88 : 73436774 : x3 = 0x6b206574;
89 : 73436774 : x4 = j4;
90 : 73436774 : x5 = j5;
91 : 73436774 : x6 = j6;
92 : 73436774 : x7 = j7;
93 : 73436774 : x8 = j8;
94 : 73436774 : x9 = j9;
95 : 73436774 : x10 = j10;
96 : 73436774 : x11 = j11;
97 : 73436774 : x12 = j12;
98 : 73436774 : x13 = j13;
99 : 73436774 : x14 = j14;
100 : 73436774 : x15 = j15;
101 : :
102 : : // The 20 inner ChaCha20 rounds are unrolled here for performance.
103 [ + + ]: 73436774 : REPEAT10(
104 : : QUARTERROUND( x0, x4, x8,x12);
105 : : QUARTERROUND( x1, x5, x9,x13);
106 : : QUARTERROUND( x2, x6,x10,x14);
107 : : QUARTERROUND( x3, x7,x11,x15);
108 : : QUARTERROUND( x0, x5,x10,x15);
109 : : QUARTERROUND( x1, x6,x11,x12);
110 : : QUARTERROUND( x2, x7, x8,x13);
111 : : QUARTERROUND( x3, x4, x9,x14);
112 : : );
113 : :
114 : 73436774 : x0 += 0x61707865;
115 : 73436774 : x1 += 0x3320646e;
116 : 73436774 : x2 += 0x79622d32;
117 : 73436774 : x3 += 0x6b206574;
118 : 73436774 : x4 += j4;
119 : 73436774 : x5 += j5;
120 : 73436774 : x6 += j6;
121 : 73436774 : x7 += j7;
122 : 73436774 : x8 += j8;
123 : 73436774 : x9 += j9;
124 : 73436774 : x10 += j10;
125 : 73436774 : x11 += j11;
126 : 73436774 : x12 += j12;
127 : 73436774 : x13 += j13;
128 : 73436774 : x14 += j14;
129 : 73436774 : x15 += j15;
130 : :
131 : 73436774 : ++j12;
132 [ + + ]: 73436774 : if (!j12) ++j13;
133 : :
134 : 73436774 : WriteLE32(c + 0, x0);
135 : 73436774 : WriteLE32(c + 4, x1);
136 : 73436774 : WriteLE32(c + 8, x2);
137 : 73436774 : WriteLE32(c + 12, x3);
138 : 73436774 : WriteLE32(c + 16, x4);
139 : 73436774 : WriteLE32(c + 20, x5);
140 : 73436774 : WriteLE32(c + 24, x6);
141 : 73436774 : WriteLE32(c + 28, x7);
142 : 73436774 : WriteLE32(c + 32, x8);
143 : 73436774 : WriteLE32(c + 36, x9);
144 : 73436774 : WriteLE32(c + 40, x10);
145 : 73436774 : WriteLE32(c + 44, x11);
146 : 73436774 : WriteLE32(c + 48, x12);
147 : 73436774 : WriteLE32(c + 52, x13);
148 : 73436774 : WriteLE32(c + 56, x14);
149 : 73436774 : WriteLE32(c + 60, x15);
150 : :
151 [ + + ]: 73436774 : if (blocks == 1) {
152 : 55955964 : input[8] = j12;
153 : 55955964 : input[9] = j13;
154 : 55955964 : return;
155 : : }
156 : 17480810 : blocks -= 1;
157 : 17480810 : c += BLOCKLEN;
158 : : }
159 : : }
160 : :
161 : 679720 : inline void ChaCha20Aligned::Crypt(Span<const std::byte> in_bytes, Span<std::byte> out_bytes) noexcept
162 : : {
163 [ - + ]: 679720 : assert(in_bytes.size() == out_bytes.size());
164 [ - + ]: 679720 : const std::byte* m = in_bytes.data();
165 : 679720 : std::byte* c = out_bytes.data();
166 : 679720 : size_t blocks = out_bytes.size() / BLOCKLEN;
167 [ - + ]: 679720 : assert(blocks * BLOCKLEN == out_bytes.size());
168 : :
169 : 679720 : uint32_t x0, x1, x2, x3, x4, x5, x6, x7, x8, x9, x10, x11, x12, x13, x14, x15;
170 : 679720 : uint32_t j4, j5, j6, j7, j8, j9, j10, j11, j12, j13, j14, j15;
171 : :
172 [ + - ]: 679720 : if (!blocks) return;
173 : :
174 : 679720 : j4 = input[0];
175 : 679720 : j5 = input[1];
176 : 679720 : j6 = input[2];
177 : 679720 : j7 = input[3];
178 : 679720 : j8 = input[4];
179 : 679720 : j9 = input[5];
180 : 679720 : j10 = input[6];
181 : 679720 : j11 = input[7];
182 : 679720 : j12 = input[8];
183 : 679720 : j13 = input[9];
184 : 679720 : j14 = input[10];
185 : 679720 : j15 = input[11];
186 : :
187 : 89599418 : for (;;) {
188 : 45139569 : x0 = 0x61707865;
189 : 45139569 : x1 = 0x3320646e;
190 : 45139569 : x2 = 0x79622d32;
191 : 45139569 : x3 = 0x6b206574;
192 : 45139569 : x4 = j4;
193 : 45139569 : x5 = j5;
194 : 45139569 : x6 = j6;
195 : 45139569 : x7 = j7;
196 : 45139569 : x8 = j8;
197 : 45139569 : x9 = j9;
198 : 45139569 : x10 = j10;
199 : 45139569 : x11 = j11;
200 : 45139569 : x12 = j12;
201 : 45139569 : x13 = j13;
202 : 45139569 : x14 = j14;
203 : 45139569 : x15 = j15;
204 : :
205 : : // The 20 inner ChaCha20 rounds are unrolled here for performance.
206 [ + + ]: 45139569 : REPEAT10(
207 : : QUARTERROUND( x0, x4, x8,x12);
208 : : QUARTERROUND( x1, x5, x9,x13);
209 : : QUARTERROUND( x2, x6,x10,x14);
210 : : QUARTERROUND( x3, x7,x11,x15);
211 : : QUARTERROUND( x0, x5,x10,x15);
212 : : QUARTERROUND( x1, x6,x11,x12);
213 : : QUARTERROUND( x2, x7, x8,x13);
214 : : QUARTERROUND( x3, x4, x9,x14);
215 : : );
216 : :
217 : 45139569 : x0 += 0x61707865;
218 : 45139569 : x1 += 0x3320646e;
219 : 45139569 : x2 += 0x79622d32;
220 : 45139569 : x3 += 0x6b206574;
221 : 45139569 : x4 += j4;
222 : 45139569 : x5 += j5;
223 : 45139569 : x6 += j6;
224 : 45139569 : x7 += j7;
225 : 45139569 : x8 += j8;
226 : 45139569 : x9 += j9;
227 : 45139569 : x10 += j10;
228 : 45139569 : x11 += j11;
229 : 45139569 : x12 += j12;
230 : 45139569 : x13 += j13;
231 : 45139569 : x14 += j14;
232 : 45139569 : x15 += j15;
233 : :
234 [ + + ]: 45139569 : x0 ^= ReadLE32(m + 0);
235 : 45139569 : x1 ^= ReadLE32(m + 4);
236 : 45139569 : x2 ^= ReadLE32(m + 8);
237 : 45139569 : x3 ^= ReadLE32(m + 12);
238 : 45139569 : x4 ^= ReadLE32(m + 16);
239 : 45139569 : x5 ^= ReadLE32(m + 20);
240 : 45139569 : x6 ^= ReadLE32(m + 24);
241 : 45139569 : x7 ^= ReadLE32(m + 28);
242 : 45139569 : x8 ^= ReadLE32(m + 32);
243 : 45139569 : x9 ^= ReadLE32(m + 36);
244 : 45139569 : x10 ^= ReadLE32(m + 40);
245 : 45139569 : x11 ^= ReadLE32(m + 44);
246 : 45139569 : x12 ^= ReadLE32(m + 48);
247 : 45139569 : x13 ^= ReadLE32(m + 52);
248 : 45139569 : x14 ^= ReadLE32(m + 56);
249 : 45139569 : x15 ^= ReadLE32(m + 60);
250 : :
251 : 45139569 : ++j12;
252 [ + + ]: 45139569 : if (!j12) ++j13;
253 : :
254 : 45139569 : WriteLE32(c + 0, x0);
255 : 45139569 : WriteLE32(c + 4, x1);
256 : 45139569 : WriteLE32(c + 8, x2);
257 : 45139569 : WriteLE32(c + 12, x3);
258 : 45139569 : WriteLE32(c + 16, x4);
259 : 45139569 : WriteLE32(c + 20, x5);
260 : 45139569 : WriteLE32(c + 24, x6);
261 : 45139569 : WriteLE32(c + 28, x7);
262 : 45139569 : WriteLE32(c + 32, x8);
263 : 45139569 : WriteLE32(c + 36, x9);
264 : 45139569 : WriteLE32(c + 40, x10);
265 : 45139569 : WriteLE32(c + 44, x11);
266 : 45139569 : WriteLE32(c + 48, x12);
267 : 45139569 : WriteLE32(c + 52, x13);
268 : 45139569 : WriteLE32(c + 56, x14);
269 : 45139569 : WriteLE32(c + 60, x15);
270 : :
271 [ + + ]: 45139569 : if (blocks == 1) {
272 : 679720 : input[8] = j12;
273 : 679720 : input[9] = j13;
274 : 679720 : return;
275 : : }
276 : 44459849 : blocks -= 1;
277 : 44459849 : c += BLOCKLEN;
278 : 44459849 : m += BLOCKLEN;
279 : : }
280 : : }
281 : :
282 : 94238639 : void ChaCha20::Keystream(Span<std::byte> out) noexcept
283 : : {
284 [ + + ]: 94238639 : if (out.empty()) return;
285 [ + + ]: 94147015 : if (m_bufleft) {
286 [ + + ]: 44461450 : unsigned reuse = std::min<size_t>(m_bufleft, out.size());
287 : 44461450 : std::copy(m_buffer.end() - m_bufleft, m_buffer.end() - m_bufleft + reuse, out.begin());
288 : 44461450 : m_bufleft -= reuse;
289 : 44461450 : out = out.subspan(reuse);
290 : : }
291 [ + + ]: 94147015 : if (out.size() >= m_aligned.BLOCKLEN) {
292 : 16429978 : size_t blocks = out.size() / m_aligned.BLOCKLEN;
293 : 16429978 : m_aligned.Keystream(out.first(blocks * m_aligned.BLOCKLEN));
294 : 16429978 : out = out.subspan(blocks * m_aligned.BLOCKLEN);
295 : : }
296 [ + + ]: 94147015 : if (!out.empty()) {
297 : 38293671 : m_aligned.Keystream(m_buffer);
298 : 38293671 : std::copy(m_buffer.begin(), m_buffer.begin() + out.size(), out.begin());
299 : 38293671 : m_bufleft = m_aligned.BLOCKLEN - out.size();
300 : : }
301 : : }
302 : :
303 : 12920162 : void ChaCha20::Crypt(Span<const std::byte> input, Span<std::byte> output) noexcept
304 : : {
305 [ - + ]: 12920162 : assert(input.size() == output.size());
306 : :
307 [ + + ]: 12920162 : if (!input.size()) return;
308 [ + + ]: 1716127 : if (m_bufleft) {
309 [ + + ]: 850280 : unsigned reuse = std::min<size_t>(m_bufleft, input.size());
310 [ + + ]: 20569851 : for (unsigned i = 0; i < reuse; i++) {
311 : 19719571 : output[i] = input[i] ^ m_buffer[m_aligned.BLOCKLEN - m_bufleft + i];
312 : : }
313 : 850280 : m_bufleft -= reuse;
314 : 850280 : output = output.subspan(reuse);
315 : 850280 : input = input.subspan(reuse);
316 : : }
317 [ + + ]: 1716127 : if (input.size() >= m_aligned.BLOCKLEN) {
318 : 679720 : size_t blocks = input.size() / m_aligned.BLOCKLEN;
319 : 679720 : m_aligned.Crypt(input.first(blocks * m_aligned.BLOCKLEN), output.first(blocks * m_aligned.BLOCKLEN));
320 : 679720 : output = output.subspan(blocks * m_aligned.BLOCKLEN);
321 : 679720 : input = input.subspan(blocks * m_aligned.BLOCKLEN);
322 : : }
323 [ + + ]: 1716127 : if (!input.empty()) {
324 : 1229413 : m_aligned.Keystream(m_buffer);
325 [ + + ]: 32672370 : for (unsigned i = 0; i < input.size(); i++) {
326 : 31442957 : output[i] = input[i] ^ m_buffer[i];
327 : : }
328 : 1229413 : m_bufleft = m_aligned.BLOCKLEN - input.size();
329 : : }
330 : : }
331 : :
332 : 20971557 : ChaCha20::~ChaCha20()
333 : : {
334 : 20971557 : memory_cleanse(m_buffer.data(), m_buffer.size());
335 : 20971557 : }
336 : :
337 : 21070274 : void ChaCha20::SetKey(Span<const std::byte> key) noexcept
338 : : {
339 : 21070274 : m_aligned.SetKey(key);
340 : 21070274 : m_bufleft = 0;
341 : 21070274 : memory_cleanse(m_buffer.data(), m_buffer.size());
342 : 21070274 : }
343 : :
344 : 13930 : FSChaCha20::FSChaCha20(Span<const std::byte> key, uint32_t rekey_interval) noexcept :
345 : 13930 : m_chacha20(key), m_rekey_interval(rekey_interval)
346 : : {
347 [ - + ]: 13930 : assert(key.size() == KEYLEN);
348 : 13930 : }
349 : :
350 : 1360075 : void FSChaCha20::Crypt(Span<const std::byte> input, Span<std::byte> output) noexcept
351 : : {
352 [ - + ]: 1360075 : assert(input.size() == output.size());
353 : :
354 : : // Invoke internal stream cipher for actual encryption/decryption.
355 : 1360075 : m_chacha20.Crypt(input, output);
356 : :
357 : : // Rekey after m_rekey_interval encryptions/decryptions.
358 [ + + ]: 1360075 : if (++m_chunk_counter == m_rekey_interval) {
359 : : // Get new key from the stream cipher.
360 : 849279 : std::byte new_key[KEYLEN];
361 : 849279 : m_chacha20.Keystream(new_key);
362 : : // Update its key.
363 : 849279 : m_chacha20.SetKey(new_key);
364 : : // Wipe the key (a copy remains inside m_chacha20, where it'll be wiped on the next rekey
365 : : // or on destruction).
366 : 849279 : memory_cleanse(new_key, sizeof(new_key));
367 : : // Set the nonce for the new section of output.
368 : 849279 : m_chacha20.Seek({0, ++m_rekey_counter}, 0);
369 : : // Reset the chunk counter.
370 : 849279 : m_chunk_counter = 0;
371 : : }
372 : 1360075 : }
|