LCOV - code coverage report
Current view: top level - src/univalue/lib - univalue_read.cpp (source / functions) Coverage Total Hit
Test: total_coverage.info Lines: 99.6 % 264 263
Test Date: 2026-02-03 21:38:54 Functions: 100.0 % 4 4
Branches: 78.2 % 280 219

             Branch data     Line data    Source code
       1                 :             : // Copyright 2014 BitPay Inc.
       2                 :             : // Distributed under the MIT software license, see the accompanying
       3                 :             : // file COPYING or https://opensource.org/licenses/mit-license.php.
       4                 :             : 
       5                 :             : #include <univalue.h>
       6                 :             : #include <univalue_utffilter.h>
       7                 :             : 
       8                 :             : #include <cstdint>
       9                 :             : #include <cstring>
      10                 :             : #include <string>
      11                 :             : #include <string_view>
      12                 :             : #include <vector>
      13                 :             : 
      14                 :             : /*
      15                 :             :  * According to stackexchange, the original json test suite wanted
      16                 :             :  * to limit depth to 22.  Widely-deployed PHP bails at depth 512,
      17                 :             :  * so we will follow PHP's lead, which should be more than sufficient
      18                 :             :  * (further stackexchange comments indicate depth > 32 rarely occurs).
      19                 :             :  */
      20                 :             : static constexpr size_t MAX_JSON_DEPTH = 512;
      21                 :             : 
      22                 :     7199161 : static bool json_isdigit(int ch)
      23                 :             : {
      24                 :     7199161 :     return ((ch >= '0') && (ch <= '9'));
      25                 :             : }
      26                 :             : 
      27                 :             : // convert hexadecimal string to unsigned integer
      28                 :         595 : static const char *hatoui(const char *first, const char *last,
      29                 :             :                           unsigned int& out)
      30                 :             : {
      31                 :         595 :     unsigned int result = 0;
      32         [ +  + ]:        2975 :     for (; first != last; ++first)
      33                 :             :     {
      34                 :        2380 :         int digit;
      35         [ +  + ]:        2380 :         if (json_isdigit(*first))
      36                 :        1183 :             digit = *first - '0';
      37                 :             : 
      38         [ +  + ]:        1197 :         else if (*first >= 'a' && *first <= 'f')
      39                 :        1175 :             digit = *first - 'a' + 10;
      40                 :             : 
      41         [ +  - ]:          22 :         else if (*first >= 'A' && *first <= 'F')
      42                 :          22 :             digit = *first - 'A' + 10;
      43                 :             : 
      44                 :             :         else
      45                 :             :             break;
      46                 :             : 
      47                 :        2380 :         result = 16 * result + digit;
      48                 :             :     }
      49                 :         595 :     out = result;
      50                 :             : 
      51                 :         595 :     return first;
      52                 :             : }
      53                 :             : 
      54                 :     6552266 : enum jtokentype getJsonToken(std::string& tokenVal, unsigned int& consumed,
      55                 :             :                             const char *raw, const char *end)
      56                 :             : {
      57                 :     6552266 :     tokenVal.clear();
      58                 :     6552266 :     consumed = 0;
      59                 :             : 
      60                 :     6552266 :     const char *rawStart = raw;
      61                 :             : 
      62   [ +  +  +  + ]:     8409236 :     while (raw < end && (json_isspace(*raw)))          // skip whitespace
      63                 :     1856970 :         raw++;
      64                 :             : 
      65         [ +  + ]:     6552266 :     if (raw >= end)
      66                 :             :         return JTOK_NONE;
      67                 :             : 
      68   [ +  +  +  +  :     6347720 :     switch (*raw) {
          +  +  +  +  +  
                      + ]
      69                 :             : 
      70                 :      332633 :     case '{':
      71                 :      332633 :         raw++;
      72                 :      332633 :         consumed = (raw - rawStart);
      73                 :      332633 :         return JTOK_OBJ_OPEN;
      74                 :      332617 :     case '}':
      75                 :      332617 :         raw++;
      76                 :      332617 :         consumed = (raw - rawStart);
      77                 :      332617 :         return JTOK_OBJ_CLOSE;
      78                 :      135501 :     case '[':
      79                 :      135501 :         raw++;
      80                 :      135501 :         consumed = (raw - rawStart);
      81                 :      135501 :         return JTOK_ARR_OPEN;
      82                 :      134452 :     case ']':
      83                 :      134452 :         raw++;
      84                 :      134452 :         consumed = (raw - rawStart);
      85                 :      134452 :         return JTOK_ARR_CLOSE;
      86                 :             : 
      87                 :     1002407 :     case ':':
      88                 :     1002407 :         raw++;
      89                 :     1002407 :         consumed = (raw - rawStart);
      90                 :     1002407 :         return JTOK_COLON;
      91                 :      816031 :     case ',':
      92                 :      816031 :         raw++;
      93                 :      816031 :         consumed = (raw - rawStart);
      94                 :      816031 :         return JTOK_COMMA;
      95                 :             : 
      96                 :       18059 :     case 'n':
      97                 :       18059 :     case 't':
      98                 :       18059 :     case 'f':
      99         [ +  + ]:       18059 :         if (!strncmp(raw, "null", 4)) {
     100                 :         625 :             raw += 4;
     101                 :         625 :             consumed = (raw - rawStart);
     102                 :         625 :             return JTOK_KW_NULL;
     103         [ +  + ]:       17434 :         } else if (!strncmp(raw, "true", 4)) {
     104                 :       15231 :             raw += 4;
     105                 :       15231 :             consumed = (raw - rawStart);
     106                 :       15231 :             return JTOK_KW_TRUE;
     107         [ +  + ]:        2203 :         } else if (!strncmp(raw, "false", 5)) {
     108                 :        2196 :             raw += 5;
     109                 :        2196 :             consumed = (raw - rawStart);
     110                 :        2196 :             return JTOK_KW_FALSE;
     111                 :             :         } else
     112                 :             :             return JTOK_ERR;
     113                 :             : 
     114                 :     1953579 :     case '-':
     115                 :     1953579 :     case '0':
     116                 :     1953579 :     case '1':
     117                 :     1953579 :     case '2':
     118                 :     1953579 :     case '3':
     119                 :     1953579 :     case '4':
     120                 :     1953579 :     case '5':
     121                 :     1953579 :     case '6':
     122                 :     1953579 :     case '7':
     123                 :     1953579 :     case '8':
     124                 :     1953579 :     case '9': {
     125                 :             :         // part 1: int
     126         [ +  + ]:     1953579 :         std::string numStr;
     127                 :             : 
     128                 :     1953579 :         const char *first = raw;
     129                 :             : 
     130                 :     1953579 :         const char *firstDigit = first;
     131         [ +  + ]:     1953579 :         if (!json_isdigit(*firstDigit))
     132                 :       40061 :             firstDigit++;
     133   [ +  +  +  + ]:     1953579 :         if ((*firstDigit == '0') && json_isdigit(firstDigit[1]))
     134                 :             :             return JTOK_ERR;
     135                 :             : 
     136         [ +  - ]:     1953578 :         numStr += *raw;                       // copy first char
     137                 :     1953578 :         raw++;
     138                 :             : 
     139   [ +  +  +  -  :     1953578 :         if ((*first == '-') && (raw < end) && (!json_isdigit(*raw)))
                   +  - ]
     140                 :             :             return JTOK_ERR;
     141                 :             : 
     142   [ +  +  +  + ]:     5802533 :         while (raw < end && json_isdigit(*raw)) {  // copy digits
     143         [ +  - ]:     3848955 :             numStr += *raw;
     144                 :     3848955 :             raw++;
     145                 :             :         }
     146                 :             : 
     147                 :             :         // part 2: frac
     148   [ +  +  +  + ]:     1953578 :         if (raw < end && *raw == '.') {
     149         [ +  - ]:       53105 :             numStr += *raw;                   // copy .
     150                 :       53105 :             raw++;
     151                 :             : 
     152   [ +  -  +  - ]:       53105 :             if (raw >= end || !json_isdigit(*raw))
     153                 :             :                 return JTOK_ERR;
     154   [ +  +  +  + ]:      505834 :             while (raw < end && json_isdigit(*raw)) { // copy digits
     155         [ +  - ]:      452729 :                 numStr += *raw;
     156                 :      452729 :                 raw++;
     157                 :             :             }
     158                 :             :         }
     159                 :             : 
     160                 :             :         // part 3: exp
     161   [ +  +  +  +  :     1953578 :         if (raw < end && (*raw == 'e' || *raw == 'E')) {
                   +  + ]
     162         [ +  - ]:       23858 :             numStr += *raw;                   // copy E
     163                 :       23858 :             raw++;
     164                 :             : 
     165   [ +  -  +  +  :       23858 :             if (raw < end && (*raw == '-' || *raw == '+')) { // copy +/-
                   +  + ]
     166         [ +  - ]:       23851 :                 numStr += *raw;
     167                 :       23851 :                 raw++;
     168                 :             :             }
     169                 :             : 
     170   [ +  -  +  + ]:       23858 :             if (raw >= end || !json_isdigit(*raw))
     171                 :             :                 return JTOK_ERR;
     172   [ +  +  +  + ]:       71555 :             while (raw < end && json_isdigit(*raw)) { // copy digits
     173         [ +  - ]:       47700 :                 numStr += *raw;
     174                 :       47700 :                 raw++;
     175                 :             :             }
     176                 :             :         }
     177                 :             : 
     178         [ +  - ]:     1953575 :         tokenVal = numStr;
     179                 :     1953575 :         consumed = (raw - rawStart);
     180                 :     1953575 :         return JTOK_NUMBER;
     181                 :     1953579 :         }
     182                 :             : 
     183                 :     1622415 :     case '"': {
     184                 :     1622415 :         raw++;                                // skip "
     185                 :             : 
     186                 :     1622415 :         std::string valStr;
     187                 :     1622415 :         JSONUTF8StringFilter writer(valStr);
     188                 :             : 
     189                 :  3434082676 :         while (true) {
     190   [ +  +  +  + ]:  3434082676 :             if (raw >= end || (unsigned char)*raw < 0x20)
     191                 :             :                 return JTOK_ERR;
     192                 :             : 
     193         [ +  + ]:  3434082672 :             else if (*raw == '\\') {
     194                 :         640 :                 raw++;                        // skip backslash
     195                 :             : 
     196         [ +  - ]:         640 :                 if (raw >= end)
     197                 :             :                     return JTOK_ERR;
     198                 :             : 
     199   [ +  +  +  +  :         640 :                 switch (*raw) {
          +  +  +  +  +  
                      + ]
     200         [ +  - ]:          14 :                 case '"':  writer.push_back('\"'); break;
     201         [ +  - ]:           4 :                 case '\\': writer.push_back('\\'); break;
     202         [ +  - ]:           2 :                 case '/':  writer.push_back('/'); break;
     203         [ +  - ]:           4 :                 case 'b':  writer.push_back('\b'); break;
     204         [ +  - ]:           4 :                 case 'f':  writer.push_back('\f'); break;
     205         [ +  - ]:           5 :                 case 'n':  writer.push_back('\n'); break;
     206         [ +  - ]:           4 :                 case 'r':  writer.push_back('\r'); break;
     207         [ +  - ]:           4 :                 case 't':  writer.push_back('\t'); break;
     208                 :             : 
     209                 :         595 :                 case 'u': {
     210                 :         595 :                     unsigned int codepoint;
     211   [ +  -  +  - ]:        1190 :                     if (raw + 1 + 4 >= end ||
     212                 :         595 :                         hatoui(raw + 1, raw + 1 + 4, codepoint) !=
     213                 :             :                                raw + 1 + 4)
     214                 :           0 :                         return JTOK_ERR;
     215         [ +  - ]:         595 :                     writer.push_back_u(codepoint);
     216                 :         595 :                     raw += 4;
     217                 :         595 :                     break;
     218                 :             :                     }
     219                 :             :                 default:
     220                 :             :                     return JTOK_ERR;
     221                 :             : 
     222                 :             :                 }
     223                 :             : 
     224                 :         636 :                 raw++;                        // skip esc'd char
     225                 :             :             }
     226                 :             : 
     227         [ +  + ]:  3434082032 :             else if (*raw == '"') {
     228                 :     1622407 :                 raw++;                        // skip "
     229                 :     1622407 :                 break;                        // stop scanning
     230                 :             :             }
     231                 :             : 
     232                 :             :             else {
     233         [ +  - ]:  3432459625 :                 writer.push_back(static_cast<unsigned char>(*raw));
     234                 :  3432459625 :                 raw++;
     235                 :             :             }
     236                 :             :         }
     237                 :             : 
     238   [ +  +  +  + ]:     3244814 :         if (!writer.finalize())
     239                 :             :             return JTOK_ERR;
     240         [ +  - ]:     1622403 :         tokenVal = valStr;
     241                 :     1622403 :         consumed = (raw - rawStart);
     242                 :     1622403 :         return JTOK_STRING;
     243                 :     1622415 :         }
     244                 :             : 
     245                 :             :     default:
     246                 :             :         return JTOK_ERR;
     247                 :             :     }
     248                 :             : }
     249                 :             : 
     250                 :             : enum expect_bits : unsigned {
     251                 :             :     EXP_OBJ_NAME = (1U << 0),
     252                 :             :     EXP_COLON = (1U << 1),
     253                 :             :     EXP_ARR_VALUE = (1U << 2),
     254                 :             :     EXP_VALUE = (1U << 3),
     255                 :             :     EXP_NOT_VALUE = (1U << 4),
     256                 :             : };
     257                 :             : 
     258                 :             : #define expect(bit) (expectMask & (EXP_##bit))
     259                 :             : #define setExpect(bit) (expectMask |= EXP_##bit)
     260                 :             : #define clearExpect(bit) (expectMask &= ~EXP_##bit)
     261                 :             : 
     262                 :      204620 : bool UniValue::read(std::string_view str_in)
     263                 :             : {
     264                 :      204620 :     clear();
     265                 :             : 
     266                 :      204620 :     uint32_t expectMask = 0;
     267                 :      204620 :     std::vector<UniValue*> stack;
     268                 :             : 
     269                 :      204620 :     std::string tokenVal;
     270                 :      204620 :     unsigned int consumed;
     271                 :      204620 :     enum jtokentype tok = JTOK_NONE;
     272                 :      204620 :     enum jtokentype last_tok = JTOK_NONE;
     273                 :      204620 :     const char* raw{str_in.data()};
     274                 :      204620 :     const char* end{raw + str_in.size()};
     275                 :     4714437 :     do {
     276                 :     4714437 :         last_tok = tok;
     277                 :             : 
     278         [ +  - ]:     4714437 :         tok = getJsonToken(tokenVal, consumed, raw, end);
     279         [ +  + ]:     4714437 :         if (tok == JTOK_NONE || tok == JTOK_ERR)
     280                 :             :             return false;
     281                 :     4714390 :         raw += consumed;
     282                 :             : 
     283         [ +  + ]:     4714390 :         bool isValueOpen = jsonTokenIsValue(tok) ||
     284         [ +  + ]:     2753636 :             tok == JTOK_OBJ_OPEN || tok == JTOK_ARR_OPEN;
     285                 :             : 
     286         [ +  + ]:     4714390 :         if (expect(VALUE)) {
     287         [ +  + ]:     1002403 :             if (!isValueOpen)
     288                 :             :                 return false;
     289                 :     1002401 :             clearExpect(VALUE);
     290                 :             : 
     291         [ +  + ]:     3711987 :         } else if (expect(ARR_VALUE)) {
     292                 :      221242 :             bool isArrValue = isValueOpen || (tok == JTOK_ARR_CLOSE);
     293         [ +  + ]:      221242 :             if (!isArrValue)
     294                 :             :                 return false;
     295                 :             : 
     296                 :      221240 :             clearExpect(ARR_VALUE);
     297                 :             : 
     298         [ +  + ]:     3490745 :         } else if (expect(OBJ_NAME)) {
     299                 :     1062894 :             bool isObjName = (tok == JTOK_OBJ_CLOSE || tok == JTOK_STRING);
     300         [ +  + ]:     1062894 :             if (!isObjName)
     301                 :             :                 return false;
     302                 :             : 
     303         [ +  + ]:     2427851 :         } else if (expect(COLON)) {
     304         [ +  + ]:     1002408 :             if (tok != JTOK_COLON)
     305                 :             :                 return false;
     306                 :     1002405 :             clearExpect(COLON);
     307                 :             : 
     308         [ +  + ]:     1425443 :         } else if (!expect(COLON) && (tok == JTOK_COLON)) {
     309                 :             :             return false;
     310                 :             :         }
     311                 :             : 
     312         [ +  + ]:     4714378 :         if (expect(NOT_VALUE)) {
     313         [ +  + ]:     2223249 :             if (isValueOpen)
     314                 :             :                 return false;
     315                 :     2223247 :             clearExpect(NOT_VALUE);
     316                 :             :         }
     317                 :             : 
     318   [ +  +  +  +  :     4714376 :         switch (tok) {
             +  +  +  - ]
     319                 :             : 
     320                 :      468130 :         case JTOK_OBJ_OPEN:
     321                 :      468130 :         case JTOK_ARR_OPEN: {
     322         [ +  + ]:      468130 :             VType utyp = (tok == JTOK_OBJ_OPEN ? VOBJ : VARR);
     323   [ -  +  +  + ]:      468130 :             if (!stack.size()) {
     324         [ +  + ]:      204486 :                 if (utyp == VOBJ)
     325         [ +  - ]:      203877 :                     setObject();
     326                 :             :                 else
     327         [ +  - ]:         609 :                     setArray();
     328         [ +  - ]:      204486 :                 stack.push_back(this);
     329                 :             :             } else {
     330                 :      263644 :                 UniValue tmpVal(utyp);
     331                 :      263644 :                 UniValue *top = stack.back();
     332         [ +  - ]:      263644 :                 top->values.push_back(tmpVal);
     333                 :             : 
     334                 :      263644 :                 UniValue *newTop = &(top->values.back());
     335         [ +  - ]:      263644 :                 stack.push_back(newTop);
     336                 :      263644 :             }
     337                 :             : 
     338   [ -  +  +  + ]:      468130 :             if (stack.size() > MAX_JSON_DEPTH)
     339                 :             :                 return false;
     340                 :             : 
     341         [ +  + ]:      468128 :             if (utyp == VOBJ)
     342                 :      332631 :                 setExpect(OBJ_NAME);
     343                 :             :             else
     344                 :      135497 :                 setExpect(ARR_VALUE);
     345                 :             :             break;
     346                 :             :             }
     347                 :             : 
     348                 :      467065 :         case JTOK_OBJ_CLOSE:
     349                 :      467065 :         case JTOK_ARR_CLOSE: {
     350   [ -  +  +  -  :      467065 :             if (!stack.size() || (last_tok == JTOK_COMMA))
                   +  + ]
     351                 :             :                 return false;
     352                 :             : 
     353         [ +  + ]:      467063 :             VType utyp = (tok == JTOK_OBJ_CLOSE ? VOBJ : VARR);
     354                 :      467063 :             UniValue *top = stack.back();
     355         [ +  + ]:      467063 :             if (utyp != top->getType())
     356                 :             :                 return false;
     357                 :             : 
     358                 :      467062 :             stack.pop_back();
     359                 :      467062 :             clearExpect(OBJ_NAME);
     360                 :      467062 :             setExpect(NOT_VALUE);
     361                 :      467062 :             break;
     362                 :             :             }
     363                 :             : 
     364                 :     1002405 :         case JTOK_COLON: {
     365   [ -  +  +  - ]:     1002405 :             if (!stack.size())
     366                 :             :                 return false;
     367                 :             : 
     368                 :     1002405 :             UniValue *top = stack.back();
     369         [ +  - ]:     1002405 :             if (top->getType() != VOBJ)
     370                 :             :                 return false;
     371                 :             : 
     372                 :     1002405 :             setExpect(VALUE);
     373                 :     1002405 :             break;
     374                 :             :             }
     375                 :             : 
     376                 :      816027 :         case JTOK_COMMA: {
     377         [ -  + ]:      816027 :             if (!stack.size() ||
     378   [ +  -  +  - ]:      816027 :                 (last_tok == JTOK_COMMA) || (last_tok == JTOK_ARR_OPEN))
     379                 :             :                 return false;
     380                 :             : 
     381                 :      816027 :             UniValue *top = stack.back();
     382         [ +  + ]:      816027 :             if (top->getType() == VOBJ)
     383                 :      730266 :                 setExpect(OBJ_NAME);
     384                 :             :             else
     385                 :       85761 :                 setExpect(ARR_VALUE);
     386                 :             :             break;
     387                 :             :             }
     388                 :             : 
     389                 :       18049 :         case JTOK_KW_NULL:
     390                 :       18049 :         case JTOK_KW_TRUE:
     391                 :       18049 :         case JTOK_KW_FALSE: {
     392      [ +  +  + ]:       18049 :             UniValue tmpVal;
     393      [ +  +  + ]:       18049 :             switch (tok) {
     394                 :             :             case JTOK_KW_NULL:
     395                 :             :                 // do nothing more
     396                 :             :                 break;
     397                 :       15229 :             case JTOK_KW_TRUE:
     398         [ +  - ]:       15229 :                 tmpVal.setBool(true);
     399                 :             :                 break;
     400                 :        2196 :             case JTOK_KW_FALSE:
     401         [ +  - ]:        2196 :                 tmpVal.setBool(false);
     402                 :             :                 break;
     403                 :             :             default: /* impossible */ break;
     404                 :             :             }
     405                 :             : 
     406   [ -  +  +  + ]:       18049 :             if (!stack.size()) {
     407         [ +  - ]:          39 :                 *this = tmpVal;
     408                 :             :                 break;
     409                 :             :             }
     410                 :             : 
     411                 :       18010 :             UniValue *top = stack.back();
     412         [ +  - ]:       18010 :             top->values.push_back(tmpVal);
     413                 :             : 
     414                 :       18010 :             setExpect(NOT_VALUE);
     415                 :       18010 :             break;
     416                 :       18049 :             }
     417                 :             : 
     418                 :      320299 :         case JTOK_NUMBER: {
     419         [ -  + ]:      640598 :             UniValue tmpVal(VNUM, tokenVal);
     420   [ -  +  +  + ]:      320299 :             if (!stack.size()) {
     421         [ +  - ]:          70 :                 *this = tmpVal;
     422                 :             :                 break;
     423                 :             :             }
     424                 :             : 
     425                 :      320229 :             UniValue *top = stack.back();
     426         [ +  - ]:      320229 :             top->values.push_back(tmpVal);
     427                 :             : 
     428                 :      320229 :             setExpect(NOT_VALUE);
     429                 :      320229 :             break;
     430                 :      320299 :             }
     431                 :             : 
     432                 :     1622401 :         case JTOK_STRING: {
     433         [ +  + ]:     1622401 :             if (expect(OBJ_NAME)) {
     434                 :     1002408 :                 UniValue *top = stack.back();
     435         [ +  - ]:     1002408 :                 top->keys.push_back(tokenVal);
     436                 :     1002408 :                 clearExpect(OBJ_NAME);
     437                 :     1002408 :                 setExpect(COLON);
     438                 :             :             } else {
     439         [ -  + ]:     1239986 :                 UniValue tmpVal(VSTR, tokenVal);
     440   [ -  +  +  + ]:      619993 :                 if (!stack.size()) {
     441         [ +  - ]:           3 :                     *this = tmpVal;
     442                 :           3 :                     break;
     443                 :             :                 }
     444                 :      619990 :                 UniValue *top = stack.back();
     445         [ +  - ]:      619990 :                 top->values.push_back(tmpVal);
     446                 :      619993 :             }
     447                 :             : 
     448                 :     1622398 :             setExpect(NOT_VALUE);
     449                 :     1622398 :             break;
     450                 :             :             }
     451                 :             : 
     452                 :             :         default:
     453                 :             :             return false;
     454                 :             :         }
     455         [ +  + ]:     4714371 :     } while (!stack.empty ());
     456                 :             : 
     457                 :             :     /* Check that nothing follows the initial construct (parsed above).  */
     458         [ +  - ]:      204554 :     tok = getJsonToken(tokenVal, consumed, raw, end);
     459         [ +  + ]:      204554 :     if (tok != JTOK_NONE)
     460                 :          13 :         return false;
     461                 :             : 
     462                 :             :     return true;
     463                 :      204620 : }
     464                 :             : 
        

Generated by: LCOV version 2.0-1