Arduino string разделитель

String-строки

String-строки

Мы с вами уже познакомились с символами в уроке про типы данных. Как в обычной жизни, одиночные символы соединяются в слова и строки – это текст, заключённый в двойные кавычки: «Hello, World!» . У нас есть два набора инструментов для работы с ними:

  • Статические строки – они же массивы символов char , являются стандартными для языка C/C++ и работают одинаково на любой платформе. О них поговорим в следующем уроке.
  • Динамические String -строки, в Arduino за них отвечает отдельная библиотека, которая входит в состав “ядра”. Эти строки просты и удобны в использовании, поэтому сначала разберём работу с ними.

Базовый синтаксис

Создание String

Строка создаётся как обычная переменная:

При создании также можно присвоить строке значение. String позволяет автоматически преобразовывать любой стандартный тип данных в строку:

Помимо такой инициализации, есть ещё вариант с конструктором, он более гибкий: в скобках можно указать значение, а для некоторых типов данных доступны дополнительные настройки:

Более того, данный способ работает быстрее присваивания, так как выделяет память под строку один раз. В варианте с присваиванием сначала выделяется пустая строка, а затем увеличивается под новые данные.

Сложение String

К строке можно прибавить любой тип данных, так же как при создании, по одному действию в строке кода:

Также String позволяет складывать строки между собой при помощи оператора + . В тексте ниже данные имеют любой тип, с которым String поддерживает сложение (см. выше):

  • Одним из слагаемых должна быть строка, как выше: стринг + данные или данные + стринг
  • Операция сложения возвращает строку обратно, что позволяет сделать “каскад” из таких сложений и собрать строку “одной строкой кода”, сборка происходит слева направо: стринг + данные1 + данные2 или данные1 + стринг + данные2 + данные3
  • Результат всей суммы можно:
    • Приравнять к String: стринг = стринг + данные1 + данные2
    • Отправить в функцию, которая принимает String: f(стринг + данные1 + данные2)
    • И так далее

Для сборки строки данный вариант менее предпочтительный, чем предыдущий с += . Ниже разберёмся, почему.

Доступ к символам

К строке можно обратиться как к массиву и прочитать или изменить символ по порядку:

Сравнение String

Стринги можно сравнивать между собой и с обычными строками ( const char* ):

Остальные методы

Рассмотрим все библиотечные методы для работы со строками, они применяются к строке через точку. В рассмотренных ниже примерах “тестовая” строка называется myString. Также оставлю некоторые комментарии по оптимизации.

myString.compareTo(myString2)

  • Возвращает отрицательное число, если myString идёт до myString2
  • Возвращает положительное число, если myString идёт после myString2
  • Возвращает 0, если строки одинаковы

myString.replace(substring1, substring2) – в строке myString заменяет последовательность символов substring1 на substring2.

myString.substring(from) и myString.substring(from, to) – возвращает подстроку, содержащуюся в myString с позиции from и до конца, либо до позиции to

myString.toInt() – конвертирует и возвращает содержимое строки в тип данных int

Проблемы и оптимизация String

Преимущество стрингов заключается в том, что с ними очень легко и удобно работать: собирать из других строк и переменных любых типов, складывать между собой, делить на подстроки и так далее. За удобство приходится платить: String является динамическим объектом (читай урок про динамическую память), что влечёт за собой некоторые проблемы. Также на форумах часто критикуют String и предлагают использовать вместо них обычные си-строки, давайте рассмотрим всё вместе:

  • String – тяжёлый. Несомненно – использование String-строк сразу добавляет пару килобайт Flash памяти к весу программы, так как для работы с ними используется менеджер памяти (встроенная библиотека). В то же время, если в программе уже используется динамическое выделение памяти – добавление String будет заметно не так сильно. На этом данная проблема заканчивается, потому что если открыть реализацию библиотеки String, то можно увидеть, что все действия со строками выполняются при помощи стандартных строковых функций языка Си (подробнее – в следующем уроке).
  • String – медленный. Да, когда строка меняет свою длину – она начинает менять свой размер и даже место в оперативной памяти микроконтроллера. Переписывание и перераспределение памяти происходит отнюдь не мгновенно, поэтому операции со String выполняются относительно долго: сотни микросекунд. Если собирать строку посимвольно – каждая прибавка будет выполняться дольше, чем хотелось бы! Этого можно избежать, используя метод reserve() , который зарезервирует память, чтобы увеличение строки происходило без выделения памяти (подробнее об этом ниже). Если место под строку зарезервировано – операции со строкой будут выполняться с такой же скоростью, как и с обычными строками, потому что для них используются те же стандартные строковые функции.
  • String – опасный. Всё верно, неаккуратная работа со String может привести к сильной фрагментации памяти, неправильной работе программы и даже полному её зависанию. В то же время, если понимать как работают стринги и использовать эффективные и безопасные конструкции в работе с ними – можно избежать абсолютно всех проблем!

Использование памяти

Несмотря на то, что строка – это динамический инструмент, в реализации Arduino она может только увеличиваться. Это означает, что если у нас была длинная строка, а затем мы её обнулили – места в памяти она не стала занимать меньше! То есть

Следующая созданная стринга будет размещена в памяти сразу за предыдущей. Возникает вопрос: а как тогда удалить строку и освободить память? Очень просто:

  • Если строка создана глобально – никак, в библиотеке не предусмотрено публичного инструмента для очистки строки.
  • Если строка создана локально – она автоматически выгрузится из памяти, когда код дойдёт до закрывающей фигурной скобки, за которой она уже не существует.

Сложение строк

Самый плохой вариант, который только можно себе представить, выглядит вот так:

Так делать нельзя, но тем не менее, на форумах очень часто можно встретить этот вариант. Здесь плохо всё: создаётся несколько “временных” экземпляров строки, под каждый выделяется память, тратится время, в результате каждый кусок начинает смещаться по памяти вперёд на новое место и изначальная строка прыгает в самый конец этого “паравозика”, образуя “дырку” в памяти (фрагментацию)!

Для сборки строки из нескольких частей рекомендуется использовать исключительно вариант с построчным прибавлением += . Пусть он не такой визуально компактный, как сложение “в одной строке кода”, но он позволяет избежать создания лишних экземпляров String, лишних перераспределений памяти и самое главное – не приводит к её фрагментации и выполняется гораздо быстрее:

Фрагментация памяти

Тут есть ещё один важный момент: если в процессе такой сборки строки создать ещё одну строку – это приведёт к сильной фрагментации памяти! Например:

В конце выполнения этого кода собранная строка состоит условно из 25 символов и должна занимать в памяти 25 байт. Но с начала выполнения этого кода свободная память уменьшилась на 50+5 байт! Как и почему это произошло:

  • Перед созданием второй строки у нас уже есть строка, представим её как блок памяти [——str——]
  • Мы создаём ещё одну строку, она располагается в памяти сразу за предыдущей строкой (так работает менеджер памяти) [——str——][—str2—]
  • Теперь мы прибавляем к первой строке вторую: вторая строка остаётся в памяти, она никуда не пропадает, а первой нужно больше места. Поэтому менеджер памяти переносит первую строку на место сразу после второй и в памяти остаётся “дырка”! [ дырка ][—str2—][——str-str2——]
  • В итоге “край” свободной памяти смещается на длину первой строки плюс длину второй строки. Беда!

С небольшими строками и кучей свободной памяти данная ситуация нам ничем не страшна, но если вы неправильно собираете например веб-страницу или другой ответ серверу – строка может начать занимать в несколько раз больше места, чем должна, и свободная оперативная память просто закончится!

Аналогичная ситуация произойдёт в том числе при вот такой записи, здесь тоже будет создана новая стринга в процессе сборки первой:

  • Избегать создания новых строк в процессе работы с уже имеющимися
  • Резервировать место под “прибавку”, прибавлять, а затем удалять вторую строку из памяти. Рассмотрим этот вариант

Сценарий первый, строка создаётся как переменная

Мы поместили создание второй строки в отдельный блок кода, чтобы она автоматически удалилась из памяти после выхода из этого блока.

Сценарий второй, преобразование

Как это работает:

  • Была строка [——str——]
  • Мы её расширили [——str—— ]
  • Создали вторую строку [——str—— ][—str2—]
  • Переписали [——str——str2—][—str2—]
  • Удалили временную строку [——str——str2—]
  • Осталась сумма и никаких препятствий в памяти

Резервирование памяти

Вернёмся к первому примеру: можно ещё сильнее оптимизировать сборку строки, если сразу зарезервировать место. Мы не знаем, какой длины она будет, но можем прикинуть. Можно даже зарезервировать чуть больше, это не так страшно:

Теперь каждое прибавление не будет приводить к перераспределению памяти и код выполнится быстрее. Также создание промежуточных строк не будет приводить к фрагментации памяти, потому что строке есть куда расти!

Оптимизация памяти

Забегая немного вперёд – текст в двойных кавычках хранится и в программной памяти программы (которой много), и в оперативной (которой мало). В уроке про PROGMEM мы рассмотрим несколько способов оптимизации памяти, но уже сейчас можно начать применять макрос F() – данный макрос позволяет хранить строку только в программной памяти и доставать её оттуда только для сложения со стрингой. Например после выполнения вот такого безобидного кода

Текст «Hello» окажется продублирован в памяти микроконтроллера целых 3 раза!

  • Текст всегда хранится в памяти программы
  • При запуске МК текст переписывается в оперативную память, чтобы можно было иметь к нему доступ. Находится там на всём протяжении работы программы
  • Мы создали стринг-строку, в которую скопировали этот текст. Копия будет находиться в памяти, пока строка не будет удалена из памяти

Если обернуть текст в макрос F() – он будет загружаться из программной памяти напрямую в строку, и удалится из неё вместе со строкой:

Таким образом этот макрос крайне рекомендуется использовать для сборки строки с участием строковых констант. Вернёмся к нашему примеру:

Именно так и рекомендуется собирать строки.

Передача в функции

Функции очень многих библиотек для Arduino принимают String-строки. Это может быть вывод на дисплей, отправка в веб и многое другое. Если посмотреть реализацию этих функций – они принимают тип данных String& или const String& . Это – ссылка на строку, подробнее читайте в уроке про указатели и ссылки.

Как это работает и зачем: допустим вам нужна функция, которая принимает строку и что то с ней делает, например выводит в монитор порта. Это будет выглядеть примерно так:

Проблема в том, что когда мы передадим в эту функцию строку

она будет продублирована в памяти, то есть внутри нашей функции будет копия переданной строки. Если строка большая, а свободной памяти мало – быть беде. Если передать строку по ссылке – внутри функции окажется именно наша строка, лишней копии не будет.

Рекомендуется делать именно так.

Далее, если вы захотите помимо String-строк отправлять в свою функцию строковые константы (текст в кавычках) или текст внутри макроса F() для экономии памяти, то нужно будет добавить слово const :

Такая конструкция сможет эффективно принимать любые строковые данные для дальнейшей работы:

Другие библиотеки

Ради интереса я написал свою версию String, но без использования динамической памяти: максимальный размер строки задаётся при её создании, это позволяет сэкономить в сумме около 2 кБ Flash на одних и тех же операциях со строкой. Библиотека имеет такой же набор методов и возможностей, как у String, что позволяет легко заменить стандартные стринги на мои, а также там есть несколько дополнительных фишек. Библиотека называется mString, документацию и примеры смотрите на GitHub.

Видео

Источник

Split String in Arduino

This tutorial will discuss splitting a string using the substring() function in Arduino.

Use the substring() Function to Split a String in Arduino

Arduino provides a built-in function substring() to split a given string. We can split a string using the start and end index value.

The substring() function has two arguments. The first argument is the starting index value from which we want to start the splitting process, and the second is the ending index value where the splitting process will stop.

The variable Sub_string will contain the output of the substring() function, and the MyString variable will contain the original string we want to split. The from variable contains the starting index, and the to variable contains the ending index.

Let’s define a string and split it using the substring() function and print it on the serial monitor of Arduino.

In the above code, the Serial.println() function prints the result on the serial monitor of Arduino. The string splitting will start from 0, include the 0 index character, and end at index 5, excluding the character at index 5.

We can also find the character index using the indexOf() function of Arduino. The index of function accepts two arguments.

The first argument is mandatory, representing the char or string whose index we want to find. The second argument is optional, and it represents the starting index to find the index of the character.

By default, the indexOf() function starts searching the string from the start to find the index of the given character, but we can also pass an index as a starting point using the second argument of the indexOf() function.

The index variable will store the val variable index, which contains a character or string in the above code. The from variable defines the starting index used as the starting point to find the index of the given character.

We use the indexOf() function when we do not know the character index to pass in substring() .

For example, if we want to split the given string using the space character as the ending index, we can use the indexOf() function to find the index of the space character and then use it inside the substring() function to split the string.

The indexOf() function will return -1 if the index is not found in the given string.

In the above code, the variable index contains the index of the space character present in the given string. As you can see, we displayed the index and the result of string splitting on the serial monitor window.

We can also split a string based on the number of lines.

For example, if a string contains multiple lines of text and we want to split and get each line as a separate string.

We can use the indexOf(‘\n’) function to find the index of a new line and split the given string accordingly.

The indexOf() function starts searching for the index from the start of the given string. However, we can also use the lastIndexOf() function, which searches for the index starting from the end of a string.

As the second argument, we can also pass the starting index inside the lastIndexOf() function. For example, let’s split a string containing three lines, get the last line, and display it on the serial monitor window.

We used the lastIndexOf() function in the above code because we only want to get the last line of text present in the given string. The first three lines are the given string in the output, and the fourth line results from string splitting.

We used the length() function to get the length of the given string which will be used as the ending index value inside substring() . We used the delay() function to add some delay in the code execution because the loop will repeat the process.

If we only want to do the splitting one, we can write the code inside the setup() function, which only runs once.

We can split a string based on any character. We only have to find its index using the indexOf() function.

We can split the string using the substring() function. Suppose we want to get all the lines separately in a given string. We have to get one line, save the remaining string in a variable, and perform the same operation again using a loop until all the lines have been extracted.

Источник

Adblock
detector