Значения, разделенные запятыми

Файл значений, разделенных запятыми ( CSV ), представляет собой текстовый файл с разделителями, в котором для разделения значений используется запятая . Каждая строка файла представляет собой запись данных . Каждая запись состоит из одного или нескольких полей , разделенных запятыми. Использование запятой в качестве разделителя полей является источником названия для этого формата файла . Файл CSV обычно хранит табличные данные (числа и текст) в виде обычного текста , и в этом случае каждая строка будет иметь одинаковое количество полей.

Формат файла CSV не полностью стандартизирован. Разделение полей запятыми является основой, но запятые в данных или встроенные разрывы строк должны обрабатываться особым образом. Некоторые реализации запрещают такое содержимое, в то время как другие заключают поле в кавычки , что снова создает необходимость экранирования, если в данных присутствуют кавычки.

Термин «CSV» также обозначает несколько тесно связанных форматов , разделенных разделителями, в которых используются другие разделители полей, например точки с запятой. [2] К ним относятся значения, разделенные табуляцией, и значения, разделенные пробелом. Разделитель, который гарантированно не является частью данных, значительно упрощает синтаксический анализ .

Альтернативным файлам, разделенным разделителями, часто присваивается расширение «.csv», несмотря на использование разделителя полей без запятой. Эта расплывчатая терминология может вызвать проблемы при обмене данными . Многие приложения, которые принимают файлы CSV, имеют опции для выбора символа-разделителя и символа кавычек. Точки с запятой часто используются вместо запятых во многих европейских регионах , чтобы использовать запятую в качестве десятичного разделителя и, возможно, точку в качестве десятичного символа группировки.

CSV — это распространенный формат обмена данными, широко поддерживаемый потребительскими, деловыми и научными приложениями. Среди его наиболее распространенных применений — перемещение табличных данных [3] [4] между программами, изначально работающими с несовместимыми (часто проприетарными или недокументированными) форматами. [1] Это работает, несмотря на отсутствие соблюдения RFC 4180 (или любого другого стандарта), потому что очень много программ поддерживают варианты формата CSV для импорта данных.

Например, пользователю может потребоваться передать информацию из программы базы данных, которая хранит данные в собственном формате, в электронную таблицу , которая использует совершенно другой формат. Большинство программ баз данных могут экспортировать данные в формате CSV, а экспортированный файл CSV затем может быть импортирован программой для работы с электронными таблицами.