Обработка данных | Datarax.ru

Обработка данных — комплекс различных методов работы с данными, позволяющих сделать данные пригодными для работы или увеличить их ценность.

Мы в компании Datarax выделяем следующие виды обработки данных:

  • Очистка данных

    Используется когда данные нужно очистить от каких-то «шумов» или некачественных данных. Позволяет подготовить данные для дальнейшего использования.

  • Валидация данных

    Часто бывает так, что при заполнении каких-то форм или сборе данных полученная информация должна проходить валидацию на соответствие определенным критериям. Данные, не проходящие валидацию, могут отбрасываться или проходить ручную проверку модератором. К классическим примерам валидации данных относится проверка корректности написания номера телефона, email адреса.

  • Нормализация данных

    Процесс приведения плохо структурированных данных к единому формату. Например, телефонные номера, не проходящие валидацию по заданному формату могут быть нормализованы до стандартного вида, заданного в данной учетной системе.

  • Сегментация (кластеризация) данных

    Позволяет разбить информацию в определенные логические блоки по различным критериям. Чаще всего сегментация данных используется при формировании аудиторий для рекламы, чтобы была возможность выделить определенную целевую группу и таргетировать на неё рекламное предложение.

  • Обогащение данных

    Процесс увеличения объема данных об объекте за счет внешних источников информации. Объектом может выступать компания, клиент или, например, товар. Так, имея просто email адрес клиента можно получить из открытых источников подробную информацию о его возрасте, интересах, городе проживания и другую полезную для таргетинга информацию. В случае с обогащением данных о компаниях, речь может идти о получении дополнительных сведений по ИНН или ОГРН. Обогащение данных о товарах позволяет получить по названию, артикулу или штрих-коду подробную информацию о свойствах, наименованию и изображения товара.

  • Поиск дубликатов

    Важный процесс для построения систем мастер-данных о клиентах, компаниях или товарах. Помогает избежать дублирования информации записанной в различных форматах.

Заказать обработку данных в компании Datarax